В компании «Франклин & Грант», специалисты которой занимаются созданием математических моделей и их программной реализацией для решения финансовых задач, утверждают, что в России вообще не существует кредитных историй достаточной длины для обучения системы. Что уж говорить о новых типах кредитных продуктов, появляющихся в стране. Например, об ипотеке, собирать данные по которой для настройки системы нужно еще лет десять.
   В ХКФБ проблему решили довольно оригинально, использовав для обучения своей системы скоринга базу данных о 4,2 млн. заемщиков из стран Центральной Европы. В этом случае «веса» различных исходных параметров получились достаточно схожими с российскими, и после небольшой коррекции под национальную специфику и текущий банк система стала работоспособной.
   Если имеются выборки сравнительно небольшого размера, разумно использовать иные методы анализа, такие как метод ближайших соседей или дерево классификаций. В первом случае новому заемщику, исходя из каких-либо его характеристик, система ставит в соответствие определенную точку с соответствующими координатами. В зависимости от того, каких точек по соседству с данной большинство: «плохих» или «хороших» (которым соответствуют люди, отдавшие или не отдавшие кредит), принимается решение о выдаче денег. При использовании деревьев классификаций система обучается следующим образом. На основе имеющихся данных строится дерево. При построении все известные ситуации обучающей выборки сначала попадают в верхний узел, а потом распределяются по узлам (рис. 1). Критерий разбиения — это различные значения входного фактора.
Скоринг на практике
   На сегодняшний день системы скоринга строятся на базе «универсальных» аналитических комплексов (SAS, KXEN), реализуются или в виде отдельных приложений, или как модули многофункциональных банковских комплексов (Invoretail, SOWK). В частности, анализ платежеспособности заемщика применяется в последних версиях системы RS-Loans (компания R-Style Softlab), комплексном решении по автоматизации кредитного бизнеса банков. В такой реализации скоринга есть ощутимое преимущество: ведь оценка уже интегрирована в сам процесс выдачи кредита. RS-Loans, по сути, моделирует от начала до конца бизнес-процесс кредитования в виде прохождения документов по цепочке «заявка — кредитный комитет — кредитный договор» с использованием нескольких функциональных элементов: «Кредитный договор», «Клиент», «Договор обеспечения», «Объект обеспечения», «Банковская карта», «Счет», «Операции», «График погашения», «Филиал» и т. д.
   В системе предусматривается разделение всех пользователей по двум основным должностям. Первая группа — кредитные инспекторы, которые занимаются сбором и оформлением документов, инициализацией операций и т. д. Вторая группа — кредитные бухгалтеры, чьи обязанности ограничиваются бухгалтерским отражением кредитной деятельности. При надобности в систему можно добавить новые должности, наделив их необходимым набором прав. Производительность кредитного отдела система повышает прежде всего за счет наличия процедур массовой обработки договоров: начисления процентов, выноса на просрочку, расчета групп риска, формирования резервов и т. д.
   Задача скоринг-функционала — рассчитать максимальный размер кредита, который можно выдать клиенту, базируясь на его анкетных данных. В системе уже есть стандартный набор показателей, который банк-заказчик системы может дополнить собственными. Не секрет, что большинство банков использует собственные критерии оценки заемщика, в том числе довольно экзотичные, тщательно храня в тайне значимость тех или иных факторов для анализа. Иногда «для отвода глаз» в анкете даже присутствуют вопросы, ответы на которые никак не учитываются в ходе анализа. Расчет максимального размера кредита в RS-Loans для разных типов кредитования может рассчитываться по различным критериям. Так, при ипотеке, как правило, применяется схема, согласно которой максимальный размер кредита устанавливается исходя из платежеспособности заемщика и оценочной стоимости покупаемой недвижимости, а окончательная сумма выдаваемого кредита формируется с учетом наименьшего из полученных значений. В RS-Loans включен программный инструментарий для ввода аналогичных правил.
   Скоринговые методики в системе имеют несколько вариантов применения. Пусть, например, покупатель желает приобрести в кредит какую-нибудь бытовую технику. При этом он имеет некоторые денежные средства, которые готов вложить. При обращении клиента к сотруднику банка последний вводит в БД информацию о заемщике + данные для скоринговых расчетов. Образец типовой анкеты в виде xls-файла поставляется в банк вместе с системой (см. таблицу). Этот образец служит основой для дальнейшей корректировки под требования конкретного банка — например, для исправления значений баллов за определенные клиентские характеристики или формирования новых шаблонов документов. В зависимости от ответов на вопросы система вычисляет максимальный размер кредита. Дальше бизнес-процесс и действия сотрудника зависят от опций схемы розничного кредитования, с учетом программной и аппаратной специфики банка, наличия выделенных каналов связи и полномочий сотрудника (наличия права подписи, например).
   Этот процесс может работать по трем основным сценариям. Первый вариант используется, если в торговом центре («провайдере» услуг потребительского кредитования) есть выделенный канал для стабильной связи с главной БД RS-Loans. В этом случае данные анкеты автоматически загружаются в систему, быстро возвращается информация по платежеспособности клиента, максимальному размеру кредита и сопутствующая отчетность. Допускается введение в схему процедур проверки достоверности указанных заемщиком сведений. На основе полученного отчета сотрудник отказывает в кредите либо заключает договор на определенную сумму. Затем он заносит в систему информацию о своих действиях, подтверждаемых соответствующими документами. Вариант с единой БД и выделенным каналом наиболее удобен, так как в этом случае имеется возможность консолидировать и обрабатывать данные о заемщиках в одном месте или централизованно изменять методики скоринга. Допускается в этом варианте и использование Интернета для заполнения заявки непосредственно в HTML. Недостаток у такой схемы только один — доступ к базе по выделенному каналу не всегда возможен.
   Если в торговом центре есть средства связи, но нет выделенного канала, передача данных идет по модему (GPRS— или обычному — неважно). Поскольку терминалы сотрудников, работающих с RS-Loans, могут действовать и через удаленное соединение, схема работы в этом случае практически аналогична предыдущей. По-прежнему будет использоваться единая база данных. Но есть другой вариант. Сотрудник банка может переслать анкетные данные напрямую или через Интернет в режиме безопасного соединения на сервер с БД RS-Loans. Серверный обработчик событий автоматически загрузит базу и сформирует необходимые отчеты и документы для обратной пересылки в торговый центр. Дополнительные сложности появляются в том случае, если прямая связь между местом продажи и главной БД RS-Loans отсутствует. Тогда приходится вести локальную БД клиентов, синхронизировать ее с центральной базой, обновлять и согласовывать «черный список» клиентов.
 
Первая модель
   В модели Дюрана фигурируют группы факторов для определения степени кредитного риска и указаны коэффициенты для различных факторов, характеризующих кредитоспособность клиента:
   1) Пол: женский (0,4 балла), мужской (0).
   2) Возраст: 20 лет и меньше (0), 21 год (0,1), 22 года (0,2), 23 года и выше (0,3).
   3) Срок проживания на одном месте: по 0,042 балла за каждый год, но не больше чем 0,42 в сумме.
   4) Профессия: 0,55 — за профессию с низким риском, 0 — за профессию с высоким риском, 0,16 — другие профессии.
   5) Финансовые показатели: наличие банковского счета (0,45), наличие недвижимости (0,35), наличие страхового полиса (0,19).
   6) Работа: предприятия в общественной отрасли (0,21), другие (0).
   7) Занятость: по 0,059 балла за каждый год стажа на последнем месте работы.
   Сам Дюран определял сумму в 1,25 балла как порог кредитоспособности.
Примеры систем
   Практически все системы розничного кредитования поддерживают интеграцию с отдельными скоринговыми приложениями. Наиболее известны на российском рынке продукты компаний BaseGroup Labs и EGAR. BaseGroup Labs предлагает заказчикам систему
   Deductor:Loans, последняя версия которой, кстати, была презентована в нынешнем январе. ПО построено на базе аналитической платформы Deductor, включающей инструменты для решения задач многомерного анализа (OLAP), бизнес-аналитики (business intelligence), «раскопок данных» (data mining) и др.
   В состав Deductor:Loans входит модуль LoansBase.Generator, позволяющий генерировать «образцы» кредитных историй. Этот программный инструмент формирует набор примеров с разными анкетными портретами заемщиков по статистическим алгоритмам с учетом заданных распределений случайных величин. В качестве распределений можно использовать статистические данные по региону или экспертные оценки типов заемщиков. Искусственная кредитная история, по мнению разработчиков, является оптимальным вариантом обучающей выборки в тех случаях, когда реальной кредитной истории не существует или ее объем недостаточен. А такие проблемы особенно часто проявляются при потребительском кредитовании, где постоянно появляются новые виды кредитных продуктов. Причем «новички» отличаются от прежних видов кредитных программ суммой кредита или требованиями поручительства. В такой ситуации появляются и исчезают некоторые входные данные, что делает уже построенную скоринговую модель неприемлемой.
   LoansBase.Generator формирует таблицу, содержащую входные факторы из анкеты заемщика, которые влияют на принятие решения о выдаче денег. Гипотезы о влиянии отдельных факторов выдвигаются, как правило, экспертами банка. Субъективность последних и является главным недостатком подхода с искусственной кредитной историей.
   После создания истории начинается итеративное построение скоринговых моделей. На каждой итерации устраняются противоречия и корректируются правила. В Deductor:Loans отсутствуют балльные скоринговые методики. Вместо «классики» используются деревья решений и нейронные сети. Эти методы, кстати, делают возможной работу с выборкой, содержащей от пятисот до тысячи элементов. Деревья решений строят модель в виде правил, видоизменяются при внесении в выборку новых примеров, игнорируют несущественные признаки. Нейронные сети предназначены для выявления нелинейных зависимостей между входными и выходными факторами, позволяя дополнить скоринг оценкой вероятности возврата кредита. То есть, грубо говоря, на выходе системы получается не бинарное решение: «отдаст/не отдаст» — «1/0», а «0,53», например. То есть 53 шанса из 100, что кредит будет возвращен.
   У компании EGAR можно отметить три продукта, автоматизирующих кредитный скоринг. Первый — EGAR Application Scoring — сочетает анализ исторических данных с применением макроэкономических показателей, что реализуется в модулях ретроспективного скоринга и макроскоринга соответственно. Алгоритмы, используемые при анализе розничных заемщиков, в большинстве своем аналогичны вышеописанным, но есть и ряд других подходов — например, байесовские сети. Банк, внедривший EGAR Application Scoring, получает возможность рассчитывать риски невозврата и досрочного погашения и управления просроченными кредитами с помощью определения лимитов и сроков погашения задолженности. Также система анализирует кредитные сделки с созаемщиками и поручителями и учитывает залоговое качество обеспечения кредита, беря в расчет временной фактор. Кстати, EGAR не только продает систему, но и сдает ее в аренду.
   EGAR Behavior & Collection Scoring предназначен для оценки рисков уже выданных кредитов. ПО учитывает график погашения задолженности заемщиком и движение его средств на других счетах. В функциональность системы также включены средства оценки эффективности мер для ликвидации просроченной задолженности (скоринг взысканий).
   Третья скоринговая разработка компании — EGAR Market Scoring — предназначена для оценки кредитоспособности юридических лиц. Этот вид скоринга относительно меньше востребован, и соответствующие ИТ-решения представлены на рынке в меньшей степени, нежели ПО, ориентированное на ритейл. И все же о скоринге компаний-заемщиков стоит упомянуть хотя бы на отдельном примере.
   EGAR Market Scoring рассчитывает вероятность банкротства заемщика за период кредитной сделки. На основании этих расчетов кредитор может обосновать условия кредитования компании. В качестве входных параметров используются квартальные финансовые отчеты за год и дополнительная информация о бизнесе. На первой стадии оценки система вычисляет финансовые показатели и на их основе выводит базовую среднегодовую вероятность дефолта. Вторая стадия — дополнительная экспертная оценка с выводом поправочного коэффициента к базовой вероятности. Решение о выдаче кредита или предложении альтернативных условий сделки зависит от суммы предполагаемого кредита, залога, надежности обеспечения, длины сделки, кредитной маржи и общих параметров портфеля. Формула для базовой оценки получена из временных рядов котировок акций и облигаций российского рынка ценных бумаг и финансовых показателей сотни открытых компаний. Длина базы составляет два-три последних года.
   Оценка может производиться по двум моделям. Первая — Credit Grades — использует идею Роберта Мертона о соответствии рыночной капитализации компании и опциона на покупку компании, цена которого соответствует вероятности неисполнения, то есть банкротства компании на установленном временном периоде. Вторая — модель Bonds Spreads — устанавливает соответствие вероятности невозврата кредита и разности в доходностях между опорными и корпоративными облигациями.
   В заключение следует сказать, что автоматизация оценки рисков не заменит «налогопослушности» граждан и солидных зарплат, ежемесячно зачисляемых на счет каждому трудящемуся члену общества. И пока вы сами официально получаете сто долларов, а тратите, скажем, семьсот, нет смысла возмущаться: а почему это мне не дают кредит под пять-шесть процентов годовых, как «у них»? Для собственного спокойствия можете считать высокие проценты по кредитам своего рода подоходным налогом, часть которого достается государству. Ведь гораздо приятнее отдавать деньги, вспоминая симпатичную девушку, которую вы сами и выбрали, предварительно сравнив ее предложение с другими, а не безликому налоговому органу с двадцатизначным номером расчетного счета и кучей странных аббревиатур, вроде КПП, БИК и прочих ОКАПО. Попомните наше слово: внуки еще будут завидовать, слушая рассказы дедушки с бабушкой о временах, когда кредиты были дорогими…

КАФЕДРА ВАННАХА: «Черный ящик» Луки Пачоли

   Автор: Ваннах Михаил
   Один «черный ящик» знают все. Его часто ищут среди обломков аэропланов. И хоть это вовсе не ящик, а шар, и не черный, а оранжевый, он таит в себе информацию о том, что на самом деле происходило с погибшей машиной. Кое-кто может помнить и о другом «черном ящике». Абстрактном объекте, иллюстрирующем некоторые положения кибернетики, который представляет собой закрытую систему, изучаемую только по состоянию ее входов и выходов. А вот работы Луки Пачоли объединяют в себе оба понятия «черного ящика». И оба лежат в основе нашей индустриальной цивилизации, хотя жил талантливый итальянец задолго и до кибернетики, и до аэропланов.
   Лука Пачоли (Pacioli) родился в 1445 году во флорентийском Городе Святого гроба на правом берегу Тибра. В детстве помогал местному торговцу Фолько де Бельфольчи; слушал рассказы дяди — армейского капитана Бенедетто. На учение попал к Пьеро делла Франческо (1416—92), прославленному художнику и математику. Из двух сторон дарования своего наставника юноша безоговорочно отдал сердце науке.
   В девятнадцать лет Лука устраивается учителем в дом венецианского купца Антонио ди Ромпиази. Воспитывая трех его сыновей, учится сам, особенно охотно — у знаментиого математика Доменико Брагадино. И там же, в Венеции, путешествуя на кораблях, перевозящих товары, помогая отцу учеников вести конторские книги, он делает первые шаги к тому, что стало основой нашей цивилизации. В 1470 году Пачоли пишет первую, рассчитанную на воспитанников, книгу — учебник коммерческой математики. Тогда же он оставляет работу учителя и переселяется в Рим. По просьбе делла Франческо Луку радушно принимает великий Леон Батиста Альберти (1404—72), архитектор, ученый, писатель, музыкант. «Красота, — учил Альберти, — есть некое согласие и созвучие частей в том, частями чего они являются, — отвечающие строгому числу, ограничению и размещению, которых требует гармония, то есть абсолютное и первичное начало природы». Слова эти запали в душу Луки Пачоли.
   В доме Альберти Лука знакомится с семьей Ровере. Ее глава Франческо из генералов ордена францисканцев становится в 1471 году Папой Сикстом IV. Пачоли, друживший с племянниками Папы, тоже выбирает духовную стезю. В 1475 году орден францисканцев пополняет фра Лука ди Борго Сан-Сеполькро. Но славу ему принесет не теология, но математика.
   Профессор математики в университете Перуджи с 1477 года. После трех лет преподавания — перерыв. Восемь лет в Заре. Исполнение орденских обязанностей, штудии теологии. С 1486 года Лука именуется магистром священной теологии. В 1487 году он опять в Перудже. Опять профессура. И здесь Пачоли вступает в спор флорентийцев с Микеланджело. Горожане считали, что живут в «…гиблое время, когда человеческий разум исчерпал свои возможности. Все, что можно узнать, — узнано; все достижимое — достигнуто; изобретаемое — создано». Микеланджело же считал, «что человечество придумает машины, предложит идеи, которые пока непостижимы для нас». Пачоли был на стороне горожан, и, пытаясь свести всю сумму математики воедино, он начал работу над книгой, которой было суждено обрести всемирную славу. Рим, родной городок, Венеция — именно там 10 ноября 1494 года из типографии «мудрого Паганино ди Паганини» выходит в свет «Summa de Arithmetica, Geometria, Proportioni et Proportionalita» — «Сумма арифметики, геометрии, учения о пропорциях и отношениях».
   Это был шаг к созданию теории математики, а XI трактат IX отдела книги, посвященного применению математики в коммерческом деле, обрел отдельную жизнь. Трактат назывался «Trattato dei Computi e delle Scritture» [Пачоли Л. Трактат о счетах и записях. М., 1983]. Революционным шагом было двойное внесение всех операций купца в Quaderno, Главную книгу. Дебет и Кредит. Модель причинно-следственных связей в строгих бумагах бухгалтеров. Повышение точности и надежности учета. Повышение качества управления материальными ресурсами. Основа грядущей рационализации и индустриализации.
   Член нищенствующего ордена — и основа капитализма. Сумма знаний — и фундамент революции.
   Вернер Зомбарт, один из исследователей генезиса нашей цивилизации, говорил об итальянской бухгалтерии поэтически. «Просто невозможно, — писал он, — представить капитализм без двойной бухгалтерии; они соотносятся друг с другом как форма и содержание… Двойная бухгалтерия родилась из того же духа, что и системы Галилея и Ньютона, учения современной физики и химии… В двойной бухгалтерии можно усмотреть идеи всемирного тяготения, кровообращения, сохранения энергии»[Sombart W. Der moderne Kapitalismus. B., 1928, II, S. 129]. (К этому списку можно по праву добавить и будущую кибернетику.) И другой философ истории, Освальд Шпенглер, в «Закате Европы» ставил Пачоли рядом с Колумбом и Коперником.
   Фра Лука преподавал в Милане (одновременно с да Винчи), Флоренции, Болонье, Риме. Умер в 1515 году на родине. Возможно, Леонардо да Винчи, рисуя эскиз счетной машины, думал о своем друге математике Луке Пачоли. Но уж использование для учета компьютеров, которые и считают, и пишут в память, однозначно связано с мыслями францисканца, давно оторвавшимися от его «Трактата…» и пустившимися в свободное плавание.

РЕПОРТАЖ:Хакеры, неоднозначно!

   Автор: Сергей Вильянов
   18 января в Федеральном Собрании РФ молодежный центр Либерально-демократической партии созвал круглый стол для обсуждения злободневной темы хакерства в России. В приглашении, упавшем в редакционный ящик, сообщалось, что «Интернет — пространство всемогущества хакеров», а в качестве противодействия этому безобразию злых киберкудесников предлагалось отлавливать, воспитывать в них патриотизм и затем натравливать на сайты «протеррористической и экстремистской направленности». За удачные взломы юные либерал-демократы предлагали поставить перековавшихся на денежное довольствие из госбюджета. Разумеется, редакция заинтересовалась столь экстравагантной инициативой и, несмотря на сильный мороз, решила заслать на мероприятие своих людей.
   По пути в Госдуму эти люди (которыми оказались мы с фотографом Александром Масловым) вдруг вспомнили старый анекдот про тимуровцев, которые на последние гроши покупали проституток и отпускали их «на волю». Впрочем, веселиться было рано: оказывается, с первого января сего года в Государственную Думу запрещено проносить приличную фототехнику без дополнительного письменного разрешения. Дешевую мыльницу, которая только и пригодна для уродования лиц народных избранников и секретной съемки компромата на них же, берите с собой на здоровье. А вот для того, чтобы использовать нормальную камеру, надо написать письмо в службу охраны и собрать на нем аж три одобряющие подписи на разных этажах немаленького здания в Охотном ряду. Стоит ли говорить, что приглашающая сторона забыла позаботиться об этом заблаговременно и все пришедшие фотографы около часа топтались за проходной, время от времени подкармливаемые обещаниями о скором прибытии подписанного разрешения на внос оборудования. Разрешение все не появлялось и не появлялось, подбадривающие нас юноши из ЛДПР ушли якобы на минутку, но потом выяснилось, что навсегда, и тут я прибегнул к безжалостному хакингу защиты молодежного центра ЛДПР от фотокорреспондентов, позвонив напрямую в пресс-службу Самого Владимира Вольфовича и попросив разобраться с салагами. Разрешение тут же появилось, правда не для всех: камера одного из коллег, который при мне раз пять повторил ее название встречающим, в заветный список не попала. Не иначе, как злобные хакеры, испугавшись, что их будут приручать за государственный счет, продемонстрировали свое всемогущество и в пространстве Госдумы.
 
   Попали мы как раз к началу бурной дискуссии, главными участниками которой стали директора московских школ, их заместители и преподаватели информатики — люди немолодые и, к сожалению, абсолютно некомпетентные. О хакерах они судили исключительно по голливудской продукции и бородатым слухам, так что и заявления делали соответствующие. Так, преподавательница информатики из школы №1939 (кстати, с углубленным изучением этого предмета) поведала о том, что «хакеры знают программы на уровне алгоритмов», а ее подопечные не всегда имеют возможность поближе познакомиться с новейшими компьютерами. На всю школу всего четыре компьютерных класса, ну куда это годится? Кроме того, по ее словам, дети такие жадные, что без хорошего подарка отказываются принимать участие в олимпиадах даже по профильным предметам.
   Тут я вспомнил единственный компьютерный класс в своей школе, оснащенный неработающими (!) БК-0010-01 с клавиатурами, нарисованными на пленке, а также многочисленные олимпиады, за победы в которых нам просто ставили лишнюю «пятерку» в журнал. Положительно, жизнь прошла мимо моего поколения.
   А тетенька из 1939-й школы все переживала по поводу недостаточного финансирования и недвусмысленно намекала, что если ей немедленно не выделят денег на оборудование для пятого класса, то ее школа будет вынуждена поставить производство хакеров на поток.
   Развила тему преподавательница математики из школы №1973, где, по ее словам, детям скучно учиться из-за плохих компьютеров, выпущенных в «прошлогоднем веке», а их родители так безжалостны, что позволяют своим чадам всю ночь с субботы на воскресенье просиживать в компьютерных клубах, да еще покупают им отличные компьютеры домой. С апокалиптическими интонациями она поведала, что если государство не обратит внимание на ее школу, там тоже будут выращивать хакеров, а те, в свою очередь, начнут резво плодить себе подобных. «У нас девочка одна с родителями была на Северном полюсе!», — угрожающе подытожила женщина.
   Видимо, расчувствовавшись, коллега из журнала «Хакер» призвал учителей на всякий случай воспитывать в своих подопечных патриотизм, чтобы они, став хакерами, никогда не взламывали отечественные ресурсы, ограничиваясь буржуйскими. Дама успокоила журналиста: оказывается, любовь к Родине у них воспитывается постоянно на уроках истории, литературы и — особенно! — математики.