Мегаобучалка Главная | О нас | Обратная связь


МЕРОПРИЯТИЯ ПО СОВЕРШЕНСТВОВАНИЮ КРЕДИТНОЙ ПОЛИТИКИ БАНКА ВТБ 24(ЗАО)



2019-12-29 247 Обсуждений (0)
МЕРОПРИЯТИЯ ПО СОВЕРШЕНСТВОВАНИЮ КРЕДИТНОЙ ПОЛИТИКИ БАНКА ВТБ 24(ЗАО) 0.00 из 5.00 0 оценок




Использование технологий интеллектуального анализа данных как способа снижения просроченной задолжности

Для уменьшения задолжности при операциях кредитования физических лиц рассмотрим метод, основанный на применении технологии интеллектуального анализа данных (Data Mining). Можно привести давно всем известную цепочку связанных событий: чем меньше рискует банк при предоставлении кредита, тем меньше процентная ставка, предлагаемая этим банком; чем меньше процентная ставка, тем больше клиентов обратиться в именно этот банк; чем больше клиентов обратиться в банк, тем большую прибыль получит банк, а это одна из основных целей коммерческой деятельности. Риск, связанный с невозвратом суммы основного долга и процентов можно значительно снизить, оценивая вероятность возврата заемщиком кредита. В последнее время для оценки риска кредитования заемщика в мировой практике широкое распространение получил скоринг. В России ему также уделяют должное внимание. Сущность этого метода состоит в том, что каждый фактор, характеризующий заемщика, имеет свою количественную оценку. Суммируя полученные баллы, можно получить оценку кредитоспособности физического лица. Каждый параметр имеет максимально возможный порог, который выше для важных вопросов и ниже для второстепенных[7].

Рисунок 3.1- Определение группы заемщиков

Таблица 3.1 - Группы кредитоспособности заемщика

Годовой доход, руб. Пол Возраст Количество детей Группа
Более 50 000 Не имеет значения Не имеет значения

 

Не имеет значения

А

Менее 50 000

Мужской

18-25 С
25-35 В
Более 35 А

Женский

18- 25 С

25-35

1-2 А
Более 2 В
Более 35 Не имеет значения В

На основе полученной информации можно сделать определенные выводы, например:

1) к числу самых добросовестных клиентов относится женщина в возрасте от 25 до 35 лет, имеющая одного или двух детей, среднегодовой заработок которой составляет менее 50 тыс. рублей;

2) одним из самых ненадежных клиентов является человек (независимо от пола) в возрасте от 18 до 25 лет, не имеющий детей, среднегодовой заработок которого составляет менее 50 тыс. рублей.

Затем для каждой группы устанавливаются лимиты кредита, проценты по нему и срок возврата. На базе всей этой информации может строиться или корректироваться скоринговая система, которой и пользуется кредитный менеджер банка, опираясь при оценке клиента уже не только на предположения, но и на вполне обоснованные данные, что так или иначе способствует снижению кредитного риска[8].

Алгоритм построения приведенного выше дерева решений можно разбить на два этапа. Первый — создание дерева(tree building). В ходе его выполнения программа сканирует данные в базе заемщиков с целью выявления у клиента характеристик, наиболее удобных для «расщепления». Затем имеющаяся информация классифицируется в соответствии с найденными признаками. Само собой разумеется, что количество групп риска, равно как и характеристик клиентов, значительно больше, чем изображено на схеме(см.Рис.3.1). Чтобы интерпретация результатов была удобной для использования, следует держать под контролем размер дерева решений, не давая ему чрезмерно разрастаться. По этому на втором этапе DM системы в случае необходимости производят сокращение (pruning) «точек ветвления» дерева[9].

Безусловным плюсом большинства современных программных продуктов, предназначенных для сбора данных и обнаружения скрытых множественных взаимосвязей между ними, является то, что они не требуют от пользователя глубоких знаний в области программирования и структур данных. Более того, результаты анализа могут быть интерпретированы

в интуитивно понятной и доступной форме, что существенно расширяет круг потенциальных пользователей и поклонников инструментов Data Mining.

Выявление профилей  кредитоспособности клиентов- не единственная область применения технологии Data Mining в кредитных учреждениях. Наряду с этим, используя все те же инструменты и элементарную логику, можно получить ответ и на другие не менее важные для банка вопросы, в том числе:

1. Какой категории граждан подойдут с наибольшей вероятностью те или иные банковские продукты?

2.  Как лучше дистанцироваться от конкурентов?

3.  Какая реклама будет наиболее эффективной для привлечения клиентов?

4. Какова вероятность покупки той или иной услуги или продукта в связке с другой услугой или продуктом?

5.  Каковы тенденции потребительского поведения?

Список можно продолжить, поскольку круг решаемых с помощью DM задач ограничивается лишь целесообразностью их выполнения и качеством данных, имеющихся в базе банка или кредитного бюро[10].

Для демонстрации подобной технологии будет использоваться программа Tree Analyzer из пакета Deductor ver.3. В качестве исходных данных была взята выборка, состоящая из 1000 записей, где каждая запись – это описание характеристик заемщика плюс параметр, описывающий его поведение во время погашения ссуды. При обучении дерева использовались следующие факторы, определяющие заемщика: "N Паспорта"; "ФИО"; "Адрес"; "Размер ссуды"; "Срок ссуды"; "Цель ссуды"; "Среднемесячный доход"; "Среднемесячный расход"; "Основное направление расходов"; "Наличие недвижимости"; "Наличие автотранспорта"; "Наличие банковского счета"; "Наличие страховки"; "Название организации"; "Отраслевая принадлежность предприятия"; "Срок работы на данном предприятии"; "Направление деятельности заемщика"; "Срок работы на данном направлении"; "Пол"; "Семейное положение"; "Количество лет"; "Количество иждивенцев"; "Срок проживания в данной местности"; "Обеспеченность займа"; "Давать кредит". При этом поля: "N Паспорта", "ФИО", "Адрес", "Название организации" алгоритм уже до начала построения дерева решений определил как непригодные (рисунок 3.2) по причине практической уникальности каждого из значений[11].

Целевым полем является поле "Давать кредит", принимающий значения "Да"(True) и "Нет"(False). Эти значения можно интерпретировать следующим образом: "Нет" – плательщик либо сильно просрочил с платежами, либо не вернул часть денег, "Да" – противоположность "Нет". Факторы для построения дерева были собраны и консолидированы в хранилище данных Deductor Warehouse.

Рисунок 3.2 - Настройка определяющих и целевых факторов

Методология хранилища такова, что информация хранится в процессах, каждый процесс имеет определенный набор измерений и фактов. Т.е. процесс реализован по стандартной схеме "Звезда", в центре которой хранятся факты, а измерения являются лучами. В данном случае процесс отображает выдачу кредита заемщику. Наиболее ценной информацией процесса является статус кредита. Хороший кредит – тот, который заемщик вернул в срок и в полном объеме, плохой – обратная ситуация.

Рисунок 3.3 - Дерево решений – модель определения кредитоспособности физических лиц

Анализируя полученное дерево решений (см. рисунок 3.3) можно сделать вывод, что при помощи дерева решений можно проводить анализ значащих факторов. Такое возможно благодаря тому, что при определении параметра на каждом уровне иерархии, по которому происходит разделение на дочерние узлы, используется критерий наибольшего устранения неопределенности. Таким образом, более значимые факторы, по которым проводится классификация, находятся на более близком расстоянии (глубине) от корня дерева, чем менее значимые. Например, фактор "Обеспеченность займа" более значим, чем фактор "Срок проживания в данной местности". Фактор "Основное направление расходов" значим только в сочетании с другими факторами. Еще одним интересным примером значимости различных факторов служит отсутствие в построенном дереве параметра "Наличие автотранспорта", что говорит о том, что на сегодняшний день это наличие не является определяющим при оценке кредитоспособности физического лица[12].

Можно заметить, что такие показатели как "Размер ссуды", "Срок ссуды", "Среднемесячный доход" и "Среднемесячный расход" вообще отсутствуют в полученном дереве. Данный факт можно объяснить тем, что в исходных данных присутствует такой показатель как "Обеспеченность займа", и т.к. этот фактор является точным обобщением четыре вышеописанных показателей, алгоритм построения дерева решений выбрал именно его.

Очень важной особенностью построенной модели является то, что правила, по которым определяется принадлежность заемщика к той или иной группе записаны на естественном языке. Например, на основе построенной модели получаются следующие правила:

1. ЕСЛИ Обеспеченность займа = Да И Срок проживания в данной местности, лет > 5,5 И Количество лет > 19,5 И Наличие недвижимости = Да И Наличие банковского счета = Да ТО Давать кредит = Да (Достоверно на 98%)

2. ЕСЛИ Обеспеченность займа = Да И Срок проживания в данной местности, лет > 5.5 И Наличие недвижимости = Да И Количество лет > 21.5 И Срок работы на данном направлении, лет <= 5.5 И Пол = Муж И Наличие банковского счета = Нет И Основное направление расходов = Одежда, продукты питания и т.п. ТО Давать кредит = Нет (Достоверно на 88%).

Правильно построенное на данных прошлых периодов дерево решения обладает одной еще очень важной особенностью. Эта особенность называется способность к обобщению. Т.е. если возникает новая ситуация (обратился потенциальный заемщик), то, скорее всего, такие ситуации уже были и достаточно много. Вследствие чего можно с большой долей уверенности сказать, что вновь обратившийся заемщик поведет себя так же, как и те заемщики, характеристики которых очень похожи на характеристики вновь обратившегося. На основе построенной модели можно определять принадлежность потенциального заемщика к одному из классов. Для этого необходимо воспользоваться диалоговым окном "Эксперимент" программы Tree Analyzer (рисунок 3.4), в котором, последовательно отвечая на вопросы, можно получить ответ на вопрос: "Давать ли кредит".

Пример получения результата. Вопросы: Обеспеченность займа: Да > Наличие недвижимости: Да > Пол: Муж > Наличие банковского счета: Нет > Основное направление расходов: Покупка товаров длительного пользования.

Ответ: Кредит давать: Да (достоверно на 96 %).

Рисунок 3.4 - Окно "Эксперимент"

 

Используя такой подход можно устранить сразу оба вышеописанных недостатка скоринговой системы оценки кредитоспособности. То есть:

1) Стоимость адаптации сводится практически к минимуму за счет того, что алгоритмы построения модели классификации (дерево решений) – это самоадаптируемые модели (вмешательство человека минимально).

2) Качество результата достаточно велико за счет того, что алгоритм выбирает наиболее значимые факторы для определения конечного ответа. Плюс ко всему полученный результат является статистически обоснованным.

Основные преимущества системы:

1) Гибкая интеграция с любыми сторонними системами, т.е. получение информации для анализа и перенос результатов не вызывает проблем.

2) Консолидация информации о заемщиках в специальном хранилище данных, т.е. обеспечение централизованного хранения данных, непротиворечивости, а также обеспечение всей необходимой поддержки процесса анализа данных, оптимизированного доступа, автоматического обновления данных, использование при работе терминов предметной обрасти, а не таблиц баз данных.

3) Широкий спектр инструментов анализа, т.е. обеспечение возможности эксперту выбрать наиболее подходящий метод на каждом шаге обработки. Это позволит наиболее точно формализовать его знания в данной предметной области.

4) Поддержка процесса тиражирования знаний, т.е. обеспечение возможности сотрудникам, не разбирающимся в методиках анализа и способах получения того или иного результата получать ответ на основе моделей подготовленных экспертом. Так, сотрудник, оформляющий кредиты должен ввести данные по потребителю и система автоматически выдаст решение о выдачи кредита или об отказе.

5) Поддержка групповой обработки информации, т.е. обеспечение возможности дать решение по списку потенциальных заемщиков. Из хранилища автоматически выбираются данные по лицам, заполнившим анкету вчера (или за какой угодно буферный период), эти данные прогоняются через построенную модель, а результат экспортируется в виде отчета (например, в виде excel файла), либо экспортируется в систему автоматического формирования договоров кредитования или писем с отказом в кредите. Это позволит сэкономить время и деньги.

6) Поддержка актуальности построенной модели, т.е. обеспечение возможности эксперту оценить адекватность текущей модели и, в случае каких либо отклонений, перестроить ее, используя новые данные.

Приведенный выше пример – это приближенный вариант того, как можно использовать методы интеллектуального анализа данных, в частности, деревья решений, для достижения поставленной задачи: уменьшения риска при операциях кредитования физических лиц. Хотя и при таком первом приближении наблюдаются положительные результаты. Дальнейшие усовершенствования могут затрагивать такие моменты как: более точный подбор определяющих заемщика факторов; изменение самой постановки задачи, так, например, вместо двух значений целевого параметра, можно использовать более детальную информацию (Вернул/ Не вернул/ Не вовремя), или использовать в качестве целевого значения вероятность того, что деньги выплачены вовремя.

Таким образом, для эффективного формирования кредитного портфеля банкам необходимо взять на вооружение передовые технологии добычи знаний и применить их для оценки потенциальных заемщиков. Благодаря этому можно будет не бояться предстоящей конкуренции на этом рынке. Подготовка решения данного вопроса сейчас позволит обкатать саму процедуру и в дальнейшем избежать ошибок и расходов в связи с массовым применением таких подходов в дальнейшем.

Далее рассчитаем экономический эффект от предложенных методов



2019-12-29 247 Обсуждений (0)
МЕРОПРИЯТИЯ ПО СОВЕРШЕНСТВОВАНИЮ КРЕДИТНОЙ ПОЛИТИКИ БАНКА ВТБ 24(ЗАО) 0.00 из 5.00 0 оценок









Обсуждение в статье: МЕРОПРИЯТИЯ ПО СОВЕРШЕНСТВОВАНИЮ КРЕДИТНОЙ ПОЛИТИКИ БАНКА ВТБ 24(ЗАО)

Обсуждений еще не было, будьте первым... ↓↓↓

Отправить сообщение

Популярное:
Как выбрать специалиста по управлению гостиницей: Понятно, что управление гостиницей невозможно без специальных знаний. Соответственно, важна квалификация...
Почему молоко имеет высокую усвояемость?
Как распознать напряжение: Говоря о мышечном напряжении, мы в первую очередь имеем в виду мускулы, прикрепленные к костям ...
Почему агроценоз не является устойчивой экосистемой



©2015-2024 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (247)

Почему 1285321 студент выбрали МегаОбучалку...

Система поиска информации

Мобильная версия сайта

Удобная навигация

Нет шокирующей рекламы



(0.026 сек.)