Моделирование кредитных рисков в Python
Если вы когда-либо подавали заявку на получение кредитной карты или займа, вы знаете, что финансовые компании проверяют информацию о ваших данных, прежде чем принять решение. Это связано с тем, что выдача кредита может иметь серьезные финансовые последствия для бизнеса. Но как компании принимают решения?
Преподаватель
Михаил Омельченко
Программист с многолетним опытом. Пишу на Python, Javascript, Typescript и руковожу командами разработчиков. Основатель youtube канал Django School. Стал ментором для десятков учеников и разработал платформу colabteam.dev
0часов
15видео
42упражнения
4950опыта
Описание курсаВ этом курсе вы узнаете, как подготавливают данные для кредитных заявок. После этого вы начнете применять машинное обучение и бизнес-правила для снижения риска и обеспечения прибыльности. Вы будете использовать два набора данных, которые имитируют реальные кредитные заявки, уделяя при этом особое внимание ценности для бизнеса. Присоединяйтесь и узнайте о ценности моделирования кредитных рисков!
1. Изучение и подготовка данных по кредиту
В первой главе мы обсудим концепцию кредитного риска и определим, как он рассчитывается. Используя перекрестные таблицы и графики, мы изучим набор реальных данных. Прежде чем применять машинное обучение, мы обработаем эти данные, выявив и решив проблемы.Понимание кредитного риска
50
Изучение данных о кредите
100
Перекрестные и сводные таблицы
100
Отклонения в кредитных данных
50
Определение отклонения с помощью перекрестных таблиц
100
Визуализация кредитных отклонений
100
Кредитные риски: отсутствие данных
50
Заполнение отсутствующих кредитных данных
100
Удаление отсутствующих данных
100
Интуитивное понимание недостающих данных
100
2. Логистическая регрессия для дефолтов
Когда данные по кредитам полностью подготовлены, мы обсудим модель логистической регрессии, которая является стандартом в моделировании рисков. Мы разберем компоненты этой модели, а также узнаем, как оценить ее эффективность. После создания прогнозов мы сможем изучить финансовые результаты использования этой модели.Логистическая регрессия для вероятности дефолта
50
Основы логистической регрессии
100
Многомерная логистическая регрессия
100
Создание обучающего и тестового наборов
100
Прогнозирование вероятности дефолта
50
Изменение коэффициентов
100
Быстрое кодирование в режиме реального времени
100
Прогнозирование вероятности дефолта
100
Эффективность кредитной модели
50
Отчет о классификации дефолтов
100
Выбор метрик отчета
100
Визуальный кредитный скоринг
100
Модель дискриминации и ее влияние
50
Пороговые значения и матрицы ошибок
100
Влияние пороговых значений на эффективность
100
Выбор порогового значения
100
3. XGBoost: Gradient Boosted Tree
Деревья принятия решений – еще одна стандартная модель кредитного риска. Мы выйдем за рамки деревьев решений, используя популярный пакет XGBoost в Python для создания деревьев с градиентным бустингом. После разработки сложных моделей мы проведем стресс-тестирование их производительности и рассмотрим выбор столбцов при несбалансированных данных.XGBoost: Gradient Boosted Tree
50
Деревья для дефолтов
100
Gradient boosted эффективного портфеля
100
Оценка gradient boosted tree
100
Выбор столбцов для кредитного риска
50
Важность столбцов и прогнозирование дефолта
100
Визуализация важности столбцов
100
Выбор столбцов и производительность модели
100
Кросс-валидация для кредитных моделей
50
Кросс-валидация кредитных моделей
100
Ограничения тестирования с кросс-валидацией
100
Оценка с помощью кросс-валидации
100
Дисбаланс классов в данных о кредитах
50
Недостаточная выборка обучающих данных
100
Эффективность дерева с недостаточной выборкой
100
Интуиция с недостаточной выборкой
100
4. Оценка и внедрение модели
После разработки и тестирования двух мощных моделей машинного обучения для их сравнения будут использованы ключевые показатели эффективности. С помощью передовых методов отбора моделей, предназначенных для финансового моделирования, мы выберем только одну. С помощью нее мы разработаем бизнес-стратегию, оценим стоимость портфеля и минимизируем ожидаемые потери.Оценка и внедрение модели
50
Сравнение отчетов по моделям
100
Сравнение с показателями ROC
100
Калибровочные кривые
100
Коэффициенты одобрения кредитов
50
Показатели приемлемости риска
100
Визуализация квантилей одобрения
100
Плохая оценка
100
Влияние коэффициента одобрения
100
Кредитная стратегия и ожидаемый убыток
50
Создание таблицы стратегии
100
Визуализация стратегии
100
Профилирование оценочной стоимости
100
Общий ожидаемый убыток
100
Подведение итогов
50