Машинное обучение с учителем
Вы узнаете, как использовать Python для обучения с учителем, а также научитесь работать с прогностическими моделями на основе реальных данных.

Преподаватель
Екатерина Герц
Практикующий Fullstack разработчик: Python, JavaScript, React, Node.js
4часа
17видео
34упражнения
3900опыта
Описание курсаМашинное обучение – класс методов искусственного интеллекта, характерной чертой которых является обучение за счет решения множества сходных задач. Алгоритм “учится” на существующих данных, чтобы делать прогнозы на основе новых данных: Кто из ваших клиентов переведет свой бизнес в другое место? Является ли конкретное письмо спамом? В этом курсе вы узнаете, как использовать Python для обучения с учителем – важнейшего компонента машинного обучения. Вы научитесь строить прогностические модели, настраивать их параметры и определять, насколько хорошо они работают – и все это на основе реальных данных. Вы будете использовать scikit-learn, одну из самых популярных и удобных библиотек машинного обучения.
1. Классификация
В этой части вы познакомитесь с одним из алгоритмов машинного обучения – классификацией. Обучите свою первую модель и оцените ее эффективность.Обучение с учителем
50
Применение классификации
50
Анализ данных (EDA)
50
Численный EDA
50
Визуальный EDA
50
Задача классификации
50
Метод k-ближайших соседей: Обучение
100
Метод k-ближайших соседей: Прогноз
100
Эффективность модели
50
Распознавание цифр
100
Обучение, прогнозирование, точность
100
Переобучение и недообучение
100
2. Регрессия
В предыдущей части вы изучили алгоритм классификации, который прогнозирует метки дискретного класса. В этой части вы изучите регрессию, которая прогнозирует непрерывное количество. Вы узнаете о фундаментальных концепциях регрессии и примените их для решения реальных задач.
Введение в регрессию
50
Применение регрессии
50
Импорт данных для обучения с учителем
100
Изучение данных о странах
50
Основы линейной регрессии
50
Обучение и прогнозирование в регрессии
100
Обучающие и тестовые данные
100
Кросс-валидация
50
5-кратная кросс-валидация
100
k-кратное сравнение
100
Регуляризованная регрессия
50
Регуляризация: Lasso
100
Регуляризация: Ridge
100
3. Оптимизация модели
После обучения модели ваша следующая задача – оценить ее эффективность. В этой части вы узнаете о метриках, которые помогут вам оценить работу вашей модели. Вы научитесь оптимизировать модели классификации и регрессии.
Насколько хороша модель?
50
Метрики для классификации
100
Логистическая регрессия и ROC-кривая
50
Построение модели логистической регрессии
100
Построение ROC-кривой
100
Кривая Precision-recall
50
Площадь под ROC-кривой (AUC)
50
Вычисление AUC
100
Настройка гиперпараметров
50
Настройка гиперпараметров: GridSearchCV
100
Настройка гиперпараметров: RandomizedSearchCV
100
Итоговая оценка модели
50
Контроль на отложенных данных
50
Контроль на отложенных данных: Классификация
100
Контроль на отложенных данных: Регрессия
100
4. Предварительная обработка и пайплайны
В этой части вы узнаете о пайплайнах и о том, как scikit-learn позволяет объединять трансформаторы и оценщики в цепочки и использовать их как единое целое. Будут представлены методы предварительной обработки как способ повышения производительности модели, а пайплайны свяжут воедино понятия из предыдущих глав.
Предварительная обработка данных
50
Изучение категориальных признаков
100
Создание фиктивных переменных
100
Регрессия с категориальными признаками
100
Обработка отсутствующих данных
50
Удаление отсутствующих данных
100
Нормализация данных
50
Центрирование и масштабирование данных
100
Центрирование и масштабирование в пайплайне
100
Создание пайплайна для классификации
100
Поздравляем!
50