Машинное обучение с учителем

Вы узнаете, как использовать Python для обучения с учителем, а также научитесь работать с прогностическими моделями на основе реальных данных.

Преподаватель

Екатерина Герц

Практикующий Fullstack разработчик: Python, JavaScript, React, Node.js

4часа

17видео

34упражнения

3900опыта

Описание курсаМашинное обучение – класс методов искусственного интеллекта, характерной чертой которых является обучение за счет решения множества сходных задач. Алгоритм “учится” на существующих данных, чтобы делать прогнозы на основе новых данных: Кто из ваших клиентов переведет свой бизнес в другое место? Является ли конкретное письмо спамом? В этом курсе вы узнаете, как использовать Python для обучения с учителем – важнейшего компонента машинного обучения. Вы научитесь строить прогностические модели, настраивать их параметры и определять, насколько хорошо они работают – и все это на основе реальных данных. Вы будете использовать scikit-learn, одну из самых популярных и удобных библиотек машинного обучения.

1. Классификация

В этой части вы познакомитесь с одним из алгоритмов машинного обучения – классификацией. Обучите свою первую модель и оцените ее эффективность.

Обучение с учителем

Применение классификации

Метод k-ближайших соседей: Обучение

100

Метод k-ближайших соседей: Прогноз

Обучение, прогнозирование, точность

100

Переобучение и недообучение

100

2. Регрессия

В предыдущей части вы изучили алгоритм классификации, который прогнозирует метки дискретного класса. В этой части вы изучите регрессию, которая прогнозирует непрерывное количество. Вы узнаете о фундаментальных концепциях регрессии и примените их для решения реальных задач.

Введение в регрессию

Применение регрессии

Импорт данных для обучения с учителем

100

Изучение данных о странах

Основы линейной регрессии

Обучение и прогнозирование в регрессии

100

Обучающие и тестовые данные

100

Кросс-валидация

5-кратная кросс-валидация

100

k-кратное сравнение

100

Регуляризованная регрессия

3. Оптимизация модели

После обучения модели ваша следующая задача – оценить ее эффективность. В этой части вы узнаете о метриках, которые помогут вам оценить работу вашей модели. Вы научитесь оптимизировать модели классификации и регрессии.

Насколько хороша модель?

Метрики для классификации

100

Логистическая регрессия и ROC-кривая

Построение модели логистической регрессии

100

Построение ROC-кривой

100

Кривая Precision-recall

Площадь под ROC-кривой (AUC)

Вычисление AUC

100

Настройка гиперпараметров

Настройка гиперпараметров: GridSearchCV

100

Настройка гиперпараметров: RandomizedSearchCV

100

Итоговая оценка модели

Контроль на отложенных данных

Контроль на отложенных данных: Классификация

100

Контроль на отложенных данных: Регрессия

100

4. Предварительная обработка и пайплайны

В этой части вы узнаете о пайплайнах и о том, как scikit-learn позволяет объединять трансформаторы и оценщики в цепочки и использовать их как единое целое. Будут представлены методы предварительной обработки как способ повышения производительности модели, а пайплайны свяжут воедино понятия из предыдущих глав.

Предварительная обработка данных

Изучение категориальных признаков

100

Создание фиктивных переменных

100

Регрессия с категориальными признаками

100

Обработка отсутствующих данных

Удаление отсутствующих данных

100

Нормализация данных

Центрирование и масштабирование данных