Сегментация потребителей в Python
Наиболее успешными компаниями на сегодняшний день являются те, которые достаточно хорошо знают своих потребителей, чтобы прогнозировать их потребности. Аналитики данных играют ключевую роль в раскрытии этих подробных сведений и сегментации потребителей, чтобы более эффективно предоставлять им услуги.

Преподаватель
Михаил Омельченко
Программист с многолетним опытом. Пишу на Python, Javascript, Typescript и руковожу командами разработчиков. Основатель youtube канал Django School. Стал ментором для десятков учеников и разработал платформу colabteam.dev
5часов
17видео
38упражнений
4700опыта
Описание курсаВ рамках данного курса вы изучите реальные методы сегментации клиентов и поведенческой аналитики, используя датасет, содержащий анонимизированные транзакции клиентов интернет-магазина. В первую очередь будет проведен когортный анализ, позволяющий понять тенденции покупательской активности. Затем научитесь строить легко интерпретируемые сегменты потребителей. Помимо этого, созданные сегменты будут подготовлены к машинному обучению. В заключение с помощью кластеризации k-means при помощи нескольких строк кода улучшите свои сегменты! К концу курса с помощью практических методов анализа поведения потребителей и сегментации рынка сможете применять их на практике.
1. Когортный анализ
В первой главе изучим когорты и методы их анализа. В результате исследования создадим собственные когорты потребителей, получим некоторые метрики и визуализируем результаты.
Введение в когортный анализ
50
Сколько привлеченных потребителей?
100
Когортный анализ
50
Определение когорты ежедневных покупок
100
Расчет коэффициента смещения времени по дням (1)
100
Расчет коэффициента смещения времени по дням (2)
100
Когортные метрики
100
Удержание потребителей
100
Расчет коэффициента удержания потребителей с нуля
100
Расчет средней стоимости
100
Визуализация когортного анализа
50
Визуализация средних количественных метрик
100
2. Анализ давности, частоты и денежной стоимости
Во второй главе рассмотрим потребительские сегменты. В частности, подробно разберем такие понятия, как давность, частота и денежная стоимость. Создадим сегменты потребителей на основе этих понятий и проанализируем полученные результаты.Сегментация давности, частоты, денег (RFM)
50
Вычисление квартилей расходов (q=4)
100
Расчет децилей давности (q=4)
100
Расчет метрик RFM
50
Наибольшее значение частоты
100
Вычисление значений RFM
100
Построение сегментов RFM
50
Расчет 3 групп для давности и частоты
100
Расчет баллов RFM
100
Анализ таблицы RFM
50
Определение среднего для сегмента RFM баллов
100
Создание потребительских сегментов
100
Анализ потребительских сегментов
100
3. Предварительная обработка данных для кластеризации
После создания некоторых сегментов необходимо сделать прогноз. Но прежде требуется освоить практические методы подготовки данных, чтобы алгоритм кластеризации k-means выявил хорошо разделенные, рациональные сегменты.Предварительная обработка данных
50
Допущения k-means
100
Вычисление статистики переменных
100
Управление перекошенными переменными
50
Выявление перекошенных переменных
100
Управление перекосами
100
Центрирование и масштабирование данных
50
Центрирование и масштабирование вручную
100
Центрирование и масштабирование с помощью функции StandardScaler()
100
Пайплайн предварительной обработки
50
Визуализация распределений RFM
100
Предварительная обработка данных RFM
100
Визуализация нормированных переменных
100
4. Сегментация потребителей с помощью K-means
В заключительной главе необходимо использовать данные, предварительно обработанные в третьей главе, для определения кластеров потребителей на основе их давности, частоты и денежной стоимости.Применение кластеризации k-means на практике
50
Метод k-means
100
Присвоение меток исходным данным
100
Расчет количества кластеров
50
Расчет суммы квадратов ошибок
100
Построение графика суммы квадратов ошибок
100
Составление профиля и интерпретация сегментов
50
Подготовка данных для построения змеиного графика
100
Визуализация змеиного графика
100
Расчет относительной значимости каждого атрибута
100
Создание тепловой карты относительной значимости
100
Решение для сквозной аналитики сегментов
50
Предварительная обработка данных
100
Расчет и построение графика суммы квадратов ошибок
100
Построение 4-кластерного алгоритма
100
Анализ сегментов
100
Подведение итогов
50