Сегментация потребителей в Python

Наиболее успешными компаниями на сегодняшний день являются те, которые достаточно хорошо знают своих потребителей, чтобы прогнозировать их потребности. Аналитики данных играют ключевую роль в раскрытии этих подробных сведений и сегментации потребителей, чтобы более эффективно предоставлять им услуги.

Преподаватель

Михаил Омельченко

Программист с многолетним опытом. Пишу на Python, Javascript, Typescript и руковожу командами разработчиков. Основатель youtube канал Django School. Стал ментором для десятков учеников и разработал платформу colabteam.dev

5часов

17видео

38упражнений

4700опыта

Описание курсаВ рамках данного курса вы изучите реальные методы сегментации клиентов и поведенческой аналитики, используя датасет, содержащий анонимизированные транзакции клиентов интернет-магазина. В первую очередь будет проведен когортный анализ, позволяющий понять тенденции покупательской активности. Затем научитесь строить легко интерпретируемые сегменты потребителей. Помимо этого, созданные сегменты будут подготовлены к машинному обучению. В заключение с помощью кластеризации k-means при помощи нескольких строк кода улучшите свои сегменты! К концу курса с помощью практических методов анализа поведения потребителей и сегментации рынка сможете применять их на практике.

1. Когортный анализ

В первой главе изучим когорты и методы их анализа. В результате исследования создадим собственные когорты потребителей, получим некоторые метрики и визуализируем результаты.

Введение в когортный анализ

Сколько привлеченных потребителей?

100

Когортный анализ

Определение когорты ежедневных покупок

100

Расчет коэффициента смещения времени по дням (1)

100

Расчет коэффициента смещения времени по дням (2)

100

Когортные метрики

100

Удержание потребителей

100

Расчет коэффициента удержания потребителей с нуля

100

Расчет средней стоимости

100

Визуализация когортного анализа

Визуализация средних количественных метрик

100

2. Анализ давности, частоты и денежной стоимости

Во второй главе рассмотрим потребительские сегменты. В частности, подробно разберем такие понятия, как давность, частота и денежная стоимость. Создадим сегменты потребителей на основе этих понятий и проанализируем полученные результаты.

Сегментация давности, частоты, денег (RFM)

Вычисление квартилей расходов (q=4)

100

Расчет децилей давности (q=4)

100

Расчет метрик RFM

Наибольшее значение частоты

100

Вычисление значений RFM

100

Построение сегментов RFM

Расчет 3 групп для давности и частоты

Определение среднего для сегмента RFM баллов

100

Создание потребительских сегментов

100

Анализ потребительских сегментов

100

3. Предварительная обработка данных для кластеризации

После создания некоторых сегментов необходимо сделать прогноз. Но прежде требуется освоить практические методы подготовки данных, чтобы алгоритм кластеризации k-means выявил хорошо разделенные, рациональные сегменты.

Предварительная обработка данных

Допущения k-means

100

Вычисление статистики переменных

100

Управление перекошенными переменными

Выявление перекошенных переменных

100

Управление перекосами

100

Центрирование и масштабирование данных

Центрирование и масштабирование вручную

100

Центрирование и масштабирование с помощью функции StandardScaler()

100

Пайплайн предварительной обработки

Визуализация распределений RFM

100

Предварительная обработка данных RFM

100

Визуализация нормированных переменных

100

4. Сегментация потребителей с помощью K-means

В заключительной главе необходимо использовать данные, предварительно обработанные в третьей главе, для определения кластеров потребителей на основе их давности, частоты и денежной стоимости.

Применение кластеризации k-means на практике

Метод k-means

100

Присвоение меток исходным данным

100

Расчет количества кластеров

Расчет суммы квадратов ошибок

100

Построение графика суммы квадратов ошибок

100

Составление профиля и интерпретация сегментов

Подготовка данных для построения змеиного графика