Анализ данных с помощью pandas
В ходе этапов прохождения курса вы получите опыт по очистке неупорядоченных данных, созданию визуализаций, объединению и изменению датасетов, а также в обработке данных временных рядов.

Преподаватель
Залина Озова
Более 3 лет преподаю информатику и математику. Обучаю студентов основам программирования. Реализую программы углубленного изучения предмета.
4часа
16видео
34упражнения
4100опыта
Описание курсаНа данный момент вы уже знакомы с основами библиотеки pandas. Этот курс даст вам возможность применить эти знания на примере реальных датасетов! Вы изучите датасеты вымышленного Исследовательского института города Программинск и проанализируете поведение полицейских, по отношению к людям с учетом гендерного признака. В ходе этапов прохождения курса вы получите больше практики по очистке неупорядоченных данных, созданию визуализаций, объединению и изменению датасетов, а также в обработке данных временных рядов. Курс "Анализ данных с помощью pandas" даст вам ценный опыт анализа датасетов от начала до конца и подготовит вас к карьере в области науки о данных!
1. Подготовка данных для анализа
Перед началом анализа очень важно сначала изучить и очистить датасеты, чтобы сделать работу с ними более эффективной. В этой главе вы получите навыки в исправлении типов данных, обработке пропущенных значений, удалении столбцов и строк, на примере датасета Исследовательского института города Программинск.Датасет Исследовательского института города Программинск
50
Изучение датасетов
100
Удаление столбцов
100
Удаление строк
100
Использование соответствующих типов данных
50
Нахождение несоответствующего типа данных
50
Фиксирование типа данных
100
Создание DatetimeIndex
50
Объединение столбцов объекта
100
Настройка индекса
100
2. Изучение взаимосвязи между гендерной принадлежностью и полицейской деятельностью
Влияет ли пол водителя на поведение полиции во время остановки? В этой главе вы получите ответ на этот вопрос, используя методы фильтрации, группировки, чейнинга, булевой математики, строковые методы и многое другое!Анализ остановок автомобилей
50
Изучение нарушений правил дорожного движения
100
Сравнение нарушений по гендерному признаку
100
Влияние пола на превышение скорости
50
Фильтрация по нескольким условиям
50
Сравнение результатов превышения скорости в зависимости от пола водителя
100
Влияние пола на задержание водителя
50
Расчет коэффициента досмотра
100
Сравнение показателей поиска по гендерному признаку
100
Добавление второго фактора в анализ
100
Влияние пола на досмотр автомобиля
50
Подсчет личных досмотров
100
Сравнение рейтинга досмотра по половому признаку
100
3. Визуальный разведочный анализ данных
Насколько вероятно то, что вас арестуют в определенное время суток? Растет ли число остановок, связанных с наркотиками? В этой главе вы ответите на эти и другие вопросы, анализируя датасеты визуально. Т.к. исходные данные сложно понять, для визуализации мы будем использовать графики.Влияние времени суток на задержания
50
Расчет арестов в зависимости от времени суток
100
Построение графика арестов в зависимости от времени суток
100
Метод ресемплинг
50
Остановки, связанные с наркотиками
100
Сравнение показателей по наркотикам и досмотрам
100
Создаем столбчатые диаграммы
50
Подсчет нарушений по зонам
100
Распределение нарушений по районам
100
Сортировка данных
50
Конвертация времени задержания в числа
100
Построение графика продолжительности остановки
100
4. Анализ влияния погодных условий на работу полиции
В этой главе вы будете использовать второй датасет, чтобы изучить влияние погодных условий на поведение полиции во время остановок на дорогах. Вы будете практиковаться в объединении и переформировании датасетов, оценке достоверности источника данных, работе с категориальными данными и других дополнительных навыках.Изучение датасета погоды
50
Построение графика температуры
100
Построение графика разности температур
100
Подготовка датасета к анализу
50
Расчет плохих погодных условий
100
Оценка погодных условий
100
Изменение типа данных на категорию
100
Объединение датасетов
50
Подготовка DataFrames
100
Объединение DataFrames
100
Влияние погоды на задержания
50
Сравнение количества задержаний в зависимости от погодного рейтинга
100
Выбор из мультииндексных Series
100
Изменение данных об уровне арестов
100
Заключение
50