Объединение данных с помощью pandas
В этом курсе Вы научитесь необходимым навыкам по объединению данных в pandas.

Преподаватель
Иван Алтов
Преподаватель в ФМШ с 13 летним стажем \ Опыт программирования на C++, Java, Python
4часа
15видео
37упражнений
4000опыта
Описание курсаУмение объединять и работать с несколькими датасетами – важный навык для любого начинающего специалиста Data Science. pandas является важнейшим фундаментом экосистемы Python Data Science, а Stack Overflow зафиксировал более 5 миллионов просмотров вопросов по pandas. С помощью этой библиотеки Вы научитесь работать с несколькими DataFrame: объединять, упорядочивать, соединять и изменять их форму. В этом курсе Вы будете работать с интересными наборами данных банка и города Программинск. Вы закончите курс, обладая необходимыми навыками по объединению данных в pandas.
1. Основы соединения данных
Вы узнаете, как можно объединить различные данные при помощи метода inner. Объединив информацию из нескольких файлов, Вы откроете для себя интересные факты, которые ранее могли быть скрыты. Кроме того, Вы узнаете, как полученные данные могут повлиять на результат.
INNER JOIN
50
Выбор столбца для соединения
50
Ваш первый INNER JOIN
100
INNER JOIN и количество возвращаемых строк
100
Отношение "один ко многим"
50
Классификация отношения "один ко многим"
50
Слияние отношения "один ко многим"
100
Соединение нескольких DataFrame
50
Соединение трех таблиц (1)
100
Соединение трех таблиц (2)
100
Слияние "один ко многим" с несколькими таблицами
100
2. Объединение таблиц с разными типами объединений
Во второй главе Вы перейдете на новый уровень своих знаний об объединениях. Вы будете работать с данными фильмов, и узнаете о таких методах объединения, как left, right, и outer. Вы также узнаете, как соединить таблицу саму с собой и по индексу DataFrame.LEFT JOIN
50
Подсчет отсутствующих строк с LEFT JOIN
100
Дополнение набора данных
100
Подсчет строк с LEFT JOIN
50
RIGHT JOIN и OUTER JOIN
50
Поиск уникальных значений с RIGHT JOIN
100
Поиск популярных жанров с RIGHT JOIN
100
Использование OUTER JOIN для выбора данных
100
Соединение таблицы с собой
50
SELF JOIN
100
Как pandas обрабатывает SELF JOIN?
50
Соединение по индексам
50
Соединение индексов для оценки фильмов
100
Приносят ли фильмы с продолжением больший доход?
100
3. Продвинутое объединение и конкатенация
В этой главе вы воспользуетесь мощными методами фильтрации, включая полу-объединение и анти-объединение. Вы также узнаете, как соединять DataFrame путем вертикального объединения и использования функции pandas.concat для создания новых датасетов. Кроме того, поскольку данные редко бывают чистыми, Вы также узнаете, как проверить ваши новые объединенные структуры данных.
4. Объединение упорядоченных данных и данных временных рядов
В последней главе вы перейдете на новый уровень. С помощью специализированных методов pandas Вы научитесь объединять временные ряды и упорядоченные данные с реальными финансовыми и экономическими показателями. Вы также узнаете, как составлять запросы к полученным таблицам, используя формат в стиле SQL, и выполнять развертывание данных с помощью метода melt.Использование merge_ordered()
50
Соотношения между ВВП и S&P500
100
Строим график с использованием функции merge_ordered()
100
Соединение данных с использованием merge_ordered()
100
Использование merge_asof()
50
Использование merge_asof() для изучения данных
100
Использование merge_asof() для создания DataFrame
100
Различия merge_asof() и merge_ordered()
50
Выборка данных с помощью .query()
50
Изучение финансовых показателей с помощью .query()
50
Выборка строк с помощью .query()
100
Изменение структуры данных с помощью .melt()
50
Выберите аргументы right .melt()
50
Использование .melt() для изменения структуры данных
100
Использование .melt() для сравнения показателей
100
Итоги изучения курса
50