Импорт данных в Python. Введение
Данный курс расскажет вам о различных способах импорта данных в Python.
Преподаватель
Дарья Иконникова
Опыт разработки на Python, JavaScript, React, Node.js, MySQL
3часа
15видео
39упражнений
4150опыта
Описание курсаКак специалисту по работе с данными, вам нужно будет очищать, обрабатывать и визуализировать их, а также строить и интерпретировать прогностические модели. Прежде чем вы начнете делать это, необходимо узнать, как импортировать данные в Python, и данный курс расскажет вам о различных способах:
текстовые файлы (.txt и .csv);
электронные таблицы Excel;
файлы Stata, SAS и MATLAB;
реляционные базы данных (SQLite и PostgreSQL).
1. Введение в импорт текстовых файлов
В этой главе вы узнаете, как импортировать данные в Python из всех типов текстовых файлов – простой и распространенной формой хранения данных. Ранее вы уже научились использовать NumPy и pandas. Теперь мы расскажем, как использовать эти пакеты для импорта текстовых файлов и настройки импорта.Импорт обычных текстовых файлов
50
Изучаем рабочий каталог
50
Импорт целого текстового файла
100
Импорт обычных текстовых файлов построчно
100
Импорт текстовых файлов
50
Пример текстовых файлов
50
Что является текстовым файлом?
50
Почему нам нравятся текстовые файлы и дзен Python
50
Импорт текстовых файлов с помощью NumPy
50
Использование NumPy для импорта текстовых файлов
100
Настройка импорта NumPy
100
Импорт различных типов данных
100
Работа со смешанными типами данных (1)
50
Работа со смешанными типами данных (2)
100
Импорт текстовых файлов с помощью pandas
50
Импорт текстовых файлов как DataFrame с помощью pandas (1)
100
Импорт текстовых файлов как DataFrame с помощью pandas (2)
100
Настройка импорта данных в pandas
100
Подведем итоги
50
2. Импорт данных из других типов файлов
Вы узнали, как импортировать обычный текст, но существуют другие типы файлов, с которыми вам потенциально придется работать в качестве специалиста по анализу данных. В этой главе мы покажем, как импортировать данные в Python из широкого спектра важных типов файлов. К ним относятся pickle-файлы, электронные таблицы Excel, файлы SAS, Stata, MATLAB и HDF5 (тип файла для хранения большого количества числовых данных). Введение в другие типы файлов
50
Не текстовый файл
50
Загрузка файлов pickle
100
Перечисление листов в файлах Excel
100
Импорт листов из файлов Excel
100
Настройка импорта электронных таблиц
100
Импорт файлов SAS/Stata с помощью pandas
50
Импорт SAS7BDAT
50
Импорт SAS файлов
100
Метод read_stata для импорта файлов Stata
50
Импорт файлов Stata
100
Импорт файлов HDF5
50
Метод File() для импорта файлов HDF5
50
Использование h5py для импорта файлов HDF5
100
Извлечение данных из файла HDF5
100
Импорт файлов MATLAB
50
Загрузка файлов с расширением .mat
100
Структура файлов с расширением .mat в Python
100
3. Реляционные базы данных в Python
Эта глава научит вас, как извлекать значимые данные из реляционных баз данных, что является необходимым навыком для любого специалиста в области Data Science. Вы узнаете о реляционных моделях, о том, как создавать SQL-запросы, фильтровать и упорядочивать записи SQL, а также как выполнять расширенные запросы путем объединения таблиц баз данных.
Введение в реляционные базы данных
50
Реляционная модель
50
Создание механизма баз данных в Python
50
Создание механизма баз данных в Python
100
Какие таблицы есть в базе данных?
100
Запрос к реляционным базам данных в Python
50
Первый SQL запрос
100
Настройка первых запросов SQL
100
Фильтрация записей с помощью WHERE в SQL
100
Упорядочивание записей SQL с помощью ORDER BY
100
Запрос к реляционным базам данных с помощью pandas
50
Pandas и первый SQL запрос
100
Pandas для выполнения более сложных запросов
100
Расширенные запросы: использование связей между таблицами
50
Сила SQL в отношениях между таблицами: INNER JOIN
100
Фильтрация INNER JOIN
100
Заключение
50