Ничего не найдено

ML на практике: исследование Бюджета школы

В этом курсе вы начнете с построения базовой модели, которая представляет собой простой подход "первого прохода".

Залина Озова
Преподаватель

Залина Озова

Более 3 лет преподаю информатику и математику. Обучаю студентов основам программирования. Реализую программы углубленного изучения предмета.

4часа
15видео
36упражнений
3850опыта
Описание курсаНаука о данных нужна не только для прогнозирования рекламных кликов – она также полезна для социального воздействия. Этот курс представляет собой пример по машинному. Вы изучите проблему, связанную с составлением бюджета школы города Программинск. Построив модель для автоматической классификации статей школьного бюджета, школы смогут легче и быстрее сравнивать свои расходы с другими школами. В этом курсе вы начнете с построения базовой модели, которая представляет собой простой подход "первого прохода". В частности, вы выполните обработку естественного языка для подготовки бюджетов к моделированию. Далее у вас будет возможность попробовать свои собственные методы и посмотреть, как они работают. Наконец, вы увидите, как объединить несколько методов для построения наиболее точной модели.
1.  Изучение исходных данных
В этой главе вы познакомитесь с проблемой, которую будете решать в этом курсе. Разберете как классифицировать статьи школьного бюджета на основании того, на что используются эти деньги. Изучите необработанные текстовые и числовые значения в наборе данных, как количественно, так и визуально. И вы узнаете, как измерить успех при попытке предсказать метки классов для каждой строки набора данных.

2.  Создание первой простой модели
В этой главе вы построите модель первого прохода. Для обучения модели вы будете использовать только числовые данные. Но помните, что выбрасывать все текстовые данные плохо для производительности. Вы узнаете, как форматировать свои предсказания. Познакомитесь с обработкой естественного языка – NLP, чтобы начать работать с большим количеством текста в данных.

3.  Улучшение модели
Здесь вы улучшите свою модель с помощью конвейеров. Поскольку бюджет состоит как из текстовых, так и из числовых данных, вы научитесь создавать конвейеры, обрабатывающие несколько типов данных. Вы также узнаете, как гибкость конвейерного процесса делает эффективным тестирование различных подходов даже в таких сложных задачах, как эта.

ООО «Дипскиллс»
г. Москва, ул. Измайловский Вал, д. 2
© DeepSkills, 2023