Ничего не найдено

Машинное обучение без учителя

Вы узнаете, как обнаружить основные группы (или "кластеры") в наборе данных.

Залина Озова
Преподаватель

Залина Озова

Более 3 лет преподаю информатику и математику. Обучаю студентов основам программирования. Реализую программы углубленного изучения предмета.

4часа
13видео
37упражнений
3950опыта
Описание курсаВ этом курсе вы узнаете о двух методах обучения без учителя для визуализации данных.
1.  Кластеризация данных
Вы узнаете, как обнаружить основные группы (или "кластеры") в наборе данных. К концу этой части вы будете составлять кластеры компаний по их биржевым ценам и составлять кластеры различные видов животных по их размерам.

2.  Визуализация иерархической кластеризации. Метод t-SNE
В этой части вы узнаете о двух методах обучения без учителя для визуализации данных – иерархической кластеризации и t-SNE. Иерархическая кластеризация объединяет образцы данных во все более крупные кластеры, создавая древовидную визуализацию иерархии кластеров. t-SNE представляет образцы данных в двухмерном пространстве, чтобы можно было визуализировать расстояние между образцами.

3.  Декорреляция данных и уменьшение размерности
Снижение размерности позволяет обобщить набор данных, используя общие закономерности. В этой части вы познакомитесь с наиболее фундаментальным методом сокращения размерности – "Principal Component Analysis" ("PCA"). PCA часто используется перед контролируемым обучением для улучшения производительности и обобщения модели. Он также может быть полезен для обучения без учителя. Например, вы будете использовать РСА, который позволит вам кластеризовать статьи Википедии по их содержанию!

4.   Обнаружение интерпретируемых признаков
В этой части вы узнаете о технике уменьшения размерности под названием "Неотрицательная матричная факторизация" ("NMF"), которая выражает выборки как комбинации интерпретируемых частей. Например, документы выражаются в виде комбинаций тем, а изображения – в виде часто встречающихся визуальных паттернов. Вы также научитесь использовать NMF для создания рекомендательных систем, которые смогут находить для вас похожие статьи для чтения или музыкальных исполнителей, соответствующих вашей истории прослушивания!

ООО «Дипскиллс»
г. Москва, ул. Измайловский Вал, д. 2
© DeepSkills, 2023