ПОИСК
Быстрый заказ
ОЦЕНКА КУРСАобщая оценка курса:оценка преподавателя: Хочу скидку |
В современной корпоративной среде продолжает ускоряться рост объема накопленных структурированных и неструктурированных данных, называемых Big Data. Но данные содержат в себе значительно больше значимой информации, чем может обнаружить аналитик. Выявление и подтверждение скрытых закономерностей решают методы машинного обучения.
Владение методами и инструментарием машинного обучения расширяют аналитику аппарат работы с данными. Учебный курс «Основы машинного обучения» позволяет за короткое время ознакомиться с жизненным циклом задач машинного обучения, с методиками и практическими приемами решения. Курс построен как непрерывный практикум по решению прикладных задач, таких как прогнозирование прибыли и оттока клиентов, анализ тональности текста, выявление схожих групп клиентов на реальных данных и прочие. Особое внимание уделено подходам обработки текстовых признаков с учетом особенностей русского языка. При выполнении практических заданий курса (на них отводится 70% времени) участники применяют обсуждаемые приемы и наблюдают как они изменяют показатели качества построенных моделей. Участники курса научатся решать задачи машинного обучения с помощью самых популярных открытых библиотек машинного обучения, в том числе от Google и Yandex. После окончания курса в личном кабинете будут доступны все примеры решения задач, с возможностью получения обновлений и консультации в дальнейшем.
РАСПИСАНИЕ ЗАНЯТИЙ
|
После изучения курса вы сможете
- определять типы прикладных задач, решаемые машинным обучением;
- понимать терминологию и жизненный цикла машинного обучения от отбора признаков до подбора модели и оценки качества;
- овладеть практическими приемами и рекомендациями по обработке признаков (в том числе русскоязычных текстов), по поиску структур, по улучшению качества моделей, по борьбе с переобучением;
- получить опыт практического применения библиотек машинного обучения и средств визуализации данных: SkLearn, Yandex CatBoost, XGBoost, Google Tensorboard и др.
Содержание курса
1. Обзор задач машинного обучения
- Введение в машинное обучение
- Задачи, решаемые машинным обучением
- Виды машинного обучения
- Жизненных цикл машинного обучения
- Язык программирования python, библиотеки обработки данных
- iPython и jupyter notebook
- Визуализация данных
- Обзор популярных библиотек машинного обучения
- Математические методы
- Первичный анализ и обработка данных
- Отбор признаков
- Понижение размерности
- Обработка текстовых признаков
- Деревья решений и метод ближайших соседей
- Композиции моделей (случайный лес)
- Линейные модели классификации и регрессии
- Градиентный бустинг
- Практика применения библиотек SkLearn, Yandex CatBoost, XGBoost
- Метрики качества
- Борьба с переобучением
- Оценка достаточности обучающей выборки
- Множественная проверка гипотез
- Обучение на огромных массивах данных
- Применение машинного обучения в изменчивой среде (в нестабильном окружении)
- Обзор методов кластеризации
- Метод главных компонент
- Поиск аномалий
- Тематическое моделирование
- Визуализация в многомерном пространстве с помощью инструмента TensorBoard
- Введение в нейронные сети
- Метод обратного распространения ошибки
- Практика применения нейронных сетей
Слушатели
- линейные менеджеры и менеджеры проектов,
- бизнес-аналитики,
- а также все, кто хочет овладеть подходами машинного обучения.
Предварительная подготовка
Для прохождения курса не требуется обладать глубокими знаниями в области математики или программирования. Материалы максимально наглядны. Основной акцент сделан на практику применения. Для продвинутых участников курса разработаны дополнительные практики.