ПОИСК
Быстрый заказ
ОЦЕНКА КУРСАобщая оценка курса:оценка преподавателя: Хочу скидку |
Этот курс продолжительностью 24 ак.часа проходит
в дистанционном формате по будним дням (6 дней) с 10:00 до 13:00 Курс «Аналитика больших данных для менеджеров» построен таким образом, чтобы всего за 24 ак. часа даже самый занятой руководитель мог эффективно освоить теорию и практику современных технологий Big Data в контексте их бизнес-применения. Обучение включает все необходимые знания для успешного участия в проектах по анализу больших данных. Программа обучения содержит информацию о фазах жизненного цикла аналитических процессов при цифровизации бизнеса и переходе к использованию Big Data. Вы узнаете базовые и расширенные методы аналитики, в т.ч. техники поиска и извлечения знаний из больших массивов разнородных данных. Также рассматриваются различные версии дистрибутивов платформы Hadoop, облачные сервисы для хранения и аналитики больших данных, «opensource» и коммерческие инструменты. Подробно изучаются сценарии применения технологий работы с Большими Данными в организациях государственного сектора и различных отраслях бизнеса: банки и финансовые учреждения, промышленность, торговля, транспорт и др. На сквозных примерах вы узнаете все особенности процессов инициации проектов цифровой трансформации, от сбора данных до формирования команды. Также детально познакомитесь с каждой фазой жизненного цикла работы с Big Data: подготовка данных, выбор модели, пилотное развертывание и тестирование прототипа, промышленная эксплуатация. В нашем курсе вы получите ответы на актуальные вопросы работы с персональными данными и обеспечения безопасности при работе с Big Data. Материалы содержат много реальных примеров (use cases) монетизации больших данных в российском и мировом бизнесе. Особое внимание уделено условиям импортозамещения, а также возможным сложностям и специфике использования при работе с большими данными для различных секторов экономики в России.
Выберите форму обучения,
чтобы увидеть актуальные даты:
РАСПИСАНИЕ ЗАНЯТИЙ
|
После изучения курса вы сможете
- разрабатывать стратегии цифровой трансформации организаций на основе больших данных;
- разрабатывать бизнес-кейсы для проектов анализа больших даннных;
- эффективно применять фрэймворки управления проектами анализа больших данных;
- разбираться в основных понятиях Больших Данных, Машинного обучения (Machine Learning), Искусственного интеллекта (Artificial Intelligence);
- понимать назначение компонентов экосистемы Hadoop, Spark, Kafka и терминов Data Lake, Delta Lake;
- знать, в чем отличие Apache Hadoop, NoSQL, MPP или Greenplum,
- выявить нюансы облачных решений, контейнеризации и применимости к своей отрасли бизнеса;
- знать, что такое политики Data Governance;
- знать особенности применения методологий для реализации процессов аналитики больших данных на примере CRISP-DM.
Содержание курса
Тема 1. Введение в Big Data (Большие данные)
Тема 2. Правовые аспекты организации защиты персональных данных
Тема 3. Понимание Бизнеса (Business Understanding)
Тема 4. Понимание данных (Data Understanding)
Тема 5. Подготовка данных (Data Preparation)
Тема 6. Выбор и построение моделей (Modeling)
Тема 7. Построение команды Data Science
Тема 8. Оценка результатов (Evaluation)
Тема 9. Развертывание (Deployment)
Тема 10. Экономическая оценка проекта
Тема 11. Цифровая трансформация организации
- Большие данные и цифровизация бизнеса.
- Характеристики data-driven организации. Data-driven и data-informed организации: основные отличия.
- Принятие data-driven решений и путь к ценности данных.
- Базовые принципы и отличия от классических подходов к работе с данными.
- Сравнительный анализ фрэймворков управления проектами анализа больших данных CRISP DM, Domino, TDSP, SEMMA, Enterprise Big Data Framework.
- Отраслевая специфика аналитики больших данных. Общий разбор отраслевых сценариев (cases).
- Тенденции в подходах Big Data и что актуально на сегодняшний день.
- Технологии Big Data в условиях импортозамещения.
Тема 2. Правовые аспекты организации защиты персональных данных
- Правовое регулирование в области защиты персональных данных.
- Права субъекта и обязанности оператора при обработке ПД.
- Нарушители безопасности ПД.
- Государственные регуляторы и их нормативно-правовая документация в области защиты ПД.
- Осуществление проверки соблюдения правил в области защиты ПД и ответственность за их нарушение.
- GDPR.
- Практическое задание.
Тема 3. Понимание Бизнеса (Business Understanding)
- Влияние Big Data на бизнес. Правильные вопросы бизнесу.
- Определение бизнес целей для проекта Big Data.
- Этапы жизненного цикла проекта анализа больших данных, модель DSCPLC.
- Инициация проекта — критические факторы успеха. Основные проблемы.
- Оценка ситуации: риски, ROI, IRR, доступные ресурсы, оценка зрелости компании.
- Приоритизация задач: что делаем, а что - нет.
- Высокоуровневый план проекта.
- Практическое задание.
Тема 4. Понимание данных (Data Understanding)
- Проблемы при работе с большими данными, модель 4V’s.
- Определение источников данных.
- Специфика работы с потоковыми и пакетными данными в Big Data.
- Принципы формирования Data Lake: выбор платформы.
- Первичный сбор и анализ данных: инструментарий и доступные методы.
- Описание данных и сбор метаданных.
- Data management и Data Governance.
- Оценка качества данных Data Quality.
- Основные трудности и проблемы, критические факторы успеха, роли и навыки.
- Разбор сценариев (cases) для фазы Data Understanding.
Тема 5. Подготовка данных (Data Preparation)
- Подготовка данных – подходы Data Science: нормализация, очистка, выборки, enrichment, форматирование данных.
- Подготовка данных – как процесс формирования Data Pipeline.
- Процессы ETL и ELT,
- Зонирование Data Lake и сегментирование данных,
- Назначение и сравнительная характеристика компонент экосистемы Apache Hadoop, NoSQL, DWH, платформ потоковой обработки для хранения и обработки Big Data на примерах (отраслевые сценарии).
- Инструменты оркестрирования и автоматизации (Data Flow).
- И снова о Метаданных: Data Lineage, Data Provenance, Data Governance, …
- Безопасность больших данных.
- Основные трудности и проблемы, критические факторы успеха.
- Специалисты и их компетенции на данной стадии.
- Практическое задание.
Тема 6. Выбор и построение моделей (Modeling)
- Классы аналитических задач и подходы к их решению.
- Обзор техник моделирования.
- Построение моделей и оценка моделей.
- Что нужно для успешного моделирования.
- Инструментарий для решения аналитических задач этапа моделирования.
- Оценка моделей и среда тестирования моделей: технические метрики оценки качества проведенного моделирования.
- А также песочницы, Machine & Deep learning, AI, Нейронные сети и многое другое.
- Основные трудности и проблемы фазы моделирования, критические факторы успеха.
- Облачные платформы для быстрой разработки.
- Место DevOps, MLOps для организации процессов разработки.
- Рассмотрение фазы моделирования на сквозных сценариях (cases): место, участники, взаимодействие с другими фазами и процессами.
Тема 7. Построение команды Data Science
- Таксономия Data Science. Система OSEMN.
- Команда Data Science: специалисты и их компетенции, роли. Таксономия Data Science. Система OSEMN.
- Техники найма команды Data Science. Удержание и развитие талантов в команде Data Science.
- Практическое задание.
Тема 8. Оценка результатов (Evaluation)
- Бизнес-метрики оценки качества моделирования.
- Отличие Data-driven метрик от традиционных.
- Операционные метрики. Vaniti метрики. Фрэймворк AARRR.
- Оценка качества моделирования.
- Что делать, если все плохо? – возвращаемся на предыдущие фазы.
- Рассматриваем данную стадию в рамках наших сценариев (cases).
- Отличия среды разработки и эксплуатации.
- Особенности этапа оценки.
Тема 9. Развертывание (Deployment)
- Планирование развертывания модели.
- Мониторинг и обслуживание модели.
- Методологии автоматизации и вывода продуктов в промышленную эксплуатацию – DevOps и MLOps.
- Задачи финального обеспечения фаз жизненного цикла Data Science: цикличность reviews, обновления и вывод из эксплуатации.
- Практическое задание.
Тема 10. Экономическая оценка проекта
- Метрики экономической эффективности проекта
- Принципы разработки бизнес-кейсов для проектов анализа больших данных. Типовые ошибки при разработке бизнес-кейсов. Разбор примеров бизнес-кейсов.
- Защита бизнес-кейсов и бюджета проекта.
Тема 11. Цифровая трансформация организации
- Факторы цифровой трансформации организации.
- Этапы цифровой трансформации. Уровни зрелости организации.
- Как не повторить «ловушки стартапов». Челенджи на пути к цифровой трансформации.
- Критерии оценки зрелости аналитики данных в организации
- Практическое задание.
Слушатели
- руководители и менеджеры государственных предприятий и частных компаний;
- специалисты, желающие узнать об инструментах и методах анализа больших данных.
Предварительная подготовка
Предварительный опыт не требуется.