ПОИСК
Быстрый заказ
ОЦЕНКА КУРСАобщая оценка курса:оценка преподавателя: Хочу скидку |
1-дневный практический курс по Cloudera Impala разработан для специалистов, инженеров данных и аналитиков, работающих с Cloudera Impala.
Практический курс для администраторов и аналитиков, использующих компонент Cloudera Impala. Рассматриваются методы доступа к данным с использованием синтаксиса SQL для выполнения OLAP-запросов в распределенной среде в режиме near-realtime, загрузка и выгрузка данных с использованием метаданных в Hive Metastore. Сценарии интеграции Cloudera Impala c Hive, Hbase, особенности исполнения запросов и JOIN операций. Практические занятия выполняются в AWS и локальной кластерной системе с использованием дистрибутивов Cloudera Hadoop.
РАСПИСАНИЕ ЗАНЯТИЙ
|
Содержание курса
1. Введение в Cloudera Impala
- Введение в Cloudera Impala: архитектура и компоненты.
- Impala синтаксис, типы данных, написание запросов, загрузка данных, использование Hive Metastore.
- Лабораторная работа.
- Загрузка данных в таблицы Запросы через HBase.
- Оптимизации производительности с использование Partition, Buckets.
- Форматы файлов для Cloudera Impala (Parquet, ORC).
- Сравнение JOIN операций для исполнения инструментами экосистемы Hadoop.
- Map JOIN. Comon JOIN. Skewed JOIN. Collocated JOIN.
- Оптимизация запросов.
Слушатели
Специалисты SQL, имеющие и желающие применить опыт работы с реляционными базами данных для организации хранения, настройки импорта и экспорта данных с использованием Cloudera Impala в кластере Hadoop.
Предварительная подготовка
- Опыт работы в Unix
- Опыт написания запросов SQL
- Знание основ Hadoop