ПОИСК
Быстрый заказ
ОЦЕНКА КУРСАобщая оценка курса:оценка преподавателя: Хочу скидку |
4-дневный практический курс по администрированию HBase разработан для специалистов, отвечающих за администрирование, настройку и сопровождение кластера Apache HBase.
Практическое обучение администраторов Big Data «Школе Больших Данных» включает теоретический минимум, необходимый для прикладной работы и эффективному администрированию HBase. Подробно рассматриваются проектирования схемы HBase и обеспечения высокой доступности кластера. Особое внимание уделено вопросам интеграции этой NoSQL-СУБД с другими Big Data средствами хранения и обработки больших данных: Apache Pig, Hive, Sqoop, Impala. Анализируются различные форматы файлов Big Data (ORC, Parquet) и параметры их сжатия. Также преподаватель детально объяснит специфику установки, конфигурирования и мониторинга системных служб HBase и Apache Zookeeper, чтобы вы могли эффективно и безопасно управлять своими кластерами в рабочей среде. На практике вы самостоятельно развернете и настроите кластер HBase, проделав все операции установки и конфигурирования, включая безопасную аутентификацию, авторизацию, реплицирование, резервное копирование и восстановление данных. Также обучение HBase в «Школе Больших Данных» поможет вам освоить инструменты мониторинга и эксплуатации кластера для анализа, своевременной диагностики и решения проблем с хранением больших данных.
Выберите форму обучения,
чтобы увидеть актуальные даты:
РАСПИСАНИЕ ЗАНЯТИЙ
|
После изучения курса вы сможете
- понять, что такое Apache HBase;
- научиться устанавливать, настраивать и поддерживать кластера HBase и Zookeeper;
- освоить методы администрирования кластера HBase;
- изучить настройки безопасности для Apache HBase;
- настраивать мониторинг и оптимизацию NoSQL-СУБД с использованием эффективных инструментов администратора Big Data NoSQL кластера;
- интегрировать HBase с другими Big Data компонентами (Apache Pig, Hive, Sqoop, Impala) и внешними системами.
Содержание курса
- Введение в HBase
- Немного о Hadoopи NoSQL. Hive и HBase. NoSQL
- Архитектура HBase. Модель данных HBase: Column family, timestamp, версионность
- Сервисы и операторы HBase. Концепция CRUD: базовые операции с таблицами
- Сценарии использования HBase
- Импорт данных и интеграция с HBase
- Импорт данных с использованием importTSV
- Взаимодействие компонент Hadoopи HBase: HDFS, PIG, Hive, sqoop, Impala
- Хранение файлов в HDFS. Форматы файлов для HDFS: параметры сжатия, ORC, Parquet
- Использование Java API для работы с HBase
- Установка и настройка HBase
- Требования по установке HBase
- Дизайн схемы HBaseдля эффективного хранения данных и HA
- Установка Apache HBase
- Команды и интерфейс командной строки HBase: HBaseAdmin
- Ручная установка кластера HBase. Настройка кластера Zookeeper
- Управление кластером HBase
- Высокая доступность (High Availability) кластера HBase. Настройка Snapshots. Настройка репликации кластера
- Безопасность HBase. Настройка аутентификации и авторизации при доступе к данным в таблицах HBase
- Резервное копирование и восстановление HBase
- Advanced HBase
- Мониторинг Apache HBase. Анализ лог файлов HBase
- Операции обслуживания. Compactions и flushes
- Оптимизация параметров HBase: Hfile, WAL, Memstores, Bloom фильтр
- Диагностика и разрешение проблем (troubleshooting). Мониторинг и оптимизация JVM. Garbage Collection
- Region splitting
Слушатели
Курс ориентирован на специалистов по администрированию и сопровождению кластеров, системных администраторов, архитекторов, разработчиков Big Data систем и DevOps-инженеров.
Предварительная подготовка
- Знание базовых команд Linux(опыт работы с командной строкой, файловой системой , POSIX, текстовыми редакторами vi, nano)
- Начальный опыт работы с Hadoop
- Базовые навыки программирования Java