Spark – Modern Big Data Framework

Где: Киев

Когда: Открытая дата

Воркшоп «SPARK – MODERN BIG DATA FRAMEWORK»

Глобальный рынок анализа данных растёт рекордными темпами. Бизнес уделяет всё больше внимания сбору, обработке и анализу больших данных для принятия управленческих решений. Технологии Big Data все прочнее входят в нашу жизнь. В этих условиях потребность в специалистах Big Data становится все более актуальной.

Этот воркшоп познакомит вас с последними технологиями в Big Data: Spark, Hadoop и Cloudera.

ПО ЗАВЕРШЕНИИ ВОРКШОПА ВЫ

• Разберетесь с основами Big Data и теорией распределённых вычислений.
• Научитесь создавать приложения для анализа Big Data на основе Spark framework.
• Получите опыт установки, запуска и отладки приложений Spark в кластере.

ДЛЯ КОГО ЭТОТ ВОРКШОП

Программа ориентирована на специалистов с опытом разработки в Java, которые хотят открыть для себя мир Big Data.

ДЛИТЕЛЬНОСТЬ

Четыре часа. По два часа в течение двух дней.

ПРОГРАММА

Воркшоп включает теоретический блок и практические задания.

Теоретическая часть

• Введение в теорию Big Data.
• Обзор Spark framework.

Практическая часть

Задание 1: Знакомство со средой выполнения Spark.
Вы создадите и запустите свое первое приложение на Spark. Оно будет основой для понимания цикла среды выполнения: установка, запуск и отладка приложения в кластере.

Задание 2: Форматы данных Spark.
Вы разберетесь как оперировать данными в Spark, узнаете какие существуют форматы для их представления. Получите опыт, как читать /преобразовывать /записывать данные в распределенной среде.

Задание 3: Создание бизнес отчета.
На этом занятии участники самостоятельно создадут бизнес отчет на основе нескольких источников данных.

ТРЕБОВАНИЯ К УЧАСТНИКАМ

Ноутбук с объемом памяти минимум 4GB и установленным ПО: VirtualBox, Cloudera Hadoop QuickStart VM.