Spark – Modern Big Data Framework

Де: Київ

Коли: Відкрита дата

Тривалість: 4 години

Глобальний ринок аналізу даних зростає рекордними темпами. Бізнес приділяє все більше уваги збиранню, обробці та аналізу великих даних для прийняття управлінських рішень. Технології Big Data все міцніше входять в наше життя. У цих умовах потреба в спеціалістах Big Data стає все більш актуальною.

Цей воркшоп познайомить вас з останніми технологіями в Big Data: Spark, Hadoop і Cloudera.

ПО ЗАВЕРШЕННІ ВОРКШОПУ ВИ

• Розберетеся з основами Big Data і теорією розподілених обчислень

• Навчитеся створювати додатки для аналізу Big Data на основі Spark framework

• Отримаєте досвід установки, запуску та налагодження додатків Spark у кластері

ДЛЯ КОГО ЦЕЙ ВОРКШОП

Програма орієнтована на фахівців з досвідом розробки в Java, які хочуть відкрити для себе світ Big Data.

ТРИВАЛІСТЬ

Чотири години. По дві години впродовж двох днів.

ПРОГРАМА

Воркшоп включає теоретичний блок і практичні завдання.

Теоретична частина

• Введення у теорію Big Data
• Огляд Spark framework

Практична частина

Завдання 1: Знайомство з середовищем виконання Spark. Ви створите і запустите свій перший додаток на Spark. Він буде основою для розуміння циклу середовища виконання: установка, запуск і відлагодження додатка у кластері.

Завдання 2: Формати даних Spark.
Ви розберетеся з оперуванням даними у Spark, дізнаєтеся, які існують формати для їх подання. Отримаєте досвід, як читати / перетворювати / записувати дані в розподіленому середовищі.

Завдання 3: Створення бізнес звіту.
На цьому занятті учасники самостійно створять бізнес звіт на основі декількох джерел даних.

ВИМОГИ ДО УЧАСНИКІВ

Ноутбук з об’ємом пам’яті мінімум 4GB і встановленим ПЗ: VirtualBox, Cloudera Hadoop QuickStart VM.