The Hadoop Ecosystem

Deskripsi

Dalam pelatihan ini Anda akan belajar Big Data menggunakan Hadoop Ecosystem. Mengapa Hadoop? Ini adalah salah satu keterampilan yang paling dicari di industri TI.

Anda akan belajar cara menggunakan perangkat lunak paling populer di industri Big Data saat ini, menggunakan pemrosesan batch serta pemrosesan realtime. Training Big Data ini akan memberi Anda latar belakang yang cukup untuk dapat berbicara tentang masalah nyata dan solusi dengan para pakar di industri ini.

Pelatihan Big Data ini berisi simulasi langsung yang dapat Anda coba di komputer Anda sendiri. Untuk menjalankan cluster Hadoop di mesin Anda sendiri, Anda harus menjalankan server virtual, dengan RAM 8 GB atau lebih.

Tujuan

Setelah mengikuti pelatihan ini peserta akan menguasai :

  • Memproses Big Data menggunakan batch
  • Memproses Big Data menggunakan data waktu riil time
  • Dapat menginstal dan mengkonfigurasi Platform Data Hortonworks (HDP)

Target Peserta

  • 1.Peserta harus memiliki latar belakang di bidang TI. Kursus ini ditujukan untuk Software Engineer, Administrator Sistem, DBA yang ingin belajar tentang Big Data
  • Berpengalaman denganbahasa pemrograman (apapun)

Syarat

Software Engineers, Database Administrators, System Administrators dan siapa saja yang ingin tahu cara kerja Big Data, dan teknologi apa yang terlibat

1. What is Big Data and Hadoop

  • What is Data Science
  • What is Hadoop
  • Hadoop Distributions

2. Introduction to Hadoop

  • Hadoop Installation
  • Hortonworks Sandbox
  • Introduction to HDFS
  • DataNode Communications
  • HDFS – Using Ambari
  • MapReduce WordCount Example
  • Lines that span blocks
  • Introduction to Yarn
  • Yarn and ResourceManager UI
  • Ambari API and Blueprints
  • Ambari API and Blueprints
  • ETL Processing in Hadoop

3. Pig

  • Pig Installation
  • Pig Commands
  • More Pig Commands

4. Apache Spark

  • Spark WordCount
  • Spark installation and WordCount

5. RDDs

  • RDD Transformations and Actions
  • Spark MLLib

6. Hive

  • Hive Queries
  • Hive Installation and Hive Queries
  • Hive Partitioning, Buckets, UDFs, and SerDes
  • The Stinger Initiative
  • Hive in Spark

7. Real Time Processing

  • Introduction to Realtime Processing

8. Kafka

  • Kafka Messages and Log Compaction
  • Kafka Use Cases and Usage
  • Kafka Installation and Usage

9. Storm

  • A Storm Topology
  • Storm installation and Example Topology
  • Storm Message Processing and Reliability
  • Trident

10. Spark Streaming

  • Spark Streaming Architecture
  • Spark Receivers and WordCount Streaming Example
  • Spark Streaming with Kafka
  • Spark Streaming State and Checkpointing
  • Stateful Spark Streaming
  • More Spark Streaming Features

Waktu Pelaksanaan 2 Hari

Complimentary Download

Terima kasih atas ketertarikan Anda pada Edutech Training and Konsultan. Untuk mendownload brosur ini, lengkapi formulir pendaftaran di sebelah kanan.

Jika Anda mengalami masalah dalam menyelesaikan formulir, kirimkan ke email ke : info@edutechsolution.co.id dan kami dapat mengirimkan file brosurnya