Big Data Hadoop Developer

Deskripsi

Big Data adalah sekumpulan data bermakna yang dapat kita manfaatkan informasinya. Setiap hari volume data semakin meningkat sehingga perusahaan akan semakin sulit menyimpan, mengambil, dan memproses data. Hadoop, menjadi solusi untuk menyimpan, menangani, mengevaluasi, dan mengambil data dalam volume besar untuk berbagai aplikasi, itulah sebabnya raksasa global di bidang ritel, perbankan dan keuangan, media sosial dan banyak sektor lainnya secara aktif menggunakan Hadoop sebagai bagian dari strategi pertumbuhan mereka.

Prospek pelanggan untuk Hadoopers tidak terbatas – dari Pengembang Hadoop, ke Tester Hadoop hingga Arsitek Hadoop, dan sebagainya. Jika Anda senang menangani dan mengelola Big Data, maka pelatihan ini cocok untuk Anda.

Tujuan

Setelah mengikuti pelatihan tersebut, peserta akan mampu :

  • Belajar arsitektur Hadoop untuk pemula
  • Belajar tentang s Hadoop, HDFS dan MapReduce framework
  • Membangun aplikasi untuk Big Data menggunakan teknologi Hadoop
  • Membangun program YARN programs pada Hadoop 2.X version
  • Menganalisis Big Data menggunakan Hive, Pig dan YARN

Target Peserta

  • Software Developers, analytics, BI, ETL, and data warehousing professionals
  • Big Data Hadoop developers, architects and testing person

Syarat

Memiliki pengetahuan dasar bahasa pemrograman.

Module 1: Big Data

  • Introduction to Big Data
  • Dimensions of Big Data
  • Big Data in Advertising
  • Big Data in Banking
  • Big Data in Telecom
  • Big Data in eCommerce
  • Big Data in Healthcare
  • Big Data in Defense
  • Processing options of Big Data
  • Hadoop as an option

Module 2: Hadoop

  • What is Hadoop
  • How Hadoop 1.0 Works
  • How Hadoop 2.0 Works
  • HDFS
  • MapReduce
  • What is YARN
  • How YARN Works
  • Advantages of YARN
  • How Hadoop has an edge

Module 3: Hadoop Ecosystem

  • Sqoop
  • Oozie
  • Pig
  • Hive
  • Flume

Module 4: HDFS ( Hadoop Distributed File System )

  • Working with HDFS
  • Setting up VM Hadoop Environment
  • Installing VMware Player
  • Setting up the Virtual Environment (Virtual Machine User Accounts; Running a Hadoop Job; Accessing the VM via ssh; Shutting Down the VM)

Module 5: Writing a MapReduce Program

  • Examining a Sample MapReduce Program With several examples
  • Basic API Concepts
  • The Driver Code
  • The Mapper
  • The Reducer

Module 6: Other Hadoop Development Aspects

6.1 Pig

  • What is Pig?
  • How Pig works?
  • Simple processing using Pig
  • Advanced processing using Pig
  • Pig hands on

6.2 Hive

  • What is Hive?
  • How Hive works?
  • Simple processing using Hive
  • Advanced processing using Hive
  • Hive hands-on

6.3 HBase

  • Introduction To Hbase
  • Row Distribution between region servers
  • Data Storage
  • HBase Master
  • HBase and Zookeeper
  • HBase Deployment
  • Installation of HBase
  • Configuration of HBase

6.4 Sqoop

  • Getting Sqoop
  • A Sample Import
  • Database Imports
  • Performing an Export

6.5 Oozie

  • What is Oozie?
  • How Oozie Works?

6.6 Impala

  • What is Impala?
  • How Impala Works
  • Where Impala is better than Hive
  • Impala’s shortcomings
  • Impala hands-on

Module 7: Commercial Distribution Of Hadoop

  • Introduction- Cloudera
  • Introduction -Hortonworks

Waktu Pelaksanaan 2 Hari

Complimentary Download

Terima kasih atas ketertarikan Anda pada Edutech Training and Konsultan. Untuk mendownload brosur ini, lengkapi formulir pendaftaran di sebelah kanan.

Jika Anda mengalami masalah dalam menyelesaikan formulir, kirimkan ke email ke : info@edutechsolution.co.id dan kami dapat mengirimkan file brosurnya