Open Source - BDHS

BigData入門-Hadoop與Spark介紹

Introduction to Big Data
  • 時數:35小時
  • 費用:NT$ 24,000
  • 點數:6.0

選擇查詢分區開課時間

地點 班號 日期 時間 預約
台北 25603 班 2025/07/07 ~ 2025/07/11 每週一二三四五 09:00~17:00 預約

目前查無開課時段

詳細開課時間請洽詢業務
新竹、台中、高雄如有上課需求,請參考台北開課日期,洽當地服務人員依需求加開遠距開課日期

聯絡恆逸

教材

恆逸專用教材

課程目標

本課程提供Big Data架構的基本知識,以介紹Hadoop生態系為主。從Hadoop基礎架構:HDFS、MapReduce開始,讓學員瞭解Hadoop架構。接著介紹Spark開發框架基礎,包含是RDD與DataFrame/DataSet的開發方式。並介紹SQL on Hadoop的主要元件:Hive,讓學員學習到如何使用類SQL語言操作、分析Hadoop的資料,而不需要撰寫MapReduce或Spark程式。最後介紹如何使用Spark MLlib對Hadoop資料進行機器學習,讓學員了解機器學習的基本知識。

適合對象

1.想要了解Big Data架構的系統管理人員

2.想要了解Hadoop/Spark開發架構的程式開發人員

3.想要了解Hadoop/Spark架構的資料分析人員

預備知識

1.基本作業系統操作

2.基本程式開發概念

課程內容

1.BigData架構介紹

●Hadoop生態系

2.Hadoop架構介紹

●HDFS

●MapReduce(MR v2)開發框架

●Spark開發框架

3.Spark程式開發

●Spark core語法介紹-RDD

●DataFrame/DataSet

●Spark SQL

4.Hadoop資料分析

●探索式分析

●Hive(HQL)

5.Hadoop機器學習

●Spark MLlib

學會技能

  1. 了解最新的Hadoop生態系架構
  2. 了解HDFS與MapReduce架構
  3. 了解Spark程式框架
  4. 具備撰寫Spark程式與使用Spark進行機器學習的基本知識
  5. 能夠使用Hive操作Hadoop資料

備註事項

學生優惠價:參加校園IT職涯學習護照方案,享有5折優惠價NT$12,000元