課程簡介
大數(shù)據(jù)存儲已經(jīng)走到了一個新的階段,肯定會有新的革命性技術來替換它,而數(shù)據(jù)湖就是大數(shù)據(jù)的下一個變革。業(yè)界趨勢是從傳統(tǒng)的數(shù)據(jù)倉庫向數(shù)據(jù)湖的方向演進.
數(shù)據(jù)湖構建實戰(zhàn),基于目前大數(shù)據(jù)領域流行的數(shù)據(jù)湖技術及方案,結合數(shù)據(jù)湖在知名互聯(lián)網(wǎng)及云計算公司的構建案例,從理論和實戰(zhàn)的角度介紹數(shù)據(jù)湖的構建及應用。
目標收益
從實戰(zhàn)角度解密流行的數(shù)據(jù)湖技術及構建方案,使企業(yè)快速構建數(shù)據(jù)湖能力,降低試錯的成本。幫助企業(yè)厘清數(shù)據(jù)湖概念,解決大數(shù)據(jù)應用實戰(zhàn)中的問題。
培訓對象
課程內(nèi)容
1.數(shù)據(jù)湖是什么湖?
a)什么是數(shù)據(jù)湖
b)原始數(shù)據(jù)保存的問題
c)與數(shù)據(jù)倉庫的區(qū)別
d)數(shù)據(jù)湖的關鍵技術
e)數(shù)據(jù)沼澤與數(shù)據(jù)治理
f)數(shù)據(jù)河與數(shù)據(jù)源
2.數(shù)據(jù)湖的架構及戰(zhàn)略分析
a)數(shù)據(jù)湖的常見架構
b)與數(shù)據(jù)倉庫的關系和并存
c)數(shù)據(jù)湖與Hadoop的關系
d)數(shù)據(jù)湖與原始數(shù)據(jù)的關系
e)數(shù)據(jù)湖與大數(shù)據(jù)
f)數(shù)據(jù)湖的安全保障
g)數(shù)據(jù)湖與元數(shù)據(jù)
3.數(shù)據(jù)湖技術分析與實戰(zhàn)
a)Apache Hadoop數(shù)據(jù)湖的基礎
b)Apache Kafka數(shù)據(jù)河流的基礎
c)Apache Hudi數(shù)據(jù)湖存儲
d)Apache Ranger數(shù)據(jù)湖安全
e)Apache Atlas數(shù)據(jù)湖治理與元數(shù)據(jù)
4.數(shù)據(jù)湖的案例分析
a)開源Hadoop數(shù)據(jù)湖案例分析
b)Amazon數(shù)據(jù)湖案例分析
c)阿里云EMR數(shù)據(jù)湖案例分析
d)阿里飛天數(shù)據(jù)湖案例分析
e)微軟Data lake as service案例分析
5.未來的發(fā)展
a)下一代數(shù)據(jù)倉庫
b)AI驅(qū)動
c)決策自動化