工程師
互聯(lián)網(wǎng)
其他
大數(shù)據(jù)
SQL
數(shù)據(jù)分析
Hadoop
Spark
分布式
推薦課程
average > 0 ? $model->average . '分' : '10.0分' ?>

大數(shù)據(jù)行業(yè)核心技術分享

中科院 大數(shù)據(jù)技術專家

北京獵豹移動科技有限公司-大數(shù)據(jù)技術專家;
(鄭州)中科院計算所大數(shù)據(jù)研究院-大數(shù)據(jù)技術專家;
鄭州工業(yè)應用技術學院特聘大數(shù)據(jù)講師;
慕課網(wǎng)大數(shù)據(jù)體系課獨家簽約講師;
電子工業(yè)出版社2022年度優(yōu)秀作者;
華為開發(fā)者學堂認證講師;
51CTO企業(yè)IT學院優(yōu)秀講師;
華為HCIP大數(shù)據(jù)高級工程師認證;
新工科-大數(shù)據(jù)高級工程師認證;
發(fā)明專利:一種基于SparkSQL和RestAPI的流數(shù)據(jù)處理方法;
出版書籍:《大數(shù)據(jù)技術及架構圖解實戰(zhàn)派》、《Flink入門與實戰(zhàn)》

北京獵豹移動科技有限公司-大數(shù)據(jù)技術專家; (鄭州)中科院計算所大數(shù)據(jù)研究院-大數(shù)據(jù)技術專家; 鄭州工業(yè)應用技術學院特聘大數(shù)據(jù)講師; 慕課網(wǎng)大數(shù)據(jù)體系課獨家簽約講師; 電子工業(yè)出版社2022年度優(yōu)秀作者; 華為開發(fā)者學堂認證講師; 51CTO企業(yè)IT學院優(yōu)秀講師; 華為HCIP大數(shù)據(jù)高級工程師認證; 新工科-大數(shù)據(jù)高級工程師認證; 發(fā)明專利:一種基于SparkSQL和RestAPI的流數(shù)據(jù)處理方法; 出版書籍:《大數(shù)據(jù)技術及架構圖解實戰(zhàn)派》、《Flink入門與實戰(zhàn)》

課程費用

5800.00 /人

課程時長

2

成為教練

課程簡介

本次課程首先從大數(shù)據(jù)生態(tài)圈層面整體介紹目前企業(yè)內(nèi)常見的大數(shù)據(jù)核心技術組件,然后會以Hadoop(大數(shù)據(jù)基礎核心)組件進行切入,幫助學員快速理解大數(shù)據(jù)技術的基礎原理。接著會從分布式計算引擎(離線Spark+實時Flink)進行深入分析,幫助學員了解掌握目前企業(yè)中最常用的兩大核心計算引擎。最后會針對OLAP分析引擎(離線Hive+實時ClickHouse)進行深入分析,幫助學員快速構建離線數(shù)倉和實時數(shù)倉的整體概念,掌握基于SQL的離線和實時數(shù)據(jù)分析能力。

目標收益

了解大數(shù)據(jù)生態(tài)圈核心技術
掌握Hadoop的原理及使用
掌握分布式計算引擎(Spark+Flink)的原理及使用
掌握OLAP分析引擎的原理及使用(Hive+ClickHouse)
了解數(shù)據(jù)倉庫(離線+實時)的架構設計

培訓對象

有一定編程基礎,想學習和了解大數(shù)據(jù)的學員
計算機相關專業(yè),未來向大數(shù)據(jù)領域方向發(fā)展的學員

課程大綱

大數(shù)據(jù)生態(tài)圈核心技術總覽 1 大數(shù)據(jù)產(chǎn)生背景
2 大數(shù)據(jù)的基本特征
3 大數(shù)據(jù)生態(tài)圈核心技術總覽(包括數(shù)據(jù)采集、數(shù)據(jù)存儲、數(shù)據(jù)計算、數(shù)據(jù)分析、數(shù)據(jù)檢索框架等)
4 大數(shù)據(jù)的典型應用場景分析
5 大數(shù)據(jù)典型架構案例分析(大數(shù)據(jù)平臺架構、離線數(shù)據(jù)倉庫架構、實時數(shù)據(jù)倉庫架構、批流一體化數(shù)倉架構等)
6 大數(shù)據(jù)基礎平臺選型分析(CDH\HDP\CDP)
Hadoop原理、架構及核心編程
(HDFS+MapReduce+YARN)
1 Hadoop整體概述
2 Apache Hadoop VS CDH VS HDP VS CDP
3 HDFS的核心原理及架構分析
4 HDFS的常見Shell命令的使用
5 MapReduce的原理及架構分析
6 基于MapReduce的離線計算案例
7 YARN的原理及架構分析
8 YARN中的三種資源調度器詳解
Spark原理、架構及核心編程 1 Spark核心原理及架構剖析
2 Spark的典型應用場景分析
2 基于Spark的離線計算案例
3 Spark核心Transformation算子分析及實戰(zhàn)
4 Spark核心Action算子分析及實戰(zhàn)
5 Spark SQL核心功能分析
Flink原理、架構及核心編程 1 流處理 VS 批處理
2 Storm VS SparkStreaming VS Flink
3 Flink的核心原理及架構分析
4 基于Flink DataStream的實時計算案例
5 Flink SQL在實時計算中的應用
Hive的核心功能及使用 Hive的核心原理及架構分析
2 Hive典型應用場景分析
3 Hive中的數(shù)據(jù)庫和表(內(nèi)部表、外部表、分區(qū)表、桶表)的原理及使用
4基于 Hive SQL的OLAP數(shù)據(jù)分析案例
5 基于Hive的離線數(shù)據(jù)倉庫架構案例分析
ClickHouse的核心功能及使用 1 ClickHouse的核心原理及架構分析
2 ClickHouse的典型應用場景分析
3 ClickHouse核心功能的使用
4 ClickHouse集成第三方系統(tǒng)
5 基于ClickHouse的實時數(shù)據(jù)倉庫架構案例分析
大數(shù)據(jù)生態(tài)圈核心技術總覽
1 大數(shù)據(jù)產(chǎn)生背景
2 大數(shù)據(jù)的基本特征
3 大數(shù)據(jù)生態(tài)圈核心技術總覽(包括數(shù)據(jù)采集、數(shù)據(jù)存儲、數(shù)據(jù)計算、數(shù)據(jù)分析、數(shù)據(jù)檢索框架等)
4 大數(shù)據(jù)的典型應用場景分析
5 大數(shù)據(jù)典型架構案例分析(大數(shù)據(jù)平臺架構、離線數(shù)據(jù)倉庫架構、實時數(shù)據(jù)倉庫架構、批流一體化數(shù)倉架構等)
6 大數(shù)據(jù)基礎平臺選型分析(CDH\HDP\CDP)
Hadoop原理、架構及核心編程
(HDFS+MapReduce+YARN)
1 Hadoop整體概述
2 Apache Hadoop VS CDH VS HDP VS CDP
3 HDFS的核心原理及架構分析
4 HDFS的常見Shell命令的使用
5 MapReduce的原理及架構分析
6 基于MapReduce的離線計算案例
7 YARN的原理及架構分析
8 YARN中的三種資源調度器詳解
Spark原理、架構及核心編程
1 Spark核心原理及架構剖析
2 Spark的典型應用場景分析
2 基于Spark的離線計算案例
3 Spark核心Transformation算子分析及實戰(zhàn)
4 Spark核心Action算子分析及實戰(zhàn)
5 Spark SQL核心功能分析
Flink原理、架構及核心編程
1 流處理 VS 批處理
2 Storm VS SparkStreaming VS Flink
3 Flink的核心原理及架構分析
4 基于Flink DataStream的實時計算案例
5 Flink SQL在實時計算中的應用
Hive的核心功能及使用
Hive的核心原理及架構分析
2 Hive典型應用場景分析
3 Hive中的數(shù)據(jù)庫和表(內(nèi)部表、外部表、分區(qū)表、桶表)的原理及使用
4基于 Hive SQL的OLAP數(shù)據(jù)分析案例
5 基于Hive的離線數(shù)據(jù)倉庫架構案例分析
ClickHouse的核心功能及使用
1 ClickHouse的核心原理及架構分析
2 ClickHouse的典型應用場景分析
3 ClickHouse核心功能的使用
4 ClickHouse集成第三方系統(tǒng)
5 基于ClickHouse的實時數(shù)據(jù)倉庫架構案例分析

課程費用

5800.00 /人

課程時長

2

預約體驗票 我要分享

近期公開課推薦

近期公開課推薦

活動詳情

提交需求