課程簡介
課程大數據分析處理技術的難度值:高;
課程大數據挖掘的難度值:中;
產品和案例面的豐富度:中;
商業(yè)模式創(chuàng)新和組織架構面詳盡度:低。
本課程將圍繞大數據治理的全流程展開講解。從大數據的思維培養(yǎng)、大數 據產品思維、大數據分析和治理方法、大數據工具和挖掘技術等層 面,從互聯網應用和傳統(tǒng)企業(yè)的業(yè)務場景諸多角度多領域做實站案例講 解。該課程使學員: n 理解大數據基本概念,理解大數據幫助企業(yè)進行商業(yè)模式創(chuàng)新的方法 和思維 n 理解大數據團隊構成和組織架構建設的重要性和方法 n 理解大數據產品設計思維和業(yè)務創(chuàng)新的方法 n 理解大數據收集、清洗、融合、挖掘及應用技術架構從零開始建設的 方法 n 理解大數據行業(yè)發(fā)展的現狀:大數據在傳統(tǒng)行業(yè)和 TMT 企業(yè)中的應用 情況、對業(yè)務提升的影響結果。 n 介紹大量大數據在互聯網應用中的智能化產品和技術解決方案作為借 鑒。這些應用包括 O2O、本地生活服務、社交型應用、互聯網金融、支 付、保險類型應用等 n 介紹大量大數據在傳統(tǒng)企業(yè)管理中的智能化產品和技術解決方案作為 借鑒。這些應用包括物流、企業(yè)外部環(huán)境認知、戰(zhàn)略分析、企業(yè)客戶關 系管理等。相關的傳統(tǒng)行業(yè)包括電信、銀行、印刷、文化藝術、零售、 制造等
目標收益
培訓對象
企業(yè)高管、產品及運營負責人、項目負責人、技術負責人、數 據分析師、數據挖掘工程師
課程內容
大量大數據真實實踐案例,重點傳統(tǒng)企業(yè)如何借鑒互聯網大數據商業(yè)模式發(fā)展方法來取得自身企業(yè)發(fā)展進行探討。最后強調:大數據不僅是一種技術和工具,更是企業(yè)治理和企業(yè)發(fā)現藍海商業(yè)模式的重要發(fā)方法輪。
課程大綱
一、大數據思維模式建立及組織架構建設 |
1.大數據概述 1.1 奧斯卡 3 項大獎電影“點球成金”揭示了什么? 1.2 全球著名的咨詢服務公司 Gartner 怎么看大數據? 1.3 大數據本質特征概述 1.4 大數據能解決什么問題? 2 大數據驅動商業(yè)模式創(chuàng)新 2.1 “互聯網+”驅動新的商業(yè)模式創(chuàng)新 2.2 “大數據+”驅動新的商業(yè)模式創(chuàng)新 2.3 成功“大數據+”企業(yè)戰(zhàn)略實施案例 2.4 大數據企業(yè)戰(zhàn)略和項目實施方法總結和禁忌點 3 大數據團隊建設 3.1 大數據公司(部門)的都在做什么? 3.2 大數據團隊組成 4 “大數據+”行業(yè)應用案例簡述 4.1 Target 孕婦案例及沃爾瑪啤酒尿布案例 4.2 TMobile 用戶流失案例 4.3 LV 旗艦試衣間案例 5 概維智能智能化服務介紹 |
二 大數據分析入門與進階 |
1 數據分析技術 1.1 數據分析的數據類型 1.2 數據分析的流程設計 1.3 數據分析驅動運營常用方法 1.3.1 數據分析表設計 1.3.2 多維分解 1.3.3 用戶分群 1.3.4 用戶細查 1.3.5 漏斗分析 1.3.6 留存分析 1.4 數據運營案例分析 1.4.1 EDM 營銷數據分析 2 前端數據埋點采集技術 2.1 數據埋點是什么? 2.2 數據埋點數據采集內容設計 2.3 數據埋點分類:代碼埋點、可視化埋點、無痕埋點 2.4 代碼埋點案例 2.5 無痕埋點的技術架構 2.6 可視化埋點常用數據采集工具 3 大數據治理框架 3.1 大數據處理及架構 3.2 流式計算架構 3.3 分布式計算架構 3.4 規(guī)則引擎 4 業(yè)務數據分析進階:用戶畫像分析 4.1 數據分析通用體系 4.2 用戶畫像數據的構成 4.3 用戶畫像體系 4.4 用戶畫像的分析使用 5 數據挖掘技術 5.1 數據治理及智能化應用通用過程 5.2 大數據技術落地介紹 5.2.1 數據格式 5.2.2數據準備 5.2.3 選擇算法 5.2.4 模型訓練 5.2.5 模型評估 5.2.6 模型應用 5.2.7 使用命令行 5.3 挖掘案例:金融服務中用戶購買意愿建模分析 |
三 機器學習及人工智能技術 |
1 機器學習本質原理 1.1 分類學習的根源問題及解決 1.2 Bias、Variance 困境 1.3 均衡 Overfitting 和 Underfitting 2 機器學習常用算法 2.1 DecisionTree 2.2 NavieBayes 2.3 Logistic Regression 3 機器學習模型進階:多模型算法 3.1 Ensemble Selection 3.2 Bagging 3.3 Random Forest 3.4 Random Decision Tree (RDT) 3.5 Boosting 3.6 Meta-learning 3.7 Error-Correcting Output Codes (ECOC) 4 機器學習評估指標 4.1 Confusion Matrix 4.2 Accuracy 和 Error Rate 4.3 Precision 和 Recall 4.4 F-measure 4.5 Specificity, Sensitivity 和 G-mean 4.6 ROC 和 AUC 4.7 MSE 和 RMSE 4.8 如何選擇合適的數據挖掘評估指標:案例講解 5 企業(yè)算法應用架構設計 5.1 通用算法架構 5.2 統(tǒng)一應用接口 5.3 實驗分流平臺 5.4 業(yè)務算法內核 5.5 大數據模型內核 5.6 實時數據統(tǒng)計分析平臺 5.7 系統(tǒng)監(jiān)控平臺 |
四 企業(yè)大數據實戰(zhàn)應用案例 |
1 推薦引擎實戰(zhàn) 1.1 推薦引擎使用場景舉例 1.2 推薦引擎基本原理及主要挑戰(zhàn) 1.3 好友推薦引擎 1.4 二度好友模型:案例講解 (1).二度好友模型解決的問題 (2).二度好友模型的建模過程 (3).二度好友模型的效果評估 1.5 好友簇算法:案例講解 (1).好友簇算法解決的問題 (2).聚類方法原理 (3).好友簇算法的建模過程 (4).好友簇算法的效果評估 1.6 加好友申請接受率預估模型:案例講解 (1).加好友申請接受率預估解決的問題 (2).加好友申請接受率預估的建模過程 (3).加好友申請接受率預估的效果評估 2 社交網絡大數據實戰(zhàn) 2.1 社交圖譜挖掘介紹 2.1.1 社交網絡數據挑戰(zhàn) 2.1.2 社交網絡中的數據挖掘意義 2.1.3 社交圖譜挖掘主要任務 2.1.4 社交圖譜挖掘通用路標 2.2 社交圖譜挖掘案例講解:好友親密度模型 2.2.1 好友親密度模型的意義 2.2.2 經典用戶行為分析建模方法簡介 2.2.3 好友親密度建模過程 2.2.4 好友親密度模型效果分析 2.3 社交圖譜挖掘案例講解:好友自動分組 2.3.1 好友智能分組的意義 2.3.2 社區(qū)發(fā)現簡介 2.3.3 好友自動分組建模過程 2.3.4 好友自動分組效果評估 3 瀏覽型及金融應用的數據挖掘實戰(zhàn) 3.1 互聯網應用的分類 3.2 瀏覽型應用中的大數據應用實例 3.2.1 全局唯一用戶識別 GUID 3.2.2 用戶及業(yè)務畫像 3.2.3 CTR 預估 3.3 金融支付保險應用中的大數據應用實例 3.3.1 用戶流失分析與預測 3.3.2 大數據用戶實時授信 3.3.3 大數據投資賬戶相似性檢測 3.3.4 大數據賬戶投資意愿預估 |
一、大數據思維模式建立及組織架構建設 1.大數據概述 1.1 奧斯卡 3 項大獎電影“點球成金”揭示了什么? 1.2 全球著名的咨詢服務公司 Gartner 怎么看大數據? 1.3 大數據本質特征概述 1.4 大數據能解決什么問題? 2 大數據驅動商業(yè)模式創(chuàng)新 2.1 “互聯網+”驅動新的商業(yè)模式創(chuàng)新 2.2 “大數據+”驅動新的商業(yè)模式創(chuàng)新 2.3 成功“大數據+”企業(yè)戰(zhàn)略實施案例 2.4 大數據企業(yè)戰(zhàn)略和項目實施方法總結和禁忌點 3 大數據團隊建設 3.1 大數據公司(部門)的都在做什么? 3.2 大數據團隊組成 4 “大數據+”行業(yè)應用案例簡述 4.1 Target 孕婦案例及沃爾瑪啤酒尿布案例 4.2 TMobile 用戶流失案例 4.3 LV 旗艦試衣間案例 5 概維智能智能化服務介紹 |
二 大數據分析入門與進階 1 數據分析技術 1.1 數據分析的數據類型 1.2 數據分析的流程設計 1.3 數據分析驅動運營常用方法 1.3.1 數據分析表設計 1.3.2 多維分解 1.3.3 用戶分群 1.3.4 用戶細查 1.3.5 漏斗分析 1.3.6 留存分析 1.4 數據運營案例分析 1.4.1 EDM 營銷數據分析 2 前端數據埋點采集技術 2.1 數據埋點是什么? 2.2 數據埋點數據采集內容設計 2.3 數據埋點分類:代碼埋點、可視化埋點、無痕埋點 2.4 代碼埋點案例 2.5 無痕埋點的技術架構 2.6 可視化埋點常用數據采集工具 3 大數據治理框架 3.1 大數據處理及架構 3.2 流式計算架構 3.3 分布式計算架構 3.4 規(guī)則引擎 4 業(yè)務數據分析進階:用戶畫像分析 4.1 數據分析通用體系 4.2 用戶畫像數據的構成 4.3 用戶畫像體系 4.4 用戶畫像的分析使用 5 數據挖掘技術 5.1 數據治理及智能化應用通用過程 5.2 大數據技術落地介紹 5.2.1 數據格式 5.2.2數據準備 5.2.3 選擇算法 5.2.4 模型訓練 5.2.5 模型評估 5.2.6 模型應用 5.2.7 使用命令行 5.3 挖掘案例:金融服務中用戶購買意愿建模分析 |
三 機器學習及人工智能技術 1 機器學習本質原理 1.1 分類學習的根源問題及解決 1.2 Bias、Variance 困境 1.3 均衡 Overfitting 和 Underfitting 2 機器學習常用算法 2.1 DecisionTree 2.2 NavieBayes 2.3 Logistic Regression 3 機器學習模型進階:多模型算法 3.1 Ensemble Selection 3.2 Bagging 3.3 Random Forest 3.4 Random Decision Tree (RDT) 3.5 Boosting 3.6 Meta-learning 3.7 Error-Correcting Output Codes (ECOC) 4 機器學習評估指標 4.1 Confusion Matrix 4.2 Accuracy 和 Error Rate 4.3 Precision 和 Recall 4.4 F-measure 4.5 Specificity, Sensitivity 和 G-mean 4.6 ROC 和 AUC 4.7 MSE 和 RMSE 4.8 如何選擇合適的數據挖掘評估指標:案例講解 5 企業(yè)算法應用架構設計 5.1 通用算法架構 5.2 統(tǒng)一應用接口 5.3 實驗分流平臺 5.4 業(yè)務算法內核 5.5 大數據模型內核 5.6 實時數據統(tǒng)計分析平臺 5.7 系統(tǒng)監(jiān)控平臺 |
四 企業(yè)大數據實戰(zhàn)應用案例 1 推薦引擎實戰(zhàn) 1.1 推薦引擎使用場景舉例 1.2 推薦引擎基本原理及主要挑戰(zhàn) 1.3 好友推薦引擎 1.4 二度好友模型:案例講解 (1).二度好友模型解決的問題 (2).二度好友模型的建模過程 (3).二度好友模型的效果評估 1.5 好友簇算法:案例講解 (1).好友簇算法解決的問題 (2).聚類方法原理 (3).好友簇算法的建模過程 (4).好友簇算法的效果評估 1.6 加好友申請接受率預估模型:案例講解 (1).加好友申請接受率預估解決的問題 (2).加好友申請接受率預估的建模過程 (3).加好友申請接受率預估的效果評估 2 社交網絡大數據實戰(zhàn) 2.1 社交圖譜挖掘介紹 2.1.1 社交網絡數據挑戰(zhàn) 2.1.2 社交網絡中的數據挖掘意義 2.1.3 社交圖譜挖掘主要任務 2.1.4 社交圖譜挖掘通用路標 2.2 社交圖譜挖掘案例講解:好友親密度模型 2.2.1 好友親密度模型的意義 2.2.2 經典用戶行為分析建模方法簡介 2.2.3 好友親密度建模過程 2.2.4 好友親密度模型效果分析 2.3 社交圖譜挖掘案例講解:好友自動分組 2.3.1 好友智能分組的意義 2.3.2 社區(qū)發(fā)現簡介 2.3.3 好友自動分組建模過程 2.3.4 好友自動分組效果評估 3 瀏覽型及金融應用的數據挖掘實戰(zhàn) 3.1 互聯網應用的分類 3.2 瀏覽型應用中的大數據應用實例 3.2.1 全局唯一用戶識別 GUID 3.2.2 用戶及業(yè)務畫像 3.2.3 CTR 預估 3.3 金融支付保險應用中的大數據應用實例 3.3.1 用戶流失分析與預測 3.3.2 大數據用戶實時授信 3.3.3 大數據投資賬戶相似性檢測 3.3.4 大數據賬戶投資意愿預估 |