課程簡(jiǎn)介
目標(biāo)收益
通過(guò)本課程的教學(xué),使學(xué)員充分了解和認(rèn)識(shí)大數(shù)據(jù)的相關(guān)知識(shí)(大數(shù)據(jù)的應(yīng)用范圍及相關(guān)技術(shù)思想),同時(shí)學(xué)會(huì)用主流的數(shù)據(jù)挖掘軟件完成數(shù)據(jù)挖掘建模任務(wù),使學(xué)員掌握數(shù)據(jù)挖掘方法論CRISP-DM的本質(zhì)。通過(guò)幾個(gè)具體的、典型的數(shù)據(jù)挖掘案例,使學(xué)員在掌握這些案例所用的技巧的同時(shí),充分理解數(shù)據(jù)挖掘的方法論,實(shí)現(xiàn)舉一反三的效果,提高學(xué)員分析問(wèn)題解決問(wèn)題的實(shí)際能力。
培訓(xùn)對(duì)象
課程大綱
大數(shù)據(jù)的介紹 |
1.1 什么是大數(shù)據(jù):海量非結(jié)構(gòu)化數(shù)據(jù)本身+處理方法 1.2 大數(shù)據(jù)為什么重要及大數(shù)據(jù)帶來(lái)的機(jī)遇:決定公司是否有未來(lái)和業(yè)務(wù)可延伸范圍 1.3 對(duì)大數(shù)據(jù)的深層理解:組成、特點(diǎn)介紹 1.4 大數(shù)據(jù)的相關(guān)技術(shù)與應(yīng)用案例 數(shù)據(jù)采集:ETL工具 數(shù)據(jù)存?。宏P(guān)系數(shù)據(jù)庫(kù);NoSQL、SQL等 基礎(chǔ)架構(gòu)支持:云存儲(chǔ);分布式文件系統(tǒng)等 計(jì)算結(jié)果展現(xiàn):云計(jì)算;標(biāo)簽云;關(guān)系圖等 1.5 大數(shù)據(jù)專題可能的演進(jìn)路徑 |
數(shù)據(jù)分析基礎(chǔ) |
2.1 數(shù)據(jù)分析的含義、主要做什么? 2.2 為什么要學(xué)習(xí)做好數(shù)據(jù)分析 2.2.1從數(shù)據(jù)分析的描述問(wèn)題、對(duì)比問(wèn)題、分析問(wèn)題 到最后解決問(wèn)題說(shuō)明為什么要做好 2.2.2通過(guò)案例說(shuō)明一般人員與數(shù)據(jù)分析師的區(qū)別 2.3 數(shù)據(jù)分析的誤區(qū)和分析的關(guān)鍵 2.4 數(shù)據(jù)分析的6個(gè)步驟,3大方向(理清思路,尋找答案,觀點(diǎn)表達(dá))案例形式詳細(xì)說(shuō)明 步驟1:需求明確--理清思路 步驟2:數(shù)據(jù)收集--理清思路 步驟3:數(shù)據(jù)處理--尋找答案 步驟4:數(shù)據(jù)分析--尋找答案 步驟5:數(shù)據(jù)展示--觀點(diǎn)表達(dá) 步驟6:報(bào)表撰寫--觀點(diǎn)表達(dá) 分別對(duì)以上6個(gè)步驟以案例的方式詳細(xì)說(shuō)明。 2.5 實(shí)踐:以數(shù)據(jù)分析項(xiàng)目為引,將數(shù)據(jù)分析的技能與業(yè)務(wù)結(jié)合,并應(yīng)用于實(shí)際的工作之中 |
數(shù)據(jù)挖掘基礎(chǔ) |
3.1 數(shù)據(jù)挖掘概述、基本理念、歷史發(fā)展進(jìn)程、主要功能、發(fā)展趨勢(shì) 3.2 數(shù)據(jù)挖掘方法論:CRISP-DM、SEMMA 3.3 數(shù)據(jù)處理過(guò)程:變量的分類及類型,數(shù)據(jù)的質(zhì)量、理解過(guò)程、準(zhǔn)備過(guò)程 |
數(shù)據(jù)挖掘及數(shù)據(jù)分析技術(shù) |
4.1.數(shù)據(jù)挖掘主要分析方法: 4.1.1 聚類分析(Clustering) 4.1.2 分類分析(Classification) 4.1.3 關(guān)聯(lián)分析(Association) 4.1.4 預(yù)測(cè)分析(Prediction) 4.1.5 回歸分析 4.1.6 相關(guān)分析 4.1.7數(shù)據(jù)比較分析 4.1.8 數(shù)據(jù)挖掘的可視化 4.2 數(shù)據(jù)挖掘的實(shí)施 4.3 分析圖形:正態(tài)性檢驗(yàn) 描述性統(tǒng)計(jì) 箱型圖、區(qū)間圖、時(shí)序圖介紹 4.4 數(shù)據(jù)挖掘的關(guān)鍵技術(shù):數(shù)據(jù)預(yù)處理 4.5 數(shù)據(jù)挖掘效果的評(píng)估 4.6 實(shí)踐:SPSS結(jié)合相應(yīng)的分析算法及展示圖形 |
構(gòu)建**數(shù)據(jù)挖掘分析體系 |
5.1 分析團(tuán)隊(duì)建設(shè) 5.2 分析工作管理 5.3 數(shù)據(jù)分析核心能力建設(shè) 5.4 分析工作與業(yè)務(wù)協(xié)同 |
數(shù)據(jù)挖掘應(yīng)用 |
6.1 數(shù)據(jù)挖掘及管理經(jīng)驗(yàn) 6.2 數(shù)據(jù)挖掘在***行業(yè)領(lǐng)域的應(yīng)用舉例 6.2.1 客戶行為與潛在客戶分析 6.2.2 用戶信用度分析 6.2.3 趨勢(shì)預(yù)測(cè) 6.2.4 新產(chǎn)品交叉營(yíng)銷分析 等 6.3 數(shù)據(jù)挖掘?qū)嵺`舉例:客戶流失、趨勢(shì)發(fā)展分析等(結(jié)合SPSS軟件) 6.4 實(shí)踐:內(nèi)容包括(從設(shè)計(jì)->形成模型->應(yīng)用). |
數(shù)據(jù)挖掘工具及未來(lái)研究的方向和熱點(diǎn) |
7.1 幾種數(shù)據(jù)挖掘工具比較 7.2 典型工具介紹及使用范圍 7.3 如何選擇數(shù)據(jù)挖掘工具 7.4 數(shù)據(jù)挖掘的方向和熱點(diǎn) |
大數(shù)據(jù)的介紹 1.1 什么是大數(shù)據(jù):海量非結(jié)構(gòu)化數(shù)據(jù)本身+處理方法 1.2 大數(shù)據(jù)為什么重要及大數(shù)據(jù)帶來(lái)的機(jī)遇:決定公司是否有未來(lái)和業(yè)務(wù)可延伸范圍 1.3 對(duì)大數(shù)據(jù)的深層理解:組成、特點(diǎn)介紹 1.4 大數(shù)據(jù)的相關(guān)技術(shù)與應(yīng)用案例 數(shù)據(jù)采集:ETL工具 數(shù)據(jù)存取:關(guān)系數(shù)據(jù)庫(kù);NoSQL、SQL等 基礎(chǔ)架構(gòu)支持:云存儲(chǔ);分布式文件系統(tǒng)等 計(jì)算結(jié)果展現(xiàn):云計(jì)算;標(biāo)簽云;關(guān)系圖等 1.5 大數(shù)據(jù)專題可能的演進(jìn)路徑 |
數(shù)據(jù)分析基礎(chǔ) 2.1 數(shù)據(jù)分析的含義、主要做什么? 2.2 為什么要學(xué)習(xí)做好數(shù)據(jù)分析 2.2.1從數(shù)據(jù)分析的描述問(wèn)題、對(duì)比問(wèn)題、分析問(wèn)題 到最后解決問(wèn)題說(shuō)明為什么要做好 2.2.2通過(guò)案例說(shuō)明一般人員與數(shù)據(jù)分析師的區(qū)別 2.3 數(shù)據(jù)分析的誤區(qū)和分析的關(guān)鍵 2.4 數(shù)據(jù)分析的6個(gè)步驟,3大方向(理清思路,尋找答案,觀點(diǎn)表達(dá))案例形式詳細(xì)說(shuō)明 步驟1:需求明確--理清思路 步驟2:數(shù)據(jù)收集--理清思路 步驟3:數(shù)據(jù)處理--尋找答案 步驟4:數(shù)據(jù)分析--尋找答案 步驟5:數(shù)據(jù)展示--觀點(diǎn)表達(dá) 步驟6:報(bào)表撰寫--觀點(diǎn)表達(dá) 分別對(duì)以上6個(gè)步驟以案例的方式詳細(xì)說(shuō)明。 2.5 實(shí)踐:以數(shù)據(jù)分析項(xiàng)目為引,將數(shù)據(jù)分析的技能與業(yè)務(wù)結(jié)合,并應(yīng)用于實(shí)際的工作之中 |
數(shù)據(jù)挖掘基礎(chǔ) 3.1 數(shù)據(jù)挖掘概述、基本理念、歷史發(fā)展進(jìn)程、主要功能、發(fā)展趨勢(shì) 3.2 數(shù)據(jù)挖掘方法論:CRISP-DM、SEMMA 3.3 數(shù)據(jù)處理過(guò)程:變量的分類及類型,數(shù)據(jù)的質(zhì)量、理解過(guò)程、準(zhǔn)備過(guò)程 |
數(shù)據(jù)挖掘及數(shù)據(jù)分析技術(shù) 4.1.數(shù)據(jù)挖掘主要分析方法: 4.1.1 聚類分析(Clustering) 4.1.2 分類分析(Classification) 4.1.3 關(guān)聯(lián)分析(Association) 4.1.4 預(yù)測(cè)分析(Prediction) 4.1.5 回歸分析 4.1.6 相關(guān)分析 4.1.7數(shù)據(jù)比較分析 4.1.8 數(shù)據(jù)挖掘的可視化 4.2 數(shù)據(jù)挖掘的實(shí)施 4.3 分析圖形:正態(tài)性檢驗(yàn) 描述性統(tǒng)計(jì) 箱型圖、區(qū)間圖、時(shí)序圖介紹 4.4 數(shù)據(jù)挖掘的關(guān)鍵技術(shù):數(shù)據(jù)預(yù)處理 4.5 數(shù)據(jù)挖掘效果的評(píng)估 4.6 實(shí)踐:SPSS結(jié)合相應(yīng)的分析算法及展示圖形 |
構(gòu)建**數(shù)據(jù)挖掘分析體系 5.1 分析團(tuán)隊(duì)建設(shè) 5.2 分析工作管理 5.3 數(shù)據(jù)分析核心能力建設(shè) 5.4 分析工作與業(yè)務(wù)協(xié)同 |
數(shù)據(jù)挖掘應(yīng)用 6.1 數(shù)據(jù)挖掘及管理經(jīng)驗(yàn) 6.2 數(shù)據(jù)挖掘在***行業(yè)領(lǐng)域的應(yīng)用舉例 6.2.1 客戶行為與潛在客戶分析 6.2.2 用戶信用度分析 6.2.3 趨勢(shì)預(yù)測(cè) 6.2.4 新產(chǎn)品交叉營(yíng)銷分析 等 6.3 數(shù)據(jù)挖掘?qū)嵺`舉例:客戶流失、趨勢(shì)發(fā)展分析等(結(jié)合SPSS軟件) 6.4 實(shí)踐:內(nèi)容包括(從設(shè)計(jì)->形成模型->應(yīng)用). |
數(shù)據(jù)挖掘工具及未來(lái)研究的方向和熱點(diǎn) 7.1 幾種數(shù)據(jù)挖掘工具比較 7.2 典型工具介紹及使用范圍 7.3 如何選擇數(shù)據(jù)挖掘工具 7.4 數(shù)據(jù)挖掘的方向和熱點(diǎn) |