課程簡介
理解數(shù)據(jù)挖掘的基本算法,比如決策樹,聚類算法,邏輯回歸,關(guān)聯(lián)規(guī)則。在這個(gè)基礎(chǔ)上理解機(jī)器學(xué)習(xí)更加深入的內(nèi)容:bagging&boosting,概率圖模型(LDA,PLSA),樹模型(GBDT,MART) ,對(duì)于深度學(xué)習(xí)有一定的認(rèn)知(word2vetcor,表征學(xué)習(xí)).不單單介紹算法的應(yīng)用場(chǎng)景,更進(jìn)一步從最優(yōu)化理論的高度解釋為何這些數(shù)據(jù)挖掘的算法要這樣設(shè)計(jì)。
目標(biāo)收益
課程中的理論和經(jīng)驗(yàn)來自于對(duì)初級(jí),中級(jí)數(shù)據(jù)挖掘工程經(jīng)常遇問題的歸納、分析與總結(jié),有針對(duì)性的給出解決方法,課程將重現(xiàn)這些問題的例講解,并對(duì)應(yīng)到學(xué)員的實(shí)際工作問題,使學(xué)員能夠把傳授的經(jīng)驗(yàn)和自己的問題結(jié)合起來,有效的啟發(fā)思路、激發(fā)興趣、提供解決問題需要的新思經(jīng)典案例,通過實(shí)路新方法。
學(xué)員的收獲總結(jié)起來有3點(diǎn):
1:了解實(shí)際的事例結(jié)合說基本算法的各種變體,開闊思路
2:將一次培訓(xùn)深化為深入了解一個(gè)細(xì)分領(lǐng)域的一個(gè)渠道,之后可以接收到培訓(xùn)內(nèi)容中知識(shí)點(diǎn)對(duì)應(yīng)的業(yè)界最新更新。
3:加入“數(shù)據(jù)挖掘”職業(yè)圈,學(xué)員可以有一個(gè)加入職業(yè)社交圈的機(jī)會(huì),和業(yè)內(nèi)人士相互交流,相互切磋。
培訓(xùn)對(duì)象
1:有一定的程序和數(shù)學(xué)基礎(chǔ),希望對(duì)于數(shù)據(jù)挖掘有個(gè)知識(shí)體系的梳理,同時(shí)深入了解在實(shí)際生產(chǎn)過程中數(shù)據(jù)挖掘的各種算法的應(yīng)用的,希望從初級(jí)走向中級(jí)的,數(shù)據(jù)增值產(chǎn)業(yè)的從業(yè)者。尤其是想做數(shù)據(jù)挖掘但是效果不顯著,希望在公司內(nèi)部得到更多重視的團(tuán)隊(duì),派出兩三人參加這個(gè)課程,效果尤佳。
2:對(duì)于數(shù)據(jù)挖掘,商業(yè)智能感興趣,希望從事類似的工作,但是又感到所謂“大數(shù)據(jù)”知識(shí)體系繁雜,無論是廣度還是深度都很難開始的“迷?!比耸?。
課程大綱
廣義線性分類的原理和應(yīng)用 |
內(nèi)容:logistic Regression和計(jì)算廣告學(xué) n1.二分類問題的例子 n2.邏輯回歸的數(shù)學(xué)原理 n3.傳統(tǒng)廣告,計(jì)算廣告,廣告實(shí)時(shí)交易平臺(tái) n4.數(shù)據(jù)預(yù)處理和維度提取 n5.LR在計(jì)算廣告中的應(yīng)用 n6.LR的效果測(cè)評(píng),模型調(diào)優(yōu) n7.LR模型中理論與工程的折中 n8.LR和他的小伙伴們:廣義線性模型 n9.新情況,基于移動(dòng)端的廣告實(shí)時(shí)交易平臺(tái),LR的各種變體 |
決策樹,聚類和異常點(diǎn)檢測(cè) |
內(nèi)容:決策樹和異常點(diǎn)檢測(cè) n1.決策樹的原理 n2.各種決策樹的生成算法 n3.決策樹在異常點(diǎn)檢測(cè)中的應(yīng)用 n4.決策樹的剪枝 n5.其它異常點(diǎn)檢測(cè)的應(yīng)用小技巧 n6.聚類算法的原理 n7.聚類算法的常見問題:初始點(diǎn)選擇 n8.聚類算法和決策樹在異常點(diǎn)檢測(cè)中的應(yīng)用 n9.結(jié)合計(jì)算廣告,談兩個(gè)異常點(diǎn)檢測(cè)小例子 |
概率圖模型 |
n1.貝葉斯網(wǎng)絡(luò)(有向圖模型) n2.馬爾科夫網(wǎng)(無向圖模型) n3.條件隨機(jī)場(chǎng)(局部有向圖模型) n4.LDA,PLSA |
Bagging & boosting |
n1.bagging n2.boosting n3.隨機(jī)森林 n4.提升樹 n5.GBDT |
分解因子機(jī) |
n1.非負(fù)矩陣分解 n2.協(xié)同過濾 n3.分解因子機(jī) |
巨型圖挖掘 |
n1.復(fù)雜網(wǎng)絡(luò)介紹 n2.當(dāng)前巨型圖應(yīng)用場(chǎng)景 n3.隨機(jī)圖,自然圖, n4.常用的圖計(jì)算框架(google的bagel,graphlab的graphx) n5.巨型圖上的算法實(shí)現(xiàn)原理 n6.常用的基于圖的算法實(shí)現(xiàn) n7.隨機(jī)游走,pageRank基于圖的實(shí)現(xiàn) n8.svd介紹以及svd在圖框架的實(shí)現(xiàn) n9.圖挖掘與推薦系統(tǒng)(qzone的廣告系統(tǒng)廣點(diǎn)通,twitter的內(nèi)容推薦) |
深度學(xué)習(xí)初探 |
n1:word2vec n2:node2vec n3:CNN n4:DNN n5:lstm |
機(jī)器學(xué)習(xí)框架 |
n1:spark n2:參數(shù)服務(wù)器 n3:Tensorflow和其他深度學(xué)習(xí)框架 |
廣義線性分類的原理和應(yīng)用 內(nèi)容:logistic Regression和計(jì)算廣告學(xué) n1.二分類問題的例子 n2.邏輯回歸的數(shù)學(xué)原理 n3.傳統(tǒng)廣告,計(jì)算廣告,廣告實(shí)時(shí)交易平臺(tái) n4.數(shù)據(jù)預(yù)處理和維度提取 n5.LR在計(jì)算廣告中的應(yīng)用 n6.LR的效果測(cè)評(píng),模型調(diào)優(yōu) n7.LR模型中理論與工程的折中 n8.LR和他的小伙伴們:廣義線性模型 n9.新情況,基于移動(dòng)端的廣告實(shí)時(shí)交易平臺(tái),LR的各種變體 |
決策樹,聚類和異常點(diǎn)檢測(cè) 內(nèi)容:決策樹和異常點(diǎn)檢測(cè) n1.決策樹的原理 n2.各種決策樹的生成算法 n3.決策樹在異常點(diǎn)檢測(cè)中的應(yīng)用 n4.決策樹的剪枝 n5.其它異常點(diǎn)檢測(cè)的應(yīng)用小技巧 n6.聚類算法的原理 n7.聚類算法的常見問題:初始點(diǎn)選擇 n8.聚類算法和決策樹在異常點(diǎn)檢測(cè)中的應(yīng)用 n9.結(jié)合計(jì)算廣告,談兩個(gè)異常點(diǎn)檢測(cè)小例子 |
概率圖模型 n1.貝葉斯網(wǎng)絡(luò)(有向圖模型) n2.馬爾科夫網(wǎng)(無向圖模型) n3.條件隨機(jī)場(chǎng)(局部有向圖模型) n4.LDA,PLSA |
Bagging & boosting n1.bagging n2.boosting n3.隨機(jī)森林 n4.提升樹 n5.GBDT |
分解因子機(jī) n1.非負(fù)矩陣分解 n2.協(xié)同過濾 n3.分解因子機(jī) |
巨型圖挖掘 n1.復(fù)雜網(wǎng)絡(luò)介紹 n2.當(dāng)前巨型圖應(yīng)用場(chǎng)景 n3.隨機(jī)圖,自然圖, n4.常用的圖計(jì)算框架(google的bagel,graphlab的graphx) n5.巨型圖上的算法實(shí)現(xiàn)原理 n6.常用的基于圖的算法實(shí)現(xiàn) n7.隨機(jī)游走,pageRank基于圖的實(shí)現(xiàn) n8.svd介紹以及svd在圖框架的實(shí)現(xiàn) n9.圖挖掘與推薦系統(tǒng)(qzone的廣告系統(tǒng)廣點(diǎn)通,twitter的內(nèi)容推薦) |
深度學(xué)習(xí)初探 n1:word2vec n2:node2vec n3:CNN n4:DNN n5:lstm |
機(jī)器學(xué)習(xí)框架 n1:spark n2:參數(shù)服務(wù)器 n3:Tensorflow和其他深度學(xué)習(xí)框架 |