工程師
其他
Python
數(shù)據(jù)分析
推薦課程
average > 0 ? $model->average . '分' : '10.0分' ?>

Python數(shù)據(jù)分析案例實(shí)戰(zhàn)培訓(xùn)

劉老師

某知名咨詢公司 云平臺(tái)系統(tǒng)架構(gòu)師

畢業(yè)于?連理??學(xué)
簡(jiǎn)介:
精通開源的?數(shù)據(jù)?態(tài)技術(shù)和架構(gòu),Hadoop、Hive、Hbase、 Spark、Flink等開源技術(shù)棧。
有10年左右基于?數(shù)據(jù)解決?案平臺(tái)、數(shù)據(jù)架構(gòu)、數(shù)據(jù)中臺(tái)、數(shù)據(jù)治理、數(shù)據(jù)分析和挖掘的?型數(shù)據(jù)湖和數(shù)
據(jù)中臺(tái)項(xiàng)?架構(gòu)實(shí)施經(jīng)驗(yàn),
?前任職國(guó)內(nèi)知名咨詢公司,先后服務(wù)于北京?學(xué)軟件研究所、阿?巴巴、Teradata,實(shí)施過基于開源?數(shù)據(jù)技術(shù)
棧的數(shù)據(jù)湖解決?案和實(shí)施、湖倉(cāng)?體架構(gòu)咨詢和實(shí)施、數(shù)據(jù)中臺(tái)的咨詢和設(shè)施
最近主要項(xiàng)?介紹:
某移動(dòng)?數(shù)據(jù)平臺(tái)架構(gòu)設(shè)計(jì)和設(shè)施 (Hadoop、Spark)
四??之?的數(shù)據(jù)湖咨詢和實(shí)施
某?型商業(yè)銀?數(shù)據(jù)中臺(tái)咨詢
某銀?基于開源?數(shù)據(jù)技術(shù)棧數(shù)據(jù)中臺(tái)的咨詢和實(shí)施
某航空公司數(shù)據(jù)平臺(tái)流批?體解決?案和實(shí)施
特長(zhǎng):
在?數(shù)據(jù)架構(gòu)、開發(fā)、運(yùn)維和優(yōu)化、數(shù)據(jù)集成、 數(shù)據(jù)湖(Data Lake)、數(shù)據(jù)建模、數(shù)據(jù)挖掘/機(jī)器學(xué)習(xí)、數(shù)據(jù)
中臺(tái)等??有豐富經(jīng) 驗(yàn)。

畢業(yè)于?連理??學(xué) 簡(jiǎn)介: 精通開源的?數(shù)據(jù)?態(tài)技術(shù)和架構(gòu),Hadoop、Hive、Hbase、 Spark、Flink等開源技術(shù)棧。 有10年左右基于?數(shù)據(jù)解決?案平臺(tái)、數(shù)據(jù)架構(gòu)、數(shù)據(jù)中臺(tái)、數(shù)據(jù)治理、數(shù)據(jù)分析和挖掘的?型數(shù)據(jù)湖和數(shù) 據(jù)中臺(tái)項(xiàng)?架構(gòu)實(shí)施經(jīng)驗(yàn), ?前任職國(guó)內(nèi)知名咨詢公司,先后服務(wù)于北京?學(xué)軟件研究所、阿?巴巴、Teradata,實(shí)施過基于開源?數(shù)據(jù)技術(shù) 棧的數(shù)據(jù)湖解決?案和實(shí)施、湖倉(cāng)?體架構(gòu)咨詢和實(shí)施、數(shù)據(jù)中臺(tái)的咨詢和設(shè)施 最近主要項(xiàng)?介紹: 某移動(dòng)?數(shù)據(jù)平臺(tái)架構(gòu)設(shè)計(jì)和設(shè)施 (Hadoop、Spark) 四??之?的數(shù)據(jù)湖咨詢和實(shí)施 某?型商業(yè)銀?數(shù)據(jù)中臺(tái)咨詢 某銀?基于開源?數(shù)據(jù)技術(shù)棧數(shù)據(jù)中臺(tái)的咨詢和實(shí)施 某航空公司數(shù)據(jù)平臺(tái)流批?體解決?案和實(shí)施 特長(zhǎng): 在?數(shù)據(jù)架構(gòu)、開發(fā)、運(yùn)維和優(yōu)化、數(shù)據(jù)集成、 數(shù)據(jù)湖(Data Lake)、數(shù)據(jù)建模、數(shù)據(jù)挖掘/機(jī)器學(xué)習(xí)、數(shù)據(jù) 中臺(tái)等??有豐富經(jīng) 驗(yàn)。

課程費(fèi)用

6800.00 /人

課程時(shí)長(zhǎng)

2

成為教練

課程簡(jiǎn)介

課程涵蓋數(shù)據(jù)分析和挖掘流程、常用工具介紹及五個(gè)項(xiàng)目實(shí)戰(zhàn),包括用戶消費(fèi)行為分析、數(shù)據(jù)分析營(yíng)銷案例、餐廳訂單數(shù)據(jù)分析、物流數(shù)據(jù)分析和用戶流失模型構(gòu)建。通過實(shí)操演練,學(xué)員將掌握數(shù)據(jù)預(yù)處理、特征工程、建模與評(píng)估等技能,并能運(yùn)用所學(xué)知識(shí)解決實(shí)際業(yè)務(wù)問題。本課程適合數(shù)據(jù)分析師、數(shù)據(jù)科學(xué)家等角色,旨在提升學(xué)員的Python數(shù)據(jù)分析和挖掘能力。

目標(biāo)收益

培訓(xùn)對(duì)象

課程大綱

第一天
數(shù)據(jù)分析和挖掘流程介紹
數(shù)據(jù)挖掘的基本任務(wù)
定義分析和挖掘目標(biāo)
數(shù)據(jù)取樣
數(shù)據(jù)探索
單變量數(shù)據(jù)探索
數(shù)據(jù)關(guān)聯(lián)性分析
數(shù)據(jù)預(yù)處理
數(shù)據(jù)特征工程構(gòu)建和選擇
挖掘建模
模型評(píng)價(jià)
數(shù)據(jù)分析和挖掘常用的工具 Jupyter工具介紹和使用
Numpy基本使用
Pandas基本使用
數(shù)據(jù)加載與處理
Pandas分組與合并
Pandas時(shí)間序列
Matplotlib基本使用
Scikit-Learn基本使用
PySpark工具介紹
項(xiàng)目實(shí)戰(zhàn)一:
用戶消費(fèi)行為數(shù)據(jù)分析實(shí)戰(zhàn)
項(xiàng)目介紹和需求分析
數(shù)據(jù)介紹和數(shù)據(jù)導(dǎo)入
數(shù)據(jù)預(yù)處理
用戶個(gè)體消費(fèi)數(shù)據(jù)分析
用戶消費(fèi)行為數(shù)據(jù)分析
用戶分層RFM模型
新用戶、活躍用戶、回流用戶和用戶流失分析
用戶購(gòu)買周期分析
用戶生命周期分析
用戶復(fù)購(gòu)率分析
用戶回購(gòu)分析
用戶營(yíng)銷和推薦分析
項(xiàng)目總結(jié)和報(bào)告撰寫
項(xiàng)目實(shí)戰(zhàn)二:
數(shù)據(jù)分析營(yíng)銷案例實(shí)戰(zhàn)
一、數(shù)據(jù)概況分析
? 數(shù)據(jù)概況
? 數(shù)據(jù)清洗
二、單變量分析
? 觀察樣本0、1的平衡性
? 觀察均值大小
? 可視化
三、相關(guān)性分析和可視化
四、邏輯回歸模型的建立和評(píng)估
? 模型建立
? 模型評(píng)估
? 模型優(yōu)化
五、業(yè)務(wù)價(jià)值
六、模型管理、發(fā)布和調(diào)用
第二天
項(xiàng)目實(shí)戰(zhàn)三:
餐廳訂單數(shù)據(jù)分析實(shí)戰(zhàn)
一、數(shù)據(jù)概況分析
? 數(shù)據(jù)概況
? 數(shù)據(jù)清洗
最受歡迎的菜單分析及可視化展示
訂單消費(fèi)維度分析及可視化展示
日期與時(shí)間維度分析及可視化展示
菜單組合營(yíng)銷分析
項(xiàng)目總結(jié)
項(xiàng)目實(shí)戰(zhàn)四:
物流數(shù)據(jù)粉實(shí)戰(zhàn)
需求分析
數(shù)據(jù)預(yù)處理-重復(fù)值、缺失值、數(shù)據(jù)格式調(diào)整
異常值和偏態(tài)分布處理
月份列的數(shù)據(jù)格式處理
貨品配送服務(wù)分析
銷售區(qū)域潛力分析
商品質(zhì)量分析
項(xiàng)目總結(jié)
項(xiàng)目實(shí)戰(zhàn)五:
用戶流失模型實(shí)戰(zhàn)
技術(shù)架構(gòu)介紹
流失模型構(gòu)建
-數(shù)據(jù)清洗和轉(zhuǎn)換
-空值和異常值處理
-數(shù)據(jù)歸一化
-特征提取
-特征的降維和升維
-文本的數(shù)據(jù)化
決策樹和隨機(jī)森林介紹
基于Python的用戶流失模型開發(fā)
模型測(cè)試
第一天
數(shù)據(jù)分析和挖掘流程介紹
數(shù)據(jù)挖掘的基本任務(wù)
定義分析和挖掘目標(biāo)
數(shù)據(jù)取樣
數(shù)據(jù)探索
單變量數(shù)據(jù)探索
數(shù)據(jù)關(guān)聯(lián)性分析
數(shù)據(jù)預(yù)處理
數(shù)據(jù)特征工程構(gòu)建和選擇
挖掘建模
模型評(píng)價(jià)
數(shù)據(jù)分析和挖掘常用的工具
Jupyter工具介紹和使用
Numpy基本使用
Pandas基本使用
數(shù)據(jù)加載與處理
Pandas分組與合并
Pandas時(shí)間序列
Matplotlib基本使用
Scikit-Learn基本使用
PySpark工具介紹
項(xiàng)目實(shí)戰(zhàn)一:
用戶消費(fèi)行為數(shù)據(jù)分析實(shí)戰(zhàn)
項(xiàng)目介紹和需求分析
數(shù)據(jù)介紹和數(shù)據(jù)導(dǎo)入
數(shù)據(jù)預(yù)處理
用戶個(gè)體消費(fèi)數(shù)據(jù)分析
用戶消費(fèi)行為數(shù)據(jù)分析
用戶分層RFM模型
新用戶、活躍用戶、回流用戶和用戶流失分析
用戶購(gòu)買周期分析
用戶生命周期分析
用戶復(fù)購(gòu)率分析
用戶回購(gòu)分析
用戶營(yíng)銷和推薦分析
項(xiàng)目總結(jié)和報(bào)告撰寫
項(xiàng)目實(shí)戰(zhàn)二:
數(shù)據(jù)分析營(yíng)銷案例實(shí)戰(zhàn)
一、數(shù)據(jù)概況分析
? 數(shù)據(jù)概況
? 數(shù)據(jù)清洗
二、單變量分析
? 觀察樣本0、1的平衡性
? 觀察均值大小
? 可視化
三、相關(guān)性分析和可視化
四、邏輯回歸模型的建立和評(píng)估
? 模型建立
? 模型評(píng)估
? 模型優(yōu)化
五、業(yè)務(wù)價(jià)值
六、模型管理、發(fā)布和調(diào)用
第二天
項(xiàng)目實(shí)戰(zhàn)三:
餐廳訂單數(shù)據(jù)分析實(shí)戰(zhàn)
一、數(shù)據(jù)概況分析
? 數(shù)據(jù)概況
? 數(shù)據(jù)清洗
最受歡迎的菜單分析及可視化展示
訂單消費(fèi)維度分析及可視化展示
日期與時(shí)間維度分析及可視化展示
菜單組合營(yíng)銷分析
項(xiàng)目總結(jié)
項(xiàng)目實(shí)戰(zhàn)四:
物流數(shù)據(jù)粉實(shí)戰(zhàn)
需求分析
數(shù)據(jù)預(yù)處理-重復(fù)值、缺失值、數(shù)據(jù)格式調(diào)整
異常值和偏態(tài)分布處理
月份列的數(shù)據(jù)格式處理
貨品配送服務(wù)分析
銷售區(qū)域潛力分析
商品質(zhì)量分析
項(xiàng)目總結(jié)
項(xiàng)目實(shí)戰(zhàn)五:
用戶流失模型實(shí)戰(zhàn)
技術(shù)架構(gòu)介紹
流失模型構(gòu)建
-數(shù)據(jù)清洗和轉(zhuǎn)換
-空值和異常值處理
-數(shù)據(jù)歸一化
-特征提取
-特征的降維和升維
-文本的數(shù)據(jù)化
決策樹和隨機(jī)森林介紹
基于Python的用戶流失模型開發(fā)
模型測(cè)試

課程費(fèi)用

6800.00 /人

課程時(shí)長(zhǎng)

2

預(yù)約體驗(yàn)票 我要分享

近期公開課推薦

近期公開課推薦

活動(dòng)詳情

提交需求