課程簡(jiǎn)介
課程涵蓋數(shù)據(jù)分析和挖掘流程、常用工具介紹及五個(gè)項(xiàng)目實(shí)戰(zhàn),包括用戶消費(fèi)行為分析、數(shù)據(jù)分析營(yíng)銷案例、餐廳訂單數(shù)據(jù)分析、物流數(shù)據(jù)分析和用戶流失模型構(gòu)建。通過實(shí)操演練,學(xué)員將掌握數(shù)據(jù)預(yù)處理、特征工程、建模與評(píng)估等技能,并能運(yùn)用所學(xué)知識(shí)解決實(shí)際業(yè)務(wù)問題。本課程適合數(shù)據(jù)分析師、數(shù)據(jù)科學(xué)家等角色,旨在提升學(xué)員的Python數(shù)據(jù)分析和挖掘能力。
目標(biāo)收益
培訓(xùn)對(duì)象
課程大綱
第一天 數(shù)據(jù)分析和挖掘流程介紹 |
數(shù)據(jù)挖掘的基本任務(wù) 定義分析和挖掘目標(biāo) 數(shù)據(jù)取樣 數(shù)據(jù)探索 單變量數(shù)據(jù)探索 數(shù)據(jù)關(guān)聯(lián)性分析 數(shù)據(jù)預(yù)處理 數(shù)據(jù)特征工程構(gòu)建和選擇 挖掘建模 模型評(píng)價(jià) |
數(shù)據(jù)分析和挖掘常用的工具 |
Jupyter工具介紹和使用 Numpy基本使用 Pandas基本使用 數(shù)據(jù)加載與處理 Pandas分組與合并 Pandas時(shí)間序列 Matplotlib基本使用 Scikit-Learn基本使用 PySpark工具介紹 |
項(xiàng)目實(shí)戰(zhàn)一: 用戶消費(fèi)行為數(shù)據(jù)分析實(shí)戰(zhàn) |
項(xiàng)目介紹和需求分析 數(shù)據(jù)介紹和數(shù)據(jù)導(dǎo)入 數(shù)據(jù)預(yù)處理 用戶個(gè)體消費(fèi)數(shù)據(jù)分析 用戶消費(fèi)行為數(shù)據(jù)分析 用戶分層RFM模型 新用戶、活躍用戶、回流用戶和用戶流失分析 用戶購(gòu)買周期分析 用戶生命周期分析 用戶復(fù)購(gòu)率分析 用戶回購(gòu)分析 用戶營(yíng)銷和推薦分析 項(xiàng)目總結(jié)和報(bào)告撰寫 |
項(xiàng)目實(shí)戰(zhàn)二: 數(shù)據(jù)分析營(yíng)銷案例實(shí)戰(zhàn) |
一、數(shù)據(jù)概況分析 ? 數(shù)據(jù)概況 ? 數(shù)據(jù)清洗 二、單變量分析 ? 觀察樣本0、1的平衡性 ? 觀察均值大小 ? 可視化 三、相關(guān)性分析和可視化 四、邏輯回歸模型的建立和評(píng)估 ? 模型建立 ? 模型評(píng)估 ? 模型優(yōu)化 五、業(yè)務(wù)價(jià)值 六、模型管理、發(fā)布和調(diào)用 |
第二天 項(xiàng)目實(shí)戰(zhàn)三: 餐廳訂單數(shù)據(jù)分析實(shí)戰(zhàn) |
一、數(shù)據(jù)概況分析 ? 數(shù)據(jù)概況 ? 數(shù)據(jù)清洗 最受歡迎的菜單分析及可視化展示 訂單消費(fèi)維度分析及可視化展示 日期與時(shí)間維度分析及可視化展示 菜單組合營(yíng)銷分析 項(xiàng)目總結(jié) |
項(xiàng)目實(shí)戰(zhàn)四: 物流數(shù)據(jù)粉實(shí)戰(zhàn) |
需求分析 數(shù)據(jù)預(yù)處理-重復(fù)值、缺失值、數(shù)據(jù)格式調(diào)整 異常值和偏態(tài)分布處理 月份列的數(shù)據(jù)格式處理 貨品配送服務(wù)分析 銷售區(qū)域潛力分析 商品質(zhì)量分析 項(xiàng)目總結(jié) |
項(xiàng)目實(shí)戰(zhàn)五: 用戶流失模型實(shí)戰(zhàn) |
技術(shù)架構(gòu)介紹 流失模型構(gòu)建 -數(shù)據(jù)清洗和轉(zhuǎn)換 -空值和異常值處理 -數(shù)據(jù)歸一化 -特征提取 -特征的降維和升維 -文本的數(shù)據(jù)化 決策樹和隨機(jī)森林介紹 基于Python的用戶流失模型開發(fā) 模型測(cè)試 |
第一天 數(shù)據(jù)分析和挖掘流程介紹 數(shù)據(jù)挖掘的基本任務(wù) 定義分析和挖掘目標(biāo) 數(shù)據(jù)取樣 數(shù)據(jù)探索 單變量數(shù)據(jù)探索 數(shù)據(jù)關(guān)聯(lián)性分析 數(shù)據(jù)預(yù)處理 數(shù)據(jù)特征工程構(gòu)建和選擇 挖掘建模 模型評(píng)價(jià) |
數(shù)據(jù)分析和挖掘常用的工具 Jupyter工具介紹和使用 Numpy基本使用 Pandas基本使用 數(shù)據(jù)加載與處理 Pandas分組與合并 Pandas時(shí)間序列 Matplotlib基本使用 Scikit-Learn基本使用 PySpark工具介紹 |
項(xiàng)目實(shí)戰(zhàn)一: 用戶消費(fèi)行為數(shù)據(jù)分析實(shí)戰(zhàn) 項(xiàng)目介紹和需求分析 數(shù)據(jù)介紹和數(shù)據(jù)導(dǎo)入 數(shù)據(jù)預(yù)處理 用戶個(gè)體消費(fèi)數(shù)據(jù)分析 用戶消費(fèi)行為數(shù)據(jù)分析 用戶分層RFM模型 新用戶、活躍用戶、回流用戶和用戶流失分析 用戶購(gòu)買周期分析 用戶生命周期分析 用戶復(fù)購(gòu)率分析 用戶回購(gòu)分析 用戶營(yíng)銷和推薦分析 項(xiàng)目總結(jié)和報(bào)告撰寫 |
項(xiàng)目實(shí)戰(zhàn)二: 數(shù)據(jù)分析營(yíng)銷案例實(shí)戰(zhàn) 一、數(shù)據(jù)概況分析 ? 數(shù)據(jù)概況 ? 數(shù)據(jù)清洗 二、單變量分析 ? 觀察樣本0、1的平衡性 ? 觀察均值大小 ? 可視化 三、相關(guān)性分析和可視化 四、邏輯回歸模型的建立和評(píng)估 ? 模型建立 ? 模型評(píng)估 ? 模型優(yōu)化 五、業(yè)務(wù)價(jià)值 六、模型管理、發(fā)布和調(diào)用 |
第二天 項(xiàng)目實(shí)戰(zhàn)三: 餐廳訂單數(shù)據(jù)分析實(shí)戰(zhàn) 一、數(shù)據(jù)概況分析 ? 數(shù)據(jù)概況 ? 數(shù)據(jù)清洗 最受歡迎的菜單分析及可視化展示 訂單消費(fèi)維度分析及可視化展示 日期與時(shí)間維度分析及可視化展示 菜單組合營(yíng)銷分析 項(xiàng)目總結(jié) |
項(xiàng)目實(shí)戰(zhàn)四: 物流數(shù)據(jù)粉實(shí)戰(zhàn) 需求分析 數(shù)據(jù)預(yù)處理-重復(fù)值、缺失值、數(shù)據(jù)格式調(diào)整 異常值和偏態(tài)分布處理 月份列的數(shù)據(jù)格式處理 貨品配送服務(wù)分析 銷售區(qū)域潛力分析 商品質(zhì)量分析 項(xiàng)目總結(jié) |
項(xiàng)目實(shí)戰(zhàn)五: 用戶流失模型實(shí)戰(zhàn) 技術(shù)架構(gòu)介紹 流失模型構(gòu)建 -數(shù)據(jù)清洗和轉(zhuǎn)換 -空值和異常值處理 -數(shù)據(jù)歸一化 -特征提取 -特征的降維和升維 -文本的數(shù)據(jù)化 決策樹和隨機(jī)森林介紹 基于Python的用戶流失模型開發(fā) 模型測(cè)試 |