課程簡(jiǎn)介
聚焦DeepSeek大模型技術(shù)體系的全面解析。從模型架構(gòu)、訓(xùn)練范式到部署實(shí)踐,系統(tǒng)性地介紹DeepSeek從V1到R1的技術(shù)演進(jìn)歷程,并結(jié)合實(shí)際案例講解大模型在工業(yè)場(chǎng)景中的落地應(yīng)用。
目標(biāo)收益
掌握DeepSeek大模型的核心技術(shù)原理和創(chuàng)新點(diǎn)
學(xué)習(xí)大模型訓(xùn)練、微調(diào)和部署的實(shí)踐技能
了解MoE架構(gòu)和分布式訓(xùn)練的關(guān)鍵技術(shù)
掌握模型應(yīng)用落地的最佳實(shí)踐經(jīng)驗(yàn)
培訓(xùn)對(duì)象
AI算法工程師
機(jī)器學(xué)習(xí)研究員
深度學(xué)習(xí)開發(fā)工程師
大模型應(yīng)用開發(fā)人員
對(duì)大模型技術(shù)感興趣的技術(shù)管理者
課程大綱
第一天 上午 9:00-12:00 DeepSeek演進(jìn)路線及核心技術(shù) |
- DeepSeek發(fā)展里程碑:從Coder到R1的完整演進(jìn)路線 - MoE架構(gòu)創(chuàng)新:從Dense到MoE的技術(shù)突破 - 核心訓(xùn)練范式:SFT、RL原理與應(yīng)用 - 推理增強(qiáng)技術(shù):CoT和搜索算法的實(shí)踐應(yīng)用 - 并行計(jì)算技術(shù):DP、EP、PP、TP的協(xié)同機(jī)制 |
下午14:00-16:00 DeepSeek高效推理部署 |
- 全參數(shù)模型部署方案與硬件規(guī)劃 - 分布式推理性能優(yōu)化技巧 - Ollama蒸餾模型部署流程 - VLLM推理加速框架實(shí)踐 - NPU部署方案與性能調(diào)優(yōu) |
第二天 上午 9:00-12:00 DeepSeek訓(xùn)練微調(diào)與蒸餾 |
- R1-Zero純強(qiáng)化學(xué)習(xí)訓(xùn)練原理 - 多階段增強(qiáng)訓(xùn)練策略 - 模型蒸餾技術(shù)實(shí)踐 - Unsloth訓(xùn)練推理模型實(shí)踐 - GRPO算法與獎(jiǎng)勵(lì)模型訓(xùn)練實(shí)戰(zhàn) |
下午14:00-16:00 DeepSeek應(yīng)用實(shí)踐 |
- deepseek Prompt工程最佳實(shí)踐 - 思維鏈應(yīng)用案例分析 - 垂直領(lǐng)域RAG應(yīng)用方案 - 分布式推理訓(xùn)練集群趨勢(shì) - 技術(shù)發(fā)展趨勢(shì)與未來展望 |
第一天 上午 9:00-12:00 DeepSeek演進(jìn)路線及核心技術(shù) - DeepSeek發(fā)展里程碑:從Coder到R1的完整演進(jìn)路線 - MoE架構(gòu)創(chuàng)新:從Dense到MoE的技術(shù)突破 - 核心訓(xùn)練范式:SFT、RL原理與應(yīng)用 - 推理增強(qiáng)技術(shù):CoT和搜索算法的實(shí)踐應(yīng)用 - 并行計(jì)算技術(shù):DP、EP、PP、TP的協(xié)同機(jī)制 |
下午14:00-16:00 DeepSeek高效推理部署 - 全參數(shù)模型部署方案與硬件規(guī)劃 - 分布式推理性能優(yōu)化技巧 - Ollama蒸餾模型部署流程 - VLLM推理加速框架實(shí)踐 - NPU部署方案與性能調(diào)優(yōu) |
第二天 上午 9:00-12:00 DeepSeek訓(xùn)練微調(diào)與蒸餾 - R1-Zero純強(qiáng)化學(xué)習(xí)訓(xùn)練原理 - 多階段增強(qiáng)訓(xùn)練策略 - 模型蒸餾技術(shù)實(shí)踐 - Unsloth訓(xùn)練推理模型實(shí)踐 - GRPO算法與獎(jiǎng)勵(lì)模型訓(xùn)練實(shí)戰(zhàn) |
下午14:00-16:00 DeepSeek應(yīng)用實(shí)踐 - deepseek Prompt工程最佳實(shí)踐 - 思維鏈應(yīng)用案例分析 - 垂直領(lǐng)域RAG應(yīng)用方案 - 分布式推理訓(xùn)練集群趨勢(shì) - 技術(shù)發(fā)展趨勢(shì)與未來展望 |