工程師
其他
大模型
推薦課程
average > 0 ? $model->average . '分' : '10.0分' ?>

DeepSeek大模型落地技術(shù)及實(shí)踐(實(shí)操課)

HiroTan

某公司 多模態(tài)大模型負(fù)責(zé)人

老師是國(guó)內(nèi)一線的人工智能和大模型算法專家。某公司,多模態(tài)大模型負(fù)責(zé)人,多年行業(yè)算法工作經(jīng)驗(yàn),專注于機(jī)器學(xué)習(xí)與大模型落地實(shí)踐;對(duì)于國(guó)產(chǎn)芯片的大模型落地有豐富的實(shí)踐經(jīng)驗(yàn),實(shí)戰(zhàn)經(jīng)驗(yàn)覆蓋C端產(chǎn)品、B端產(chǎn)品、與硬件大模型落地方案。在技術(shù)層面,老師尤為擅長(zhǎng)圍繞人工智能領(lǐng)域的全線技術(shù),研究方向包括多模態(tài)大模型,端側(cè)邊緣計(jì)算等。
曾任百度集團(tuán)(大數(shù)據(jù)部)算法專家;

老師是國(guó)內(nèi)一線的人工智能和大模型算法專家。某公司,多模態(tài)大模型負(fù)責(zé)人,多年行業(yè)算法工作經(jīng)驗(yàn),專注于機(jī)器學(xué)習(xí)與大模型落地實(shí)踐;對(duì)于國(guó)產(chǎn)芯片的大模型落地有豐富的實(shí)踐經(jīng)驗(yàn),實(shí)戰(zhàn)經(jīng)驗(yàn)覆蓋C端產(chǎn)品、B端產(chǎn)品、與硬件大模型落地方案。在技術(shù)層面,老師尤為擅長(zhǎng)圍繞人工智能領(lǐng)域的全線技術(shù),研究方向包括多模態(tài)大模型,端側(cè)邊緣計(jì)算等。 曾任百度集團(tuán)(大數(shù)據(jù)部)算法專家;

課程費(fèi)用

6800.00 /人

課程時(shí)長(zhǎng)

2

成為教練

課程簡(jiǎn)介

聚焦DeepSeek大模型技術(shù)體系的全面解析。從模型架構(gòu)、訓(xùn)練范式到部署實(shí)踐,系統(tǒng)性地介紹DeepSeek從V1到R1的技術(shù)演進(jìn)歷程,并結(jié)合實(shí)際案例講解大模型在工業(yè)場(chǎng)景中的落地應(yīng)用。

目標(biāo)收益

掌握DeepSeek大模型的核心技術(shù)原理和創(chuàng)新點(diǎn)
學(xué)習(xí)大模型訓(xùn)練、微調(diào)和部署的實(shí)踐技能
了解MoE架構(gòu)和分布式訓(xùn)練的關(guān)鍵技術(shù)
掌握模型應(yīng)用落地的最佳實(shí)踐經(jīng)驗(yàn)

培訓(xùn)對(duì)象

AI算法工程師
機(jī)器學(xué)習(xí)研究員
深度學(xué)習(xí)開發(fā)工程師
大模型應(yīng)用開發(fā)人員
對(duì)大模型技術(shù)感興趣的技術(shù)管理者

課程大綱

第一天
上午 9:00-12:00
DeepSeek演進(jìn)路線及核心技術(shù)
- DeepSeek發(fā)展里程碑:從Coder到R1的完整演進(jìn)路線
- MoE架構(gòu)創(chuàng)新:從Dense到MoE的技術(shù)突破
- 核心訓(xùn)練范式:SFT、RL原理與應(yīng)用
- 推理增強(qiáng)技術(shù):CoT和搜索算法的實(shí)踐應(yīng)用
- 并行計(jì)算技術(shù):DP、EP、PP、TP的協(xié)同機(jī)制
下午14:00-16:00
DeepSeek高效推理部署
- 全參數(shù)模型部署方案與硬件規(guī)劃
- 分布式推理性能優(yōu)化技巧
- Ollama蒸餾模型部署流程
- VLLM推理加速框架實(shí)踐
- NPU部署方案與性能調(diào)優(yōu)
第二天
上午 9:00-12:00
DeepSeek訓(xùn)練微調(diào)與蒸餾
- R1-Zero純強(qiáng)化學(xué)習(xí)訓(xùn)練原理
- 多階段增強(qiáng)訓(xùn)練策略
- 模型蒸餾技術(shù)實(shí)踐
- Unsloth訓(xùn)練推理模型實(shí)踐
- GRPO算法與獎(jiǎng)勵(lì)模型訓(xùn)練實(shí)戰(zhàn)
下午14:00-16:00
DeepSeek應(yīng)用實(shí)踐
- deepseek Prompt工程最佳實(shí)踐
- 思維鏈應(yīng)用案例分析
- 垂直領(lǐng)域RAG應(yīng)用方案
- 分布式推理訓(xùn)練集群趨勢(shì)
- 技術(shù)發(fā)展趨勢(shì)與未來展望
第一天
上午 9:00-12:00
DeepSeek演進(jìn)路線及核心技術(shù)
- DeepSeek發(fā)展里程碑:從Coder到R1的完整演進(jìn)路線
- MoE架構(gòu)創(chuàng)新:從Dense到MoE的技術(shù)突破
- 核心訓(xùn)練范式:SFT、RL原理與應(yīng)用
- 推理增強(qiáng)技術(shù):CoT和搜索算法的實(shí)踐應(yīng)用
- 并行計(jì)算技術(shù):DP、EP、PP、TP的協(xié)同機(jī)制
下午14:00-16:00
DeepSeek高效推理部署
- 全參數(shù)模型部署方案與硬件規(guī)劃
- 分布式推理性能優(yōu)化技巧
- Ollama蒸餾模型部署流程
- VLLM推理加速框架實(shí)踐
- NPU部署方案與性能調(diào)優(yōu)
第二天
上午 9:00-12:00
DeepSeek訓(xùn)練微調(diào)與蒸餾

- R1-Zero純強(qiáng)化學(xué)習(xí)訓(xùn)練原理
- 多階段增強(qiáng)訓(xùn)練策略
- 模型蒸餾技術(shù)實(shí)踐
- Unsloth訓(xùn)練推理模型實(shí)踐
- GRPO算法與獎(jiǎng)勵(lì)模型訓(xùn)練實(shí)戰(zhàn)
下午14:00-16:00
DeepSeek應(yīng)用實(shí)踐
- deepseek Prompt工程最佳實(shí)踐
- 思維鏈應(yīng)用案例分析
- 垂直領(lǐng)域RAG應(yīng)用方案
- 分布式推理訓(xùn)練集群趨勢(shì)
- 技術(shù)發(fā)展趨勢(shì)與未來展望

課程費(fèi)用

6800.00 /人

課程時(shí)長(zhǎng)

2

預(yù)約體驗(yàn)票 我要分享

近期公開課推薦

近期公開課推薦

活動(dòng)詳情

提交需求