課程簡介
覆蓋了深度學(xué)習(xí)、強化學(xué)習(xí)和大模型的基本概念,并從理論到應(yīng)用逐步展開,旨在幫助學(xué)生建立全面的理解。
目標(biāo)收益
培訓(xùn)對象
課程內(nèi)容
第一部分:深度學(xué)習(xí)基礎(chǔ)(3小時)
一,深度學(xué)習(xí)簡介 (30分鐘)
1.什么是深度學(xué)習(xí)?
2.深度學(xué)習(xí)的歷史背景和發(fā)展
3.深度學(xué)習(xí)與傳統(tǒng)機器學(xué)習(xí)的區(qū)別
二,神經(jīng)網(wǎng)絡(luò)基礎(chǔ) (1小時)
1.神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)(感知機、多層感知機)
2.激活函數(shù)(ReLU、Sigmoid等)
3.反向傳播算法
三,卷積神經(jīng)網(wǎng)絡(luò)(CNN) (1小時)
1.CNN的基本概念與原理
2.卷積層、池化層、全連接層
3.常見CNN架構(gòu)(如LeNet、VGG、ResNet)
四,訓(xùn)練與優(yōu)化 (30分鐘)
1.梯度下降與優(yōu)化方法(SGD、Adam等)
2.正則化與避免過擬合
第二部分:大模型與智能體(3小時)
一,大模型的挑戰(zhàn)與應(yīng)用 (1小時)
1.大模型的定義與特點
2.GPT、BERT等大型預(yù)訓(xùn)練模型的架構(gòu)與應(yīng)用
3.DeepSeek 的推理模型
4.CLIP跨模態(tài)大模型
5.訓(xùn)練大模型的技術(shù)挑戰(zhàn)(計算資源、數(shù)據(jù)等)
二,智能體與強化學(xué)習(xí) (1小時)
1.強化學(xué)習(xí)基本概念:獎勵、策略、值函數(shù)
2.Q-learning與深度Q網(wǎng)絡(luò)(DQN)
訓(xùn)練智能體的環(huán)境與算法