廣告

當(dāng)前位置:首頁(yè) > AI大模型 > DeepSpeed

Logo

DeepSpeed

DeepSpeed,微軟開(kāi)發(fā)的開(kāi)源深度學(xué)習(xí)優(yōu)化庫(kù),大規(guī)模模型分布式訓(xùn)練的工具

類(lèi)別: AI大模型

詳情內(nèi)容

DeepSpeed官網(wǎng),微軟開(kāi)發(fā)的開(kāi)源深度學(xué)習(xí)優(yōu)化庫(kù),大規(guī)模模型分布式訓(xùn)練的工具

什么是DeepSpeed?

DeepSpeed是微軟推出的大規(guī)模模型分布式訓(xùn)練的工具,主要實(shí)現(xiàn)了ZeRO并行訓(xùn)練算法。DeepSpeed是一個(gè)由微軟開(kāi)發(fā)的開(kāi)源深度學(xué)習(xí)優(yōu)化庫(kù),旨在提高大規(guī)模模型訓(xùn)練的效率和可擴(kuò)展性。它通過(guò)多種技術(shù)手段來(lái)加速訓(xùn)練,包括模型并行化、梯度累積、動(dòng)態(tài)精度縮放、本地模式混合精度等。DeepSpeed還提供了一些輔助工具,如分布式訓(xùn)練管理、內(nèi)存優(yōu)化和模型壓縮等,以幫助開(kāi)發(fā)者更好地管理和優(yōu)化大規(guī)模深度學(xué)習(xí)訓(xùn)練任務(wù)。此外deepspeed基于pytorch構(gòu)建,只需要簡(jiǎn)單修改即可遷移。DeepSpeed已經(jīng)在許多大規(guī)模深度學(xué)習(xí)項(xiàng)目中得到了應(yīng)用,包括語(yǔ)言模型、圖像分類(lèi)、目標(biāo)檢測(cè)等等。

DeepSpeed官網(wǎng): https://www.deepspeed.ai/

github開(kāi)源地址: https://github.com/microsoft/DeepSpeed

廣告

用戶評(píng)論

相關(guān)推薦

Recommend

Logo
百度文心大模型

百度文心大模型官網(wǎng),ai作畫(huà)網(wǎng)站,寫(xiě)作,ai繪畫(huà),論文,文生圖,寫(xiě)歌


Logo
天工AI助手

天工AI助手,對(duì)標(biāo)ChatGPT的大語(yǔ)言模型


Logo
騰訊混元大模型

騰訊混元大模型官網(wǎng)入口,api,發(fā)布時(shí)間,升級(jí),申請(qǐng)


Logo
百川大模型

百川大模型官網(wǎng),百川智能baichuan,匯聚世界知識(shí) 創(chuàng)作妙筆生花


Logo
PaLM 2

palm2,Google的下一代大語(yǔ)言模型,3.6萬(wàn)億token,3400億參數(shù)