資料介紹
軟件簡介
PatrickStar 是一款騰訊開發(fā)的分布式深度學(xué)習(xí)訓(xùn)練工具,它的設(shè)計(jì)目標(biāo)是支持以 GPT、Bert 為代表的超大預(yù)訓(xùn)練模型訓(xùn)練。
用法
PatrickStar 基于 PyTorch,這使得遷移 pytorch 項(xiàng)目變得容易。以下是 PatrickStar 的示例:
from patrickstar.runtime import initialize_engine config = { "optimizer": { "type": "Adam", "params": { "lr": 0.001, "betas": (0.9, 0.999), "eps": 1e-6, "weight_decay": 0, "use_hybrid_adam": True, }, }, "fp16": { # loss scaler params "enabled": True, "loss_scale": 0, "initial_scale_power": 2 ** 3, "loss_scale_window": 1000, "hysteresis": 2, "min_loss_scale": 1, }, "default_chunk_size": 64 * 1024 * 1024, "release_after_init": True, "use_cpu_embedding": False, } def model_func(): # MyModel is a derived class for torch.nn.Module return MyModel(...) model, optimizer = initialize_engine(model_func=model_func, local_rank=0, config=config) ... for data in dataloader: optimizer.zero_grad() loss = model(data) model.backward(loss) optimizer.step()
使用與?DeepSpeed 配置 JSON?相同的config
格式,主要包括優(yōu)化器、損失縮放器和一些 PatrickStar 特定配置的參數(shù)。
引用我們
@article{fang2021patrickstar,
title={PatrickStar: Parallel Training of Pre-trained Models via a Chunk-based Memory Management},
author={Fang, Jiarui and Yu, Yang and Zhu, Zilin and Li, Shenggui and You, Yang and Zhou, Jie},
journal={arXiv preprint arXiv:2108.05818},
year={2021}
}
- 深度學(xué)習(xí)在嵌入式設(shè)備上的應(yīng)用
- 基于Simulink的電子對抗分布式仿真系統(tǒng) 26次下載
- 基于DSP的航空發(fā)動機(jī)分布式總線設(shè)計(jì)方案 14次下載
- 輕量級分布式機(jī)器學(xué)習(xí)系統(tǒng)及算法 16次下載
- 面向聯(lián)邦學(xué)習(xí)的分布式與隱私安全性綜述 3次下載
- 基于預(yù)訓(xùn)練模型和長短期記憶網(wǎng)絡(luò)的深度學(xué)習(xí)模型 19次下載
- 一種優(yōu)化的分布式二維卷積算法 1次下載
- 基于分布式數(shù)據(jù)Cache的實(shí)時(shí)動態(tài)遷移機(jī)制 20次下載
- 一種分布式網(wǎng)絡(luò)掃描架構(gòu)和任務(wù)調(diào)度算法 19次下載
- 深度學(xué)習(xí)是什么?了解深度學(xué)習(xí)難嗎?讓你快速了解深度學(xué)習(xí)的視頻講解 16次下載
- 基于虛擬化的多GPU深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練框架 0次下載
- 小波域分布式深度圖視頻編碼 1次下載
- 引入深度遍歷機(jī)制的分布式數(shù)據(jù)結(jié)構(gòu)插值算法 0次下載
- GL Studio的分布式虛擬訓(xùn)練系統(tǒng)關(guān)鍵技術(shù) 27次下載
- 分布式對象調(diào)試中的事件模型
- 深度學(xué)習(xí)模型訓(xùn)練過程詳解 424次閱讀
- Java手寫分布式鎖的實(shí)現(xiàn) 424次閱讀
- tldb提供分布式鎖使用方法 761次閱讀
- 基于PyTorch的模型并行分布式訓(xùn)練Megatron解析 2284次閱讀
- 視覺深度學(xué)習(xí)遷移學(xué)習(xí)訓(xùn)練框架Torchvision介紹 734次閱讀
- 如何使用分布式存儲系統(tǒng)促進(jìn)AI模型訓(xùn)練 494次閱讀
- 基于多智能體深度強(qiáng)化學(xué)習(xí)的體系任務(wù)分配方法 3370次閱讀
- 鴻蒙分布式相機(jī)“踩坑”分享 1578次閱讀
- 分布式鎖的設(shè)計(jì)與實(shí)現(xiàn) 1563次閱讀
- 分布式光纖傳感器原理_分布式光纖傳感器的應(yīng)用 8424次閱讀
- NVIDIA遷移學(xué)習(xí)工具包 :用于特定領(lǐng)域深度學(xué)習(xí)模型快速訓(xùn)練的高級SDK 3031次閱讀
- 有多快?華為云刷新深度學(xué)習(xí)加速紀(jì)錄 5134次閱讀
- 淺談分布式塊存儲的元數(shù)據(jù)服務(wù)設(shè)計(jì) 4871次閱讀
- 如何借助分布式GPU環(huán)境來提升神經(jīng)網(wǎng)絡(luò)訓(xùn)練系統(tǒng)的浮點(diǎn)計(jì)算能力 5063次閱讀
- 深度解讀分布式存儲技術(shù)之分布式剪枝系統(tǒng) 1773次閱讀
下載排行
本周
- 1使用單片機(jī)實(shí)現(xiàn)七人表決器的程序和仿真資料免費(fèi)下載
- 2.96 MB | 44次下載 | 免費(fèi)
- 2聯(lián)想E46L DAOLL6筆記本電腦圖紙
- 1.10 MB | 2次下載 | 5 積分
- 3MATLAB繪圖合集
- 27.12 MB | 2次下載 | 5 積分
- 4PR735,使用UCC28060的600W交錯式PFC轉(zhuǎn)換器
- 540.03KB | 1次下載 | 免費(fèi)
- 5UCC38C42 30W同步降壓轉(zhuǎn)換器參考設(shè)計(jì)
- 428.07KB | 1次下載 | 免費(fèi)
- 6DV2004S1/ES1/HS1快速充電開發(fā)系統(tǒng)
- 2.08MB | 1次下載 | 免費(fèi)
- 7模態(tài)分解合集matlab代碼
- 3.03 MB | 1次下載 | 2 積分
- 8美的電磁爐維修手冊大全
- 1.56 MB | 1次下載 | 5 積分
本月
- 1使用單片機(jī)實(shí)現(xiàn)七人表決器的程序和仿真資料免費(fèi)下載
- 2.96 MB | 44次下載 | 免費(fèi)
- 2UC3842/3/4/5電源管理芯片中文手冊
- 1.75 MB | 15次下載 | 免費(fèi)
- 3DMT0660數(shù)字萬用表產(chǎn)品說明書
- 0.70 MB | 13次下載 | 免費(fèi)
- 4TPS54202H降壓轉(zhuǎn)換器評估模塊用戶指南
- 1.02MB | 8次下載 | 免費(fèi)
- 5STM32F101x8/STM32F101xB手冊
- 1.69 MB | 8次下載 | 1 積分
- 6HY12P65/HY12P66數(shù)字萬用表芯片規(guī)格書
- 0.69 MB | 6次下載 | 免費(fèi)
- 7華瑞昇CR216芯片數(shù)字萬用表規(guī)格書附原理圖及校正流程方法
- 0.74 MB | 6次下載 | 3 積分
- 8華瑞昇CR215芯片數(shù)字萬用表原理圖
- 0.21 MB | 5次下載 | 3 積分
總榜
- 1matlab軟件下載入口
- 未知 | 935119次下載 | 10 積分
- 2開源硬件-PMP21529.1-4 開關(guān)降壓/升壓雙向直流/直流轉(zhuǎn)換器 PCB layout 設(shè)計(jì)
- 1.48MB | 420061次下載 | 10 積分
- 3Altium DXP2002下載入口
- 未知 | 233084次下載 | 10 積分
- 4電路仿真軟件multisim 10.0免費(fèi)下載
- 340992 | 191367次下載 | 10 積分
- 5十天學(xué)會AVR單片機(jī)與C語言視頻教程 下載
- 158M | 183335次下載 | 10 積分
- 6labview8.5下載
- 未知 | 81581次下載 | 10 積分
- 7Keil工具M(jìn)DK-Arm免費(fèi)下載
- 0.02 MB | 73807次下載 | 10 積分
- 8LabVIEW 8.6下載
- 未知 | 65987次下載 | 10 積分
評論
查看更多