當前位置:首頁 > 報告詳情

李笙維 DataFunSummit非數據中心GPU上的大模型并行訓練.pdf

上傳人: 張** 編號:177548 2024-10-01 33頁 4.17MB

word格式文檔無特別注明外均可編輯修改,預覽文件經過壓縮,下載原文更清晰!
三個皮匠報告文庫所有資源均是客戶上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作商用。

相關圖表

本文主要圍繞非數據中心GPU上的大模型并行訓練問題展開研究。首先,作者從研究背景出發,指出深度學習模型參數量爆炸式增長,對算力系統體系結構、系統軟件提出了新的要求,大規模并行與分布計算仍然是基礎模型訓練的主要手段。接著,作者詳細介紹了并行訓練的基本方法,包括數據并行、模型并行、張量并行、流水線并行以及混合并行等。然后,作者提出了針對非數據中心GPU上的大模型并行訓練的關鍵技術研究,包括高性價比的大模型訓練、高效率的并行訓練以及高可編程性的并行訓練。最后,作者總結了研究進展,并展望了未來的研究方向。
大模型訓練如何提高性價比? 非數據中心GPU如何實現高效并行訓練? 如何提高大規模并行訓練的可編程性?
客服
商務合作
小程序
服務號
折疊
午夜网日韩中文字幕,日韩Av中文字幕久久,亚洲中文字幕在线一区二区,最新中文字幕在线视频网站