當前位置:首頁 > 報告詳情

GPU 推理中的數據格式全局優化算法.pdf

上傳人: li 編號:29465 2021-02-07 25頁 431.72KB

word格式文檔無特別注明外均可編輯修改,預覽文件經過壓縮,下載原文更清晰!
三個皮匠報告文庫所有資源均是客戶上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作商用。

相關圖表

本文主要探討了在深度學習模型推理過程中,如何通過優化tensor數據格式來提升GPU推理性能。作者提出了一種基于圖切分和動態規劃的優化算法,通過對模型進行切分,獨立優化每個子圖的數據格式,從而達到提升整體推理性能的目的。文章中提到了多種數據格式,如NCHW、NHWC等,并指出不同的數據格式對模型推理性能有顯著影響。作者還通過實際測試數據展示了優化算法在不同模型和硬件上的性能提升,平均提升1.75倍。此外,文章還討論了算法在混合精度計算和異構計算中的應用前景。
"GPU推理中的數據格式優化如何影響模型性能?" "混合精度計算中,如何選擇最優的數據格式?" "異構計算環境下,數據格式選擇與性能提升的關系是什么?"
客服
商務合作
小程序
服務號
折疊
午夜网日韩中文字幕,日韩Av中文字幕久久,亚洲中文字幕在线一区二区,最新中文字幕在线视频网站