當前位置:首頁 > 報告詳情

2020年終大會-自然語言處理:6-5.pdf

上傳人: li 編號:29866 2020-12-01 28頁 2.13MB

word格式文檔無特別注明外均可編輯修改,預覽文件經過壓縮,下載原文更清晰!
三個皮匠報告文庫所有資源均是客戶上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作商用。

相關圖表

本文主要介紹了字節跳動AI實驗室的LightSeq系列成果,包括在NLP序列推理、模型壓縮量化以及TVM應用方面的突破。LightSeq針對NLP序列模型推理進行了優化,支持Bert/GPT/Transformer等模型,以及不同的推理策略。其優化方法包括算子多運算融合、動態顯存復用和層級式解碼計算等,顯著提高了模型推理性能,降低了延遲。在模型壓縮量化方面,LightSeq通過層參數共享、詞向量分解等方法,在保持模型精度的同時降低了參數規模。TVM方面的背景是提升計算密集型運算性能,并具備多端部署能力,通過引入TVM代碼自動生成與參數搜索,實現了動態形狀量化,并優化了序列模型。LightSeq已在火山翻譯、NeurST、mRASP等多個場景得到應用,展示了其在性能和功能上的優勢。
"LightSeq如何實現高性能NLP序列推理實踐?" "ByteDance AI Lab的LightSeq在模型壓縮量化方面有哪些突破?" "TVM如何提升計算密集型運算性能并實現多端部署?"
客服
商務合作
小程序
服務號
折疊
午夜网日韩中文字幕,日韩Av中文字幕久久,亚洲中文字幕在线一区二区,最新中文字幕在线视频网站