當前位置:首頁 > 報告詳情

王璽源《基于昇騰CANN的訓推開源軟件支持與實踐》.pdf

上傳人: 蘆葦 編號:651751 2025-05-01 32頁 3.59MB

word格式文檔無特別注明外均可編輯修改,預覽文件經過壓縮,下載原文更清晰!
三個皮匠報告文庫所有資源均是客戶上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作商用。

相關圖表

本文主要介紹了基于昇騰CANN的訓推開源軟件支持與實踐。主要內容包括: 1. 昇騰CANN的開源使能,全面支持業界AI框架,原生適配PyTorch社區版本。 2. vLLM開源大模型,以PagedAttention為核心算法,支持100+生成式大語言模型,與Hugging Face Transformers相比,吞吐量提升24倍。 3. vLLM支持多種硬件加速技術,如Paged Attention算法、Chunked Prefill、Prefix Cache、PD分離等,支持多種量化算法和自定義算子。 4. vLLM支持多種部署方式,如在線/離線、多機多卡、MP、Ray、Kubernetes等。 5. vLLM Ascend支持sleep mode特性,滿足RLHF場景訓推共卡需求,提升吞吐。 6. vLLM Ascend First RC Release for vLLM v0.8.4,支持多種部署方式,提升性能。
昇騰CANN如何支持大模型訓練? vLLM如何實現多硬件平臺上的高效運行? vLLM如何通過通信優化提升訓練性能?
客服
商務合作
小程序
服務號
折疊
午夜网日韩中文字幕,日韩Av中文字幕久久,亚洲中文字幕在线一区二区,最新中文字幕在线视频网站