當前位置:首頁 > 報告詳情

太極 Angel 助力生成式大模型高效落地-劉凱.pdf

上傳人: 張** 編號:164025 2024-05-31 30頁 8.70MB

word格式文檔無特別注明外均可編輯修改,預覽文件經過壓縮,下載原文更清晰!
三個皮匠報告文庫所有資源均是客戶上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作商用。

相關圖表

本文主要探討了生成式大模型的高效落地及其面臨的挑戰,以騰訊的混元大模型為例,介紹了劉凱自2019年以來在模型推理、壓縮和優化方面的工作。關鍵數據包括:模型規??焖僭鲩L,設備能力提升緩慢,禁令導致硬件選擇受限,模型訓練和推理的顯存和計算優化需求,以及如何使用國產芯片打造大模型等。文章提出了太極Angel-HCF和Angel-SNIP等解決方案,以優化大模型的訓練和推理效率,降低成本,并緩解激活空間顯存的壓力。此外,還探討了模型壓縮技術,如量化壓縮和蒸餾壓縮,以及如何在大模型基礎上快速裁剪出性能相當的小模型。文章還介紹了騰訊混元大模型在多個業務場景的應用,并強調了在實際場景中選擇最適合的模型優化方法的重要性。
"騰訊Angel如何優化大模型推理效率?" "生成式AI技術部署挑戰有哪些?騰訊的解決方案是什么?" "如何通過Angel-HCF和Angel-SNIP實現生成式AI模型的無損壓縮?"
客服
商務合作
小程序
服務號
折疊
午夜网日韩中文字幕,日韩Av中文字幕久久,亚洲中文字幕在线一区二区,最新中文字幕在线视频网站