當前位置:首頁 > 報告詳情

下一代MTIA元推薦推理加速器.pdf

上傳人: c** 編號:465022 2025-01-12 27頁 1.33MB

word格式文檔無特別注明外均可編輯修改,預覽文件經過壓縮,下載原文更清晰!
三個皮匠報告文庫所有資源均是客戶上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作商用。

相關圖表

本文介紹了一種名為Next Gen MTIA的推薦推理加速器,由Mahesh Maddury等人研發。該加速器采用TSMC 5nm技術,擁有2.35B個門和103M個浮點運算能力。其特點包括支持PyTorch eager模式、基于硬件的整數動態量化、GEN-O-GEN性能提升、稀疏矩陣支持等。加速器具有354個GEMM TOPs(INT8),177個GEMM TOPs(FP16),并且在稀疏模式下,這一數字翻倍。其內存為128GB LPDDR5,帶寬為204.8GB/s。該加速器旨在提高性能與能效比,處理模型跨多個Meta服務的問題,以及提高開發者效率。其架構包括8x8網格的處理元素、控制子系統和主機接口、256MB的片上SRAM、16通道的LPDDR5內存等。Next Gen MTIA已經在數據中心部署,并取得了超過2倍的性能提升。
"Next Gen MTIA如何提升模型推理性能?" "深度學習推薦模型的發展趨勢是什么?" "如何通過硬件解壓縮引擎優化大型嵌入式索引處理?"
客服
商務合作
小程序
服務號
折疊
午夜网日韩中文字幕,日韩Av中文字幕久久,亚洲中文字幕在线一区二区,最新中文字幕在线视频网站