當前位置:首頁 > 報告詳情

SESSION 20 - Machine Learning Accelerators.pdf

上傳人: 2*** 編號:155003 2024-02-04 365頁 34.27MB

word格式文檔無特別注明外均可編輯修改,預覽文件經過壓縮,下載原文更清晰!
三個皮匠報告文庫所有資源均是客戶上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作商用。

相關圖表

本文主要介紹了神經視覺增強引擎(NVE)的設計與實現。NVE是一款基于3nm工藝的神經網絡加速器,具有以下特點: 1. 18行數字計算存儲器(DCIM)核心,配合4周期行切換控制,提高了計算能效。 2. 卷積元素融合,建立了負載平衡的流水線,減少了外部存儲器訪問和片上內存。 3. 自適應數據控制和條帶優化,提供了靈活性并減少了內存訪問。 NVE的整體架構包括: - 8x12b數據控制器 - 數據收集器 - 數據緩沖區 - 數據調度器 - 卷積設置和行選擇器 - DCIM宏核 - 累加器 - 激活函數和重排序 - CE融合接口 - 特征圖內存 - CV核心 - 格式轉換器 - 地址控制器 - 緩沖區 - 連接網絡 NVE在峰值性能下實現了23.2 TOPS/W的能量效率,在1.0V、540MHz的條件下,峰值面積效率為12.0 TOPS/mm2。 此外,本文還介紹了NVE在多種應用場景下的性能表現,包括超分辨率、降噪、視頻流處理等,證明了NVE在實時高分辨率神經網絡模型推理方面的有效性和高效性。
如何在智能設備上實現實時高分辨率視覺質量增強? 如何設計高效的擴散模型加速器以實現低功耗的語言模型推理? 如何利用稀疏混合專家神經輻射場實時進行移動SLAM?
客服
商務合作
小程序
服務號
折疊
午夜网日韩中文字幕,日韩Av中文字幕久久,亚洲中文字幕在线一区二区,最新中文字幕在线视频网站