當前位置:首頁 > 報告詳情

Session 16Highlighted Chip Releases_ Digital and Machine Learning Processors.pdf

上傳人: 張** 編號:620803 2025-03-31 14頁 10.95MB

word格式文檔無特別注明外均可編輯修改,預覽文件經過壓縮,下載原文更清晰!
三個皮匠報告文庫所有資源均是客戶上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作商用。

相關圖表

本文主要介紹了四款最新的數字處理器和系統,它們針對AI加速和高性能網絡進行了產品化改進。這些創新包括用于AI處理的新穎架構、復雜的內存架構和先進的交換芯片設計。這些工作展示了在各種應用中,從移動設備到數據中心,AI能力、能效和可擴展性的顯著提升。 1. 三星電子推出了Exynos 2400 SoC,用于Galaxy S24智能手機。該芯片采用4nm EUV工藝,支持設備上AI,具有異構NPU架構,包括向量引擎和兩種類型的張量引擎。該4nm SoC通過使用扇出晶圓級封裝技術改善了熱散逸,實現了AI性能的提升。 2. FuriosaAI推出了5nm推理芯片RNGD,利用張量收縮中的并行性和數據局部性,采用HBM3內存、切片冗余和高帶寬NoC。它提供了256TFLOPS/512TOPS的性能,并實現了對GPT-J的12.3查詢/秒,準確率達到99%。 3. Broadcom推出了Tomahawk5,這是一款用于數據中心和AI環境的交換芯片,提供51.2Tb/s的交換容量。該芯片包括512個106.4Gb/s PAM4 SerDes通道,支持多種I/O配置,具有168MB共享緩沖區架構,并設計為單片芯片,具有9,352個引腳和六個ARM處理器核心。 4. SambaNova Systems推出了SN40L,這是一款5nm 2.5D數據流加速器,具有三層內存:片上SRAM、片上HBM和片外DRAM。該芯片采用雙芯片設計,每個芯片包含1020億個晶體管,提供640 BF16 TFLOPs和520MB片上SRAM。SN40L的數據流架構和三層內存系統旨在在計算大型語言模型(LLM)時比GPU更節能。
三星Exynos 2400如何通過FOWLP提高AI性能? FuriosaAI的RNGD芯片如何優化大型語言模型推理? SambaNova SN40L如何實現萬億參數AI模型的訓練?
客服
商務合作
小程序
服務號
折疊
午夜网日韩中文字幕,日韩Av中文字幕久久,亚洲中文字幕在线一区二区,最新中文字幕在线视频网站