《海光信息:實現獨立迭代的X86國產化服務器領軍-220803(45頁).pdf》由會員分享,可在線閱讀,更多相關《海光信息:實現獨立迭代的X86國產化服務器領軍-220803(45頁).pdf(45頁珍藏版)》請在三個皮匠報告上搜索。
1、上市海光 8100 典型功耗 260-350W 典型運算類型 雙精度、單精度、半精度浮點數據和各種常見整型數據 計算 60-64 個計算單元(最多 4096 個計算核心)支持 FP64、FP32、FP16、INT8、INT4 內存 4 個 HBM2 內存通道 最高內存帶寬為 1TB/s 最大內存容量為 32GB I/O 16 Lane PCIe Gen4 DCU 芯片之間高速互連 資料來源:公司招股書、申萬宏源研究 海光 8100 能夠充分挖掘應用的并行性,發揮其大規模并行計算的能力,快速開發高能效的應用程序。海光 8100 采用先進的 FinFET 工藝,典型應用場景下性能指標可以達到國際同
2、類型高端產品的同期水平。表 29:海光深算一號與國際同類型高端產品核心參數比較 項目 海光 NVIDIA AMD 品牌 深算一號 Ampere 100 MI100 生產工藝 7nm FinFET 7nm FinFET 7nm FinFET 核心數量 4096(64 CUs)2560 CUDA processors 120CUs 640 Tensor processors 內核頻率 Up to 1.5GHz(FP64)Up to 1.53Ghz Up to 1.5GHz(FP64)Up to 1.7Ghz(FP32)Up to 1.7Ghz(FP32)顯存容量 32GB HBM2 80GB HB
3、M2e 32GB HBM2 顯存位寬 4096 bit 5120 bit 4096bit 顯存頻率 2.0 GHz 3.2 GHz 2.4 GHz 顯存帶寬 1024 GB/s 2039 GB/s 1228 GB/s TDP 350 W 400 W 300W CPU to GPU 互聯 PCIe Gen4 x 16 PCIe Gen4 x 16 PCIe GEN4 x 16 GPU to GPU 互聯 xGMI x 2,Up to 184 GB/s NVLink up to 600 GB/s Infinity Fabric x 3,up to 276 GB/s 資料來源:中國計量科學研究院測試
4、報告(報告編號:CLzn2020-01190)、申萬宏源研究 海光深算二號、三號與國際一線同類產品基本屬于同一代際。根據公司 IPO 前公開發布會,海光 DCU 同時支持全精度和半精度訓練,有稀缺性。預計 2023 年底量產的 DCU3性能與 NVDIA H100 性能持平。已量產的 DCU2 約等于 70%NVDIA A100,雙方在模擬效率和精度都處于同一代際。表 30:海光 DCU2/DCU3 基礎性能對比 5“類CUDA”:由于ROCm 和 CUDA 在生態、編程環境等方面具有高度的相似性,CUDA 用戶可以以較低代價快速遷移至 ROCm 平臺,因此 ROCm 也被稱為“類 CUDA”公司深度 請務必仔細