《通信行業AI算力架構系列1:GB200網絡架構測算1.6T光模塊需求有望超預期-240417(18頁).pdf》由會員分享,可在線閱讀,更多相關《通信行業AI算力架構系列1:GB200網絡架構測算1.6T光模塊需求有望超預期-240417(18頁).pdf(18頁珍藏版)》請在三個皮匠報告上搜索。
1、 敬請閱讀末頁的重要說明 證券研究報告|行業深度報告 2024 年 04 月 17 日 推薦推薦(首次)(首次)GB200 網絡架構測算,網絡架構測算,1.6T 光光模塊需求有望超預期模塊需求有望超預期 TMT 及中小盤/通信 2024 年年 3 月,英偉達發布推出月,英偉達發布推出 NVIDIA Blackwell 平臺,平臺,Blackwell 平臺包括平臺包括全域全域 NVLink 和和 Infiniband 兩種連接方式。兩種連接方式。NVLink 連接方式中若單機柜連接,連接方式中若單機柜連接,則全部采用銅纜連接;若構建則全部采用銅纜連接;若構建 576 張卡的集群,則需要光模塊與張
2、卡的集群,則需要光模塊與 GPU 的比例為的比例為9:1,我們測算光模塊價值量,我們測算光模塊價值量 5080 萬元。萬元。Infiniband 架構中,若為兩層架構則架構中,若為兩層架構則1.6T 光模塊與光模塊與 GPU 比例為比例為 2.06:1;若為三層架構則;若為三層架構則 1.6T 光模塊與光模塊與 GPU 比例為比例為2.98:1(將(將 800G 均換算為均換算為 1.6T)。當機柜出貨量達到)。當機柜出貨量達到 5.8 萬時,我們預計有望萬時,我們預計有望帶來帶來 650 萬支萬支 1.6T 光模塊需求,光模塊需求,1.6T 光模塊需求有望超預期。光模塊需求有望超預期。GB2
3、00 機柜內算力密度大幅提升,互聯技術是關鍵。機柜內算力密度大幅提升,互聯技術是關鍵。2024 年 3 月,英偉達宣布推出 NVIDIA Blackwell 平臺。Blackwell 平臺包括最新一代的 B200 芯片、第二代 Transformer 引擎、第五代 NVLink、RAS 引擎、安全 AI、解壓縮引擎六項核心變革性創新。GB200 單機柜算力大幅提升,包括 9 個交換托盤和 18 個計算托盤。在交換托盤內包含兩顆最新一代 NVLink 芯片支持 72端口雙向 1.8TB 傳輸速率交換。同時頂部裝配一臺 NVIDIA Quantum-X800交換機提供 144 端口 800Gb 速
4、率端口用于 Infiniband 架構連接。計算托盤包含兩顆Blackwell Superchip芯片,每顆Superchip芯片上包含1顆Grace Cpu與兩顆 B200 GPU。同時包含 4 顆 ConnectX-8 SuperNIC 芯片與 1 顆BlueField-3 DPU 芯片。全域全域 NVLink:機柜內部僅用銅纜,外部連接需九倍光模塊。1)NVL72:NVL72中單機柜內 18 個 Compute Tray 共有 72 顆 B200 芯片,9 個 Switch Tray 共有 18 顆 NVSwitch 芯片。NVL72 中需要 5184 根銅纜連接。2)NVL576:16
5、機柜互聯,光模塊數量 9 倍于 GPU。NVL72 方案已將所有 NVLink 端口插滿,不具備進一步擴大規模的空間。若要擴大集群規模需降低機柜內算力密度,給出空的 NVLink 端口用于向上連接。在 L2 與 L1 之間連接需要光模塊,我們測算第二層總共有 10368 個端口 50GB 端口需要連接,需要 5184 個 1.6T光模塊進行連接。假設 1.6T 光模塊單價 1400 美金,則 NVL576 總共需要光模塊價值量 5080 萬元。Infiniband 連接:連接:架構與 H100 SuperPod 相仿,光模塊比例介于 2-3 之間。Infiniband 網絡傳輸為單端口單向傳輸
6、速率 800Gb,遠小于 NVLink 單端口單向傳輸速率的 900GB(7.2Tb),因此應用光模塊比例小于 NVLink 連接。GB200 的 Infiniband 連接結構與 DGX H100 SuperPod 的網絡架構類似,但是與光模塊比例關系略小于 H100 SuperPod 架構。據測算,兩層交換機最多支持 9216 張卡互聯,光模塊與 GPU 比例關系為 2.56:1,將 800G 換算為 1.6T后與 GPU 比例關系為 2.06:1。三層交換機最多支持 73728 張卡互聯,光模塊與 GPU 比例關系為 3.48:1,將 800G 換算為 1.6T 后與 GPU 的比例為2
7、.98:1。投資建議:投資建議:考慮到 GB200 為英偉達當前最新一代產品,在當前 GB200 供應有限的情況下,超過 576 卡的 Infiniband 集群預計為主要出貨形式。在假設NVL72、NVL576 與 Infiniband 三種情形的比例分別為 15%、15%、70%,Infiniband 中兩層和三層架構的比例分別為 50%的前提下,當機柜出貨量達到 5.8 萬個時有望帶來 650 萬支 1.6T 光模塊需求。GB200 芯片批量出貨有望帶 行業規模行業規模 占比%股票家數(只)194 3.8 總市值(十億元)2663.0 3.5 流通市值(十億元)1965.6 2.9 行業
8、指數行業指數%1m 6m 12m 絕對表現-9.0-15.2-17.0 相對表現-8.4-12.1-3.7 資料來源:公司數據、招商證券 相關相關報告報告 1、AI 算力網絡系列報告 16:IDC供需格局邊際好轉,AI 打開全新增長空間2024-03-31 2、NVIDIA GTC 前瞻之二,新架構推動 AI 發展再迎關鍵時刻AI 算力網絡系列報告 162024-03-16 3、AI 算力網絡系列報告 15:NVDIAGTC 前瞻,液冷時代加速到來2024-03-12 梁程加梁程加 S1090522060001 劉浩天劉浩天 S1090523070005 -40-30-20-1001020Ap
9、r/23Aug/23Nov/23Mar/24(%)通信滬深300AIAI 算力架構系列算力架構系列 1 1 敬請閱讀末頁的重要說明 2 行業深度報告 動 1.6T 光模塊需求超預期。重點推薦北美光通信核心供應商:中際旭創、天孚通信。建議關注:新易盛。風險提示:風險提示:計算假設與實際情況存在差異,計算假設與實際情況存在差異,GB200 市場接受度不及預期,市場接受度不及預期,1.6T光模塊產業鏈成熟度低于預期光模塊產業鏈成熟度低于預期 重點公司主要財務指標重點公司主要財務指標 公司簡稱公司簡稱 公司代碼公司代碼 市值市值 22EPS 23EPS 23PE PB 投資評級投資評級 中際旭創 30
10、0308.SZ 136.1 1.52 2.74 61.9 10.0 強烈推薦 天孚通信 300394.SZ 65.3 1.02 1.84 90.1 22.6 強烈推薦 資料來源:公司數據、招商證券(備注:市值單位為十億元)uZjWhYkXlXnMvNoRoNqNaQ9R8OtRmMtRsOfQrRtPlOoPwO9PoPrRwMrNpPuOnQsP 敬請閱讀末頁的重要說明 3 行業深度報告 正文正文目錄目錄 一、互聯技術是關鍵,GB200 架構層層剖析.5 1.1 網絡連接部分:NVLink 迭代升級,組成更大網絡集群.6 1.1.1 機架內部連接.6 1.1.2 機架向外連接.8 1.2 計
11、算部分:更大的 GPU 芯片,更大的共享高速內存.9 1.3.1 BlackWell Superchip.10 1.3.2 ConnectX-8 SuperNIC.11 1.3.3 BlueField-3 DPU.12 二、全域 NVLink:機柜內部僅用銅纜,外部連接需九倍光模塊.13 2.1 NVL72:單機柜內算力密度大幅提升.13 2.2 NVL576:16 機柜互聯,光模塊用量個數 9 倍于 GPU.14 三、Infiniband 連接:架構與 H100 SuperPod 相仿,光模塊比例介于 2-3 之間15 四、投資建議.16 五、風險提示.17 圖表圖表目錄目錄 圖 1:Bla
12、ckwell 平臺全貌及核心組件.5 圖 2:Blackwell 六項核心變革性創新.6 圖 3:機柜的中間 9 層用作網絡連接.7 圖 4:NVLink Switch 系統(NVL72 的中間 9 個托盤).7 圖 5:Switch Tray 完整結構.7 圖 6:Switch Tray 包含兩顆 NVLink Switch 芯片.7 圖 7:NVSwitch 芯片.8 圖 8:NVLink 迭代歷程.8 圖 9:NVIDIA Quantum Infiniband Switch.9 圖 10:BlackWell Compute Tray 全貌.10 圖 11:Compute Tray 內部構
13、造.10 圖 12:BlackWell Superchip 實物圖.11 圖 13:BlackWell Superchip 示意圖.11 圖 14:AI 計算能力過去 8 年間提升 1000 倍.11 敬請閱讀末頁的重要說明 4 行業深度報告 圖 15:BlackWell Superchip 性能參數.11 圖 16:ConnectX-800G Infiniband Supernic 芯片.12 圖 17:Compute Tray 中搭載 4 顆 Supernic 芯片.12 圖 18:NVIDIA BlueField-3 DPU.12 圖 19:NVIDIA NVL72 拓撲圖.13 圖 2
14、0:NVIDIA NVL72 依靠背部銅纜互連.14 圖 21:NVIDIA NVL576 拓撲圖.14 圖 22:NVIDIA NVL576 兩排機柜實物圖.15 圖 23:H100 SuperPod 架構.16 表 1:NVL576 光模塊價值量測算.15 表 2:Infiniband 架構光模塊比例測算.15 表 3:1.6T 光模塊需求測算.16 敬請閱讀末頁的重要說明 5 行業深度報告 一、一、互聯技術是關鍵,互聯技術是關鍵,GB200 架構層層剖析架構層層剖析 2024 年 3 月,英偉達宣布推出 NVIDIA Blackwell 平臺以賦能計算新時代。新架構以紀念 David H
15、arold Blackwell 命名。Blackwell 不僅是一位專門研究博弈論和統計學的數學家,也是第一位入選美國國家科學院的黑人學者。這一新架構是繼兩年前推出的 NVIDIA Hopper 架構以來的全新架構。該平臺可使客戶能夠在萬億參數的大語言模型(LLM)上構建和運行實時生成式 AI,其成本和能耗較上一代產品降低多達 25 倍。Blackwell GPU 架構搭載六項變革性的加速計算技術,這些技術將助推數據處理、工程模擬、電子設計自動化、計算機輔助藥物設計、量子計算和生成式 AI 等領域實現突破。圖圖 1:Blackwell 平臺全貌及核心組件平臺全貌及核心組件 資料來源:英偉達、招
16、商證券 Blackwell 的多項創新技術為加速計算和生成式的多項創新技術為加速計算和生成式 AI 提供助力。提供助力。憑借六項變革性的技術,Blackwell 能夠在擁有高達 10 萬億參數的模型上實現 AI 訓練和實時 LLM 推理,這些技術包括:新一代更加強大的芯片:Blackwell 架構 GPU 具有 2080 億個晶體管,采用專門定制的雙倍光刻極限尺寸 4NP TSMC 工藝制造。第二代 Transformer 引擎:得益于全新微張量縮放支持,以及集成于 NVIDIA TensorRT-LLM 和NeMo Megatron框架中的 NVIDIA先進動態范圍管理算法,Blackwel
17、l 在新型 4 位浮點 AI 推理能力下實現算力和模型大小翻倍。第五代 NVLink:為了提升萬億級參數模型和多模態 AI 模型的性能,最新一代 NVIDIA NVLink 為每塊 GPU 提供突破性的 1.8TB/s 雙向吞吐量,確保最多576 塊 GPU 之間的無縫高速通信,滿足了當今最復雜 LLM 的需求。敬請閱讀末頁的重要說明 6 行業深度報告 RAS 引擎:采用 Blackwell 架構的 GPU 包含一個用于保障可靠性、可用性和可維護性的專用引擎。此外,Blackwell 架構還增加了多項芯片級功能,能夠利用 AI 預防性維護來運行診斷并預測可靠性相關的問題。這將最大程度地延長系統
18、正常運行時間,提高大規模 AI 部署的彈性,使其能夠連續不間斷運行數周乃至數月,同時降低運營成本。安全 AI:先進的機密計算功能可以在不影響性能的情況下保護 AI 模型和客戶數據,并且支持全新本地接口加密協議,這對于醫療、金融服務等高度重視隱私問題的行業至關重要。解壓縮引擎:專用的解壓縮引擎支持最新格式,通過加速數據庫查詢提供極其強大的數據分析和數據科學性能。未來幾年,每年需要企業花費數百億美元的數據處理將越來越多地由 GPU 加速。圖圖 2:Blackwell 六項核心變革性創新六項核心變革性創新 資料來源:英偉達、招商證券 1.1 網絡連接部分:網絡連接部分:NVLink 迭代升級,組成更
19、大網絡集群迭代升級,組成更大網絡集群 1.1.1 機架內部連接機架內部連接 在 NVL72 機柜中間有 9 層托盤用于網絡連接,被稱作 Switch Tray。除了第五代NVIDIA NVLink 外,該結構還包括 NVIDIA BlueField-3 DPU,并將支持最新發布的 NVIDIA Quantum-X800 InfiniBand 網絡。該架構為平臺中的每個 GPU 提供高達 1.8Tb 每秒的帶寬。此外,第四代 NVIDIA 可伸縮的分層聚合和還原協議(SHARP)TM 技術提供了 14.4 teraflops 的網絡計算,與上一代相比增加了 4 倍。敬請閱讀末頁的重要說明 7 行
20、業深度報告 圖圖 3:機柜的中間機柜的中間 9 層用作網絡連接層用作網絡連接 圖圖 4:NVLink Switch 系統(系統(NVL72 的中間的中間 9 個托盤)個托盤)資料來源:機器學習社區,招商證券 資料來源:英偉達,招商證券 GB200 NVL72引入了第五代NVLink,在一個NVLink域中最多連接576個GPU,總帶寬超過 1 PB/s,高速內存 240 TB。每個 NVLink Switch Tray 提供 144 個 100 GB NVLink 端口,9 個 Switch Tray 完全連接 72 個 Blackwell GPU,每個 GPU 上面 18 個 NVLink
21、端口。每個 GPU 的 1.8 TB/s 雙向吞吐量是 PCIe Gen5 帶寬的 14倍以上。第五代 NVLink 比 2014 年引入的第一代 160 GB/s 快 12 倍。NVLink GPU-to-GPU 通信在 AI 和高性能計算中擴展多 GPU 性能方面發揮了重要作用。圖圖 5:Switch Tray 完整結構完整結構 圖圖 6:Switch Tray 包含兩顆包含兩顆 NVLink Switch 芯片芯片 資料來源:英偉達,招商證券 資料來源:英偉達,招商證券 敬請閱讀末頁的重要說明 8 行業深度報告 圖圖 7:NVSwitch 芯片芯片 資料來源:英偉達、招商證券 回顧 NV
22、Link 發展歷史,第一代 NVLink 推出于 2014 年配套 P100 GPU 使用,采用 4 通道連接,實現 160 GB/s 的雙向總帶寬。第二代 NVLink 基于 6 通道連接將雙向總帶寬提升至 300 GB/s。第三代 NVLink 采用 12 通道連接,達到雙向總帶寬 600 GB/s。第四代 NVLink 使用 18 通道連接,進一步增加至雙向總帶寬900 GB/s。搭配GB200的第五代NVLink使用18通道連接,總帶寬提升至1.8TB/s。圖圖 8:NVLink 迭代歷程迭代歷程 資料來源:英偉達、招商證券 1.1.2 機架向外連接機架向外連接 機架最頂部的區域裝配有
23、 Quantum Infiniband 交換機。NVIDIA Quantum-X800 平臺提供 800 Gb/s 的端到端連接,具有超低延遲.NVIDIA Quantum-X800 專為訓練和部署萬億參數規模的 AI 模型而設計。位于平臺核心的 NVIDIA Quantum-X800 Q3400 InfiniBand 交換機支持 2 倍更快的速度和 5 倍更高的可伸縮性,用于 AI 敬請閱讀末頁的重要說明 9 行業深度報告 計算網絡。NVIDIA Quantum-X800 InfiniBand 交換機提供 144 個端口,每個端口提供 800Gb/s 連接。它包括基于硬件的網絡計算,SHAR
24、P v4,自適應路由,基于遙測的擁塞控制,性能隔離功能,以及一個支持統一網絡管理器(UFM)的專用端口。NVIDIA Quantum-X800 交換機還添加了先進的功耗效率功能,包括低功耗鏈接狀態和功耗分析。NVIDIA Quantum-X800 交換機提供了更高的性能和功耗效率,以顯著降低科學計算、人工智能工作負載完成時間和能源成本。圖圖 9:NVIDIA Quantum Infiniband Switch 資料來源:英偉達、招商證券 1.2 計算部分:更大的計算部分:更大的 GPU 芯片,更大的共享高速內存芯片,更大的共享高速內存 GB200 計算托盤是基于新的 NVIDIA MGX 液冷
25、設計,包含兩個 Grace cpu 和四個 Blackwell gpu。GB200 裝配有用于液冷的冷板和管路,支持高速網絡的 PCIe gen 6,以及用于 NVLink 的 NVLink 連接器。GB200 計算托盤提供每秒 80PFlops的人工智能性能和 1.7 TB 的 HMB3e。高達 32TB 每秒的存儲的帶寬。敬請閱讀末頁的重要說明 10 行業深度報告 圖圖 10:BlackWell Compute Tray 全貌全貌 資料來源:英偉達、招商證券 計算部分的核心芯片包括:2 顆 BlackWell Superchip,每顆 Superchip 上包含 1顆Grace Cpu與兩
26、顆B200 GPU;4顆ConnectX-8 SuperNIC芯片與1顆BlueField-3 DPU 芯片。圖圖 11:Compute Tray 內部構造,包含內部構造,包含 2 顆顆 CPU,4 顆顆 GPU,4 顆顆 IB Supernic,1 顆顆DPU 芯片芯片 資料來源:英偉達、招商證券 1.3.1 BlackWell Superchip GB200 NVL72 的核心是 NVIDIA GB200 Grace Blackwell 超級芯片。它連接了兩個高性能的 NVIDIA Blackwell Tensor Core gpu 和 NVIDIA Grace CPU,通過NVLink-
27、Chip-to-Chip(C2C)接口提供 900GB/s 的雙向帶寬。使用 NVLink-C2C,應用程序可以一致地訪問統一的內存空間。這簡化了編程,并支持萬億參數LLM、多模態任務的變壓器模型、大規模仿真模型和 3D 數據生成模型的更大內存需求。BlackWell Superchip With 1 CPU&2 GPU BlueField-3 DPU IB Supernic 敬請閱讀末頁的重要說明 11 行業深度報告 圖圖 12:BlackWell Superchip 實物圖實物圖 圖圖 13:BlackWell Superchip 示意圖示意圖 資料來源:英偉達,招商證券 資料來源:英偉達
28、,招商證券 B200 的單顆芯片 FP4 計算能力達到 20PFlops,BlackWell Superchip FP4 計算能力達到 40PFlops,由 36 顆 Superchip 組成的 GB200 NVL72 FP4 計算能力達到 1440 PFlops,單顆芯片的計算能力在過去 8 年里提升超過 1000 倍。圖圖 14:AI 計算能力過去計算能力過去 8 年間提升年間提升 1000 倍倍 圖圖 15:BlackWell Superchip 性能參數性能參數 資料來源:英偉達,招商證券 資料來源:英偉達,招商證券 1.3.2 ConnectX-8 SuperNIC NVIDIA C
29、onnectX-8 SuperNIC 利用 NVIDIA 的下一代適配器架構,提供端到端800Gb/s 網絡性能,對于高效管理多租戶生成式人工智能云至關重要。SuperNIC通過 PCI Express(PCIe)Gen6 提供了 800Gb/s 的數據吞吐量,并為各種應用場景提供高達 48 個通道,例如在 NVIDIA GPU 系統內進行 PCIe 交換。此外,它還支持先進的 NVIDIA In-Network Computing、MPI_Alltoall 和 MPI 標簽匹配硬件引擎,以及諸如網絡質量控制和擁塞控制等網絡增強功能。ConnectX-8 SuperNIC 具有單端口 OSFP
30、 224G 和 QSFP 112G 適配器連接器,并兼容多種形式因數,包括 OCP 3.0 和 Card Electromechanical(CEM)PCIe x16。此外,ConnectX-8 SuperNIC 還支持 NVIDIA Socket DirectTM 16 通道輔助卡擴展。敬請閱讀末頁的重要說明 12 行業深度報告 圖圖 16:ConnectX-800G Infiniband Supernic 芯片芯片 圖圖 17:Compute Tray 中搭載中搭載 4 顆顆 Supernic 芯片芯片 資料來源:英偉達,招商證券 資料來源:英偉達,招商證券 1.3.3 BlueField
31、-3 DPU 英偉達 BlueField-3 DPU(data processing units)是一個每秒 400Gb/s 的基礎計算平臺,具有軟件定義網絡、存儲和網絡安全的處理器。BlueField-3 結合了強大的計算、高速網絡和廣泛的可編程性,為最苛刻的工作負載提供軟件定義的硬件加速解決方案。從加速 AI 到混合云,從高性能計算到 5G 無線網絡。BlueField-3 DPU是一種云基礎架構處理器,使組織能夠構建從云到邊緣的軟件定義、硬件加速的數據中心。BlueField-3 DPU 可卸載、加速和隔離軟件定義網絡、存儲、安全和管理功能,顯著提升數據中心的性能、效率和安全性。通過將數
32、據中心基礎設施與業務應用程序分離,BlueField-3 創建了一個安全的、零信任的數據中心基礎設施,簡化了操作,并降低了總成本。圖圖 18:NVIDIA BlueField-3 DPU 資料來源:英偉達、招商證券 敬請閱讀末頁的重要說明 13 行業深度報告 二、二、全域全域 NVLink:機柜內部僅用銅纜,外部連接需:機柜內部僅用銅纜,外部連接需九倍光模塊九倍光模塊 2.1 NVL72:單機柜內算力密度大幅提升:單機柜內算力密度大幅提升 NVL72 中單機柜內總共兩張 Blackwell Superchip 構成,一張 Superchip 內有 2 個B200 芯片,一個 Compute T
33、ray 包括 2 顆 Superchip 芯片,總共 18 個 Compute Tray總共有 2*2*18=72 顆 B200 芯片。Switch Tray 中共有 2 個 NVSwitch 芯片,9 個Switch Tray 共有 18 顆 NVSwitch 芯片。每個 NVSwitch 芯片 72ports,一個 ports 傳輸速率為 100GB 雙向,單向傳輸速率50GB。每個 B200 包含 18 個 port,每個 port 雙向 100GB,總共實現 1.8TB 的雙向帶寬??偣?18 個 NVSwitch 芯片與 72 個 GPU 芯片之間產生 1296 個連接,每根線纜傳輸
34、速率為 112Gb,實現 50GB 的傳輸需要 4 根線纜,總共需要 5184 根線纜完成連接,總共長度 2 英里。圖圖 19:NVIDIA NVL72 拓撲圖拓撲圖 資料來源:Zartbot、招商證券 敬請閱讀末頁的重要說明 14 行業深度報告 圖圖 20:NVIDIA NVL72 依靠背部銅纜互連依靠背部銅纜互連 資料來源:英偉達、招商證券 2.2 NVL576:16 機柜互聯,光模塊用量個數機柜互聯,光模塊用量個數 9 倍于倍于 GPU NVL72 方案已將所有 NVLink 端口插滿,不具備進一步擴大規模的空間。若要進一步擴大集群規模需要降低機柜內算力密度,給出空的 NVLink 端口
35、用于向上連接。在 NVL576 中每個機柜仍然包含 18 個 Compute Tray,但是每個 Compute Tray 中僅包括 1 顆 Superchip,1 顆 Superchip 包括 2 顆 B200 芯片,一個機柜內共有36顆B200芯片。一個機柜內同時包括9個Switch Tray,每個Switch Tray內兩枚 NVSwitch 芯片總共 18 顆 NVSwitch 芯片。因此累計單個機柜有36*2*9=648個上行端口,構成NVL576總共16個機柜,則累計上行端口數為 648*16=10368 個。單個 NVSwitch 包括 72 個端口,因此L2 層需要 10368
36、/72=144 個 NVSwitch 芯片。在 L2 與 L1 之間連接需要光模塊,假設采用 1.6T 光模塊進行連接,1.6T 光模塊傳輸速率 1.6Tb=200GB,所應用光模塊個數為 10368*50/200*2=5184 個,與 GPU 比例為 5184/576=9。圖圖 21:NVIDIA NVL576 拓撲圖拓撲圖 資料來源:Zartbot、招商證券 敬請閱讀末頁的重要說明 15 行業深度報告 圖圖 22:NVIDIA NVL576 兩排機柜實物圖兩排機柜實物圖 資料來源:英偉達、招商證券 假設 1.6T 光模塊單價 1400 美元,則 NVL576 集群整體光模塊價值量約為 50
37、80萬元。表表 1:NVL576 光模塊價值量測算光模塊價值量測算 數量 單價($)總價值量(萬元)1.6T 光模塊 5184 1400 5080.32 資料來源:英偉達、招商證券 三、三、Infiniband 連接:架構與連接:架構與 H100 SuperPod 相仿,相仿,光模塊比例介于光模塊比例介于 2-3 之間之間 Infiniband 網絡傳輸為單端口單向傳輸速率 800Gb,遠小于 NVLink 單端口單向傳輸速率的 900GB(7.2Tb),因此應用光模塊比例小于 NVLink 連接。GB200 的Infiniband 連接結構與 DGX H100 SuperPod 的網絡架構類
38、似,但是由于 GB200 搭配的交換機為 Quantum-X800 800G 144 個接口,而 H100 搭載的 QM9700 為 400G 64 端口,因此與光模塊比例關系略小于 H100 SuperPod 架構。根據 SemiAnalysis測算,兩層交換機最多支持 9216 張卡互聯,需要 9216 個 800G 光模塊與 14400個 1.6T 光模塊,光模塊與 GPU 比例關系為 2.56:1,將 800G 換算為 1.6T 后的 1.6T光模塊與 GPU 比例關系為 2.06:1。三層交換機最多支持 73728 張卡互聯,需要73728個800G光模塊與18259個1.6T光模塊
39、,光模塊與GPU比例關系為3.48:1,將 800G 換算為 1.6T 后 1.6T 光模塊與 GPU 的比例為 2.98:1。表表 2:Infiniband 架構光模塊比例測算架構光模塊比例測算 GPU 數量數量 72 144 288 576 1152 2304 4608 9216 18432 36864 73728 交換機層數 1 1 2 2 2 2 2 2 3 3 3 Leaf 交換機 1 1 4 8 16 32 64 128 256 512 1024 Spine 交換機 0 0 2 4 8 18 36 72 216 504 1008 Core 交換機 0 0 0 0 0 0 0 0 1
40、08 252 504 敬請閱讀末頁的重要說明 16 行業深度報告 GPU 數量數量 72 144 288 576 1152 2304 4608 9216 18432 36864 73728 總共交換機數量 1 1 6 12 24 50 100 200 580 1268 2536 800G 接口數 72 144 288 576 1152 2304 4608 9216 18432 36864 73728 1.6T 接口數 72 72 432 864 1728 3600 7200 14400 41760 91296 182592 光模塊總量 144 216 720 1440 2880 5904 11
41、808 23616 60192 128160 256320 光模塊:GPU 2.00 1.50 2.50 2.50 2.50 2.56 2.56 2.56 3.27 3.48 3.48 資料來源:SemiAnalysis、招商證券 圖圖 23:H100 SuperPod 架構,架構,GB200 Infiniband 架構與之類似架構與之類似 資料來源:英偉達、招商證券 四、四、投資建議投資建議 由于光模塊在三種不同架構中的用量差異較大,因此決定明年光模塊需求的核心變量為三種架構的比例。NVL72 主要應用于小模型推理,NVL576 主要應用于中等模型的訓練,更大規模的 GB200 集群用于更大
42、參數規模模型的訓練??紤]到GB200 為英偉達當前最新一代產品,在當前 GB200 供應有限的情況下,客戶應當更大比例的考慮用 GB200 做參數更大參數規模模型的訓練,因此超過 576 卡的集群預計為主要出貨形式。我們假設 NVL72、NVL576 與 Infiniband 三種情形的比例分別為 15%、15%、70%。在 Infiniband 中兩層交換機與三層交換機的比例各自為 50%。當出貨量達到 5.8 萬個機柜時,將有望帶來 650 萬支 1.6T 光模塊需求。表表 3:1.6T 光模塊需求測算光模塊需求測算 出貨占比出貨占比 總機柜數總機柜數(萬柜)(萬柜)GPU 數量數量(萬張
43、)(萬張)1.6T 光模塊光模塊 比例比例 1.6T 光模塊光模塊 數量(萬支)數量(萬支)NVLinkNVL72 15%0.87 62.64 0 0.00 NVLinkNVL576 15%0.87 31.32 9 281.88 Infiniband兩層架構 35%2.03 73.08 2.06 150.54 Infiniband三層架構 35%2.03 73.08 2.98 217.78 合計 100%5.8 240.12 2.71 650.20 資料來源:英偉達、SemiAnalysis、招商證券測算 敬請閱讀末頁的重要說明 17 行業深度報告 GB200 芯片批量出貨有望帶動 1.6T
44、光模塊需求超預期。重點推薦北美光通信核心供應商:中際旭創、天孚通信。建議關注:新易盛。五、五、風險提示風險提示 計算假設與實際情況存在差異:計算假設與實際情況存在差異:實際應用光模塊需求受到客戶實際需求的影響,具體網絡架構可能與理論比例存在差異,實際情況可能與計算理論假設有差異。GB200 市場接受度不及預期:市場接受度不及預期:GB200 實際銷售情況受到客戶資本開支預算、競爭對手新品開發情況等多重因素影響,如果 GB200 銷售不及預期可能導致光模塊整體需求不及預期 1.6T 光模塊產業鏈成熟度低于預期:光模塊產業鏈成熟度低于預期:1.6T 光模塊的實際出貨受到產業鏈成熟程度的影響,如果上
45、游元器件成熟度不及預期可能導致光模塊的實際交付能力受到影響。敬請閱讀末頁的重要說明 18 行業深度報告 分析師分析師承諾承諾 負責本研究報告的每一位證券分析師,在此申明,本報告清晰、準確地反映了分析師本人的研究觀點。本人薪酬的任何部分過去不曾與、現在不與,未來也將不會與本報告中的具體推薦或觀點直接或間接相關。評級評級說明說明 報告中所涉及的投資評級采用相對評級體系,基于報告發布日后 6-12 個月內公司股價(或行業指數)相對同期當地市場基準指數的市場表現預期。其中,A 股市場以滬深 300 指數為基準;香港市場以恒生指數為基準;美國市場以標普 500 指數為基準。具體標準如下:股票股票評級評級
46、 強烈推薦:預期公司股價漲幅超越基準指數 20%以上 增持:預期公司股價漲幅超越基準指數 5-20%之間 中性:預期公司股價變動幅度相對基準指數介于 5%之間 減持:預期公司股價表現弱于基準指數 5%以上 行業評級行業評級 推薦:行業基本面向好,預期行業指數超越基準指數 中性:行業基本面穩定,預期行業指數跟隨基準指數 回避:行業基本面轉弱,預期行業指數弱于基準指數 重要重要聲明聲明 本報告由招商證券股份有限公司(以下簡稱“本公司”)編制。本公司具有中國證監會許可的證券投資咨詢業務資格。本報告基于合法取得的信息,但本公司對這些信息的準確性和完整性不作任何保證。本報告所包含的分析基于各種假設,不同
47、假設可能導致分析結果出現重大不同。報告中的內容和意見僅供參考,并不構成對所述證券買賣的出價,在任何情況下,本報告中的信息或所表述的意見并不構成對任何人的投資建議。除法律或規則規定必須承擔的責任外,本公司及其雇員不對使用本報告及其內容所引發的任何直接或間接損失負任何責任。本公司或關聯機構可能會持有報告中所提到的公司所發行的證券頭寸并進行交易,還可能為這些公司提供或爭取提供投資銀行業務服務??蛻魬斂紤]到本公司可能存在可能影響本報告客觀性的利益沖突。本報告版權歸本公司所有。本公司保留所有權利。未經本公司事先書面許可,任何機構和個人均不得以任何形式翻版、復制、引用或轉載,否則,本公司將保留隨時追究其法律責任的權利。