《AI算力“賣水人”系列(3):NVIDIA GB200:重塑服務器、銅纜、液冷、HBM價值-241018(49頁).pdf》由會員分享,可在線閱讀,更多相關《AI算力“賣水人”系列(3):NVIDIA GB200:重塑服務器、銅纜、液冷、HBM價值-241018(49頁).pdf(49頁珍藏版)》請在三個皮匠報告上搜索。
1、NVIDIA GB200NVIDIA GB200:重塑服務器:重塑服務器/銅纜銅纜/液冷液冷/HBM/HBM價值價值AIAI算力算力“賣水人賣水人”系列(系列(3 3)評級:推薦(維持)證券研究報告2024年10月18日計算機劉熹(證券分析師)S請務必閱讀報告附注中的風險提示和免責聲明2相對滬深300表現表現1M3M12M計算機44.1%35.5%-5.5%滬深30019.9%8.2%4.1%最近一年走勢相關報告計算機行業動態研究:鴻蒙原生:生態應用“裂變”生長,萬物互聯時代已來(推薦)*計算機*劉熹2024-09-24AI算力行業月度跟蹤(202409):OpenAI o1開創AI算力新紀元
2、,Blackwell產能持續擴大(推薦)*計算機*劉熹2024-09-18計算機行業2024年中報總結:行業整體加速復蘇,關注:算力、出海、華為鏈(推薦)*計算機*劉熹2024-09-11-37%-25%-14%-3%8%20%2023/10/182024/02/182024/06/18計算機滬深300請務必閱讀報告附注中的風險提示和免責聲明3核心提要核心提要u 核心要點:核心要點:NV Blackwell系列或于系列或于2024Q4推出,有望帶來推出,有望帶來機柜、銅纜、液冷、機柜、銅纜、液冷、HBM四個市場的價值量提升。四個市場的價值量提升。u 一、一、Blackwell系列:系列:GB2
3、00計算能力遠超計算能力遠超H100,CSP廠商資本開支提升廠商資本開支提升B200集成2080億個晶體管,采用臺積電N4P制程,為雙芯片架構,192GB HBM3E,AI算力達20petaFLOPS(FP4),是Hopper的5倍。GB200機架提供4種不同主要外形尺寸,每種尺寸均可定制。與H100 相比,GB200 NVL72將訓練速度(如 1.8 T 參數 GPT-MoE)提高了 30 倍?;ヂ摼W資本開支方面,Meta、Alphabet(谷歌)、微軟、亞馬遜等廠商均增加2024年資本開支指引。微軟預計FY25Q1資本支出將環比增加,及2025財年資本支出將高于24財年;谷歌表示2024年
4、季度資本開支將等于或高于一季度水平;Meta將2024年資本支出預測提高至370-400億美元,亞馬遜表示2024年下半年的資本投資將更高。u 二、服務器細節拆分:主板從二、服務器細節拆分:主板從HGX到到MGX,GB200 NVL72價值量提升價值量提升GB200主板從HGX模式變為MGX,HGX是NVIDIA推出的高性能服務器,通常包含8個或4個GPU,MGX是一個開放模塊化服務器設計規范和加速計算的設計,在Blackwell系列大范圍使用。MGX模式下,GB200 Switch tray主要為工業富聯生產,Compute Tray為緯創與工業富聯共同生產,交付給英偉達。據Semianal
5、ysis,有望帶來機柜集成、HBM、銅連接、液冷等四個市場價值量2-10倍提升。u 三、銅連接:三、銅連接:DACs市場較快增長,市場較快增長,GB200 NVL72需求較大需求較大高速線纜中,有源光纜適合遠距離傳輸,直連電纜高速低功耗。據LightCounting,高速線纜規模預期28年達28億美元,DACs保持較快增長,Nvidia的策略是盡可能多地部署DACs。據QYResearch,2022 年,全球前十強廠商大約占據了 69.0%的市場份額,其中安費諾的市場份額位居全球第一,國內廠商包括立訊精密、兆龍互聯、金信諾、電聯技術等,但全球市占率較低。u 四、四、HBM:HBM3E將于下半年
6、出貨,英偉達為主要買家將于下半年出貨,英偉達為主要買家HBM 目前已經量產的共有HBM、HBM2、HBM2E、HBM3、HBM3E 五個子代標準。其中HBM3E將于下半年出貨,HBM4或于2026年上市。預期2024年底HBM TSV產能約250K/m,三星與海力士擴產積極,三星HBM總產能至年底將達約130K(含TSV);SK海力士約120K。英偉達目前是HBM最大買家,海力士與三星完成HBM3E驗證。u 五、冷板式液冷較為成熟,五、冷板式液冷較為成熟,GB200 NVL72采用液冷方案采用液冷方案AI大模型訓推對芯片算力提出更高要求,提升單芯片功耗,英偉達B200功耗超1000W、接近風冷
7、散熱上限。液冷技術具備更高散熱效率,包括冷板式與浸沒式兩類,其中冷板式為間接冷卻,初始投資中等,運維成本較低,相對成熟,英偉達GB200 NVL72采用冷板式液冷解決方案。請務必閱讀報告附注中的風險提示和免責聲明4核心提要核心提要l投資建議:大模型訓推帶動投資建議:大模型訓推帶動 AI AI算力需求增長,算力需求增長,GB200GB200等新一代算力架構將推出,算力產業鏈中的等新一代算力架構將推出,算力產業鏈中的AIAI芯片、服務器整機、銅連接、芯片、服務器整機、銅連接、HBMHBM、液冷、液冷、光模塊、光模塊、IDCIDC等環節有望持續受益。維持對計算機行業等環節有望持續受益。維持對計算機行
8、業“推薦推薦”評級。評級。l相關公司相關公司1 1)AIAI芯片:海光信息、寒武紀、龍芯中科、景嘉微、英偉達、AMD、Intel2 2)服務器整機:工業富聯、浪潮信息、中科曙光、華勤技術、中國長城、高新發展、神州數碼、烽火通信、拓維信息、緯創、廣達、英業達、緯穎、超微電腦。3 3)服務器組件:散熱:飛榮達、曙光數創、英維克、同方股份、申菱環境、高瀾股份、奇鋐科技、雙鴻、VERTIV;主板:滬電股份、深南電路、勝宏科技、技嘉、華擎;HBM:SK海力士、三星、美光、賽騰股份、聯瑞新材;銅連接:安費諾、沃爾核材、華豐科技。4 4)光模塊:天孚通信、中際旭創、新易盛、光迅科技、華工科技。5 5)數據中
9、心:奧飛數據、光環新網、寶信軟件、數據港、電科數字。l風險提示:宏觀經濟影響下游需求、大模型產業發展不及預期、市場競爭加劇、中美博弈加劇、相關公司業績不及預期等,各公司并不具備完風險提示:宏觀經濟影響下游需求、大模型產業發展不及預期、市場競爭加劇、中美博弈加劇、相關公司業績不及預期等,各公司并不具備完全可比性,對標的相關資料和數據僅供參考。全可比性,對標的相關資料和數據僅供參考。請務必閱讀報告附注中的風險提示和免責聲明5投資建議與投資建議與相關公司相關公司Compute Tray Compute Tray*10 10內地:內地:工業富聯中國臺灣:中國臺灣:緯創Switch Tray Switc
10、h Tray*9 9內地:內地:工業富聯中國臺灣:中國臺灣:緯創Compute Tray Compute Tray*8 8電源電源電源電源內地:內地:中國長城、歐陸通、杰華特、泰嘉股份中國臺灣:中國臺灣:臺達分歧管分歧管(液冷:支持130KW的制冷能力)內地:內地:曙光數創、飛榮達、中航光電、英維克、同飛股份、申菱環境、高瀾股份、依米康中國臺灣:中國臺灣:奇鋐、雙鴻、健策、建準、高力海外:海外:VERTIV線纜線纜(銅連接:5000+根NVLink線纜)內地:內地:沃爾核材、華豐科技、兆龍互連、鼎通科技、立訊精密、神宇股份海外:海外:安費諾GPUGPU內地:內地:華為海思、海光信息、寒武紀、龍
11、芯中科。海外:海外:英偉達、AMD、Intel主板主板內地:內地:滬電股份、勝宏科技、深南電路、生益科技中國臺灣:中國臺灣:泰安電腦(神達)、技嘉、華擎、華碩、英業達、緯創、研華美國:美國:Intel、Supermicro組裝測試組裝測試整機廠商整機廠商ODMODM:1 1)內地:)內地:浪潮信息、工業富聯、中科曙光、紫光股份、中國長城、華勤技術、神州數碼、拓維信息、烽火通信、軟通動力;2 2)中國臺灣:)中國臺灣:鴻海、廣達、緯創、英業達、緯穎;3 3)美股:)美股:戴爾、超微電腦BIOS/BMCBIOS/BMC:1 1)內地:)內地:卓易信息;2 2)中國臺)中國臺灣:灣:新唐、系微、信驊
12、存儲存儲 NANDNAND公司:公司:長江存儲、兆易創新、佰維存儲、朗科科技海外:海外:三星、西部數據、鎧俠、SK海力士、美光光模塊光模塊內地:內地:中際旭創、新易盛、光迅科技、天孚通信正面正面背面背面英偉達英偉達GB200 GB200 NVL72NVL72實物圖實物圖CPUCPU內地:內地:華為海思、海光信息、飛騰、龍芯中科海外:海外:英偉達、AMD、IntelNV Switch ChipNV Switch Chip網卡等網卡等海外:海外:英偉達、Mellanox注:藍字為零部件。注:藍字為零部件。上圖展示以英偉達GB200 NVL72整機柜為例,僅列示了部分參與公司資料來源:英偉達官網,O
13、pen Compute Project,hansenfluid,各公司官網,Semianalysis,國海證券研究所請務必閱讀報告附注中的風險提示和免責聲明6第一章第一章 Blackwell Blackwell系列系列GB200GB200計算能力遠超計算能力遠超H100H100,CSPCSP廠商資本開支提升廠商資本開支提升請務必閱讀報告附注中的風險提示和免責聲明71.1 NVIDIA每一代每一代GPU的計算能力、的計算能力、NVLink、內存持續擴大、內存持續擴大25%GPU訓練NVLink推理PCIeA30L4A100A100HGX A1008-GPUFP16 0.3P-1PH100H100
14、H200VRAM80GB-141GBHGX H1008-GPUHGX H2008-GPUFP16 1P-1.75PNVLink 0.9TB/s-1.8TB/sL40SB100B200HGX B1008-GPUHGX B2008-GPUFP16 1P-2.25PVRAM 141GB-192GBNVLink 0.9TB/s-1.8TB/s架構AmpereHopperAda LovelaceBlackwellArmCPU+GPU訓練NVLink1-level NVSwitchInterconnection2-level NVSwitchInterconnectionGH2001-GPUGH200NV
15、L32GH200Superpod32*GH2008*FP16 1P-5PVRAM 141GB-384GBNVLink 0.9TB/s-3.6TB/s32GPU-72GPU256GPU-576GPUFP16 256P-1440PVRAM 24.5TB-110TBNVLink 230TB/s-1PB/sGB2002-GPUGB200NVL72GB200Superpod36*GB2008*資料來源:fibermall,國海證券研究所請務必閱讀報告附注中的風險提示和免責聲明81.1 NVIDIA每一代每一代GPU的計算能力、的計算能力、NVLink、內存持續擴大、內存持續擴大 英偉達Blackwell
16、 GPU支持FP4精度,GB200的FP4計算能力可以達到20P,其計算能力是FP8的兩倍,NVlink為3.6TB/s,顯存容量為384GB,顯存帶寬為16TB/s。A100-H100:FP16密集計算能力增加了3倍以上,功耗從400W增加到700W。H200-B200:FP16密集計算能力增加了2倍以上,功耗從700W增加到1000W。B200的FP16密集計算能力約為A100的7倍,但功耗只增加了2.5倍。ArchitectureA100H100H200GH200B100B200Full B200GB200AmpereHopperBlackwellVRAM Size80GB80GB141
17、GB96GB/144GB180/192GB180/192GB192GB384GBVRAM Bandwidth2TB/s3.35TB/s4.8TB/s4TB/s/4.9TB/s8TB/s8TB/s8TB/s16TB/sFP16(FLOPS)312T1P1P1P1.75P2.25P2.5P5PINT8(OPS)624T2P2P2P3.5P4.5P5P10PFP8(FLOPS)X2P2P2P3.5P4.5P5P10PFP6(FLOPS)XXXX3.5P4.5P5P10PFP4(FLOPS)XXXX7P9P10P20PNVLink Bandwidth600GB/s900GB/s900GB/s900GB
18、/s1.8TB/s1.8TB/s1.8TB/s3.6TB/sPower Consumption400w700w700w1000w700w1000w1200w2700wNotesDie*1Die*1Die*1Grace CPU*1H200 GPU*1Die*2Die*2Die*2Grace CPU*1Blackwell GPU*2表:英偉達表:英偉達GPUGPU迭代情況迭代情況資料來源:fibermall,國海證券研究所請務必閱讀報告附注中的風險提示和免責聲明91.1 B200:Blackwell為為TSMC 4N工藝,工藝,B200采用雙芯片封裝采用雙芯片封裝l B200 GPU:l 工藝:B
19、lackwell GPU采用TSMC的N4P技術,H100 GPU采用N4工藝。H100是一個單芯片(單個完整的半導體單元)封裝,Blackwell GPU是一個多芯片封裝,有2個芯片。l 計算能力:計算能力:每個Blackwell GPU芯片的FP8計算能力大約是H100的2.5倍。l 通信能力:B200為為雙芯片架構,兩個芯片之間的通信帶寬為10TB/s。連接8個8層堆疊的HBM3E,容量達到了192GB。資料來源:電子工程專輯表:英偉達表:英偉達B200 GPUB200 GPU請務必閱讀報告附注中的風險提示和免責聲明101.1 GB200:計算性能可達計算性能可達H100 30倍,倍,N
20、VLink-C2C互聯互聯900GB/s GB200性能:性能:相較于H100,GB200的算力提升了6倍,在處理多模態特定領域任務時,其算力更是能達到H100的30倍。GB200集成了諸多先進技術,包括第二代 Transformer引擎、第五代 NVLink 高速互聯技術等。GB200組成:組成:是將2個B200芯片和1個GraceCPU整合到一起,相應的 GPU 算力和顯存都加倍。CPU 和 GPU 之間依然通過 900GB/s 的 NVLink-C2C 實現高速互聯,對應的功耗為 2700W。圖:英偉達圖:英偉達GB200GB200實物圖實物圖圖:英偉達圖:英偉達GB200GB200結構
21、圖結構圖圖:英偉達圖:英偉達GB200 Compute TrayGB200 Compute Tray結構圖結構圖資料來源:36Kr,10lun,Semianalysis請務必閱讀報告附注中的風險提示和免責聲明111.2 Rubin將于將于2026年推出,年推出,GPU產品迭代加速產品迭代加速圖:英偉達未來產品迭代情況圖:英偉達未來產品迭代情況2 0 2 4 年 6 月 2 日,C O M P U T E X 2024大會召開,英偉達CEO黃仁勛 在 大 會 上 展 示 G P U、C P U、NVLink等方面技術路線圖。1)GPU:一年迭代一次。下一:一年迭代一次。下一代代Rubin于于20
22、26年上市:年上市:將集成8顆HBM4;2027年推出Rubin Ultra GPU,將集成12顆HBM4。2)C P U:英 偉 達 確 認 下 一 代CPU平臺Vera CPU將于2026年推出。3)N V L i n k:第 五 代 N V I D I A NVLink互連可擴展至576個GPU。2 0 2 6 年,計 劃 推 出 第 六 代N V L i n k s w i t c h,達 到3600GB/sec。4)NVIDIA Spectrum-X以太以太網網絡平臺:網網絡平臺:全球首款專為AI打造的以太網網絡平臺,計劃每年都推出新的 Spectrum-X 產品。資料來源:IT之家
23、,國海證券研究所請務必閱讀報告附注中的風險提示和免責聲明121.3 互聯互聯網網廠商廠商資本開支指引提升資本開支指引提升,ASIC AI服務器采購占比服務器采購占比增長增長0204060801001201401601802002022Q1 2022Q2 2022Q3 2022Q4 2023Q1 2023Q2 2023Q3 2023Q4 2024Q1 2024Q2Meta谷歌Alphabet微軟亞馬遜(億美元)公司公司20242024年年互聯網大廠資本開支預期情況互聯網大廠資本開支預期情況MicrosoftMicrosoft2024Q2資本開支為190億美元。資本開支預期大約一半用于基礎設施需求
24、,建設和租賃數據中心,其余相關支出主要用于服務器,包括CPU和GPU。未來繼續擴大基礎設施投資,預計未來繼續擴大基礎設施投資,預計2024Q32024Q3資本支出將環比增加。資本支出將環比增加。Alphabet Alphabet (谷歌)(谷歌)2024Q2公司資本開支達到130億美元。公司預計全年每季度資本支出將大致維持第一季度公司預計全年每季度資本支出將大致維持第一季度120120億美元或略高。億美元或略高。MetaMeta2024Q2公司資本開支為85億美元。公司上調全年資本支出下限至公司上調全年資本支出下限至370370億億-400-400億美元(此前預期為億美元(此前預期為35035
25、0億億-400-400億美元),并預計億美元),并預計20252025年的資本支出將明顯增加,基礎設施是增加的主要因素。年的資本支出將明顯增加,基礎設施是增加的主要因素。亞馬遜亞馬遜2024Q2資本開支為164億美元。公司預計下半年的資本投資將更高,大部分支出將用于支持對公司預計下半年的資本投資將更高,大部分支出將用于支持對AWS AWS 基礎設施日益增長的需求基礎設施日益增長的需求圖:圖:2022-2024Q2 2022-2024Q2 各廠商資本性開支各廠商資本性開支資料來源:Wind,Microsoft Start,澎湃新聞,搜狐,財聯社,財經涂鴉官網,Trendforce,國海證券研究所
26、22%19%15%9%6%9%20%20%17%16%11%6%5%25%MicrosoftGoogleAWSMetaCoreWeaveBBAT其他圖:圖:2023-20242023-2024年全球年全球CSPCSP對高階對高階AIAI服務器需求占比服務器需求占比內圈:2023外圈:2024E請務必閱讀報告附注中的風險提示和免責聲明131.3 互聯互聯網網廠商廠商資本開支指引提升資本開支指引提升,ASIC AI服務器采購占比服務器采購占比增長增長 CSP資本開支持續投向資本開支持續投向AI服務器采購。服務器采購。據TrendForce預估,全球AI服務器2024年第2季出貨量將季增近20%,全
27、年出貨量上修至167萬臺,年增率達41.5%。2024年大型CSPs及品牌客戶等對于高階AI服務器的需求較好,來自北美CSPs業者(如AWS、Meta等)持續擴大自研ASIC(專用集成電路),以及中國本土業者如:阿里巴巴、百度、華為等積極擴大自主ASIC 方案,促ASIC服務器占整體AI服務器的比重在2024年將提升至26%,而主流搭載GPU的AI服務器占比則約71%。表表1 1:20242024年搭載年搭載ASICASIC芯片芯片AIAI服務器出貨占比將逾服務器出貨占比將逾2.52.5成成公司公司20222022202320232024E2024ENVIDIANVIDIA67.6%65.5%
28、63.6%AMDAMD(包括(包括XilinxXilinx)5.7%7.3%8.1%IntelIntel(包括(包括AlteraAltera)3.1%3.0%2.9%OthersOthers23.6%24.1%25.3%全部全部100%100%100%資料來源:Trendforce,國海證券研究所請務必閱讀報告附注中的風險提示和免責聲明141.3 OpenAI模型加速迭代,模型加速迭代,o1推理能力提升算力需求推理能力提升算力需求 O p e n A I-o 1 擁 有 進 化 的 推 理 能 力。擁 有 進 化 的 推 理 能 力。9 月 1 2 日,O p e n A I 發 布“草 莓”
29、模 型 的 部 分 預 覽 版 OpenAI-o1,這是OpenAI計劃推出的一系列“推理”模型中的第一個。OpenAI-o1可以進行通用復雜推理,擅長解決復雜問題,尤其是編碼、數學、科學遠超OpenAI-4o。OpenAI-o1和和o1-mini模型已經在模型已經在ChatGPT中上線,中上線,Plus和和Team訂閱用戶可以直接體驗。訂閱用戶可以直接體驗。開發者對o1的訪問非常昂貴,在API中,o1-preview的價格是每100萬個輸入tokens 15美元,每100萬個輸出tokens 60美元。相比之下,GPT-4o的價格是每100萬個輸入tokens 5美元,每100萬個輸出tok
30、ens 15 美元。但目前的請求頻率有限制,o1-preview的每周速率限制為30條消息,o1-mini的每周速率限制為50條。我們認為,我們認為,OpenAI-o1及及o1 mini模型在編碼、數學、模型在編碼、數學、科學等復雜推理任務方面的能力提升,將促進其提科學等復雜推理任務方面的能力提升,將促進其提升應用效果、擴大應用范圍,促進算力需求持續增升應用效果、擴大應用范圍,促進算力需求持續增長。同時,長。同時,OpenAI-o1在算法上的優化,以及在思在算法上的優化,以及在思維 鏈 推 理、多 步 推 理 等 能 力 的 提 升,或 將 導 致維 鏈 推 理、多 步 推 理 等 能 力 的
31、 提 升,或 將 導 致OpenAI-o1對比上一代模型在同一任務下消耗更大對比上一代模型在同一任務下消耗更大的 算 力,更 高 的 定 價 亦 或 反 應 了 該 趨 勢。因 此,的 算 力,更 高 的 定 價 亦 或 反 應 了 該 趨 勢。因 此,OpenAI-o1的推廣有望全面擴大的推廣有望全面擴大AI算力需求。算力需求。圖:圖:GPT-4oGPT-4o與與o1o1的多方面基準測試對比的多方面基準測試對比資料來源:OpenAI請務必閱讀報告附注中的風險提示和免責聲明15第二章第二章 服務器細節拆分服務器細節拆分主板從主板從HGXHGX到到MGXMGX,GB200 NVL72GB200
32、NVL72價值量提升價值量提升請務必閱讀報告附注中的風險提示和免責聲明162.1 英偉達整機:英偉達整機:HGX到到MGX計算平臺,服務器整機到系統形態計算平臺,服務器整機到系統形態資料來源:AMAX圖:服務器制造等級分類圖:服務器制造等級分類 服務器制造級別可分為服務器制造級別可分為L e v e l 1-L e v e l 1 2。Level 1為零部件制造,Level 6為主板集成,通常為 ODM 發貨“服務器準系統”時提供的。Level 10為完整服務器組裝和測試,能夠達到 10 級制造水平的制造商將提供有效的服務器解決方案。Level 11-12級可將多臺服務器聯網作為機架級甚至多機
33、架級解決方案。請務必閱讀報告附注中的風險提示和免責聲明172.1 英偉達整機:英偉達整機:HGX版本由版本由ODM出貨,出貨,DGX版本由英偉達交付版本由英偉達交付 HGX:模組主要為SXM版本,隨后8個GPU SXM模組構建成一個HGX UBB基板,基本交付給英偉達后,分配給品牌級服務器廠商,包括鴻海、廣達、緯創、英業達等廠商。DGX:SXM模組生產后,交給下游服務器廠商進行組裝,整機交付給英偉達,流向下游CSP廠商與企業客戶等。圖:英偉達HGX/DGX服務器制作產業鏈GPUSXM版本PCIe版本HGX系統DGX系統帶有NV品牌終端企業終端企業CSPCSPODMODM品牌級品牌級ODMODM
34、品牌級品牌級終端企業終端企業CSPCSP終端企業終端企業CSPCSP資料來源:芯智訊,英偉達官網,opencompute,研華官網,HCDT,國海證券研究所請務必閱讀報告附注中的風險提示和免責聲明182.1 英偉達整機:英偉達整機:MDX開放模塊化設計,開放模塊化設計,NVL72或采用此結構或采用此結構 MGX(Module GPU Accelerator):):是一個開放模塊化服務器設計規范和加速計算的設計。MGX讓系統制造商快速且經濟高效地為 AI、HPC 和 NVIDIA Omniverse 應用程序構建 100 多種服務器變體。GB200 NVL72整個系統由整個系統由18個個Comp
35、ute Trays計算節點和計算節點和9個個Switch Trays交換節點組成。交換節點組成。圖:英偉達服務器制作產業鏈從看HGX-8卡到MGXHGX系統GraceNVLink C2CNVLink 1.8TB/sNVLink 1.8TB/sBlackwellBlackwellGB200GB200 SUPERCHIP GB200 SUPERCHIP COMPUTE TRAYCOMPUTE TRAY2x GB20080 PETAFLOPS FP4 AI INFERENCE40 PETAFLOPS FP8 AI TRAINING1728 GB FAST MEMORY1U Liquid cooled
36、18 Per RackNVLINK SWITCH TRAYNVLINK SWITCH TRAY2x NVLINK SWITCH14.4 TB/s Total BandwidthSHARPv4 FP64/32/16/81U Liquid cooled9 Per Rack資料來源:fibermall,英偉達官網,opencompute,國海證券研究所請務必閱讀報告附注中的風險提示和免責聲明192.1 英偉達整機:英偉達整機:Hopper到到Blackwell,服務器系統多元變化,服務器系統多元變化 從從Hopper平臺升級到平臺升級到Blackwell平臺,平臺,英偉達系統級解決方案存在變化:英偉
37、達系統級解決方案存在變化:D G X H 1 0 0 服 務 器:服 務 器:采 用 8 個 H 1 0 0 GPU,向外擴展18個 NVLink,總共900GB/s雙向帶寬;還包括 CPU主板、系統內存、網卡、PCIe交換機等組件。GB200 NVL72機架:機架:NVL72包含18塊計算托盤與9塊交換托盤,每塊計算托盤包括2個Grace CPU與4個B200 GPU,機柜內部通信主要采用NVLink網絡架構,使用高速銅纜通信互連,提供水冷散熱。圖:英偉達DGX H100服務器圖:英偉達GB200 NVL72整機柜圖:GB200 NVL72 SuperpodGB200 NVL72 Super
38、pod圖:英偉達英偉達DGX SuperpodDGX Superpod資料來源:英偉達官網,元宇宙產業聯盟,國海證券研究所請務必閱讀報告附注中的風險提示和免責聲明202.1 英偉達整機:英偉達整機:GB200 NVL72 訓練與推理能力倍數提升訓練與推理能力倍數提升 AI 訓練:訓練:GB200 包含速度更快的第二代 Transformer 引擎。與相同數量的 NVIDIA H100 GPU 相比,GB200 NVL72 可為 GPT-MoE-1.8 T 等大型語言模型提供 4 倍的訓練性能。AI 推理:推理:GB200 引入了先進的功能和第二代 Transformer 引擎,可加速 LLM
39、推理工作負載。與上一代 H100 相比,它將資源密集型應用程序(例如 1.8 T 參數 GPT-MoE)的速度提高了 30 倍。新一代 Tensor Core 引入了 FP4 精度和第五代 NVLink 帶來的諸多優勢,使這一進步成為可能。加快數據庫查詢加快數據庫查詢速度:速度:GB200利用NVIDIA Blackwell 架構中具有高頻寬記憶體效能的NVLink-C2C和專用解壓縮引擎,將關鍵資料庫查詢的速度提升為CPU的18倍,總擁有成本降低5倍。圖:GB200 NVL72訓練性能約為H100的4倍圖:對比H100,GB200可提供30倍實時吞吐量圖:GB200可提升數據庫查詢速度資料來
40、源:英偉達官網請務必閱讀報告附注中的風險提示和免責聲明212.2 GB200 NVL系統:發展系統:發展NVL72為代表的為代表的四種不同外形尺寸四種不同外形尺寸 GB200機架提供機架提供4種不同主要外形尺寸,每種尺寸均可定制。種不同主要外形尺寸,每種尺寸均可定制。G B 2 0 0 N V L 7 2:除 了 一 家 計 劃 將 其 部 署 為 主 要 變 體 的 超 大 規 模 提 供 商 外,據SemiAnalysis,在 Blackwell Ultra 之前很少部署此版本,因為即使使用直接到芯片的液體冷卻(DLC)也是如此,大多數數據中心基礎設施也無法支持如此高的機架密度。GB200
41、 NVL72GB200 NVL72 架構圖架構圖 NVL72:18個1U計算托盤和9個NVSwitch 托盤。計算托盤:計算托盤:2個 Bianca板,每個板是1 個 G r a c e C P U 和 2 個 B l a c k w e l l G P U。N V S w i t c h 托 盤:托 盤:有 兩 個 2 8.8 T b/s NVSwitch5 ASIC。120kW功率。功率。圖:英偉達GB200 NVL72 的計算與網絡節點GB200*2網卡*4BlueField-3 DPU*1 資料來源:英偉達官網,SemianalysisGB200 NVL72GB200 NVL72 實物
42、圖實物圖請務必閱讀報告附注中的風險提示和免責聲明222.2 GB200 NVL系統:系統:NVL36 x 2增加交換托盤與功耗增加交換托盤與功耗 GB200 NVL36x2:每個機架18個Grace CPU 和36個Blackwell GPU 計算托盤:計算托盤:每個計算托盤高 2U,包括2 個 Bianca 板 NV Switch托盤托盤:兩個28.8Tb/s NVSwitch5 ASIC 芯片。每芯片背板后方 14.4Tb/s,前板14.4Tb/s。每個NVswitch托 架 都 有 1 8 個 1.6 T 雙 端 口 O S F P 殼 體,水 平 連 接 到 一 對NVL36機架。每
43、機 架每 機 架 66kW,總 共 為,總 共 為 132kW。由于額外的 NVS wi t c h A S I C 和 跨 機 架 互 連 布 線 的 要 求,與 N V L 7 2 相 比,NVL36x2 系統確實多使用了約10kW 的功率。NVL36x2 總共將有 36 個 NVSwitch5 ASIC,而 NVL72 上只有 18 個 NVSwitch5 ASIC。GB200 NVL36GB200 NVL36 x x 2 2資料來源:Semianalysis請務必閱讀報告附注中的風險提示和免責聲明232.2 GB200 NVL系統:推出系統:推出NVL36x2(Ariel)與)與x86
44、 B200版本版本 G B 2 0 0 N V L 3 6 x 2(A r i e l):):據SemiAnalysis,主要由 Meta 使用。Meta大部 分 采 購 普 通 的 N V L 3 6 x 2,因 為 更 適 合GenAI工作負載,Ariel版本將僅用于最大的推薦系統工作負載。由于Meta 的推薦系統訓練和推理工作負載,它們需要更高的 CPU 內核和更多的每 GPU 內存比率。x 8 6 B 2 0 0 N V L 7 2/N V L 3 6 x 2:據SemiAnalysis,在 2025 年第二季度,將推出 B200 NVL72 和 NVL36x2 外形尺寸,它們將使用
45、x86 CPU,而不是 Nvidia 的內部 grace CPU。這種外形規格稱為 Miranda。據SemiAnalysis,每個計算托盤的 CPU 到 GPU 將保持不變,每個計算托盤 2 個 CPU 和 4 個 GPU。GB200 NVL36x2GB200 NVL36x2(ArielAriel)NVL36 x 2(Ariel):):每 個 機 架 1 8 個 G r a c e CPU 和36個Blackwell GPU定 制定 制“Ariel”板板:1 個 G r a c e C P U 和 1 個 Blackwell GPUN V S w i t c h 托 盤:托 盤:有 1 8
46、個 1.6 T 雙 端 口 OSFP 籠,水平連接一對 NVL36 機架資料來源:Semianalysis請務必閱讀報告附注中的風險提示和免責聲明242.2 NVL72組裝模式:組裝模式:MGX-整機柜整機柜-集群集群compute tray&switch tray交給NV客戶Compute TrayCompute TraySwitch TraySwitch TrayMGX NVL系列DGX NVL系列ODM 組裝ODM 組裝交給NV圖:NVL72的組裝流程資料來源:各公司官網,國海證券研究所請務必閱讀報告附注中的風險提示和免責聲明252.2 NVL72組裝模式:組裝模式:GPU數量、計算能力
47、、網絡性能實現提升數量、計算能力、網絡性能實現提升 NVL系統系統 NVL32-NVL72:GPU數量從32增加到72,FP16密集計算能力從32P增加到180P,幾乎增加了6倍,而功耗也從40kW(估計數據)增加到120kW,近3倍。GH200 SuperPod-GB200 SuperPod:GPU數量從256增加到576,FP16密集計算能力從256P增加到1440P,幾乎增加了6倍。在NVL72和GB200 SuperPod中使用最新的800Gb/s帶寬ConnectX-8 IB網絡卡,而HGX B100和HGX B200仍然使用400Gb/s帶寬ConnectX-7 IB網絡卡。需要注
48、意的是:NVIDIA介紹說GB200 SuperPod由8個NVL72組成,而GH200 SuperPod不是由8個NVL32組成。表:Hopper架構和Blackwell架構對應的NVL機柜和SuperPodArchitectureNVL32GH200 SuperPodNVL72GB200 SuperPod32 xGH200256 x GH20036 x GB200288 x GB20032 x GPU256 x GPU72 x GPU576 x GPUHopperBlackwellHBM VRAM Size32 x 144GB=4.6T256 x 96GB=24.5TB36 x 384GB
49、=13.8TB288 x 384GB=110TBLPDDR5X VRAM Size32 480GB=15.4T256 x 480GB=123TB36 x 480GB=17.3TB288 x 480GB=138TBHBM VRAM Bandwidth32 x 4.9TB/s256 x 4TB/s72 x 8TB/s576 x 8TB/sFP16(FLOPS)32P256P180P1440PINT8(OPS)64P64P360P2880PFP8(FLOPS)64P64P360P2880PFP6(FLOPS)XX360P2880PFP4(FLOPS)XX720P5760PNVSwitch Syste
50、mGen3-64 Port/NVSwitchGen4-72 Port/NVSwitch9 L1 NVSwitch Tray96 L1 NVSwitch Tray36 L2 NVSwitch Tray9 L1 NVSwitch Tray144 L1 NVSwitch Tray72 x L2 NVSwitch TrayGPU-to-GPU Bandwidth0.9TB/s0.9TB/s1.8TB/s1.8TB/sNVLink Bandwldth36 x 0.9T/s=32TB/s256 x 0.9T/s=230TB/s72 x 1.8T/s=130TB/s576 x 1.8TB/s=1PB/sEt
51、hernet16 x 200Gb/s256 x 200Gb/s18 x 400Gb/sInfiniBand32 x 400Gb/s256 x 400Gb/s72 x 800Gb/s576 x 800Gb/sPower Consumption32 x 1kw=32kw256 x 1kw=256kw36 2.7kw=97.2kw288 x 2.7kw=777.6kwTotal Power Consumption120kwNotesConnectX-7 NICConnectX-8 NIC資料來源:fibermall,國海證券研究所請務必閱讀報告附注中的風險提示和免責聲明262.3 NV Blackw
52、ell重塑價值鏈,機柜重塑價值鏈,機柜/銅纜銅纜/液冷液冷/HBM占比提升占比提升資料來源:Semianalysis,國海證券研究所整機柜HBM銅連接散熱GB200H100$12k$12k每GPU服務器ODM毛利情況$6k$6k2X2X$3k$3k每GPUHBM花費$1k$1k3X3X$3k$3k每GPU$0.3k$0.3k10X10X$1.4k$1.4k每GPU BOM$0.4k$0.4k3X3X GB200 NVL系列的發布,有望帶來系列的發布,有望帶來機柜機柜、HBM、銅纜銅纜、液冷液冷等市場的等市場的價值量占比提升。價值量占比提升。整機柜:整機柜:機柜采用MGX架構,由計算托盤與交換托
53、盤組成,提升組裝復雜度,帶來ODM整機廠的加工價值量提升。HBM:H100采用5顆HBM3,Blackwell Ultra預期采用8顆HBM3e,單顆GPU采用HBM數量與單價均實現提升。銅 連 接:銅 連 接:GB200 NVL 7 2 采用NVLink銅纜鏈接。散熱:散熱:B200 GPU功耗約1200W,GB200功耗約2700W,或達到風冷上線,有望推動液冷組件價值量提升。請務必閱讀報告附注中的風險提示和免責聲明27第三章第三章 銅連接銅連接DACsDACs市場較快增長,市場較快增長,GB200 NVL72GB200 NVL72需求較大需求較大請務必閱讀報告附注中的風險提示和免責聲明2
54、83.1 高速線纜高速線纜:有源光纜適合遠距離傳輸,直連電纜高速低功耗:有源光纜適合遠距離傳輸,直連電纜高速低功耗 交換網絡中有多種連接解決方案,包括光模塊交換網絡中有多種連接解決方案,包括光模塊+光纖、有源光纜(光纖、有源光纜(AOC)和直連電纜()和直連電纜(DAC)。)。有源光纜有源光纜AOC:AOC是由集成光電器件組成的,用于數據中心、高性能計算機、大容量存儲器等設備間進行高速率、高可靠性互聯的傳輸設備,它通常滿足工業標準的電接口,通過內部的電-光-電轉換,使用光纜的優越性進行數據的傳輸。直連電纜直連電纜DAC:在數據中心,銅纜一般用來連接服務器和存儲區域網絡,最常用的以直連銅纜(DA
55、C,Direct Attach Copper Cable)為主,而其中又以無源銅纜用得尤盛。由于無源銅纜價格便宜、傳輸速度快,因而成了實現短距離傳輸的最佳解決方案。圖:圖:AOCAOC有源光纜有源光纜圖:高速線纜示意圖圖:高速線纜示意圖資料來源:易天光通信圖:圖:DACDAC直連電纜直連電纜請務必閱讀報告附注中的風險提示和免責聲明293.1 高速線纜:高速線纜:規模預期規模預期28年達年達28億美元,億美元,DACs保持較快增長保持較快增長 據LightCounting,受益于服務器連接以及分解式交換機和路由器中的互連需求提升,預期高速線纜的銷售額預計在預期高速線纜的銷售額預計在2023-20
56、28年將增加一倍以上,到年將增加一倍以上,到2028年將達到年將達到28億美元億美元。有源電纜(AECs)將逐步搶占有源光纜(AOCs)和無源銅線(DACs)的市場份額。AECs的傳輸距離更長,而且比DACs輕得多。DACs將保持較快增長,將保持較快增長,NVIDIA需求較高。需求較高。新的100G SerDes使100G/lane設計的無源銅纜的覆蓋范圍比預期的要長,包括400G、800G和1.6T DACs。據LightCounting,預計2024年底開始發貨的200G SerDes表現出色,這將使DACs擴展到每通道200G的設計,由于DACs不需要電,因此它是努力提高電力效率的數據中
57、心連接的默認解決方案。最小化功耗對AI集群來說是最關鍵的。Nvidia的策略是盡可能多地部署DACs,只有在必要的情況下才使用光模塊。圖:圖:AOCsAOCs與銅纜的銷售量預期與銅纜的銷售量預期圖:圖:AOCsAOCs與銅纜的銷售量預期與銅纜的銷售量預期資料來源:LightCounting請務必閱讀報告附注中的風險提示和免責聲明303.1 高速線纜:高速線纜:安費諾為安費諾為DAC市占率第一,集中度相對較高市占率第一,集中度相對較高 根據 QYResearch、北京瑞云智信等數據,在全球范圍內,高速直連銅(DAC)電纜的 主 要 生 產 商 有 安 費 諾(A m p h e n o l Co
58、rporation)、莫仕(Molex)、泰科(TE Connectivity)、瞻博網絡(Juniper Networks)、豪利士(Volex)、泛達公司(Panduit)等。2 0 2 2 年,全 球 前 十 強 廠 商 大 約 占 據 了年,全 球 前 十 強 廠 商 大 約 占 據 了 69.0%的市場份額,其中安費諾的市場份的市場份額,其中安費諾的市場份額位居全球第一。額位居全球第一。圖:圖:20222022年年,全球高速直連銅全球高速直連銅纜纜(DAC)(DAC)廠商廠商前前1515強及份額強及份額資料來源:北京瑞云智信,QYResearch請務必閱讀報告附注中的風險提示和免責聲
59、明313.2 英偉達英偉達NVL72:采用:采用NVLink全連接,銅纜數量達全連接,銅纜數量達5000+根根 據 G T C 大 會,英 偉 達 G B 2 0 0 N V L i n k S w i t c h 和 S p i n e 由 7 2 個Blackwell GPU采用NVLink全互連,有5000根NVLink銅纜(合計長度超2英里)。GB200 NVL72 Switch Tray:內部有一對 Nvidia 的 NVLink 7.2T ASIC,總共提供 144 個 100 GBps 鏈路。每個機架有 9 個 NVLink 交換機,相當于為機架中的 72 個 GPU 中的每一個
60、提供 1.8 TBps(18 個鏈路)的雙向帶寬。圖:圖:英偉達英偉達GB200 NVL72GB200 NVL72銅纜組成銅纜組成圖:圖:英偉達英偉達GB200 NVL72GB200 NVL72 Switch Tray Switch Tray圖:圖:英偉達英偉達GB200 NVL72GB200 NVL72 Compute Tray Compute Tray圖:圖:英偉達英偉達GB200 NVL72 GB200 NVL72 互聯結構互聯結構資料來源:Semianalysis,聯想,英偉達官網,新智元,中國線纜網請務必閱讀報告附注中的風險提示和免責聲明323.2 英偉達英偉達NVL72:overp
61、ass高速跳線與高速跳線與Ultrapass Paladin背板背板 Nvidia 選擇使用選擇使用 Amphenol 的的 Ultrapass Paladin 背背板產品作為其板產品作為其 NVLink 背板互連的主要初始來源。背板互連的主要初始來源。每個 Blackwell GPU 都連接到 Amphenol Paladin HD 224G/s 連接器,每個連接器有 72 個差分對。然后,該連接器連接到背板 Paladin 連接器。從 NVSwitch P a l a d i n 連 接 器 到 N V S w i t c h A S I C 芯 片,需 要 OverPass 跨接電纜。圖
62、:圖:英偉達英偉達GB200 NVL72GB200 NVL72 Switch Tray Switch Tray圖:圖:英偉達英偉達GB200 NVL72 GB200 NVL72 連接系統連接系統圖:圖:英偉達英偉達GB200 NVL72 GB200 NVL72 互聯結構互聯結構資料來源:Semianalysis請務必閱讀報告附注中的風險提示和免責聲明33第四章第四章 HBM HBMHBM3EHBM3E將于下半年出貨,將于下半年出貨,英偉達英偉達為主要買家為主要買家請務必閱讀報告附注中的風險提示和免責聲明344.1 HBM市場:市場:HBM3E將于下半年出貨,將于下半年出貨,HBM4或于或于20
63、26年上市年上市 HBM(High Bandwidth Memory):):是一款新型的CPU/GPU 內存芯片(即“RAM”),是將很多個DDR芯片堆疊在一起后和GPU封裝在一起,實現大容量,高位寬的DDR組合陣列。HBM 目前已經量產的共有目前已經量產的共有 HBM、HBM2、HBM2E、HBM3、HBM3E 五個子代標準。五個子代標準。從迭代周期看,從迭代周期看,SK 海力士表示海力士表示 HBM3E內存已經量產,內存已經量產,HBM4 產品有望于產品有望于 2026 年正式推出并量產,同樣,美光和三星也計劃在年正式推出并量產,同樣,美光和三星也計劃在2026年量產年量產HBM4。圖:圖
64、:HBM DRAM 3DHBM DRAM 3D圖形圖形中間的die是GPU/CPU,左右2邊4個小die是DDR顆粒 的 堆 疊,D i e 之 間 用TVS方式連接,現在一般只有2/4/8三種層數。圖:海力士的圖:海力士的HBM HBM 發展歷程發展歷程資料來源:海力士公開路演PPT,艾邦半導體網,國海證券研究所請務必閱讀報告附注中的風險提示和免責聲明354.1 HBM市場:市場:HBM3E將于下半年出貨,將于下半年出貨,HBM4或于或于2026年上市年上市 HBM3e將是今年市場主流,集中在今年下半年出貨。將是今年市場主流,集中在今年下半年出貨。集邦咨詢指出,HBM3e將在今年成為市場主流
65、,出貨量集中在下半年。目前,SK海力士仍然是主要供應商,與美光一起,都使用1beta nm制程,并且都已開始向英偉達供貨。三星使用1alpha nm制程,預計將在第二季度完成認證,于年中開始交付。H B M 4 有 望有 望 2 0 2 6 年 上 市。年 上 市。據TrendForce集邦,HBM4預計規劃于2026年推出。隨著客戶對運算效能要求的提升,在堆棧的層數上,HBM4除了現有的12hi外,也將再往16hi發展。HBM4 12hi產品將于2026年推出;而16hi產品則預計于2027年問世。此外,受到規格更往高速發展帶動,將首次看到HBM最底層的Logic die采用12nm制程wa
66、fer,該部分將由 晶 圓 代 工 廠 提 供,使 得 單 顆HBM產品需要結合晶圓代工廠與存儲器廠的合作。資料來源:Trendforce表:HBM發展時間軸請務必閱讀報告附注中的風險提示和免責聲明364.1 HBM:2024年底年底TSV產能約產能約250K/m,三星與海力士擴產積極,三星與海力士擴產積極 據TrendForce預估,截至2024年底,整體DRAM產業規劃生產HBM TSV的產能約為250K/m,占總DRAM產能(約1,800K/m)約14%,供給位元年成長約260%。此外,2023年HBM產值占比之于DRAM整體產業約8.4%,至2024年底將擴大至20.1%。以HBM產能
67、來看,三星、SK海力士(SK hynix)至今年底的HBM產能規劃最積極,三星HBM總產能至年底將達約130K(含TSV);SK海力士約120K,但產能會依據驗證進度與客戶訂單持續而有變化。另以現階段主流產品HBM3產品市占率來看,目前SK海力士于HBM3市場比重逾9成,而三星將隨著后續數個季度AMD MI300逐季放量持續緊追。表:表:2022202420222024年年HBMHBM占占DRAMDRAM產業產值比重預估產業產值比重預估(百萬美元百萬美元)表:表:2023202420232024年各供貨商年各供貨商HBM/TSVHBM/TSV產能預估產能預估資料來源:Trendforce,國海
68、證券研究所202220232024EHBM營收占比2.6%8.4%20.1%DRAM產業營收800875186384150HBM供貨商三星SK海力士美光2023年底HBM TSV產能45000片/月45000片/月3000片/月2024年底HBM TSV產能130000片/月120000-125000片/月20000片/月請務必閱讀報告附注中的風險提示和免責聲明374.2 英偉達目前是英偉達目前是HBM最大買家最大買家,海力士與三星完成,海力士與三星完成HBM3E驗證驗證 英偉達目前是英偉達目前是HBM市場的最大買家。市場的最大買家。英偉達H100搭載的HBM容量為80GB,而2024年放量的
69、H200則躍升到144GB。據TrendForce,預期2025年,受到Blackwell平臺全面搭載HBM3e、產品層數增加,及單芯片HBM容量的上升,NVIDIA在HBM市場的采購比重將突破70%,對HBM3e市場整體的消耗量或推升至85%以上。Blackwell Ultra或將采用8顆HBM3e 12hi,GB200也有升級可能,再加上B200A的規劃,預估2025年12hi產品在HBM3e當中的比重將提升至40%。海力士與三星完成海力士與三星完成HBM3E驗證驗證。據TrendForce,SK hynix(SK海力士)、Micron(美光科技)在2024年第二季開始量產HBM3e。隨著
70、進入到HBM3e 12hi階段,技術難度也提升,驗證進度顯得更加重要,完成驗證的先后順序可能影響訂單的分配比重。據集邦咨詢,三星、SK海力士與美光已分別于2024年上半年和第三季提交首批HBM3e 12hi樣品,目前處于持續驗證階段。其中SK海力士與美光進度較快,有望于今年底完成驗證。表:表:HBMHBM產品進度情況產品進度情況項目項目詳細內容詳細內容海力士海力士據財聯社9/4訊,SK海力士正在將利川廠的M10F產線轉向生產HBM,計劃明年四季度實現量產。投產后,SK海力士的HBM產能可達每月15萬片。設備供應商已收到相關設備的采購訂單。據財聯社8/20訊,SK海力士副總裁Ryu Seong-
71、su表示,海力士HBM正受到全球企業的高度關注,蘋果、微軟、谷歌、亞馬遜、英偉達、Meta和特斯拉美股科技股七巨頭都向SK海力士提出了定制HBM解決方案的要求。三星三星據財聯社9/6訊,三星電子正與臺積電合作開發下一代高帶寬存儲器HBM4人工智能(AI)芯片。據財聯社9/4訊,TrendForce集邦咨詢表示,三星電子的HBM3E內存產品已完成驗證,并開始正式出貨HBM3E 8Hi,主要用于H200,同時Blackwell系列的驗證工作也在穩步推進。美光美光據財聯社9/9訊,美光表示,目前正在將可供制造的(production-capable)12層第五代HBM(HBM3E)送交給AI產業鏈重
72、要合作伙伴,以進行驗證程序。資料來源:財聯社,國海證券研究所請務必閱讀報告附注中的風險提示和免責聲明38第五章第五章 液冷液冷冷板式液冷較為成熟,冷板式液冷較為成熟,GB200 NVL72GB200 NVL72采用液冷方案采用液冷方案請務必閱讀報告附注中的風險提示和免責聲明395.1 芯片散熱起源:電子設備發熱的本質是工作能量轉成熱能芯片散熱起源:電子設備發熱的本質是工作能量轉成熱能 電子設備發熱的本質原因就是工作能量轉化為熱能的過程。電子設備發熱的本質原因就是工作能量轉化為熱能的過程。芯片作為電子設備的核心部件,其基本工作原理是將電信號轉化為各種功能信號,實現數據處理、存儲和傳輸等功能。而芯
73、片在完成這些功能的過程中,會產生大量熱量,這是因為電子信號的傳輸會伴隨電阻、電容、電感等能量損耗,這些損耗會被轉化為熱能。溫度過高會影響電子設備工作性能,甚至導致電子設備損壞。溫度過高會影響電子設備工作性能,甚至導致電子設備損壞。據電子芯片散熱技術的研究現狀及發展前景,如對于穩定持續工作的電子芯片,最高溫度不能超過85,溫度過高會導致芯片損壞。散熱技術需要持續升級,來控制電子設備的運行溫度。散熱技術需要持續升級,來控制電子設備的運行溫度。芯片性能持續發展,這提升了芯片功耗,也對散熱技術提出了更高的要求。此外,AI大模型的訓練與推理需求,要求AI芯片的單卡算力提升,有望進一步打開先進散熱技術的成
74、長空間。圖:芯片的溫度云圖變化資料來源:CSDN,各公司官網,國海證券研究所圖:CPUGPUSwitch IC的TDP逐漸提升CPU型號發布時間TDPIntelIce Lake2021Q2105W-270WSapphire Rapids2023115W-350WEmerald Rapids2023150W-385WGranite Rapids2024500WAMDRome2019120W-280WMilan2021120W-280WGenoa2022200W-360WGPU型號發布時間TDPNVIDIAA1002020250W-400WH100 SXMH100 PCIe2023300W-350
75、Wup to 700WAMDMI1002020up to 300WMI2002021300WMI3002023600W請務必閱讀報告附注中的風險提示和免責聲明405.1 芯片芯片散熱革新:相比散熱革新:相比熱管熱管/VC/3DVC,冷板式散熱范圍廣,冷板式散熱范圍廣資料來源:uanalyze,國海證券研究所 熱管與熱管與VC的散熱能力較低,的散熱能力較低,3D VC風冷散熱上限擴大至風冷散熱上限擴大至1000W,冷板式具備,冷板式具備1000W+的廣闊散熱范圍。的廣闊散熱范圍。請務必閱讀報告附注中的風險提示和免責聲明415.1 芯片散熱革新:浸沒式散熱效果好,冷板式更為成熟芯片散熱革新:浸沒式
76、散熱效果好,冷板式更為成熟 根據ODCC冷板液冷服務器設計白皮書,綜合考量初始投資成本、可維護性、PUE 效果以及產業成熟度等因素,冷板式和單相浸沒式相較其他液冷技術更有優勢,是當前業界的主流解決方案。冷板式和單相浸沒式相較其他液冷技術更有優勢,是當前業界的主流解決方案。表:服務器散熱技術對比情況表:服務器散熱技術對比情況液冷方案液冷方案非接觸式液冷非接觸式液冷接觸式液冷接觸式液冷冷板式冷板式浸沒式液冷浸沒式液冷相變浸沒式相變浸沒式單相浸沒式單相浸沒式投資成本投資成本初始投資中等初始投資及運維成本高初始投資及運維成本高運維成本低PUEPUE1.1-1.21.051.09可維護性可維護性較簡單復
77、雜供應商供應商華為、浪潮曙光、聯想超聚變等主流供應商曙光阿里巴巴、H3C、綠色云圖、云酷智能、曙光數創應用案例應用案例多超算領域較多較多分析分析初始投資中等,運維成本初始投資中等,運維成本較較低,低,PUE PUE 收益中收益中等,等,部署方式與風冷相同,從傳統模式過渡較平滑初始投資最高初始投資最高,PUE PUE 收益最高,收益最高,使用專用機柜,服務器結構需改造為刀片式初始投資較高,初始投資較高,PUE PUE 收益較高收益較高,部分部件不乘容,服務器結構需改造資料來源:冷板液冷服務器設計白皮書,國海證券研究所請務必閱讀報告附注中的風險提示和免責聲明425.2 GB200 NVL72:采用
78、冷板液冷散熱,多家廠商合作打造系統:采用冷板液冷散熱,多家廠商合作打造系統 在3月18日英偉達GTC2024上,多家廠商展出基于英偉達GB200 NVL72液冷服務器設備,選取冷板液冷進行散熱。選取冷板液冷進行散熱。鴻海:展出鴻海:展出Ingrasys鴻佰科技開發的鴻佰科技開發的GB200 NVL72液冷液冷機架系統,采用冷板式結構,機架具備風液混合、液冷等機架系統,采用冷板式結構,機架具備風液混合、液冷等結構。結構。圖:鴻海采用液體冷卻的 GB200 計算托盤資料來源:鴻海官網,ingrasys,英偉達官網,國海證券研究所圖:英偉達NV72液冷機柜設計圖:鴻海的3種液冷機架解決方案圖:鴻海L
79、A0452系統為液冷-風冷混合散熱圖:鴻海LL1000系統為液冷與CDU等設備混合散熱請務必閱讀報告附注中的風險提示和免責聲明43第六章第六章投資建議與風險提示投資建議與風險提示請務必閱讀報告附注中的風險提示和免責聲明446.1 投資建議與相關公司投資建議與相關公司 投資建議:大模型訓推帶動投資建議:大模型訓推帶動 AI AI算力需求增長,算力需求增長,GB200GB200等新一代算力架構將推出,算力產業鏈中的等新一代算力架構將推出,算力產業鏈中的AIAI芯片、芯片、服務器整機、銅連接、服務器整機、銅連接、HBMHBM、液冷、光模塊、液冷、光模塊、IDCIDC等環節有望持續受益。維持對計算機行
80、業等環節有望持續受益。維持對計算機行業“推薦推薦”評級。評級。相關公司相關公司 1 1)AIAI芯片:芯片:海光信息、寒武紀、龍芯中科、景嘉微、英偉達、AMD、Intel 2 2)服務器整機:)服務器整機:工業富聯、浪潮信息、中科曙光、華勤技術、中國長城、高新發展、神州數碼、烽火通信、拓維信息、緯創、廣達、英業達、緯穎、超微電腦。3 3)服務器組件:)服務器組件:散熱:飛榮達、曙光數創、英維克、同方股份、申菱環境、高瀾股份、奇鋐科技、雙鴻、VERTIV;主板:滬電股份、深南電路、勝宏科技、技嘉、華擎;HBM:SK海力士、三星、美光、賽騰股份、聯瑞新材;銅連接:安費諾、沃爾核材、華豐科技。4 4
81、)光模塊:)光模塊:天孚通信、中際旭創、新易盛、光迅科技、華工科技。5 5)數據中心:)數據中心:奧飛數據、光環新網、寶信軟件、數據港、電科數字。請務必閱讀報告附注中的風險提示和免責聲明456.1 投資建議與投資建議與相關公司相關公司Compute Tray Compute Tray*10 10內地:內地:工業富聯中國臺灣:中國臺灣:緯創Switch Tray Switch Tray*9 9內地:內地:工業富聯中國臺灣:中國臺灣:緯創Compute Tray Compute Tray*8 8電源電源電源電源內地:內地:中國長城、歐陸通、杰華特、泰嘉股份中國臺灣:中國臺灣:臺達分歧管分歧管(液冷
82、:支持130KW的制冷能力)內地:內地:曙光數創、飛榮達、中航光電、英維克、同飛股份、申菱環境、高瀾股份、依米康中國臺灣:中國臺灣:奇鋐、雙鴻、健策、建準、高力海外:海外:VERTIV線纜線纜(銅連接:5000+根NVLink線纜)內地:內地:沃爾核材、華豐科技、兆龍互連、鼎通科技、立訊精密、神宇股份海外:海外:安費諾GPUGPU內地:內地:華為海思、海光信息、寒武紀、龍芯中科。海外:海外:英偉達、AMD、Intel主板主板內地:內地:滬電股份、勝宏科技、深南電路、生益科技中國臺灣:中國臺灣:泰安電腦(神達)、技嘉、華擎、華碩、英業達、緯創、研華美國:美國:Intel、Supermicro組裝
83、測試組裝測試整機廠商整機廠商ODMODM:1 1)內地:)內地:浪潮信息、工業富聯、中科曙光、紫光股份、中國長城、華勤技術、神州數碼、拓維信息、烽火通信、軟通動力;2 2)中國臺灣:)中國臺灣:鴻海、廣達、緯創、英業達、緯穎;3 3)美股:)美股:戴爾、超微電腦BIOS/BMCBIOS/BMC:1 1)內地:)內地:卓易信息;2 2)中國臺)中國臺灣:灣:新唐、系微、信驊存儲存儲 NANDNAND公司:公司:長江存儲、兆易創新、佰維存儲、朗科科技海外:海外:三星、西部數據、鎧俠、SK海力士、美光光模塊光模塊內地:內地:中際旭創、新易盛、光迅科技、天孚通信正面正面背面背面英偉達英偉達GB200
84、GB200 NVL72NVL72實物圖實物圖CPUCPU內地:內地:華為海思、海光信息、飛騰、龍芯中科海外:海外:英偉達、AMD、IntelNV Switch ChipNV Switch Chip網卡等網卡等海外:海外:英偉達、Mellanox注:藍字為零部件。注:藍字為零部件。上圖展示以英偉達GB200 NVL72整機柜為例,僅列示了部分參與公司資料來源:英偉達官網,Open Compute Project,hansenfluid,各公司官網,Semianalysis,國海證券研究所請務必閱讀報告附注中的風險提示和免責聲明466.2 風險提示風險提示 1)宏觀經濟影響下游需求:)宏觀經濟影響
85、下游需求:宏觀經濟環境下行,將影響客戶對信息化基礎設施的采購需求;2)大模型產業發展不及預期:)大模型產業發展不及預期:行業的核心驅動力是人工智能大語言模型的訓練和推理對算力的需求,如果大模型行業發展不及預期將會影響AI算力的相關需求;3)市場競爭加?。海┦袌龈偁幖觿。篒T 產品和服務行業是成熟且完全競爭的行業,新進入者可能加劇整個行業的競爭態勢;4)中美博弈加?。海┲忻啦┺募觿。簢H形勢持續不明朗,美國不斷通過“實體清單”等方式對中國企業實施打壓,若中美緊張形勢進一步升級,將可能導致中國半導體供應鏈供應受到影響;5)相關公司業績不及預期:)相關公司業績不及預期:市場環境變化、公司治理情況變化
86、、其他非主營業務經營不及預期等原因或將導致相關公司的整體業績不及預期。6)各公司并不具備完全可比性,對標的相關資料和數據僅供參考。)各公司并不具備完全可比性,對標的相關資料和數據僅供參考。請務必閱讀報告附注中的風險提示和免責聲明47研究小組介紹研究小組介紹劉熹,本報告中的分析師均具有中國證券業協會授予的證券投資咨詢執業資格并注冊為證券分析師,以勤勉的職業態度,獨立,客觀的出具本報告。本報告清晰準確的反映了分析師本人的研究觀點。分析師本人不曾因,不因,也將不會因本報告中的具體推薦意見或觀點而直接或間接收取到任何形式的補償。分析分析師承師承諾諾行業投資評級行業投資評級國海證券投資評級標準國海證券投
87、資評級標準推薦:行業基本面向好,行業指數領先滬深300指數;中性:行業基本面穩定,行業指數跟隨滬深300指數;回避:行業基本面向淡,行業指數落后滬深300指數。股票投資評級股票投資評級買入:相對滬深300 指數漲幅20%以上;增持:相對滬深300 指數漲幅介于10%20%之間;中性:相對滬深300 指數漲幅介于-10%10%之間;賣出:相對滬深300 指數跌幅10%以上。計算機小組介紹計算機小組介紹劉熹,計算機行業首席分析師,上海交通大學碩士,多年計算機行業研究經驗,致力于做前瞻性深度研究,挖掘投資機會。新浪金麒麟新銳分析師、Wind金牌分析師團隊核心成員。請務必閱讀報告附注中的風險提示和免責
88、聲明48免責聲明和風險提示免責聲明和風險提示免責聲明免責聲明本報告的風險等級定級為R3,僅供符合國海證券股份有限公司(簡稱“本公司”)投資者適當性管理要求的客戶(簡稱“客戶”)使用。本公司不會因接收人收到本報告而視其為客戶??蛻艏?或投資者應當認識到有關本報告的短信提示、電話推薦等只是研究觀點的簡要溝通,需以本公司的完整報告為準,本公司接受客戶的后續問詢。本公司具有中國證監會許可的證券投資咨詢業務資格。本報告中的信息均來源于公開資料及合法獲得的相關內部外部報告資料,本公司對這些信息的準確性及完整性不作任何保證,不保證其中的信息已做最新變更,也不保證相關的建議不會發生任何變更。本報告所載的資料、
89、意見及推測僅反映本公司于發布本報告當日的判斷,本報告所指的證券或投資標的的價格、價值及投資收入可能會波動。在不同時期,本公司可發出與本報告所載資料、意見及推測不一致的報告。報告中的內容和意見僅供參考,在任何情況下,本報告中所表達的意見并不構成對所述證券買賣的出價和征價。本公司及其本公司員工對使用本報告及其內容所引發的任何直接或間接損失概不負責。本公司或關聯機構可能會持有報告中所提到的公司所發行的證券頭寸并進行交易,還可能為這些公司提供或爭取提供投資銀行、財務顧問或者金融產品等服務。本公司在知曉范圍內依法合規地履行披露義務。市場有風險,投資需謹慎。投資者不應將本報告為作出投資決策的唯一參考因素,
90、亦不應認為本報告可以取代自己的判斷。在決定投資前,如有需要,投資者務必向本公司或其他專業人士咨詢并謹慎決策。在任何情況下,本報告中的信息或所表述的意見均不構成對任何人的投資建議。投資者務必注意,其據此做出的任何投資決策與本公司、本公司員工或者關聯機構無關。若本公司以外的其他機構(以下簡稱“該機構”)發送本報告,則由該機構獨自為此發送行為負責。通過此途徑獲得本報告的投資者應自行聯系該機構以要求獲悉更詳細信息。本報告不構成本公司向該機構之客戶提供的投資建議。任何形式的分享證券投資收益或者分擔證券投資損失的書面或口頭承諾均為無效。本公司、本公司員工或者關聯機構亦不為該機構之客戶因使用本報告或報告所載
91、內容引起的任何損失承擔任何責任。風險提示風險提示本報告版權歸國海證券所有。未經本公司的明確書面特別授權或協議約定,除法律規定的情況外,任何人不得對本報告的任何內容進行發布、復制、編輯、改編、轉載、播放、展示或以其他任何方式非法使用本報告的部分或者全部內容,否則均構成對本公司版權的侵害,本公司有權依法追究其法律責任。鄭重聲明鄭重聲明心懷家國,洞悉四海國海研究深圳國海研究深圳深圳市福田區竹子林四路光大銀行大廈28F郵編:518041電話:0755-83706353國海研究上海國海研究上海上海市黃浦區綠地外灘中心C1棟國海證券大廈郵編:200023電話:021-61981300國海研究北京國海研究北京北京市海淀區西直門外大街168號騰達大廈25F郵編:100044電話:010-88576597國海證券研究所計算機研究團隊國海證券研究所計算機研究團隊