《電子行業深度研究:AI算力需求持續釋放重點看好AI服務器產業鏈-230614(29頁).pdf》由會員分享,可在線閱讀,更多相關《電子行業深度研究:AI算力需求持續釋放重點看好AI服務器產業鏈-230614(29頁).pdf(29頁珍藏版)》請在三個皮匠報告上搜索。
1、 行業行業報告報告|行業深度研究行業深度研究 請務必閱讀正文之后的信息披露和免責申明 1 電子電子 證券證券研究報告研究報告 2023 年年 06 月月 14 日日 投資投資評級評級 行業行業評級評級 強于大市(維持評級)上次評級上次評級 強于大市 作者作者 潘暕潘暕 分析師 SAC 執業證書編號:S1110517070005 俞文靜俞文靜 分析師 SAC 執業證書編號:S1110521070003 資料來源:聚源數據 相關報告相關報告 1 電子行業點評:蘋果 MR 發布在即,重點推薦相關產業鏈 2023-05-31 2 電子行業深度研究:電子行業 23Q1總結:有望進入復蘇周期 2023-0
2、5-21 3 電子行業深度研究:AI 賦能制造業道路,傳統安防龍頭估值邏輯切換 2023-04-09 行業走勢圖行業走勢圖 AI 算力需求持續釋放,重點看好算力需求持續釋放,重點看好 AI 服務器產業鏈服務器產業鏈 AI 服務器直接受益于需求端服務器直接受益于需求端增長增長,Nvidia 高速互聯助力高速互聯助力 AI 運算運算。2018 年至今,模型升級帶來參數量指數級增加,AI 訓練+推理段模型需求催生 AI服務器海量需求(訓練階段算力需求=6模型參數數量訓練集規模),按照 A100 640GB 服務器參數假設,據測算,訓練端需要服務器數量為 3423臺/日,推理端按照 1 億活躍用戶測算
3、對應成本為 4000 萬美元,并隨著用戶量和訪問互動量上升,算力需求持續提升。此外,Nvidia 高速互聯助力 AI運算,800G 交換機陸續發布,下一代超寬互聯蓄勢待發。AI 重塑服務器行業格局,重塑服務器行業格局,ODM 模式模式/廠商受益廠商受益于于 AI 服務器增長服務器增長。根據Statista 數據,2021 年全球服務器市場規模達到 831.7 億美元,同比增長6.97%,其中 AI 服務器市場達到 156.3 億美元,同比增長 39.1%。AI 服務器有望成為增速最快的細分板塊,預計 AI 服務器市場將在 2026 年達到 347.1億美元,5 年 CAGR 達到 17.3%。
4、ODM 模式/廠商受益于 CSP 客戶增量,2022年出貨的服務器中 ODM 生產的市占率或達 50%。全球 ODM 廠商競爭格局集中度高,CR5 高達 94.4%,分別為鴻海/工業富聯(43%)、廣達(17%)、緯創(14%)、英業達(12.8%)和超微(7.6%)。AI 服務器放量預期利好上游核心部件服務器放量預期利好上游核心部件。AI 服務器銷量增加將拓寬上游核心零部件的增量市場,尤其是 AI 芯片(GPU、ASIC 和 FPGA)、存儲器、固態硬盤等。其中,國內上游環節的國產替代程度不一。我們認為國內處于樂觀機遇期的有 AI 服務器制造廠商、服務器用 PCB 廠商、DRAM 廠商和散熱
5、廠商,PCB 和 DRAM 的服務器領域均是行業實現擴產和開拓市場的重點所在;制約瓶頸為人工智能芯片,仍被國外廠商壟斷,有望實現突破的環節為先進封裝 Chiplet,或成為我國算力困境的關鍵轉折點。投資投資建議建議:建議關注 AI 服務器及上游產業鏈相關標的:1)AI 服務器龍頭:工業富聯;2)服務器 PCB:鵬鼎控股;3)服務器線束與連接器:電連技術、兆龍互連;4)算力芯片:寒武紀、海光信息(天風計算機團隊覆蓋)、景嘉微(天風計算機團隊聯合覆蓋);5)存儲供應鏈:兆易創新、北京君正、江波龍(天風計算機團隊聯合覆蓋)、瀾起科技、雅克科技、鼎龍股份(天風化工團隊聯合覆蓋)、華懋科技(天風汽車團隊
6、聯合覆蓋)、華特氣體;6)邊緣 AI:瑞芯微、晶晨股份、全志科技、恒玄科技、富瀚微、中科藍訊、樂鑫科技;7)AI to B/機器視覺:大華股份、??低?、鼎捷軟件(天風計算機團隊覆蓋)、凌云光、天準科技、舜宇光學、??低?、奧普特(天風機械軍工團隊覆蓋);8)Chiplet:長電科技、通富微電、華天科技、長川科技(天風機械團隊覆蓋)、華峰測控(天風機械團隊覆蓋)、利揚芯片、芯碁微裝、偉測科技 風險風險提示提示:中美貿易摩擦導致上游原材料斷供、AI 服務器出貨不及預期、技術瓶頸仍未擺脫 -17%-12%-7%-2%3%8%13%2022-062022-102023-022023-06電子滬深30
7、0 行業行業報告報告|行業深度研究行業深度研究 請務必閱讀正文之后的信息披露和免責申明 2 內容目錄內容目錄 1.人工智能服務器為算力支撐,助燃人工智能服務器為算力支撐,助燃 AI 產業化產業化.4 1.1.從通用服務器到 AI 服務器的過渡.4 1.2.AI 服務器與普通服務器相比有著明顯的性能優勢.4 1.3.AI 服務器的進步源于芯片,未來將關注更多功能性.5 2.龐大算力需求是龐大算力需求是 AI 服務器未來放量的關鍵驅動力服務器未來放量的關鍵驅動力.6 2.1.AI 模型優化迭代引發算力缺口,未來推理功能將需更多算力.6 2.2.AI 服務器作為承載算力主體將受益,成服務器市場的增長
8、主力.8 2.3.Nvidia 高速互聯助力 AI 運算,多 GPU 通信成為關鍵技術.11 3.AI 服務器放量預期利好上游核心部件,挑戰機遇共存服務器放量預期利好上游核心部件,挑戰機遇共存.19 3.1.危機四伏:上游供應危機尚未解除,國產替代必需提上日程.19 3.2.柳暗花明:以 Chiplet 工藝打開我國對算力的想象空間.22 3.3.適逢其會:為上游部分元件打開增量空間.23 3.3.1.AI 服務器或將打開 PCB 增量市場.23 3.3.2.高算力使服務器芯片散熱成為難題,散熱模組應需求提高散熱效率.24 3.3.3.數據存力作為算力進階需求迭起,看好國產存儲器后續發展.24
9、 3.4.下游指明服務器發展方向,人工智能滲透率提高將擴展 AI 服務器應用.25 4.投資建議投資建議.27 5.風險提示風險提示.28 圖表目錄圖表目錄 圖 1:AI 服務器的 CPU+架構.4 圖 2:中國智能算力規模.7 圖 3:全球服務器市場規模及增速.8 圖 4:中國服務器市場規模及增速.8 圖 5:全球 AI 服務器市場規模及增速.8 圖 6:中國 AI 服務器市場規模及增速.8 圖 7:ODM 和品牌服務器廠商市占率.9 圖 8:預計 2022 年 ODM 廠商競爭格局.9 圖 9:2021 年 H1 全球 AI 服務器競爭格局.9 圖 10:2021 年 H1 中國 AI 服
10、務器競爭格局.9 圖 11:2021 年全球服務器競爭格局.10 圖 12:2021 年中國服務器競爭格局.10 圖 13:GPT 模型參數對應 GPU 數量與 DGX A100 POD 配置.11 圖 14:NVIDIA DGX Systems.12 圖 15:NVIDIA DGX A100 配置.12 圖 16:NVIDIA DGX H100 配置.13 圖 17:NVIDIA DGX H100(H100、NVLink、NVSwitch 配套).13 SVpZgU8VkWUVrVaXiYaQ9RaQsQoOmOmPiNoOpRjMnMsP7NqRrRNZsQsQxNnNmP 行業行業報告報
11、告|行業深度研究行業深度研究 請務必閱讀正文之后的信息披露和免責申明 3 圖 18:DGX A100 與 DGX H100 32 節點 256 GPU NVIDIA SuperPOD 架構比較.14 圖 19:PCIe 與 NVLink 架構比較.14 圖 20:NVIDIA NVLink 迭代規格.14 圖 21:以 P100 為例,NVLink 組成架構.15 圖 22:NVIDIA NVSwitch 參數.15 圖 23:NVSwitch 拓撲圖(以 16 個 GPU 為例).16 圖 24:NVSwitch 芯片.16 圖 25:NVIDIA Mellanox 400G InfiniB
12、and 組成.16 圖 26:NVIDIA ConnectX-7 智能主通道配接器(HCA)示意圖.16 圖 27:NVIDIA Quantum-2 QM9700 Series 示意圖.17 圖 28:光模塊工作原理.17 圖 29:光模塊成本結構.17 圖 30:思科第一款 800G Nexus.18 圖 31:相關產業鏈.19 圖 32:2018 年 IDC 公布的服務器成本拆解.19 圖 33:中國 AI 芯片市場規模(億元).20 圖 34:2019/2020 年全球服務器應用場景.26 圖 35:2021 年我國服務器下游應用場景.26 圖 36:主要的 AI 服務器采購商 2019
13、-2022 年 Capex(億元).27 表 1:主流服務器類型(不完全統計).4 表 2:AI 服務器與普通服務器相比具有更好的技術優勢.5 表 3:AI 服務器的技術迭代核心在于硬件架構.5 表 4:AI 服務器未來發展方向.5 表 5:2018-2020 年模型升級帶來的參數量激增.6 表 6:訓練所需服務器測算.6 表 7:以 ChatGPT 產品測算所需算力.7 表 8:AI 服務器廠商.10 表 9:光芯片可分為激光器芯片和探測器芯片.18 表 10:主流 AI 芯片的對比.20 表 11:國內 AI 服務器所搭載的 GPU 廠商主要以英偉達為主.21 表 12:英偉達 A100
14、與 A800GPU 性能相差不大.21 表 13:國內生產供應服務器的 GPU 廠商.22 表 14:璧仞科技的 BR100、寒武紀的思元 370 與 NVIDIA A100 性能比較.23 表 15:Chiplet 實現量產的國內公司.23 表 16:PCB 領域的國內廠商.23 表 17:散熱模組領域的國內廠商.24 表 18:國內企業的存儲器產品.25 表 19:提供企業級 SSD 的企業.25 表 20:相關公司盈利預測與估值.27 行業行業報告報告|行業深度研究行業深度研究 請務必閱讀正文之后的信息披露和免責申明 4 1.人工智能服務器為算力支撐,助燃人工智能服務器為算力支撐,助燃
15、AI 產業化產業化 1.1.從通用服務器到從通用服務器到 AI 服務器的過渡服務器的過渡 AI 服務器服務器在眾多服務器中脫穎而出源于其架構優勢。在眾多服務器中脫穎而出源于其架構優勢。AI 服務器是承載智慧計算中 AI 計算的核心基礎設施,是一種能夠提供人工智能的數據服務器,既可以用于支持本地應用程序和網頁,也可以為云和本地服務器提供復雜的 AI 模型和服務,通過異構形式適應不同應用范圍以及提升服務器的數據處理能力,異構方式包括 CPU+GPU/TPU/ASIC/FPGA。圖圖 1:AI 服務器的服務器的 CPU+架構架構 資料來源:人工智能服務器技術研究王峰,天風證券研究所 AI 服務器的發
16、展脫胎自通用服務器服務器的發展脫胎自通用服務器的性能提升需求。的性能提升需求。復盤主流服務器的發展歷程,隨著數據量激增、數據場景復雜化,誕生了適用于不同場景的服務器類型:通用服務器、云計算服務器、邊緣計算服務器、AI 服務器。隨著大數據、云計算、人工智能及物聯網等網絡技術的普及,充斥在互聯網中的數據呈現幾何倍數的增長,使得以 CPU 為主要算力來源的傳統服務器承受著越來越大的壓力,并且對于目前 CPU 的制程工藝而言,單個 CPU 的核心數已經接近極限,但數據的增加卻還在繼續,因此服務器數據處理能力必須得到新的提升,在這種環境下,AI 服務器應運而生。面對 ChatGPT 所引出的大規模預訓練
17、模型,AI 服務器以其架構優勢帶來的大吞吐量特點,有望在一眾服務器中脫穎而出。表表 1:主流服務器類型主流服務器類型(不完全統計不完全統計)特點特點 配置配置 應用場景應用場景 通用服務器 物理服務器,獨立存在,擁有完全管理員權限和獨立 IP 地址,安全穩定性高。CPU、硬盤、內存等。云計算服務器 通過虛擬化技術,將一臺/多臺服務器虛擬化成一個可以切分的資源池,客戶按需靈活配置與擴展,管理便捷,費用相對低廉。按客戶需求配置 CPU、內存、數據盤等。適合對業務彈性擴展需求和易用性的需求:電商、IT行業、教育、移動應用、游戲等。邊緣計算服務器 承擔 70%以上的計算任務,需支持ARM/GPU/NP
18、U 等異構計算,針對不同業務場景開發,遠程控制運維。工業互聯網、車聯網、醫療保健、AR/VR、智慧城市等。AI 服務器 采用異構形式服務器,承擔大量計算;大規模并行運算、多重向量/張量運算、計算效率高。GPU/FPGA/ASIC 等加速芯片、CPU、內存等。融合深度學習、機器視覺、知識圖譜等人工智能技術的應用:醫療影像智能分析、人臉/語音/指紋識別、安防監控場景等。資料來源:人工智能與創新公眾號、皖云數科公眾號、物聯網世界官網、高升數據公眾號、機智云物聯網公眾號、天風證券研究所 1.2.AI 服務器與普通服務器相比有著明顯的性能優勢服務器與普通服務器相比有著明顯的性能優勢 行業行業報告報告|行
19、業深度研究行業深度研究 請務必閱讀正文之后的信息披露和免責申明 5 AI 服務器相較于傳統服務器算力上大幅躍升。服務器相較于傳統服務器算力上大幅躍升。AI 服務器利用 CPU+的架構模式,CPU 仍作為 CPU 的數據處理主要模塊,同時植入并行式計算加速部件,如 ASIC、FPGA、GPU 等,負責人工智能計算負載加速??偠灾?,在 CPU+架構下,AI 服務器的技術選型和部件配置針對不同的業務場景做相應的調整優化,通過合理的負載分擔實現計算能力的提升。表表 2:AI 服務器與普通服務器相比具有更好的技術優勢服務器與普通服務器相比具有更好的技術優勢 AI 服務器服務器 普通服務器普通服務器 卡
20、的數量 以加速卡為主導,基礎要求為四塊以上的 GPU 卡,甚至需要搭建外部服務器作為支持。以 CPU 為主導,單卡/雙卡 CPU。P2P 通訊 GPU 卡間需要大量的參數通信,模型越復雜,通信量越大:SXM3 協議下,P2P 帶寬高值 300GB/s;SXM2 協議下,P2P 帶寬高值 50GB/s;PCI3.0 協議下,P2P 帶寬高值 32GB/s。普通 GPU 服務器一般只要求單卡性能。特有設計 全面考慮對存儲、通信、網絡等相關領域的技術方案進行合理配置,使之與計算部件的計算能力相匹配,避免出現性能瓶頸。-專有技術 Purley 平臺更大內存帶寬;NVlink 提供更大的互聯帶寬;Ten
21、sorCore 提供更強的 AI 計算力。-資料來源:南京錕前官網,天風證券研究所 1.3.AI 服務器的進步源于芯片,未來將關注更多功能性服務器的進步源于芯片,未來將關注更多功能性 我們認為我們認為 AI 服務器的技術迭代取決于服務器的技術迭代取決于硬件中硬件中 AI 芯片的選擇芯片的選擇。傳統普通服務器數據處理核心單一,以 CPU 為主,AI 服務器則采取 CPU+的異構方式完成數據處理能力提升。參考英偉達 HGX 的產品迭代路徑,核心差異在于搭載的 GPU,HGX-1、HGX-2 和 HGX A100 分別對應 Tesla P100 GPU、Tesla V100 和 A100,在深度學習
22、和高性能計算領域都展現出更高的性能。因此,我們認為可以從 AI 芯片發展窺見 AI 服務器的技術迭代歷程,主要以CPU+GPU 為主的 AI 服務器,結合云服務趨勢發展至 CPU+GPU/ASIC/FPGA 的多功能+優性能+靈活性+高性價 AI 服務器。表表 3:AI 服務器的技術迭代核心在于硬件架構服務器的技術迭代核心在于硬件架構 階段性進展階段性進展 硬件架構發展路徑硬件架構發展路徑 匯聚主流 2010-2014 2010 年后隨著云計算、大數據為代表的新一代信息技術高速發展并逐漸開始普及,云端采用“CPU+GPU”混合計算模式,推動人工智能算法的演進和人工智能芯片的廣泛使用。百花齊放
23、2015-2020 隨著以深度學習為核心的人工智能技術得到全球范圍內的關注,業界對人工智能算力的要求越來越高。更多高性能的定制化芯片開始出現,部署不同場景的服務器中,2015 年 Google 推出基于 ASIC 架構的 TPU 用于云端訓練和推理,2017 年微軟發布基于 FPGA 芯片組建的 Project Brainwave 低時延深度學習系統,2018 年亞馬遜發布高性能推理芯片 AWS Inferentia 等。融合發展 2021-至今 上云需求+數據規模膨脹,云原生+人工智能服務器逐漸成為一種趨勢,既能夠應對人工智能計算密集型工作,也能兼顧高彈性、高敏捷和高性價比的優勢。資料來源:
24、人工智能芯片產業技術發展研究商惠敏,澎湃,驅動科技公眾號,Kyligence 公眾號,天風證券研究所 結合整個人工智能技術和服務的發展,未來人工智能服務器將重點發展軟硬件平臺融合、結合整個人工智能技術和服務的發展,未來人工智能服務器將重點發展軟硬件平臺融合、低功耗設計、低功耗設計、智能邊緣計算智能邊緣計算等領域。等領域。特別是隨著量子計算、類腦芯片等新一代人工智能計算加速技術的興起,人工智能服務器的設計與實現可能會產生顛覆性變化??傊?,人工智能服務器作為提供計算能力的核心要素,都是人工智能研發應用體系中不可或缺的組成部分,它的良性發展勢必會為整個人工智能產業的成長奠定堅實的基礎。表表 4:AI
25、 服務器未來發展方向服務器未來發展方向 行業行業報告報告|行業深度研究行業深度研究 請務必閱讀正文之后的信息披露和免責申明 6 發展趨勢發展趨勢 主要內容主要內容 軟硬件融合 通過更多考慮軟硬件協同,以系統應用為導向驅動芯片等硬件設計,讓用戶得到更好的體驗。低功耗發展 在節能減排要求下,重點探索液冷技術以實現更高的散熱效率和更少的電能使用。推理工作負載 伴隨企業人工智能應用成熟度逐步遞增,企業將人工智能訓練負載轉移到推理工作負載,這意味著人工智能模型將逐步進入廣泛投產模式。資料來源:半導體行業觀察公眾號,2022-2023 中國人工智能計算力發展評估報告IDC 與浪潮信息,天風證券研究所 2.
26、龐大算力需求是龐大算力需求是 AI 服務器未來放量的關鍵驅動力服務器未來放量的關鍵驅動力 2.1.AI 模型優化迭代引發算力缺口,未來推理功能將需更多算力模型優化迭代引發算力缺口,未來推理功能將需更多算力 計算力是人工智能計算力是人工智能研究研究的生產力。的生產力。在當今以深度學習為中心的人工智能發展中,AI 模型的進步主要依賴于模型的規?;瘮U展。在 AlexNet 網絡模型出現后,ResNet、Transformer、BERT 等優秀模型也在不斷涌現,尤其在圖像、語音、機器翻譯、自然語言處理等領域帶來了跨越式提升。AI 模型智能程度不斷發展的同時,AI 模型的數據量、結構的復雜程度也在不斷增
27、加,其帶來了模型的參數量增長,模型尺寸呈指數級增加。隨著模型尺寸不斷膨脹,實現高效 AI 模型訓練的重要支撐即更快的算力,即在短時間內完成大規模 AI 計算。表表 5:2018-2020 年模型升級帶來的參數量激增年模型升級帶來的參數量激增 時間時間 公司公司 模型模型 參數量(億)參數量(億)2018 Open AI GPT-1 1.5 2018 Google Bert-Large 3.4 2019 微軟 MT-DNN 3.3 2019 Open AI GPT-2 15.42 2019 阿里巴巴 PERSEUS-BERT 1.1 2019 NVIDIA Pmojert Megatron 83
28、 2019 Facebook RoBERTa 3.35 2019 Facebook XILM 6.65 2019 NVIDIA Megaltron-Scaled Version of OpenAI GPT-2 83 2020 微軟 NLG 172 2020 Open AI GPT-3 1750 資料來源:ittbank 公眾號,天風證券研究所 AI 訓練模型的需求或將釋放訓練模型的需求或將釋放 AI 服務器海量產能。服務器海量產能。根據 OpenAI 在 2020 年發表的論文,訓練階段算力需求與模型參數數量、訓練數據集規模等有關,且為兩者乘積的 6 倍:訓練階段算力需求=6模型參數數量訓練集
29、規模。GPT-3 模型參數約 1750 億個,預訓練數據量為 45 TB,折合成訓練集約為 3000 億 tokens。即訓練階段算力需求=61.75101131011=3.151023 FLOPS=3.15108 PFLOPS 依據谷歌論文,OpenAI 公司訓練 GPT-3 采用英偉達 V100 GPU,有效算力比率為 21.3%。GPT-3 的實際算力需求應為 1.48109 PFLOPS(17117 PFLOPS-day)。假設應用 A100 640GB 服務器進行訓練,該服務器 AI 算力性能為 5 PFLOPS,最大功率為6.5 kw,則我們測算訓練階段需要服務器數量=訓練階段算力
30、需求服務器 AI 算力性能=2.96108臺(同時工作 1 秒),即 3423 臺服務器工作 1 日。表表 6:訓練所需服務器測算訓練所需服務器測算 項目項目 值值 行業行業報告報告|行業深度研究行業深度研究 請務必閱讀正文之后的信息披露和免責申明 7 參數量 1750 億 預訓練數據量 45TB 算力需求 3.15*108 PFLOPS 有效算力比率 21.3%實際算力需求 1.48*109 PFLOPS A100 服務器算力性能 5 PFLOPS 工作 1 天所需服務器(臺)3423 資料來源:英偉達公司官網,天翼智庫微信公眾號,天風證券研究所 后期推理側算力需求將成為主力后期推理側算力需
31、求將成為主力。據 IDC 數據,2021 年中國人工智能服務器工作負載中,57.6%的負載用于推理,42.4%用于模型訓練,預計至 2026 年 AI 推理的負載比例將進一步提升至 62.2%。具體落到 ChatGPT 的算力需求場景中,可以將預訓練、Finetune 歸類為訓練,日常運營歸類為推理。ChatGPT 的更新迭代已展示出對算力的高需求:從訓練端來看,GPT1-3 經歷了從 1.5 億到 1750 億參數的增長過程,預計需要 3640PFlop/s-day;從推理端來看,據 SimilarWeb 數據,2023 年 1 月 ChatGPT 官網日訪問量突破千萬級別,1 月 31日達
32、到 2800 萬訪問量,以 3.4%的日增速度持續擴展,其中獨立訪客數量為 1570 萬。據CNBC,達到 1 億級別活躍用戶將產生成本約 4000 萬美元,則該 1570 萬用戶所耗費互動成本約為 628 萬美元,推算得相對算力處理量為 5714.8 PFlop/s-day,隨著新用戶不斷進入并多次訪問,該算力需求將不斷推高,是未來算力的重點需求端。表表 7:以以 ChatGPT 產品測算所需算力產品測算所需算力 應用場景應用場景 ChatGPT 具體應用具體應用 功能功能 算力要求(算力要求(PFlop/s-day)(以(以 GPT-3 模型為例)模型為例)訓練 預訓練 通過大量無標準的純
33、文本數據,訓練模型基礎語言能力,得到GPT-1/2/3 基礎大模型。3640 Finetune 在預訓練的大模型基礎上,進行監督學習、強化學習等,實現對模型參數量的優化調整。-推理 日常運營 基于用戶的輸入進行推理計算,并輸出反饋結果。5714.8 資料來源:2022-2023 中國人工智能計算力發展評估報告IDC 與浪潮信息,Similarweb,ittbank 公眾號,藍海大腦官網,天風證券研究所 國內大廠在國內大廠在 AI 元年堅定入局元年堅定入局+國內算力基建化,國內算力基建化,或將或將成為成為國內國內 AI 服務器服務器需求需求來源來源。在ChatGPT 帶動的浪潮中,國內大廠開始密
34、切發布類 ChatGPT 產品,3 月 16 日百度正式推出國內首款生成式 AI 產品“文心一言”、3 月 30 日騰訊推出“混元”AI 大模型、4 月 7 日阿里的“通義千語”開啟內測邀請,華為 4 月 8 日推出盤古大模型等。據 IDC 數據,2021年中國智能算力規模為 155.2 EFLOPS,隨著 AI 模型日益復雜、計算數據量快速增加、人工智能應用場景不斷深化,未來國內智能算力規模將持續增長,預計 2026 年智能算力規模將達 1271.4 EFLOPS,5 年 CAGR 達到 52.3%。對于國內人工智能算力需求的高增長,我國正牽頭東數西算、智能計算中心,通過算力基礎設施完成從點
35、到網的升級,據 IDC 觀點,中國市場的人工智能硬件支出占人工智能總支出的比例將在未來 5 年保持在 65%左右,其中服務器是硬件中的重要部分。我們認為,AI 服務器作為智能算力運算的主要載體,看好未來持續放量的高預期走勢。圖圖 2:中國智能算力規模中國智能算力規模 行業行業報告報告|行業深度研究行業深度研究 請務必閱讀正文之后的信息披露和免責申明 8 資料來源:2022-2023 中國人工智能計算力發展評估報告IDC 與浪潮信息,貴州省大數據發展管理局,天風證券研究所 2.2.AI 服務器作為承載算力主體將受益,成服務器市場的增長主力服務器作為承載算力主體將受益,成服務器市場的增長主力 AI
36、 服務器市場擴張表現亮眼,中國市場領跑全球。服務器市場擴張表現亮眼,中國市場領跑全球。根據 Statista 數據,2021 年全球服務器市場規模達到 831.7 億美元,同比增長 6.97%,其中 AI 服務器市場達到 156.3 億美元,同比增長 39.1%,在整體服務器市場中占比 18.79%,同比提升 4.34pct,這主要系隨著人工智力所需算力擴大,AI 服務器作為新型算力基礎設施的主體將直接影響 AI 創新迭代和產業落地,我們認為市場將需更多、更強算力的 AI 服務器作為核心解決方案,據 IDC 與浪潮信息,預計 AI 服務器市場將在 2026 年達到 347.1 億美元,5 年
37、CAGR 達到 17.3%。再看中國市場,2021 年國內服務器市場規模達到 250.9 億美元,同比增長 15.9%,高于全球增長速度;其中AI 服務器市場達到 59.2億美元,同比增長68.2%,在國內服務器市場中占比23.6%,這主要得益于國內人工智能應用的加速落地,浪潮信息、新華三、寧暢等廠商助推人工智能基礎設施產品的優化更新,IDC 調研顯示,超過 80%的中國廠商表示在未來將增加人工智能服務器的投資規模,預計在 2026 年中國 AI 服務器市場規模將達到 123.4 億美元,5年 CAGR 為 15.82%。圖圖 3:全球服務器市場規模及增速全球服務器市場規模及增速 圖圖 4:中
38、國服務器市場規模及增速中國服務器市場規模及增速 資料來源:Statista,天風證券研究所 資料來源:中商產業研究所公眾號,天風證券研究所 圖圖 5:全球全球 AI 服務器市場規模及增速服務器市場規模及增速 圖圖 6:中國中國 AI 服務器市場規模及增速服務器市場規模及增速 31.775155.2268427640.7922.81271.402004006008001000120014002019202020212022E 2023E 2024E 2025E 2026E中國智能算力規模(EFLOPS)行業行業報告報告|行業深度研究行業深度研究 請務必閱讀正文之后的信息披露和免責申明 9 資料來
39、源:量子位公眾號,2022-2023 中國人工智能計算力發展評估報告IDC 與浪潮信息,天風證券研究所 資料來源:量子位公眾號,2022-2023 中國人工智能計算力發展評估報告IDC與浪潮信息,天風證券研究所 全球服務器行業生產模式趨向白牌化,全球服務器行業生產模式趨向白牌化,ODM 廠商市占率集中。廠商市占率集中。服務器廠商可分為 ODM廠商和品牌廠商兩種類型。品牌服務器廠商以浪潮、華為、新華三為代表,ODM 廠商以超微、廣達為代表,根據品牌服務器廠商的委托完成硬件生產,加貼委托方商標并交付給品牌持有者進行銷售,近年不少客戶會繞過品牌商向 ODM 廠商直接訂購服務器成品,白牌服務器生產模式
40、的興起對傳統品牌服務器廠商造成一定沖擊。在下游業務業務+成本+時間的需求考慮下,Facebook 在 2011 年率先主導成立 OCP 聯盟,向內部成員統一硬件標準與硬件開源,成員中的白牌廠商開始獲得服務器設計方案,為白牌廠商繞過品牌廠商提供技術支持,這將進一步推高服務器白牌廠商的市占率。據重磅數據,ODM 市場份額從2014Q3 的 6.6%快速攀升至 2019Q3 的 26.4%,根據 2022 年全球服務器銷售量(848.7 億美元)與全球服務器代工市值(4557 億元)測算,2022 年出貨的服務器中 ODM 生產市占率或達 50%,我們認為這主要得益 CSP 客戶(如微軟、谷歌)的發
41、展,服務器需求隨著業務成長而持續增長,采購量不斷增加。根據 Digitimes Research,全球 ODM 廠商競爭格局集中度高,CR5 高達 94.4%,分別為鴻海(43%)、廣達(17%)、緯創(14%)、英業達(12.8%)和超微(7.6%),主要客戶涵蓋惠普、戴爾、聯想、亞馬遜、微軟、谷歌等國際巨頭。隨著超大型資料中心需求強勁+下游云計算領域 Capex 擴大,造就白牌廠商的強勁發展勢頭。圖圖 7:ODM 和品牌服務器廠商市占率和品牌服務器廠商市占率 圖圖 8:預計預計 2022 年年 ODM 廠商競爭格局廠商競爭格局 資料來源:重磅數據,天風證券研究所 資料來源:芯智訊,天風證券
42、研究所 國內服務器品牌廠商在國內服務器品牌廠商在 AI 服務器市場占優,未來有望放大優勢。服務器市場占優,未來有望放大優勢。從全球 AI 服務器市場格局來看,2021 年上半年數據顯示,中國廠商在 TOP5 廠商中占據過半席位(浪潮、聯想、華為),累計占比為 31.1%,其中浪潮信息以 20%的市占率占據榜首。從國內 AI 服務器市場競爭格局來看,市場集中度較高,浪潮信息占據近半市場,CR5 超過 80%。未來,隨著國產廠商在AI服務器的持續深耕,有望在既有市場優勢中吸收更大來自AI產業的發展機遇。對比全球/中國 AI 服務器競爭格局,我們認為國產服務器廠商在 AI 服務器市場優勢較為明顯,未
43、來有望利用既有市場優勢+推出具有競爭力的 AI 服務器進一步拓寬市場份額,吸收來自 AI 產業的發展機遇,有望以技術優勢打造盈利護城河,在國際市場上爭取更高話語權。圖圖 9:2021 年年 H1 全球全球 AI 服務器競爭格局服務器競爭格局 圖圖 10:2021 年年 H1 中國中國 AI 服務器競爭格局服務器競爭格局 行業行業報告報告|行業深度研究行業深度研究 請務必閱讀正文之后的信息披露和免責申明 10 資料來源:機器人技術與應用公眾號,天風證券研究所 資料來源:IDC 公眾號,天風證券研究所 圖圖 11:2021 年全球服務器競爭格局年全球服務器競爭格局 圖圖 12:2021 年中國服務
44、器競爭格局年中國服務器競爭格局 資料來源:智研咨詢公眾號,天風證券研究所 資料來源:智研咨詢公眾號,天風證券研究所 表表 8:AI 服務器廠商服務器廠商 公司公司 主要情況主要情況 浪潮信息 浪潮信息是全球領先的 IT 基礎設施產品、方案和服務提供商,通過場景優化設計形成了豐富的產品線,涵蓋計算型、存儲型、多節點、關鍵應用、整機柜等各類服務器,支持全場景高效計算。2022 年上半年,浪潮信息服務器出貨量保持全球第二,中國第一。工業富聯 工業富聯在云計算服務器出貨量持續全球第一,與全球主要服務器品牌商、國內外 CSP 客戶深化合作,推出新一代云計算基礎設施解決方案,包括模塊化服務器、高效運算 H
45、PC 等,重點解決因 ChatGPT 持續升溫而引發 AIGC 算力井噴需求。公司多年來為數家第一梯隊云服務商 AI 服務器(加速器)與 AI 存儲器供應商,產品已經開發至第四代。伴隨著 AI 硬件市場迅速成長,公司相關產品 2022 年出貨加倍,AI 服務器及 HPC 出貨增長迅速,在 2022 年云服務商產品中,占比增至約 20%,持續維持增長態勢。緯穎科技 緯穎科技專注于提供超大型數據中心及云端基礎構架各項產品及系統的解決方案,藉由傳承緯創資通豐富的創新設計技術,以及多年的制造經驗,緯穎科技的頂尖團隊為客戶提供巨型數據中心、運營商及企業的云計算解決方案,其中包括高性價比的服務器、儲存設備
46、、網絡系統、機房基礎設備及軟硬體整合的私有云解決方案。中興通訊 中興通訊服務器產品擁有該領域多項自主知識產權及專利,涵蓋機架服務器、刀片服務器和云計算節點服務器,滿足互聯網、高性能計算、數據庫、數據中心等多種場景需求,并配合中興通訊其它產品形成豐富的產品組合,滿足客戶的各種業務需要。服務于政府、金融、交通、教育、醫療、電信運營商和互聯網等多個行業。中科曙光 中科曙光以 IT 核心設備研發、生產制造為基礎,對外提供高端計算機、存情、安全數據中心等 ICT 基礎設施產品,大力發展云計算、大數據、人工智能、邊緣計算等先進計算業務,為用戶提供全方位的信息系統服務解決方案。主要產品為高端計算機、存儲產品
47、、軟件開發、系統集成、技術服務。超聚變 超聚變聚焦發展算力與生態,致力成為全球領先的算力基礎設施與服務提供者,憑借在多樣性算力、液冷技術等方面的優勢,成功入選 Gartner 全球服務器代表性廠商名錄。新華三 新華三集團作為數字化解決方案領導者,致力于成為客戶業務創新、數字化轉型值得信賴的合作伙伴。作為紫 行業行業報告報告|行業深度研究行業深度研究 請務必閱讀正文之后的信息披露和免責申明 11 光集團旗下的核心企業,新華三通過深度布局“云-網-算-存-端”全產業鏈,不斷提升數字化和智能化賦能水平。新華三擁有計算、存儲、網絡、5G、安全、終端等全方位的數字化基礎設施整體能力,提供云計算、大數據、
48、人工智能、工業互聯網、信息安全、智能聯接、邊緣計算等在內的一站式數字化解決方案,以及端到端的技術服務。同時,新華三也是 HPE服務器、存儲和技術服務的中國獨家提供商。寧暢 寧暢信息產業(北京)有限公司是集研發、生產、部署、運維一體的服務器廠商,及 IT 系統解決方案提供商,為全行業客戶提供基于 X86 架構通用機架、人工智能、多節點、邊緣計算及 JDM 全生命周期定制等多類型服務器及 IT 基礎設施產品。英業達 英業達自 1975 年成立以來,從早期制造計算機、電話機,而后制造筆記本電腦與服務器,奠定了公司扎實穩固的基礎。英業達企業電腦事業群(EBG)成立于 1998 年,專注服務器研發制造。
49、英業達數據中心解決方案傳承EBG,專注于提供超大型數據中心、運算密集行業包括互聯網及電信運營商最佳解決方案,領先研發制造能力深獲客戶信任。廣達 廣達電腦擁有完整及領先業界的數據中心產品線,提供各種數據中心所需的 IT 硬件設備,包括服務器、存儲設備及網絡交換機等,從產品研發、制造、整合到優化,為客戶提供最全面的一站式服務,以豐富經驗協助客戶解決下一代數據中心于設計及運營上的挑戰,并為云端服務運營商、電信運營商以及企業用戶建構公有云、混合云與私有云。拓維信息 拓維信息作為中國領先的軟硬一體化產品及解決方案提供商,依托自身 10 多年的行業云服務能力,基于自主研發的行業 PaaS 平臺,為政企客戶
50、提供 SaaS 化產品、云化解決方案、智能硬件、咨詢規劃、項目設計、運維服務、信息安全等一站式拓維云服務,目前業務已覆蓋全國近 20 個省市,覆蓋了政府、教育、通信、金融、制造、交通等十多個領域。中國長城 中國長城科技集團股份有限公司是中國電子信息產業集團有限公司旗下“安全、先進、綠色自主計算產業專業子集團”,是中國“PKS”自主計算體系建設主力軍和網信科技自主創新生力軍。中國長城持續聚焦自主計算產業、系統裝備核心主業。中國長城堅持“芯端一體,雙核驅動”的發展戰略,致力于構建以“芯-端”為核心的自主計算產品鏈,全面帶動“網-云-數-智”自主計算產業生態發展。自重組以來成功突破高端通用芯片(CP
51、U)、固件等關鍵核心技術,依托“PKS”自主計算體系,構建了從芯片、臺式機、筆記本、服務器、網絡交換設備到應用系統等具有完整自主知識產權的產品譜系,成功賦能黨政辦公及金融、能源、電信、交通等重點信息化領域的數字化轉型。寶德科技 寶德計算機系統股份有限公司是以服務器和 PC 整機的研發、生產、銷售及提供相關的綜合解決方案為主營業務的國家級高新技術企業和國家專精特新“小巨人”企業,致力于成為中國領先的計算產品方案提供商,為政府、互聯網、教育、金融、電力、交通、醫療、運營商、安平等行業客戶持續提供先進的算力產品、解決方案和全棧服務。多年來,憑借不斷創新的產品技術和獨特的軟硬件綜合實力,寶德計算勇奪信
52、創市場 NO.1,穩居 X86 服務器國內品牌 TOP5 和全球 TOP9、中國 AI 服務器 NO.3。資料來源:各公司官網、公告、東莞臺博會公眾號,ifind,wind,天風證券研究所 2.3.Nvidia 高速互聯助力高速互聯助力 AI 運算,多運算,多 GPU 通信成為關鍵技術通信成為關鍵技術 DGX POD 是是 NVIDIA 的的 AI 基礎架構,主要由運算、基礎架構,主要由運算、HCA(網絡適配器)、交換機組成。(網絡適配器)、交換機組成。1)運算 NVIDIA DGX Systems:主要使用 DGX A100 和 DGX H100 Systems;2)HCA:NVIDIA D
53、GX H100 系統配備了 NVIDIA ConnectX-7 HCA。NVIDIA DGX A100 系統配備 ConnectX-7或 ConnectX-6 HCA;3)交換器:在系統之間提供多條高帶寬、低延遲的路徑,DGX BasePOD配置可以配備四種類型的 NVIDIA 網絡交換機。配置需求以 GPT 模型為例,參數范圍從 10億到 1 萬億個,會有不同的配置需求;1736 億個參數預計需要 3264 顆 GPU,大約需要 4 到 8 個 DGX A100 POD,若達到 1450 億個參數預計需要 1536 顆 GPU,需要在 GPU集群上進行高效的大規模語言模型訓練,需要 10 到
54、 20 SUs 的 DGX A100 SuperPOD,其中每個 SU 由 20 個 DGX A100 系統組成。圖圖 13:GPT 模型參數對應模型參數對應 GPU 數量與數量與 DGX A100 POD 配置配置 行業行業報告報告|行業深度研究行業深度研究 請務必閱讀正文之后的信息披露和免責申明 12 資料來源:聯想凌拓公司官網,天風證券研究所 NVIDIA DGX Systems 實現服務器中所有實現服務器中所有 GPU 之間的高帶寬、任意連接。之間的高帶寬、任意連接。2016 年 Nvidia在 GPU 技術大會上推出全球首款深度學習超級計算機 NVIDIA DGX-1,實現了與硬件、
55、深度學習軟件和開發工具的全面集成,為深度學習提供每秒高于 21 萬億次浮點運算峰值性能的新型半精度指令技術。2017 年 NVIDIA NVSwitch 與 NVIDIA V100 Tensor Core GPU 和第二代 NVLink 一起推出。2020 年 NVIDIA A100 Tensor Core GPU 引入了第三代 NVLink 和第二代 NVSwitch,使每 CPU 帶寬和減少帶寬都增加了一倍。2022 年使用第四代 NVLink和第三代 NVSwitch,具有八個 NVIDIA H100 Tensor Core GPU 的系統具有 3.6 TB/s 的二等分帶寬和 450
56、GB/s 的縮減操作帶寬;與上一代相比,這兩個數字分別增加了 1.5 倍和 3 倍。此外,使用第四代 NVLink 和第三代 NVSwitch 以及外部 NVIDIA NVLink 交換機,現在可以實現 NVLink 速度跨多臺服務器進行多 GPU 通信。圖圖 14:NVIDIA DGX Systems 資料來源:英偉達公司官網,天風證券研究所 NVIDIA DGX A100 配置:配置:8 個 NVIDIA A100 GPU 搭載共 640 GB GPU 內存,每個 GPU 使用 12 個 NVLink,GPU 至 GPU 帶寬每秒 600 GB,6 個第二代 NVSwitch 雙向帶寬每秒
57、 4.8 TB比前一代高出 2 倍。10 個 NVIDIA ConnectX-7 每秒 200GB 網絡接口每秒 500 GB 的雙向帶寬峰值。圖圖 15:NVIDIA DGX A100 配置配置 行業行業報告報告|行業深度研究行業深度研究 請務必閱讀正文之后的信息披露和免責申明 13 資料來源:英偉達公司官網,天風證券研究所 NVIDIA DGX H100 配置:配置:8 個 NVIDIA H100 GPU,總 GPU 內存高達 640GB,每個 GPU 都擁有18個NVIDIA NVLink,提供每秒900GB的GPU至GPU雙向帶寬,4個NVIDIA NVSwitch,每秒 7.2TB
58、的 GPU 雙向帶寬,比前一代快 1.5 倍。8 個 NVIDIA ConnectX-7 和 2 個搭載每秒 400Gb 網絡適配器的 NVIDIA BLUEFIELD DPU。圖圖 16:NVIDIA DGX H100 配置配置 資料來源:gdep 官網,天風證券研究所 DGX H100 中中 8 個個 GPU+NVLink+NVSwitch 是關鍵的組成部分是關鍵的組成部分。DGX H100 擁有八個 H100張量核 GPU 和四個第三代 NV 交換機。每個 H100 GPU 都有多個第四代 NVLink 端口,并連接到所有四個 NVLink 交換機。每個 NVSwitch 都是一個完全無
59、阻塞的交換機,完全連接所有八個 H100 Tensor Core GPU。圖圖 17:NVIDIA DGX H100(H100、NVLink、NVSwitch 配套)配套)資料來源:英偉達公司官網,天風證券研究所 DGX H100 可以支持可以支持 256 個個 GPU 連接,并提供連接,并提供 57.6TB 的帶寬的帶寬。將新的 NVLINK Network技術與新的第三代 NVSwitch 結合,而每一個 GPU 節點都會公開節點中 GPU 之所有 NVLink帶寬的 2:1 錐形層級。節點是通過 NVLink Switch 模塊中包含的第二層 NVSwitch 連接在一 行業行業報告報告
60、|行業深度研究行業深度研究 請務必閱讀正文之后的信息披露和免責申明 14 起,這些模塊常駐于運算節點外部,并將多個節點連接在一起。DGX H100 SuperPod 可以橫跨多達 256 個 GPU,連接之節點可以提供 57.6 TB 的全部對全部帶寬,使用以第三代NVSwitch 技術為基礎的新型 NVLink Switch,通過 NVLink Switch System 完全連接。圖圖 18:DGX A100 與與 DGX H100 32 節點節點 256 GPU NVIDIA SuperPOD 架構比較架構比較 資料來源:英偉達公司官網,天風證券研究所 NVLink相較于相較于PCIe能
61、提供更大的帶寬。能提供更大的帶寬。以第二代Volta NVLink為例,通道帶寬為300GB/s,PCIe 3.0帶寬為 16GB/s;以第四代 NVLink為例,每個通道的帶寬為 100 Gbps,是PCIe Gen 5 的 32 Gbps 帶寬的三倍多;此外通過組合多個 NVLink 以提供更高的聚合通道數,從而產生更高的吞吐量。第四代 NVLink 技術為多 GPU 系統配置提供 1.5 倍帶寬,并改善可擴充性。單個 NVIDIA H100 Tensor 核心 GPU 最高可支持 18 個 NVLink 聯機,總帶寬可達每秒900 GB(GB/秒),將近是第 5 代 PCIe 帶寬的 7
62、 倍。圖圖 19:PCIe 與與 NVLink 架構比較架構比較 資料來源:IBM Redbooks 官網,天風證券研究所 NVLink 高速通信不斷迭代,第四代高速通信不斷迭代,第四代相較于相較于第三代帶寬提升第三代帶寬提升 0.5 倍。倍。為了將訓練時間從數個月壓縮至數天,需要在服務器集群中的每一個 GPU 之間進行高速無縫通訊。而 PCIe 因帶寬有限而造成瓶頸,因此需要更快速、更具擴充性的 NVLink 互連。NVIDIA A100 Tensor核心 GPU 采用的第三代 NVLink(包含 12 個第三代 NVLink 鏈路,提供每秒 600 GB 的總帶寬),H100 GPU 采用
63、新的第四代 NVLink(H100 包含 18 個第四代 NVLink 鏈路,提供每秒 900 GB 的總帶寬),H100 GPU 相較于 A100 提供 1.5 倍的通訊帶寬。圖圖 20:NVIDIA NVLink 迭代規格迭代規格 行業行業報告報告|行業深度研究行業深度研究 請務必閱讀正文之后的信息披露和免責申明 15 資料來源:英偉達公司官網,天風證券研究所 NVLink 由物理層(由物理層(PHY)、數據連接層()、數據連接層(DL)以及交易層()以及交易層(TL)組成組成。1)物理層 PL 與PHY,負責跨所有八個信道并確保原始的數據可在各種物理媒體上傳輸;2)DL 數據連接層為位于
64、物理層與網絡層之間,在兩個網絡實體之間提供數據鏈路連接的建立、維持和釋放管理;3)TL 交易層請求和響應信息形成的基礎。圖圖 21:以以 P100 為例,為例,NVLink 組成架構組成架構 資料來源:英偉達公司官網,天風證券研究所 NVSwitch 是是 NVLink 交換系統的關鍵,交換系統的關鍵,實現實現 GPU 高速高速跨節點連接跨節點連接。新的第三代 NVSwitch技術包含常駐于節點內部和外部的交換器,可以在服務器、叢集和數據中心環境中連接多個 GPU。節點內部每一個新的第三代 NVSwitch 皆提供 64 個第四代 NVLink 鏈路端口,以加快多 GPU 聯機能力。第三代 N
65、VSwitch 是 NVLink 交換機系統的關鍵,以 NVLink 速度實現 GPU 跨節點的連接。圖圖 22:NVIDIA NVSwitch 參數參數 資料來源:英偉達公司官網,天風證券研究所 NVSwitch 為定制工藝構建,并行運行增加互聯傳輸效率為定制工藝構建,并行運行增加互聯傳輸效率。NVSwitch 芯片并行運行,以支持數量日益增加的 GPU 之間的互連,核心邏輯是讓端口邏輯模塊中的數據包轉換,進出多 行業行業報告報告|行業深度研究行業深度研究 請務必閱讀正文之后的信息披露和免責申明 16 GPU 的流量看似是通過單一 GPU。隨著 NVLink 交換機系統提供的帶寬是 Infi
66、niBand 的 4.5倍,大規模模型培訓變得更加實用;例如,當使用 14 TB 嵌入表訓練推薦引擎時,與使用InfiniBand 的 H100 相比,預計使用 NVLink 交換系統的 H100 在性能上會有顯著提升。第三代 NVSwitch 它使用為 Nvidia 定制的 TSMC 4N 工藝構建,該芯片包含 251 億個晶體管,比NVIDIA V100 Tensor Core GPU的晶體管多,面積為294平方毫米封裝尺寸為50 mm x 50 mm,共有 2645 個焊球。圖圖 23:NVSwitch 拓撲圖拓撲圖(以(以 16 個個 GPU 為例)為例)圖圖 24:NVSwitch
67、芯片芯片 資料來源:英偉達公司官網,天風證券研究所 資料來源:英偉達公司官網,天風證券研究所 NVIDIA Quantum InfiniBand 提供高效能運算網絡解決方案。提供高效能運算網絡解決方案。InfiniBand 和以太網持續競爭網路通信世界的主導地位。作為被最廣泛使用的網路通訊協議,以太網擁有優秀的性價比以及和多數裝置兼容的優勢。然而,現今網路早已發展成一個更為龐大復雜的系統,大量的數據運算需求讓人們開始關注 InfiniBand 架構的優勢。InfiniBand 主機信道適配卡(HCA)提供了超低延遲、極高傳輸量和創新的 NVIDIA 網絡內運算引擎,以提供現代工作負載所需的加速
68、、可擴充性和功能豐富的技術。2020 年 Nvidia 于 SC20 大會上,宣布推出 NVIDIA Mellanox 400G InfiniBand,這是全球首個 400Gb/s 網速的端到端網絡解決方案,可為全球的人工智能(AI)和高效能運算用戶提供最快的網絡互連效能,同時成功將運算、可程序化和軟件定義三種技術結合,成為業界領先的軟件定義、硬件加速的可程序設計網絡。圖圖 25:NVIDIA Mellanox 400G InfiniBand 組成組成 資料來源:英偉達公司官網,天風證券研究所 NVIDIA ConnectX InfiniBand 智能適配卡可運用更快的速度和創新的網絡內運算智
69、能適配卡可運用更快的速度和創新的網絡內運算。NVIDIA ConnectX 能降低營運成本,提升投資報酬率,實現高效能運算、機器學習、進階儲存空間、叢集數據庫、低延遲嵌入式 I/O 應用程序等強大功能。ConnectX-7 智能主通道配接器(HCA)采用 NVIDIA Quantum-2 InfiniBand 架構,可提供每秒 400GB 的吞吐量;ConnectX-6 HDR 智能主通道配接器(HCA)采用 NVIDIA Quantum InfiniBand 架構,可提供每秒 200GB 的吞吐量。圖圖 26:NVIDIA ConnectX-7 智能主通道配接器智能主通道配接器(HCA)示意
70、圖示意圖 行業行業報告報告|行業深度研究行業深度研究 請務必閱讀正文之后的信息披露和免責申明 17 資料來源:深博公司官網,天風證券研究所 NVIDIA Quantum InfiniBand 交換器,提供龐大吞吐量、網絡內運算的架構。交換器,提供龐大吞吐量、網絡內運算的架構。QM8700 InfiniBand 系列,具備高達每秒 16Tb 的無阻塞帶寬,提供多達 40 埠、每埠每秒 200Gb 的完整雙向帶寬。QM9700 InfiniBand 系列,擁有 64 個 400Gbps 端口或 128 個 200Gbps 端口,能以多種切換器系統的設置供貨,在 400Gbps 下最高搭載 2,04
71、8 個端口,或于 200Gbps下最高搭載 4,096 個端口。圖圖 27:NVIDIA Quantum-2 QM9700 Series 示意圖示意圖 資料來源:Nvidia,天風證券研究所 光模塊是實現光信號傳輸過程中光電轉換和電光轉換功能的光電子器件。光模塊是實現光信號傳輸過程中光電轉換和電光轉換功能的光電子器件。光模塊工作在OSI 模型的物理層,是光纖通信系統中的核心器件之一。它主要由光電子器件(光發射器、光接收器)、功能電路和光接口等部分組成,主要作用就是實現光纖通信中的光電轉換和電光轉換功能。光模塊工作原理圖所示,發送接口輸入一定碼率的電信號,經過內部的驅動芯片處理后由驅動半導體激光
72、器(LD)或者發光二極管(LED)發射出相應速率的調制光信號,通過光纖傳輸后,接收接口再把光信號由光探測二極管轉換成電信號,并經過前置放大器后輸出相應碼率的電信號。圖圖 28:光模塊工作原理光模塊工作原理 資料來源:Huawei,天風證券研究所 光模塊中光芯片成本占比約光模塊中光芯片成本占比約 18%。光器件可分為有源、無源,其中光無源器件不需要外加能源驅動工作,是光傳輸系統的關節,光有源器件是光通信系統中將電信號轉換成光信號或將光信號轉換成電信號的關鍵器件。根據華經產業研究院數據,光模塊成本中,光器件占 73%、外殼占 4%、印刷電路板占 5%、光芯片占 18%。圖圖 29:光模塊成本結構光
73、模塊成本結構 行業行業報告報告|行業深度研究行業深度研究 請務必閱讀正文之后的信息披露和免責申明 18 資料來源:華經產業研究院公眾號,天風證券研究所 光芯片按功能可以分為激光器芯片和探測器芯片。光芯片按功能可以分為激光器芯片和探測器芯片。光芯片采用光波(電磁波)來作為信息傳輸或數據運算的載體,一般依托于集成光學或硅基光電子學中介質光波導來傳輸導模光信號,將光信號和電信號的調制、傳輸、解調等集成在同一塊襯底或芯片上。按功能可以分為:1)激光器芯片(發射信號),主要將電信號轉化為光信號,按出光結構可進一步分為面發射芯片和邊發射芯片,面發射芯片包括 VCSEL 芯片,邊發射芯片包括 FP、DFB
74、和EML 芯片;2)探測器芯片(接收信號),主要將光信號轉化為電信號,主要有 PIN 和 APD兩類。表表 9:光芯片可分為激光器芯片和探測器芯片:光芯片可分為激光器芯片和探測器芯片 種類 產品類別 工作波長 應用場景 激光器芯片 VCSEL 800-900nm 500 米以內短距離傳輸 FP 1310-1550nm 中低速無線接入短距離市場 DFE 1270-1610nm 中長距離傳輸 EML 1270-1610nm 長距離傳輸 探測器芯片 PIN 830-860/1100-1600nm 中長距離傳輸 APD 1270-1610nm 長距離單模光纖 資料來源:源杰科技招股書、中商產業研究院公
75、眾號,天風證券研究所 800G 交換機陸續發布,下一代超寬互聯蓄勢待發。交換機陸續發布,下一代超寬互聯蓄勢待發。2022 年 10 月思科在 OCP 全球峰會上發布了兩款新的 800G 交換機系列及新的光模塊,以支持超級數據中心運營商和電信運營商對更大的交換容量、靈活性和提升功效的要求。2023 年 1 月 Juniper 宣布在線媒體連接的 Virgin Media O2 成功使用 Juniper 網絡升級了其 IP 核心骨干網絡,Virgin Media O2 通過 Juniper 網絡 PTX10008(PTX10008 路由器支持 400G,未來還可以通過硅創新和機箱中易于交換的線卡升
76、級到 800G)分組傳輸路由器成功地將其在英國的六個骨干站點的所有核心流量遷移。2023 年 4 月新華三重磅發布 S12500G-EF 新一代綠色智能交換機,支持超寬 400G,未來可無縫升級 800G,為下一代超寬互聯就緒。圖圖 30:思科第一款思科第一款 800G Nexus 73%4%5%18%光器件外殼印刷電路板光芯片 行業行業報告報告|行業深度研究行業深度研究 請務必閱讀正文之后的信息披露和免責申明 19 資料來源:思科、SDN LAB,天風證券研究所 3.AI 服務器放量預期利好上游核心部件,挑戰機遇共存服務器放量預期利好上游核心部件,挑戰機遇共存 各環節國產發展程度不一,機遇與
77、挑戰并存各環節國產發展程度不一,機遇與挑戰并存。我們認為,在算力和數字時代的背景下,AI服務器作為算力載體為數字經濟提供發展動力,更加彰顯其重要性??v觀 AI 服務器的全景產業鏈,我們認為當下可以把握的機遇有 AI 服務器上游中部分電子元件環節(PCB/存儲器),制約 AI 服務器發展的瓶頸主要在上游的 GPU 環節,未來有望突破的轉折為 Chiplet工藝。圖圖 31:相關產業鏈相關產業鏈 資料來源:富果研究部,中商產業研究院公眾號,威爾克通信實驗室公眾號,果殼硬科技公眾號,Wind,各公司公告等,天風證券研究所 3.1.危機四伏:危機四伏:上游供應危機尚未解除上游供應危機尚未解除,國產替代
78、必需提上日程,國產替代必需提上日程 拆解服務器的成本,芯片成本與性能高低成正比。拆解服務器的成本,芯片成本與性能高低成正比。據 IDC 2018 年關于服務器成本機構數據,芯片成本在基礎性服務器中約占總成本的 32%,該比重隨著性能和運算能力的要求而逐步攀升,在高性能或具有更強運算能力的服務器中,芯片相關成本可以高達 80%。圖圖 32:2018 年年 IDC 公布的服務器成本拆解公布的服務器成本拆解 行業行業報告報告|行業深度研究行業深度研究 請務必閱讀正文之后的信息披露和免責申明 20 資料來源:IDC,智研咨詢,天風證券研究所 AI 產業化落地將推動人工智能芯片快速放量。產業化落地將推動
79、人工智能芯片快速放量。由于 CPU 并不適合 AI 服務器中的大規模并行計算,因此在 AI 服務器中,主要是用 GPU、FPGA、ASIC 等計算芯片補齊 CPU 中人工智能負載處理的短板。在國家政策支持+資本推動+產業鏈和應用場景持續完善擴張的驅動下,中國 AI 芯片需求有望持續上漲。據艾瑞咨詢數據,2021 年中國 AI 芯片市場規模將達到 297 億元,未來在人工智能、云計算、數據中心、邊緣計算等領域的廣泛應用,中國市場規模預計到 2025 年達到 1385 億元,2021-2025 年 CAGR 預計達到 47%。圖圖 33:中國中國 AI 芯片市場規模(億元)芯片市場規模(億元)資料
80、來源:艾瑞咨詢公眾號,天風證券研究所 人工智能芯片搭載率將持續增高,人工智能芯片搭載率將持續增高,GPU 仍為主流方案。仍為主流方案。據 IDC 調研顯示,當前每臺人工智能服務器上配備 2 個 GPU、3 個 FPGA 或 3 個 ASIC 的比例最高,未來 18 個月,比例最高的服務器有望配備 4 個 GPU、7 個 FPGA 或 5 個 ASIC,普遍搭載率均呈上升趨勢。再看中國市場,目前在國內市場主要是用以GPU為主實現數據中心計算加速,市場占有率近90%,這主要是因為 GPU 可以較好支持高度并行的工作負載。ASIC、FPGA、NPU 等非 GPU 芯片市場占有率超過 10%,得益于近
81、年智慧城市建設、無人駕駛載具、智慧醫療系統構建、智能家居等成為熱門領域,應用于該類領域的非 GPU 芯片也得到發展。我們認為,未來面對需求的多元增長,AI 芯片將呈現百花齊放的發展空間。表表 10:主流主流 AI 芯片的對比芯片的對比 AI 芯片分類芯片分類 功能功能 優勢優勢 缺點缺點 競爭格局競爭格局 GPU 主要用于處理圖形、圖像領域的海量數據運算,適用于高級復雜算法和通用性人工更強大的浮點運算能力和更快的并行計算速度;通用型更強 性能功耗比較低 寡頭壟斷:技術壁壘極高,硬件結構精密復雜,圖形算法規模龐大、軟件生態相對126197297441647946138556.35%50.76%4
82、8.48%46.71%46.21%46.41%0.00%10.00%20.00%30.00%40.00%50.00%60.00%050010001500201920202021E2022E2023E2024E2025E中國AI芯片市場規模(億元)yoy 行業行業報告報告|行業深度研究行業深度研究 請務必閱讀正文之后的信息披露和免責申明 21 智能平臺;封閉。海外廠商:英偉達、AMD、Intel 等;FPGA 現場可編程門陣列,使用者可以根據不同的應用需求,使用硬件描述語言對 FPGA芯片上集成的基本門電路和存儲器進行重新定義,適用于芯片功能尚未定型、算法仍需不斷完善的情況下使用。靈活性更強,速
83、度快、功耗低、可編程性強。對使用者技術水平要求較高。價格高。整體運算能力不高。寡頭壟斷:目前國內 FPGA 芯片集中在 40mm、55mm 工藝水平,與國外的工藝仍存在一定的差距。國外廠商:英特爾、賽靈思等,國內廠商:復旦微電、紫光國微等;ASIC 是一種根據特殊應用場景要求進行全定制化的專用人工智能芯片 功耗低、可擴展性強,算存一體 電路需要定制,開發周期長,難以擴展,風險高 目前處于技術發展初期,市場競爭格局分散,我國生產水平與世界領先水平差距較小。海外:谷歌、英特爾等,國內:寒武紀等;資料來源:商惠敏人工智能芯片產業技術發展研究,劉晨我國人工智能產業競爭力分析與建議,天風證券研究所 GP
84、U海外寡頭壟斷格局海外寡頭壟斷格局+禁運風險或為國產禁運風險或為國產 AI服務器的主要瓶頸。服務器的主要瓶頸。GPU主要分為獨立GPU和集成 GPU,前者用于 AI 服務器、高性能電腦中,后者則主要用于移動端設備。目前 Nvidia和 AMD 壟斷獨立 GPU 市場,其中 Nvidia 優勢更為明顯,2021Q1 市占率達到 83%。同時,據電子發燒網,Nvidia的GPU芯片是AI大模型的關鍵,在大模型訓練市場的市占比近100%,而 GPT-3.5 大模型需要高達 2 萬枚 GPU,未來商業化后或將超過 3 萬枚。同時國內如浪潮、寧暢等國內品牌廠商的 AI 服務器中同樣配置 Nvidia 的
85、芯片。受到中美脫鉤的持續影響,部分供應 AI 服務器的 GPU 成為限制出口的產品,直接影響國內 AI 服務器的出貨量。根據美國商務部工業與安全局宣布的針對中國出口先進芯片的管制新規聲明,凡輸入/輸出(I/O)雙向傳輸速度高于 600GB/s,同時每次操作的比特長度乘以 TOPS 計算出的處理性能大于或等于 4800 的產品,將無法出口至中國,英偉達的 A100 即屬于限制范圍之內。從AI 芯片行業投融資來看,目前國內 AI 芯片產業熱度持續高漲,根據 IT 桔子的數據,2022年中國 AI 芯片行業投融資額達到 179.5 億元,資本的持續進入有望加速國內 GPU 國產化進程,逐步切入 AI
86、 服務器的供應鏈中。表表 11:國內國內 AI 服務器所搭載的服務器所搭載的 GPU 廠商主要以英偉達為主廠商主要以英偉達為主 品牌廠商品牌廠商 型號型號 GPU 浪潮信息 NF5688M6 8 個 NVIDIA 最新的 NVSwitch 全互聯500W Ampere 架構 GPU 寧暢 X660 G45 LP 8 個 NVIDIA 的 A800 拓維信息 兆瀚 AI 推理服務器 8 張 Atlas300I(國產芯片)寶德科技 PR4910W 8 個 NVIDIA A800/10 個 NVIDIA 的A40/30 資料來源:各公司官網,華為計算公眾號,天風證券研究所 表表 12:英偉達英偉達
87、A100 與與 A800GPU 性能相差不大性能相差不大 性能性能 A100 A800 數據傳輸速率 600GB/s 400GB/s 顯存帶寬(最高)2TB/s 2TB/s 顯存容量(最高)80GB 80GB FP64 9.7TFLOPS 9.7TFLOPS 行業行業報告報告|行業深度研究行業深度研究 請務必閱讀正文之后的信息披露和免責申明 22 FP32 19.5TFLOPS 19.5TFLOPS Tensor Float 32(TF32)156TFLOPS/312 TFLOPS 156TFLOPS/312 TFLOPS 資料來源:英偉達公司官網,51CTO,新智元,天風證券研究所 國內廠商
88、正在陸續推出國內廠商正在陸續推出 GPU 產品進行市場檢驗,國產替代提上日程。產品進行市場檢驗,國產替代提上日程。伴隨資本和政策的持續加碼,一批國內 GPU 廠商逐漸嶄露頭角(見下表)。然而,我們仍需看到在芯片設計制造領域,我國仍缺乏設計軟件、先進制程及設備與世界領先水平之間仍有差距,該領域部分產品及裝備仍十分依賴進口,國產 GPU 之路仍是路漫漫其修遠兮。表表 13:國內生產供應服務器的國內生產供應服務器的 GPU 廠商廠商 公司公司 進展進展 性能性能 景嘉微(300474.SZ)第三代 GPU 芯片 JM9 系列的兩款產品分別于 2021 年 11月 16 日和 2022 年 6 月 2
89、8 日完成階段性測試工作 用于地理信息系統、媒體處理、CAD 輔助設計、游戲、虛擬化等高性能顯示和人工智能計算領域。龍芯中科(688047.SH)2022 年推出 16 核芯片產品 3C5000,32 核 3D5000 研制成功 主要用于存儲服務器,取得石油、石化等客戶的突破;海光信息(688041.SH)海光深算一號 DCU 實現商業化應用,深算二號正在研發中 廣泛用于大數據處理、人工智能、商業計算等計算密集類應用領域,主要部署在服務器集群或數據中心,為應用程序提供高性能、高能效比的算力,支撐高復雜度和高吞吐量的數據處理任務。芯原股份(688521.SH)推出 Vivante3DGPGPUI
90、P 提供從低功耗嵌入式設備到高性能服務器的計算能力,滿足廣泛的AI 計算需求。天數智芯 2021 年 3 月發布了首款通用 GPU 訓練芯片天垓 100 廣泛支持傳統機器學習、數學運算、加解密及數字信號處理等領域;2022 年 12 月發布通用 GPU 智鎧 100 支持國內外主流深度學習框架,擁有豐富編程接口拓展和高性能函數庫,廣泛適用于智慧城市、智慧港口、智慧交通等眾多領域。璧仞科技 2022 年 9 月發布首款通用 GPU 芯片 BR100 算力創下全球記錄,率先采用Chiplet 技術。資料來源:Wind,電子發燒網公眾號,天天 IC 公眾號,天數智芯公眾號,天風證券研究所 3.2.柳
91、暗花明:以柳暗花明:以 Chiplet 工藝打開我國對算力的想象空間工藝打開我國對算力的想象空間 Chiplet 有望成為我國先進制程及算力受限的困境的突破口。有望成為我國先進制程及算力受限的困境的突破口。在 AI 時代浪潮的裹挾下,以ChatGPT 為代表的是大數據+大模型+大算力的產物,每一代 GPT 模型的參數量高速增長,隨著科技頭部企業類 ChatGPT 項目入局,整體在算力提升、數據存儲及數據傳輸端需求迭起。我們認為采用 Chiplet,即將模塊化設計引入半導體制造和制造,協同計算助力 HPC芯片算力突破及性能提升,從而滿足大型模型的訓練需求。國外廠商 AMD 于 2021 年 6
92、月發布基于臺積電 3D Chiplet 封裝技術的第三代服務器處理芯片,國內華為于 2019 年推出基于 Chiplet 技術的 7nm 鯤鵬 920 處理器,實現多核高并發和資源調度優化,計算性能提高 20%。在美國對我國半導體產業持續封鎖的狀態下,國產算力和先進制程瓶頸有望在Chiplet 助力下實現突破,甚至在該領域實現彎道超車,如璧仞科技和寒武紀推出采用Chiplet 工藝的芯片(見下表),在部分性能上可以達到甚至超越英偉達供應 AI 服務器的A100。國內這一領域的優勢一方面是由于 Chiplet 開發模式將芯片工藝轉向系統集成,因而能夠以我國在應用創新的優勢換取光刻機受限的緩沖期;
93、另一方面則是 Chiplet 的核心為“先進封裝”技術,國內 Chiplet 封裝產業技術積累深厚,國際競爭力強,如長電科技、行業行業報告報告|行業深度研究行業深度研究 請務必閱讀正文之后的信息披露和免責申明 23 通富微電和華天科技具備 Chiplet 量產能力,并據 ittbank 數據,長電科技、通富微電和華天科技均位列 2021 年全球營收前十的封測廠商排名中。表表 14:璧仞科技的璧仞科技的 BR100、寒武紀的思元、寒武紀的思元 370 與與 NVIDIA A100 性能比較性能比較 性能比較性能比較 璧仞璧仞 BR100(2022 年)年)思元思元 370-X8(2021 年)年
94、)NVIDIA A100(2020 年)年)晶體管數量 770 億顆 390 億顆 542 億顆 芯片面積 1074mm2-828 mm2 工藝節點 臺積電 7nm 7nm 臺積電 7nm 顯存容量 64GB HBM2E 48GB 80GB HBM2E 峰值算力 2048TOPS(INT8)256TOPS(INT8)624TOPS(INT8)最大熱設計功耗 TDP 550W 250W 400W 資料來源:芯東西公眾號,寒武紀官網,寒武紀公司公告,天風證券研究所 Chiplet 或將帶來全產業鏈投資機遇?;驅砣a業鏈投資機遇。Chiplet 工藝有望突破國產芯片的算力瓶頸,成為半導體發展核心
95、,2022 年 12 月中國工信部中國電子工業標準化技術協會審定并發布了小芯片接口總線技術要求,中國迎來了首個原生 Chiplet 小芯片標準。該推廣將推動本土半導體芯片這一領域的發展。表表 15:Chiplet 實現量產的國內公司實現量產的國內公司 功能功能 企業企業 主要工藝主要工藝 封測 長電科技 采用通過 Chiplet 異構集成技術完成的 XDFOI TM Chiplet 高密度多維異構集成系列工藝,已按計劃進入量產計劃。通富微電 公司在多芯片組件、集成輸出封裝、2.5/3D 等先進封裝技術方面均提前布局,為客戶提供多樣化的 Chiplet 封裝解決方案,并且已經開始大規模生產 Ch
96、iplet 產品。華天科技 公司開發了3D FO SiP封裝技術,完成用于高性能計算的大尺寸HFCBGA產品,公司已量產Chiplet產品,主要應用于 5G 通信、醫療等領域。資料來源:各公司官網、公告,天風證券研究所 3.3.適逢其會:為上游部分元件打開增量空間適逢其會:為上游部分元件打開增量空間 3.3.1.AI 服務器或將打開服務器或將打開 PCB 增量市場增量市場 AI 服務器價值量提升為服務器價值量提升為 PCB 市場帶來發展空間市場帶來發展空間。PCB 主要參與服務器內部的主板、電源背板、硬盤背板、網卡、Riser 卡等,隨著服務器對運算及傳輸速率的要求不斷提升,對PCB 提出更嚴
97、苛的電性能要求,同時也給對應的 PCB 市場帶來良好機會。從 PCB 價值量來看,傳統通用服務器 PCB 以 8-10 層 M6 板為主,價值量約為 3400 元。AI 服務器分為訓練服務器和推理服務器。訓練服務器 PCB 以 18-20 層 M8 板為主,價值量約 10350 元。推理服務器 PCB 以 14-16 層 M6 為主,價值量約為 7140 元??傮w來看,AI 服務器 PCB 價值量約為普通服務器 PCB 的 2-3 倍。從 PCB 下游市場來看,根據 Prismark 數據,2021 年全球服務器用 PCB 的產值為 78.04 億美元,預計 2026 年產值達到 124.94
98、 億美元,5 年 CAGR為 9.9%,增速快于其他 PCB 品類。服務器行業發展空間廣闊+消費電子/PC 領域呈現疲態,眾多 PCB 企業在積極布局服務器用 PCB 領域。表表 16:PCB 領域的國內廠商領域的國內廠商 企業企業 服務器用服務器用 PCB 產品情況產品情況 鵬鼎控股 PCB 行業的龍頭企業,對于 AI 服務器對主板的高要求,公司表示已做好應對市場放量的準備。深南電路 從事高中端印刷電路板的設計、研發及制造等相關工作,正重點布局數據中心(含服務器)領域。生益電子 專注于各類印刷電路板的研發、生產與銷售業務。公司印制電路板產品定位于中高端應用市場,服務器是其應用領域之一。廣合科
99、技 2020-2022 年服務器領域 PCB 營收占比超過 60%,公司產品應用于 Intel 發布的 Purley、Whitley 及 Eagle Stream 各世代芯片平臺的服務器,正與客戶針對下一代芯片平臺開展研究。公司在 AMD 發布的各世代芯片平臺也有對應的 PCB 產品向服務器廠商供應,在 ARM 架構芯片平臺也有供貨和儲備。行業行業報告報告|行業深度研究行業深度研究 請務必閱讀正文之后的信息披露和免責申明 24 勝宏科技 應用于 Eagle Stream 級服務器領域的產品實現規?;慨a;基于 AI 服務器的加速模塊的高階 HDI 及高多層產品,已實現 4 階 HDI 及高多層
100、的產品化,6 階 HDI 產品已在加速布局中。滬電股份 2021 年次世代服務器平臺印制電路板已進入客戶樣品打樣階段,已具備新一代服務器平臺用 PCB 的批量生產能力。資料來源:各公司公告、各公司與投資者會議紀要、天風證券研究所 3.3.2.高算力使服務器芯片散熱成為難題,散熱模組高算力使服務器芯片散熱成為難題,散熱模組應應需求提高散熱效率需求提高散熱效率 服務器的高功率服務器的高功率或將引導或將引導散熱模組散熱模組轉型,開拓液冷新市場轉型,開拓液冷新市場。以 NVIDIA DGX A100 為例,AI 服務器系統功耗達到了 6.5KW。散熱效率一直是服務器廠商需要解決的問題之一,當前主流模式
101、是利用散熱鰭片、熱導管、風扇、空調等組成的風冷模式。隨著大數據、云計算帶來天量的數據處理等高通量的計算業務,使得服務器芯片的散熱收到嚴重挑戰,芯片熱封裝殼溫也在不斷提高,達到了風冷的極限。同時風冷的耗電量極高,數據中心的制冷空調系統用電量占整個數據中心的 30-50%。相比之下,液體比熱容為空氣的 1000-3500 倍,導熱性能是空氣的 15-25 倍,利用自然冷卻顯著降低耗電量,使得液冷成為風冷的不二選擇,在未來或將全面替代風冷,成為 AI 服務器乃至數據中心的標配。目前已有不少專注于熱功能的廠商,在加大對液冷模式的研發和布局,如老牌散熱模組供應商雙鴻、超眾已切入液體循環散熱的領域,中石科
102、技能夠提供全方位熱管理綜合解決方案,飛榮達針對服務器的散熱需求開發軸流風扇、特種散熱器、單相液冷冷板模組、兩相液冷模組等產品。我們認為,數據量增長給服務器帶來更迫切的散熱需求,散熱組件的重要性將持續凸顯,尤其看好未來液冷對氣冷替代所產生的需求。表表 17:散熱模組領域的國內廠商散熱模組領域的國內廠商 企業企業 主要情況主要情況 中石科技 為客戶提供熱模組產品,新基建(服務器、數據中心等高性能計算需求)是公司面向的四大高成長行業之一,為其提供高端熱管理綜合解決方案;覆蓋的產品包括但不限于導電墊、導熱硅脂、導熱凝膠、導熱相變材料 PCM、EMI 材料、熱模組等。飛榮達 散熱模組是公司的主營產品之一
103、,應用于通信設備、計算機、游戲機、智慧屏、工控設備等領域。飛榮達針對服務器的散熱需求開發軸流風扇、特種散熱器、單相液冷冷板模組、兩相液冷模組等產品 超頻三 為客戶提供熱模組產品,積極導入四大高成長性行業,如新消費電子(智能家居/醫療設備等)、數字基建(服務器/數據中心)、智能交通、清潔能源等。同飛股份 公司目前已主要形成了液體恒溫設備、電氣箱恒溫裝置、純水冷卻單元和特種換熱器四大類產品,應用涵蓋多個工業制冷領域。高瀾股份 公司是 IDC 領域中從事液冷醉酒的解決方案提供商之一,多年前邊開始關注 IDC 液冷賽道。雙鴻(臺)全方位熱流方案提供者,為全球第一大筆記型計算機散熱模塊設計及制造廠,同時
104、公司已經切入液體循環散熱的領域。超眾(臺)臺灣筆記本電腦散熱模組供應商,并與 Intel 及臺灣筆記型電腦大廠同步開發 CPU 散熱設計。資料來源:Wind,各公司投資者調研紀要,富果研究,天風證券研究所 3.3.3.數據存力作為算力進階需求迭起,看好國產存儲器后續發展數據存力作為算力進階需求迭起,看好國產存儲器后續發展 服務器內的數據存力重要性成為存儲器發展動力。服務器內的數據存力重要性成為存儲器發展動力。在服務器行業,既需要高頻寬的 DRAM作為暫存,提供處理器技術時即時所需的資料;也需要 NAND Flash 用以存放資料,通常以固態硬盤(SSD)的形態存在。DRAM 存儲器存儲器:目前
105、我們生活中接觸各種內存概念產品多為 DRAM,領導標準機構 JEDEC將 DRAM 定義為標準 DDR、移動 DDR、圖形 DDR 三個類別,分別指代為電腦內存、手機運存、顯卡顯存,其中圖形 DDR 能提供極高吞吐量,適合面向圖形應用程序、數據中心加速以及 AI 的數據密集型應用程序,并且將很多 DDR 芯片堆疊后與 GPU 封裝在一起,就構成了另一種形式的顯存,即 HBM。我們認為,ChatGPT 催生對更高性能存儲的需求,HBM技術有望隨著人工智能快速發展而發展,從而成為適配 AI 服務器的高階選擇。這從 2023年初 ChatGPT 帶動三星電子和 SK 海力士 HBM 訂單激增可見一斑
106、,AI 服務器中所需的英特爾 A100、V100 均搭載了 HBM2。與其他 DRAM 相比,HBM 通過垂直連接多個 DRAM 行業行業報告報告|行業深度研究行業深度研究 請務必閱讀正文之后的信息披露和免責申明 25 顯著提高數據處理速度,售價是普通 DRAM 的五倍,但由于其生產的復雜性和技術的先進性,國內外市場均由三星和 SK 海力士主導。HBM 當前在 DRAM 滲透率低,同時出于性價比選擇,傳統服務器仍多選擇 DDR 和 GDDR 以提高內存性能。根據前瞻產業研究所,2020年 DRAM 市場由海外廠商三星、海力士和美光所主導,CR3 達到 94.5%。根據清楓資本公眾號,2020
107、年服務器用 DRAM 占比 34.9%。我們看好中長期內高算力需求增長將成為存儲器發展的成長驅動力。表表 18:國內企業的存儲器產品國內企業的存儲器產品 企業企業 代表產品代表產品 紫光國芯 DDR/DDR2/DDR3/DDR4 DDR5(試產)合肥長鑫(未上市)DDR4/LPDDR4/LPDDR4X/DDR5/LPDDR5 GDDR6(規劃)GDDR6(試產)兆易創新 DDR3/DDR4/LPDDR4 江波龍 主要從事 Flash 及 DRAM 存儲器的研發、設計和銷售,目前提供消費級、工規級、車規級存儲器以及行業存儲軟硬件應用解決方案 東芯半導體 DDR3/LPDDR2 華邦電子(臺)DD
108、R3/DDR4/DDR4X 南亞科技(臺)DDR5/LPDDR4X 資料來源:果殼硬科技公眾號,Wind,天風證券研究所 SSD 固態硬盤固態硬盤:主要分為企業級和消費級,企業級 SSD 即應用于高性能計算、邊緣計算、高端存儲、數據中心等各種企業級場景中的固態硬盤,具備不間斷工作能力,能夠處理 I/O密集型工作負載。海量數據處理是人工智能計算負載的典型特點,當前 SSD 成本不斷下降,已經成為高性能服務器的必須,其中也包括人工智能服務器。并且,X86 處理器的發展也對周邊存儲設備起到了帶動作用,PCIe 4.0 SSD 在數據中心占比大幅增長,滿足數據密集型應用高速吞吐的需求。隨著未來持續增加
109、的數據存儲、傳輸需求,只有性能更強、容量更大、更穩定耐用的存儲設備才能支撐數字經濟發展,而企業級 SSD 面向企業級客戶,比消費級 SSD 具備更強性能、更高可靠性和更強耐用性,我們認為有望成為 AI 服務器的剛性需求。當前的 SSD 市場的領先企業包括英特爾、西部數據、美光、東芝,國內 SSD 企業仍處于追趕期,包括憶聯、憶恒創源、浪潮、大普微等均推出企業級 SSD,從產品性能和產能方面逐漸對標國際領先企業。當前企業級 SSD 下游客戶主要來自云服務器&互聯網,我們預計在未來幾年內,云計算與互聯網仍是國內企業級 SSD 硬盤的購買主力,尤其是目前處于人工智能元年,對 AI 服務器的增量需求或
110、將穩固企業級 SSD 硬盤的增長。表表 19:提供企業級提供企業級 SSD 的企業的企業 企業企業 代表產品代表產品 鎧俠 企業級 PM7 SSD 系列主打高性能計算、人工智能、緩存層、金融交易與分析等用例,讀取性能較上一代提升約 20%,容量水平可達到 30.72TB。西部數據 推出了面向熱存儲的 Ultrastar DC SN840 高性能 SSD,通過雙接口、1 和 3 DW/D 耐久性以及 TCG 加密等設計,適應 HPC、數據庫、虛擬化、人工智能、5G 通訊、自動駕駛和機器學習等不同應用。金士頓 DC1500M 采用高性能 Gen 3.0 x4 PCIe NVMe 設計,可預測的隨機
111、讀寫性能和延遲,適應高性能云服務、媒體采集、傳輸以及大數據應用要求。長江存儲 提供 3D NAND 閃存晶圓和顆粒以及企業級固態硬盤等產品,應用于服務器、數據中心等領域。億恒創源 國內企業級 NVM SSD 產品提供商,企業級 SSD 在數據庫、大數據、云計算、人工智能等領域廣泛應用。資料來源:千山資本,全球 SSD 公眾號,天風證券研究所 3.4.下游指明服務器發展方向,人工智能滲透率提高將擴展下游指明服務器發展方向,人工智能滲透率提高將擴展 AI 服務器應用服務器應用 全球服務器需求以企業資料中心為主,超大型資料中心(全球服務器需求以企業資料中心為主,超大型資料中心(HDC)占比穩步增長。
112、)占比穩步增長。企業資料中心主要是由擁有龐大數據存儲需求的公司建構,如 Netflix、Zoom 等互聯網公司和部分 行業行業報告報告|行業深度研究行業深度研究 請務必閱讀正文之后的信息披露和免責申明 26 金融企業等,市場份額正在被超大型資料中心所擠壓,這主要是對存儲需求大的企業數量有限。超大型資料中心指的是云服務提供商(CSP),如亞馬遜的 AWS,微軟的 Azure、阿里的阿里云,主要為有云端需求的企業提供服務,解決中小企業無法負擔直接搭建企業資料中心的成本困境,我們認為隨著中小產業持續導入,或將成為云服務的重要增量市場,從而拉動服務器的增長。圖圖 34:2019/2020 年全球服務器
113、應用場景年全球服務器應用場景 資料來源:TrendForce,富果研究部,天風證券研究所 國內服務器下游重點關注互聯網云服務商與電信運營商。國內服務器下游重點關注互聯網云服務商與電信運營商。中國服務器下游用戶主要分布在互聯網、運營商、政府、金融等多個領域?;ヂ摼W以超過 40%份額成為主流應用,BAT 和第三方 IDC 服務器公司成為服務器行業的主要購買力來源,同時近年來云計算的支出也為服務器出貨量貢獻力量。國內電信領域同樣值得關注,國內三大運營商提出算網一體,算力網絡按照算網協同、算網融合和算網一體的三階段演進路徑已經成為業界共識,2022年運營商進一步加大對算力底座的投資落地,2022 年三
114、大運營商服務器相關招標中,共涉及近 60 萬臺服務器,金額超過 200 億元,預計 2023 年運營商的 capex 將維持擴張,其中算力支出為最大支出。2022 年末在 AI 浪潮回卷趨勢下,互聯網巨頭爭先布局人工智能產品,AI 服務器有望成為服務器產品的新興業務負載。圖圖 35:2021 年我國服務器下游應用場景年我國服務器下游應用場景 資料來源:IDC,中商產業研究院公眾號,天風證券研究所 下游需求預期飽滿,持續受益于下游需求預期飽滿,持續受益于 AI 應用和模型逐步落地。應用和模型逐步落地。根據 Trendforce 報告指出,2022年 AI 服務器采購中,北美四大云端廠商谷歌、亞馬
115、遜 AWS、Meta、微軟合計占比 66%,國內字節跳動(6%)、騰訊(2.3%)、阿里巴巴(1.5%)和百度(1.5%)緊隨其后。AI 服務器需求和云計算及互聯網客戶的 Capex 直接掛鉤,下游客戶 capex 企穩回暖使得 AI 服務器產能有望持續受益擴張,尤其是在 ChatGPT 的應用之下,AI 服務器采購商紛紛布局人工智能應用,AI 服務器行業預計將迎來高景氣。企業資料中心超大型資料中心電信資料中心其他20192020 行業行業報告報告|行業深度研究行業深度研究 請務必閱讀正文之后的信息披露和免責申明 27 圖圖 36:主要的主要的 AI 服務器采購商服務器采購商 2019-202
116、2 年年 Capex(億元)(億元)資料來源:Wind,天風證券研究所 4.投資建議投資建議 建議建議關注關注 AI 服務器及上游產業鏈相關標的:服務器及上游產業鏈相關標的:1)AI 服務器龍頭:工業富聯;2)服務器 PCB:鵬鼎控股;3)服務器線束與連接器:電連技術、兆龍互連;4)算力芯片:寒武紀、海光信息(天風計算機團隊覆蓋)、景嘉微(天風計算機團隊聯合覆蓋);5)存儲供應鏈:兆易創新、北京君正、江波龍(天風計算機團隊聯合覆蓋)、瀾起科技、雅克科技、鼎龍股份(天風化工團隊聯合覆蓋)、華懋科技(天風汽車團隊聯合覆蓋)、華特氣體;6)邊緣 AI:瑞芯微、晶晨股份、全志科技、恒玄科技、富瀚微、中
117、科藍訊、樂鑫科技;7)AI to B/機器視覺:大華股份、??低?、鼎捷軟件(天風計算機團隊覆蓋)、凌云光、天準科技、舜宇光學、??低?、奧普特(天風機械軍工團隊覆蓋);8)Chiplet:長電科技、通富微電、華天科技、長川科技(天風機械團隊覆蓋)、華峰測控(天風機械團隊覆蓋)、利揚芯片、芯碁微裝、偉測科技 表表 20:相關公司盈利預測與估值相關公司盈利預測與估值 產 業 鏈 環節 企業 營業收入(億元)EPS(元/股)PE 2021A 2022A 2023E 2021A 2022A 2023E 2021A 2022A 2023E 服務器 工業富聯 4395.57 5118.50 5745.0
118、0 1.01 1.01 1.20 11.83 9.08 19.03 浪潮科技 670.58 695.25 826.86 1.38 1.42 1.80 26.01 15.14 29.18 拓維信息 22.30 22.37 30.92 0.07-0.81 0.10 124.76-8.17 194.58 中國長城 177.90 140.27 189.02 0.20 0.04 0.17 69.63 273.55 84.88 大華股份 328.35 305.65 347.14 1.13 0.77 1.03 20.82 14.76 19.84 GPU 景嘉微 10.93 11.54 17.21 0.97
119、0.64 0.90 156.62 85.84 114.11 龍芯中科 12.01 7.39 16.59 0.66 0.13 0.52-662.11 276.31 海光信息 23.10 51.25 74.46 0.16 0.35 0.56-116.05 145.46 芯原股份 21.39 26.79 33.88 0.03 0.15 0.30 2881.83 297.18 294.27 FPGA 復旦微電 25.77 35.39 43.27 0.63 1.32 1.73 79.70 52.94 32.09 紫光國微 53.42 71.20 92.27 3.22 3.10 4.05 69.88 42
120、.55 21.34 ASIC 寒武紀 7.21 7.29 10.75-2.06-3.13-1.95-46.12-17.40-115.19 先進封裝 長電科技 305.02 337.62 337.61 1.66 1.82 1.52 18.66 12.70 21.35 通富微電 158.12 214.29 246.29 0.72 0.33 0.50 26.99 49.68 51.00 華天科技 120.97 119.06 133.80 0.44 0.24 0.25 28.77 35.23 38.05 DRAM 紫光股份 676.38 740.58 850.81 0.75 0.75 0.94 30.
121、43 25.86 36.45 兆易創新 85.10 81.30 71.53 3.50 3.08 2.00 50.23 33.30 56.00 東芯股份 11.34 11.46 13.45 0.59 0.42 0.55 76.32 62.41 67.04 江波龍 97.49 83.30 101.16 2.73 0.18 0.71-334.50 159.21 PCB 鵬鼎控股 333.15 362.11 409.00 1.43 2.16 2.23 29.69 12.71 11.13 廣合科技 20.76 24.12-0.27 0.74-深南電路 139.43 139.92 157.82 3.03
122、3.20 3.60 40.25 22.57 22.00 行業行業報告報告|行業深度研究行業深度研究 請務必閱讀正文之后的信息披露和免責申明 28 生益電子 36.47 35.35 38.97 0.32 0.38 0.44 43.94 24.75 28.66 勝宏科技 74.32 78.85 93.33 0.78 0.92 1.09 38.97 14.13 24.49 散熱模組 中石科技 12.48 15.92 20.12 0.47 0.69 0.92 46.81 21.50 27.26 飛榮達 30.58 41.25 54.70 0.06 0.19 0.46 422.50 75.99 37.0
123、4 超頻三 5.8 11.50 22.81-0.38 0.04 0.21-21.79 190.65 34.54 同飛股份 8.29 10.08 18.12 2.31 1.37 1.40 55.39 67.28 35.78 高瀾股份 16.79 19.04 12.85 0.23 0.93 0.37 68.65 10.68 59.75 資料來源:截止于 2023 年 6 月 14 日的 Wind 一致預期,天風證券研究所 5.風險提示風險提示 中美貿易摩擦導致上游原材料斷供:中美貿易摩擦導致上游原材料斷供:若美國加大對于中國的制裁范圍和強度,國內廠商芯片等原材料可能出現斷供風險。AI 服務器出貨不
124、及預期:服務器出貨不及預期:若出現 GPU 供應不足等情況,可能導致 AI 服務器出貨承壓。技術瓶頸仍未擺脫:技術瓶頸仍未擺脫:若受到硬件架構等條件限制,AI 服務器技術迭代可能受阻。行業行業報告報告|行業深度研究行業深度研究 請務必閱讀正文之后的信息披露和免責申明 29 分析師聲明分析師聲明 本報告署名分析師在此聲明:我們具有中國證券業協會授予的證券投資咨詢執業資格或相當的專業勝任能力,本報告所表述的所有觀點均準確地反映了我們對標的證券和發行人的個人看法。我們所得報酬的任何部分不曾與,不與,也將不會與本報告中的具體投資建議或觀點有直接或間接聯系。一般聲明一般聲明 除非另有規定,本報告中的所有
125、材料版權均屬天風證券股份有限公司(已獲中國證監會許可的證券投資咨詢業務資格)及其附屬機構(以下統稱“天風證券”)。未經天風證券事先書面授權,不得以任何方式修改、發送或者復制本報告及其所包含的材料、內容。所有本報告中使用的商標、服務標識及標記均為天風證券的商標、服務標識及標記。本報告是機密的,僅供我們的客戶使用,天風證券不因收件人收到本報告而視其為天風證券的客戶。本報告中的信息均來源于我們認為可靠的已公開資料,但天風證券對這些信息的準確性及完整性不作任何保證。本報告中的信息、意見等均僅供客戶參考,不構成所述證券買賣的出價或征價邀請或要約。該等信息、意見并未考慮到獲取本報告人員的具體投資目的、財務
126、狀況以及特定需求,在任何時候均不構成對任何人的個人推薦??蛻魬攲Ρ緢蟾嬷械男畔⒑鸵庖娺M行獨立評估,并應同時考量各自的投資目的、財務狀況和特定需求,必要時就法律、商業、財務、稅收等方面咨詢專家的意見。對依據或者使用本報告所造成的一切后果,天風證券及/或其關聯人員均不承擔任何法律責任。本報告所載的意見、評估及預測僅為本報告出具日的觀點和判斷。該等意見、評估及預測無需通知即可隨時更改。過往的表現亦不應作為日后表現的預示和擔保。在不同時期,天風證券可能會發出與本報告所載意見、評估及預測不一致的研究報告。天風證券的銷售人員、交易人員以及其他專業人士可能會依據不同假設和標準、采用不同的分析方法而口頭或書
127、面發表與本報告意見及建議不一致的市場評論和/或交易觀點。天風證券沒有將此意見及建議向報告所有接收者進行更新的義務。天風證券的資產管理部門、自營部門以及其他投資業務部門可能獨立做出與本報告中的意見或建議不一致的投資決策。特別聲明特別聲明 在法律許可的情況下,天風證券可能會持有本報告中提及公司所發行的證券并進行交易,也可能為這些公司提供或爭取提供投資銀行、財務顧問和金融產品等各種金融服務。因此,投資者應當考慮到天風證券及/或其相關人員可能存在影響本報告觀點客觀性的潛在利益沖突,投資者請勿將本報告視為投資或其他決定的唯一參考依據。投資評級聲明投資評級聲明 類別類別 說明說明 評級評級 體系體系 股票
128、投資評級 自報告日后的 6 個月內,相對同期滬 深 300 指數的漲跌幅 行業投資評級 自報告日后的 6 個月內,相對同期滬 深 300 指數的漲跌幅 買入 預期股價相對收益 20%以上 增持 預期股價相對收益 10%-20%持有 預期股價相對收益-10%-10%賣出 預期股價相對收益-10%以下 強于大市 預期行業指數漲幅 5%以上 中性 預期行業指數漲幅-5%-5%弱于大市 預期行業指數漲幅-5%以下 天風天風證券研究證券研究 北京北京 ??诤??上海上海 深圳深圳 北京市西城區佟麟閣路 36 號 郵編:100031 郵箱: 海南省??谑忻捞m區國興大道 3 號互聯網金融大廈 A 棟 23 層 2301 房 郵編:570102 電話:(0898)-65365390 郵箱: 上海市虹口區北外灘國際 客運中心 6 號樓 4 層 郵編:200086 電話:(8621)-65055515 傳真:(8621)-61069806 郵箱: 深圳市福田區益田路 5033 號 平安金融中心 71 樓 郵編:518000 電話:(86755)-23915663 傳真:(86755)-82571995 郵箱: