《半導體行業深度:AI加速器協同高速通信技術加速AI創新發展-240328(22頁).pdf》由會員分享,可在線閱讀,更多相關《半導體行業深度:AI加速器協同高速通信技術加速AI創新發展-240328(22頁).pdf(22頁珍藏版)》請在三個皮匠報告上搜索。
1、 AI 加速器加速器協同協同高速通信技術高速通信技術,加速加速 AI 創新發展創新發展 相關研究:相關研究:1.AI成長可期,需求復蘇可望2023.12.24 行業評級:增持行業評級:增持 近十二個月行業表現近十二個月行業表現%1 個月 3 個月 12 個月 相對收益-1.67-16.3-14.8 絕對收益-0.2-11.0-27.8 注:相對收益與滬深 300 相比 分析師:王文瑞分析師:王文瑞 證書編號:證書編號:S0500523010001 TelTel:(8621)50293694 EmailEmail: 地址:地址:上海市浦東新區銀城路88號中國人壽金融中心10樓湘財證券研究所 核心
2、要點:核心要點:訓練端計算集群滲透率穩步提升,訓練端計算集群滲透率穩步提升,AIAI 計算加速器需求上行計算加速器需求上行 業界通常根據 AI 模型發展的關鍵節點,將人工大智能分為訓練端(Training)和推理端(Inference)。訓練端的核心目標是訓練出能夠完成目標任務的人工智能大模型產品。訓練端 AI 大模型的參數持續增多,AI 算力平臺從過去依賴單一計算機的算力逐漸演變為依賴計算集群,研究顯示大模型的參數、樣本數與訓練大模型所需 GPU 卡數呈正相關關系;大模型參數的增加會持續拉動 AI 計算加速器的需求。隨著 AI 大模型訓練需求及模型參數的提升,AMD 預計 2023 年至 2
3、027 年全球用于數據中心的 AI 計算加速芯片市場規模的年均復合增速約為 72.7%。網絡優化提升計算集群性能,網絡優化提升計算集群性能,InfinibandInfiniband 與與 RoCERoCE 方案方案市場滲透率提升市場滲透率提升 中國移動披露的數據顯示大模型訓練需要在不同的 GPU 網卡之間傳遞大量參數和梯度信息,GPU 通信時間占比達到 50%以上,提升同一機器內 GPU 與各硬件的傳輸效率、不同服務期間信息的傳輸效率對于大模型訓練效率的提升至關重要。GPU 集群的跨服務器通信解決方案領域,業界多采用 InifiniBand 和 RoCE 解決方案。其中 RoCE 網絡方案的普
4、及,或帶動 DPU 崛起,賽迪顧問統計數據預計 2020 年至 2025 年我國 DPU市場規模年均復合增速約為 170%。RoCE 以太網正在向 400GbE/800GbE 升級演進;IDC 發布的報告顯示,2023 年全球數據中心領域 200/400 GbE 交換機的收入同比增長 68.9%,DellOro 預測 2024 年將是 800GbE 以太網部署的重要一年,預計到 2027年,400 Gbps/800 Gbps 的端口數量滲透率將達到 40%以上;帶動高性能以太網交換機設備及以太網交換芯片需求增長。存儲設備領域,NVMe-oF+NVMe SSD 方案具有更高的性能、更低的延遲、更
5、高的可擴展性;Markets And Markets 預計受人工智能技術、物聯網、數據安全等多種需求推動,2022 年至 2025 年,NVMe 市場規模年均復合增速達29.7%。投資建議投資建議 AI 大模型領域競爭的加劇疊加 AI 大模型參數的持續增長,推動大模型訓練端的算力平臺從依賴單一計算機的算力逐漸演變為依賴計算集群,催生了優化算力集群間跨服務器信息傳輸效率的需求。計算集群數量的提升,持續提振 AI 加速器(GPU、FPGA、ASIC)的市場需求。算力集群間跨服務器傳輸效率的優化會推升 Infiniband 及 RoCE 網絡方案的市場滲透率,高性能 IB 交換機、以太網交換機,IB
6、 網卡、以太網智能網卡、DPU,NVMe SSD 等多種半導體硬件需求有望中長期受益。建議持續關注半導體行業,維持行業“增持”評級。風險提示風險提示 下游需求不及預期;企業新產品研發落地進展不及預期;政策支持力度不及預期。證券研究報告證券研究報告 2024 年年 03 月月 28 日日 湘財證券研究所湘財證券研究所 行業研究行業研究 半導體半導體行業深度行業深度 正文目錄 1 AI 基礎設施建設加速,奠定 AI 發展的基礎.3 2 AI 大模型發展:訓練至推理的全鏈條解析.4 2.1 訓練端計算集群滲透率穩步提升,AI 計算加速器需求上行.5 2.2 網絡優化提升計算集群性能,Infiniba
7、nd 與 RoCE 方案普及.8 2.2.1 RoCE 網絡方案普及,或帶動 DPU 崛起.12 2.2.2 以太網升級,帶動高性能以太網交換機需求上行.14 2.2.3 NVMe 技術演進:存儲性能革新推動數據中心升級.18 3 投資建議.19 4 風險提示.20 zViZiYfXhUkWlWaQaObRpNoOpNnRlOpPpMfQnPxO8OrQqRvPsPmNuOmPrP 2 敬請閱讀末頁之重要聲明 行業研究 圖表目錄 圖 1 人工智能-訓練端.4 圖 2 人工智能-推理端.4 圖 3 人類智能基礎設施體系視圖.5 圖 4 全球大模型參數量變化趨勢.6 圖 5 大模型訓練需要的卡數估
8、算公式.7 圖 6 算力計算模型.8 圖 7 AI 服務器內部結構(華為 Atlas 800).9 圖 8 人工智能服務器集群.9 圖 9 Meta-以太網 Roce 解決方案.11 圖 10 Meta-Nvidia InfiniBand 網絡解決方案.11 圖 11 全球 InfiniBand 市場規模.12 圖 12 InfiniBand 市場主要參與者及產品.12 圖 13 DPU 在數據中心計算側和分布式存儲領域的應用.13 圖 14 全球 DPU 市場規模.13 圖 15 中國 DPU 市場規模(億元).13 圖 16 交換機三層網絡設計圖示.14 圖 17 全球以太網交換機市場規模
9、.15 圖 18 AI 后端網絡中高速以太網交換機滲透率上行.15 圖 19 中國以太網交換設備市場規模及增速.16 圖 20 2023 年全球以太網交換機市場競爭格局.16 圖 21 2023YQ1 國內以太網交換機市場競爭格局.16 圖 22 全球以太網交換芯片市場規模.17 圖 23 全球商用 VS 自用占比.17 圖 24 中國商用以太網交換芯片.18 圖 25 中國商用以太網各應用場景市場規模占比.18 圖 26 國內商用以太網交換芯片競爭格局.18 圖 27 NVME 市場規模(億美元).19 圖 28 NVME 帶動 PCIE 接口出貨上行.19 表 1 AI 新型基礎設施分類及
10、簡介.4 表 2 中國加速計算市場產品構成.8 表 3 AI 服務器集群中的通信分類及簡介.10 表 4 三種 RDMA 網絡對比.11 表 5 交換機簡介.14 表 6 高密度 400GE 有利于用戶簡化網絡,提升效率.15 表 7 以太網交換芯片成本占比估算.17 3 敬請閱讀末頁之重要聲明 行業研究 1 1 AIAI 基礎設施建設基礎設施建設加速,奠定加速,奠定 AIAI 發展發展的基礎的基礎 2024 年 3 月初發布的政府工作報告中將“適度超前建設數字基礎設施,加快形成全國一體化算力體系;深化大數據、人工智能等研發應用,開展“人工智能+”行動,打造具有國際競爭力的數字產業集群?!绷袨?/p>
11、 2024 年的重點工作目標?;厮輾v史會發現,每一輪推動人類社會生產方式的重大的科技革新都伴隨著基礎設施的建設。第一次工業革命以蒸汽機的發明和應用為標志,開啟了人類大機器生產時代。這一時期,生產力的飛速發展對交通運輸和能源供應提出了新的要求,鐵路、運河等基礎設施應運而生。它們極大地提高了運輸效率,促進了商品流通和市場經濟的發展,為工業革命的深入發展奠定了基礎。第二次工業革命以電力的發明和應用為標志,開啟了電氣時代。這一時期,電力的廣泛應用推動了生產力的再次飛躍,高速公路、電網等基礎設施相繼出現。高速公路的建設便捷了人員和貨物的流動,電網的建立則為工業生產和日常生活提供了可靠的能源保障。第三次工
12、業革命以信息技術的興起為標志,開啟了信息時代?;ヂ摼W、移動通信網絡等信息基礎設施的出現,徹底改變了人們的生產和生活方式。信息技術的廣泛應用,推動了經濟社會數字化轉型,并催生了新興產業和商業模式的快速發展 2023 年初,以 ChatGPT 為代表的生成式人工智能通用大模型的誕生推動著 AI 賦能千行百業的步伐加速,生成式 AI 主要用于內容生成,在學習歸納已有數據的基礎上,學習數據產生的模式,并創造數據中不存在的新樣本,實現了從數據分析到內容創作的跨越式發展;業界普遍認為以 ChatGPT 為代表的人工智能大模型的誕生或標志著新一輪科技革命的開啟。AI 的快速發展和應用落地對于基礎設施也提出了
13、更高的要求,AI 新型基礎設施這一概念受到政府及市場的廣泛關注。中國信通院聯合華為發布的星河 AI 網絡白皮書指出,AI 新型基礎設施分為信息基礎設施、融合基礎設施和創新基礎設施三類,其中信息基礎設施是 AI 新型基礎設施的核心;融合基礎設施是傳統基礎設施升級轉型的重要支撐;創新型基礎設施則是支持 AI 應用落地的具有公共屬性的基礎設施。4 敬請閱讀末頁之重要聲明 行業研究 表表 1 1 AIAI 新型基礎設施分類及簡介新型基礎設施分類及簡介 類別 定位 簡介 信息基礎設施信息基礎設施 新型基礎設施的核心 包含通信網絡基礎設施、新技術基礎設施、算力基礎設施。融合基礎設施融合基礎設施 傳統基礎設
14、施轉型升級的重要支撐 新一代信息基礎設施在各行業深度融合的產物。創新基礎設施創新基礎設施 支撐科學研究、技術開發、產品研制等具有公共屬性的基礎設施 重大科技基礎設施、科教基礎設施、產業技術創新基礎設施等。資料來源:中國信通院、華為,湘財證券研究所 2 2 AIAI 大模型發展:訓練至推理的全鏈條解析大模型發展:訓練至推理的全鏈條解析 業界通常根據 AI 模型發展的關鍵步驟/節點,將人工大智能分為訓練端(Training)和推理端(Inference)。訓練端的核心目標是訓練出能夠完成目標任務的人工智能大模型產品;推理端則在訓練完成的基礎上,實現模型對于新的數據進行分析預測的功能。圖圖 1 1
15、人工智能人工智能-訓練端訓練端 圖圖 2 2 人工智能人工智能-推理端推理端 資料來源:NEURAL SERVERS、湘財證券研究所 資料來源:NEURAL SERVERS、湘財證券研究所 訓練端,模型通過大量數據和算法的訓練,學會識別和生成規律,并不斷調整參數以提高預測準確性。最終,模型能夠具備適應各種任務的學習能力,應用于圖像識別、自然語言處理等多個領域。具體來說,訓練過程可以分為數據準備、模型構建、模型訓練、模型評估四個步驟:數據準備:收集和整理訓練所需的數據,包括圖像、文本、語音等多種類型。模型構建:選擇合適的模型架構和算法,并設置模型參數。模型訓練:將訓練數據輸入模型,并不斷調整參數
16、,以最小化預測與實際值之間的誤差。模型評估:使用測試數據評估模型的性能,并進行必要的調整和改進。5 敬請閱讀末頁之重要聲明 行業研究 推理端,AI 模型將訓練好的模型應用于新的、未見過的數據,以進行預測、分類或生成新內容。在這個階段,模型利用先前學到的規律,在實際應用中做出有意義的決策。推理階段是 AI 模型落地應用的關鍵環節,它可以應用于生產環境,例如對圖像、語音或文本進行分類,也可以用于其他任務,如語言生成、翻譯等。具體來說,AI 模型的推理過程可以分為模型部署、數據預處理、模型推理、結果預測四個步驟:模型部署:將訓練好的模型部署到推理環境,例如云端、邊緣設備等。數據預處理:對新的數據進行
17、預處理,使其符合模型的輸入格式。模型推理:將預處理后的數據輸入模型,得到預測結果。結果處理:對預測結果進行分析和處理,以滿足應用需求。我們根據人工智能技術發展中的兩個重要環節結合中國信通院發布的星河 AI 網絡白皮書對人工智能基礎設施進行分析可知,人工智能基礎設施中訓練端以信息基礎設施的建設(如智算中心、AI 訓練云)為核心,融合基礎設施為輔;推理端的基礎設施布局則多為融合性基礎設施和創新型基礎設施。圖圖 3 3 人類智能基礎設施體系視圖人類智能基礎設施體系視圖 資料來源:中國信通院、湘財證券研究所 2.1 訓練端訓練端計算計算集群集群滲透率穩步提升滲透率穩步提升,AI 計算加速器需求計算加速
18、器需求上行上行 訓練端,AI 大模型的參數將持續增多,預計 AI 算力平臺將會從過去依賴 6 敬請閱讀末頁之重要聲明 行業研究 單一計算機的算力逐漸演變為依賴計算集群,目前 OpenAI、Meta、字節跳動等多家 AI 大模型廠商都在建設大規模的 GPU 卡集群。圖圖 4 全球大模型參數量變化趨勢全球大模型參數量變化趨勢 資料來源:iResearch、湘財證券研究所 根據 Nvidia、斯坦福大學和微軟的聯合發布的研究顯示,大模型的參數、樣本數、GPU 卡的峰值算力、GPU 卡的利用率、預期訓練時長這五個因素為影響大模型所需 GPU 卡數的核心影響因素,并且模型參數量與訓練樣本之間呈正相關關系
19、。大模型訓練所需卡數與影響因素存在下屬的近似量化關系。根據華為、中國信通院聯合發布的報告中的數據及測算顯示,GPT3 的模型參數為 1750 億,訓練樣本數為 3000 億,若 GPU 的峰值算力為 312T,預期一個月完成模型訓練,GPU 的平均利用率為 50%左右,則需要的 GPU 卡數為 1038卡;根據 Nvidia 近期舉辦的 GTC 大會披露的消息顯示,ChatGPT-4.0 的參數規模約為 1.8 萬億,訓練端需要 8000 個 Hopper GPU 工作約 3 個月。根據谷歌發布的 Gemini 1.5 Pro 技術報告披露的信息顯示,Gemini 1.5pro 是在分布在多個
20、數據中心的 4096 個 TPUv4 加速器設備上進行訓練的。海光信息公布的數據顯示,2023 年全球 AI 加速計算市場規模將達 450 億美元;美國超威半導體公司(AMD)預計 2027 年全球用于數據中心的 AI 計算加速芯片市場規模將增長至 4000 億美元,年均復合增速約為 72.7%。7 敬請閱讀末頁之重要聲明 行業研究 圖圖 5 大模型訓練需要的卡數估算公式大模型訓練需要的卡數估算公式 大模型訓練需要的卡數=8 模型參數量 樣本數預期的訓練時長 GPU 卡的峰值算力 GPU 卡的利用率 資料來源:華為&中國信通院、湘財證券研究所 值得注意的是GPU只是AI加速器中的一種,AI計算
21、加速器還包括FPGA、ASIC、NPU 等非 GPU 加速卡。其中 ASIC 通常為特定深度學習任務而設計,在特定領域可以提供卓越的性能,但其可編程性不及 GPU,從而通用性弱于GPU。GPU 的多功能性和可編程性使其更適合于處于高速發展期的各種人工智能任務。目前全球 AI 計算加速芯片市場中,GPU 的市場份額穩定高于 80%;IDC 預計,到 2025 年人工智能芯片市場規模將達 726 億美元,人工智能芯片搭載率將持續增高,目前每臺人工智能服務器上普遍多配置 2 個 GPU,未來18 個月,GPU、ASIC 和 FPGA 的搭載率均會出現增長。國內加速計算市場中,GPU 的市場份額占比為
22、 90%左右,IDC 統計數據顯示 2021 年至 2023H1 中國加速服務器市場中 GPU 和非 GPU 加速器的市場規模都保持上行態勢。IDC 預計 2023 年我國人工智能服務器市場規模將達 91億美元,同比增長82.5,2027年將達到134億美元,年復合增長率達21.8。假設 2023 年中國加速計算市場中 GPU 的市場份額為 90%,則 2023 年國內GPU 加速器市場規模年同比增長 37.3%,非 GPU 加速器市場規模年同比增長23.5%。8 敬請閱讀末頁之重要聲明 行業研究 表表 2 中國加速計算市場產品構成中國加速計算市場產品構成 20212021 年年 202220
23、22 年年 2023H12023H1 2023E2023E 2027E2027E 中國加速器市場規模(億美元)53.9 67 31 91 134 GPU 加速器市場份額占比 88.40%89%92%90%-GPU 加速器市場規模年同比增速 72.54%25%-37.3%-非 GPU 加速器市場份額占比 11.60%11%8%10%-非 GPU 加速器市場規模年同比增速 43.80%17.9%8%23.5%-資料來源:IDC、湘財證券研究所 2.2 網絡優化提升計算集群性能,網絡優化提升計算集群性能,Infiniband 與與 RoCE 方方案普及案普及 GPU 集群中 GPU 卡的利用率(即并
24、行計算效率)的提升要以超大容量的網絡為基礎,人工智能應用中,數據需要在不同組件之間傳輸,例如內存、存儲和其他處理單元。較長的網絡通信時間會顯著影響人工智能系統的整體性能和效率,從而限制充分利用人工智能處理器的處理能力。根據華為發布的報告顯示,業界普遍認可算力受到通用計算能力、高性能計算能力、存儲能力和網絡能力的綜合影響。圖圖 6 算力計算模型算力計算模型 算力=f(通用算力,高性能算力,存儲能力,網絡能力)資料來源:華為&中國信通院、湘財證券研究所 業界目前采用了數據并行、流水線并行、張量并行及混合并行這四種并行計算方式來提升 AI 大模型的訓練速率:(1)數據并行:將訓練數據集分成多份,分不
25、到不同的服務器上進行并行訓練,從而減少訓練時間;需要通過分布式存儲系統來存儲和管理分片數據,為了確保模型更新的一致性,每個服務器需要與其他服務器通信以交換梯度和其他信息。9 敬請閱讀末頁之重要聲明 行業研究(2)流水線并行:將模型的不同層,部署到不同的 GPU 服務器上,從而減少大模型計算對于GPU內存的需求。類似于流水線作業,每個 GPU 負責處理模型的一部分,并將其傳遞給下一階段的 GPU 進行處理。相鄰設備間通過通信鏈路傳輸數據。(3)張量并行:將模型切分到不同的 GPU 卡或服務器上,使得每個 GPU 上的參數量顯著減小,從而可以實現對于更大參數的模型進行訓練的目標。(4)混合并行:將
26、數據并行、模型并行和流水線并行等多種并行計算方式結合起來,從而進一步提升 AI 大模型的訓練效率?;旌喜⑿幸呀洷粡V泛應用于 AI 大模型的訓練,例如 GPT-3、PaLM 等?;旌喜⑿兄忻總€服務器也需要與其他服務器通信以交換信息。數據并行、流水線并行和混合并行都需要通過跨服務器通信來進行信息數據并行、流水線并行和混合并行都需要通過跨服務器通信來進行信息傳輸,降低信息傳輸的時間及損耗是業界關注的重點。傳輸,降低信息傳輸的時間及損耗是業界關注的重點。根據中國移動披露的數據顯示大模型訓練需要在不同的 GPU 網卡之間傳遞大量參數和梯度信息,GPU 通信時間占比達到 50%以上;從而提升同一機器內 G
27、PU 與各硬件(如內存、CPU、GPU)的傳輸效率、提升不同服務期間信息的傳輸效率對于大模型訓練效率的提升至關重要。目前業界提升機器內 GPU 的通信效率通過高速高性能的 PCIE5.0/6.0 接口芯片,英偉達 NVLINK、華為 HCCS 互連技術等來實現。提升跨服務器的數據通信效率,業界多采用 RDMA 網絡通信技術,RDMA技術能直接通過網絡接口訪問內存數據,無需操作系統內核的介入。這允許高吞吐、低延遲的網絡通信,尤其適合在大規模并行計算機集群中使用。目前有3 種主流的 RDMA 技術,分別為 Infiniband(Nvidia 主推的網絡解決方案)、RoCE(RDMA over Co
28、nverged Ethernet)、iWARP。圖圖 7 7 AIAI 服務器內部結構(華為服務器內部結構(華為 Atlas 800Atlas 800)圖圖 8 8 人工智能人工智能服務器集群服務器集群 資料來源:OFEEK、湘財證券研究所 資料來源:華為官網、湘財證券研究所 10 敬請閱讀末頁之重要聲明 行業研究 表表 3 3 AIAI 服務器集群中的通信分類及簡介服務器集群中的通信分類及簡介 機器內通信機器內通信 名稱名稱 簡介 QPI/UPIQPI/UPI 鏈路鏈路 Intel 開發的點對點處理器連接技術,例如多核 CPU 系統中 CPU 間的通信。PCIEPCIE 用于 CPU 與 G
29、PU 之間的通信,以及其他設備與 CPU 之間的通信。NVLINKNVLINK NVLink 提供了直接的點對點連接,具有比傳統的 PCIe 總線更高的傳輸速度和更低的延遲。主要用于連接多個 GPU 之間或連接 GPU 與其他設備(如 CPU、內存等)之間的通信 DMA(Direct DMA(Direct Memory Access)Memory Access)允許設備直接訪問內存,無需 CPU 參與。提供在外設和存儲器之間或者存儲器和存儲器之間的高速數據傳輸。MPIMPI 并行計算的應用程序接口(API),常在超級計算機、電腦集群等非共享內存環境程序設計。HCCSHCCS 華為研發的 Cac
30、he 一致性總線 HCCS,可以實現 CPU 和 CPU 之間的高速互聯,通信速率高達每秒 30GT,是業界主流 CPU 互聯速率的 2 倍多。機器間通信(跨服務器通信)機器間通信(跨服務器通信)TCP/IPTCP/IP TCP/IP 提供了點對點鏈接的機制,將資料應該如何封裝、尋址、傳輸、路由以及在目的地如何接收,都加以標準化 RDMARDMA 一種直接存儲器訪問技術,它將數據直接從一臺計算機的內存傳輸到另一臺計算機,無需雙方操作系統的介入。RDMA 可以釋放許多資源,從而提高系統的吞吐量和性能??梢栽谶h程計算機上執行讀取和寫入等操作,而無需中斷該計算機的 CPU。該技術有助于提高數據傳輸速
31、率和低延遲網絡,尤其適合在大規模并行計算機集群中使用。RDMA 通過啟用網絡適配器將數據直接傳輸到系統緩沖區來使用零復制網絡。-InfiniBandInfiniBand 一種高性能網絡技術,專為低延遲和高帶寬數據通信而設計。它通常用于數據中心和高性能計算(HPC)環境,特別是需要在服務器之間進行快速可靠通信的應用程序,如機器學習訓練、高性能計算、云計算。一種高性能網絡技術,專為低延遲和高帶寬數據通信而設計。它通常用于數據中心和高性能計算(HPC)環境,特別是需要在服務器之間進行快速可靠通信的應用程序。-iWARPiWARP 基于 TCP 的 RDMA 網絡,通過標準 TCP/IP 基礎設施實現
32、類似 RDMA 的數據傳輸性能,從而減少延遲并提高效率。具備較好的兼容性,但性能不及 InfiniBand。-RocRoce e 可通過標準以太網實現 RDMA(遠程直接內存訪問)功能。它本質上將 RDMA“封裝”在以太網之上,允許應用程序利用 RDMA 的優勢來實現更快的數據傳輸,而無需像 Infiniband 這樣的專用硬件。與傳統的 TCP/IP 相比,RoCE 降低了數據傳輸延遲,適合需要快速通信的應用,例如大規模機器學習訓練。資料來源:維基百科、CDSN、華為,湘財證券研究所 GPU集群的跨服務器通信解決方案領域,業界多采用InifiniBand和RoCE解決方案,如近期 Meta
33、官網披露的其一對 GPU 集群的網絡架構方案,一個集群采用了基于 Arista 公司的 Arista 7800 機架交換機的以太網 RoCE 方案,另一個則使用 Nvidia 的 Quantum2 InfiniBand 網絡解決方案。Infiniband 從硬件級別保證可靠傳輸,提供更高的帶寬和低時延,但是搭配 InfiniBand 網卡、InfiniBand 交換機、InfiniBand 路由器和 InfiniBand to Ethernet 網關系統來實現解決方案的落地,解決方案配置成本較高;根據 Dell 官方網站披露的數據顯示,搭建 Infiniband 所需的 NVIDIA Quan
34、tum-2 QM9700-交換機單價約為 4 11 敬請閱讀末頁之重要聲明 行業研究 萬美金。RoCE 搭配普通的以太網交換機、支持 RoCE 的網卡和適配器即可實現解決方案的落地。根據 IDC 披露的數據顯示,2022 年 AI 網絡市場中,InfiniBand 網絡方案貢獻了 75%的收入,目前 IB 網絡方案在業界的占比較高。圖圖 9 9 MetaMeta-以太網以太網 RoceRoce 解決方案解決方案 圖圖 1010 MetaMeta-Nvidia Nvidia InfiniBandInfiniBand 網絡解決方案網絡解決方案 資料來源:Meta、湘財證券研究所 資料來源:Meta
35、、湘財證券研究所 表表 4 三種三種 RDMA 網絡對比網絡對比 InfiniBandInfiniBand iWARPiWARP RoCERoCE 性能性能 最好 稍差(受 TCP 影響)與 InfiniBand 相當 成本成本 高 中 低 穩定性穩定性 好 差 較好 交換機交換機 IB 交換機 以太網交換機 以太網交換機 資料來源:華為、湘財證券研究所 根據百度發布的 智算中心網絡架構白皮書 披露的統計數據顯示 Nvidia目前是 infiniband 網絡解決方案和配套硬件供應商市場上市占率最高的企業,市場份額超過 70%。英偉達可以提供 InfiniBand 網卡、InfiniBand
36、交換機、路由器及網管、遠程互連系統及收發器等各種 Infiniband 網絡解決方案所需的硬件。根據英偉達披露的季度報告數據顯示2024 年英偉達的Quantum InfiniBand解決方案的年度營收增長超過了 5 倍。咨詢機構 Maximize Market Research 統計數據顯示 2021 年全球 InfiniBand 市場規模為 66.6 億美元,預計 2029 年增長至 983.7 億美元,年均復合增速約為 40%。12 敬請閱讀末頁之重要聲明 行業研究 圖圖 1111 全球全球 InfiniBandInfiniBand 市場規模市場規模 圖圖 1212 InfiniBand
37、InfiniBand 市場市場主要主要參與者及產品參與者及產品 公司公司 產品簡介產品簡介 Nvidia 是 InfiniBand 技術的主要供應商之一,提供各種InfiniBand 適配器、交換機和其他相關產品 Intel 提供各種 InfiniBand 網絡產品和解決方案 思科 知名的網絡設備制造商,也提供 InfiniBand 交換機和其他相關產品 Hewlett Packard Enterprise 一家大型 IT 公司,提供各種 InfiniBand 網絡解決方案和產品,包括適配器、交換機和服務器等。資料來源:MAXIMIZ Market Research、湘財證券研究所 資料來源:
38、百度、湘財證券研究所 2.2.1 RoCE 網絡方案普及,網絡方案普及,或帶動或帶動 DPU 崛起崛起 RoCE 協議是 RDMA 網絡的主流實現方案之一,RoCE 有 RoCEv1 和RoCEv2兩個版本,其中RoCE v2位于協議棧的傳輸層,引入IP解決了RoCEv1的可擴展性問題,可以在不同網絡上的設備之間使用。RoCE v2 還引入了多隊列支持,網絡具有更高的吞吐量和并發性能;數據傳輸效率進一步提高,適配于數據中心、高性能計算等的網絡需求。同時相較于 IB 網絡,RoCE v2 網絡具有硬件無關性,即其可以在不同廠商的以太網適配器和交換機上實現網絡搭建。RoCE v2 所需的網絡接口卡
39、為適用于 RoCE v2 的 InfiniBand 和以太網混合適配器,主流廠商有 Nvidia、Intel、Broadcom、華為。目前商用網卡的端口PHY 速率最高已達 400Gbps;目前 25Gbps 和 100Gbps 網卡仍是市場的主力型產品。DPU 在 RDMA 網絡中的應用受到硬件廠商及云廠商的關注,DPU 是一種新型可編程處理器,專用于數據中心的 DPU 可以將存儲協議和安全協議的封裝與解封裝等耗費大量 CPU 算力任務卸載到 DPU 上,節約更多 CPU 算力支撐更多的應用業務。在存儲域,DPU 可以在分散的計算架構中,連接不同資源池的方式將從原來的系統總線承載,轉變成總線
40、-網絡-總線的方式;并在網絡側為存儲系統提供高效擁塞控制機制和增強的負載均衡能力,降低長尾時延,提供更可靠更高效的存儲傳輸網絡,根據中國信通院公布的數據顯示,在某些場景下,DPU 可以帶來 10 倍以上的應用性能提升。020040060080010002021Y2029E40%13 敬請閱讀末頁之重要聲明 行業研究 圖圖 13 DPU 在數據中心計算側和分布式存儲領域的應用在數據中心計算側和分布式存儲領域的應用 資料來源:中興通訊、湘財證券研究所 DPU 通常被集成在 SmartNIC(智能網卡)中,作為 CPU 和 GPU 之外的第三種計算單元,構建了數據中心的異構計算架構。根據市場研究機構
41、 DellOro 的數據顯示,2024 年全球 SmartNIC 的市場規模將超過 6 億美元,占全球以太網適配器市場的 23%。預計 2026年全球智能網卡收入增長至 16億美元,年均復合增速達 38.67%。而 DPU 除了應用于數據中心的智能網卡中,還可應用于大數據清洗處理、網絡安全、深度學習、邊緣計算等多領域,賽迪顧問統計數據顯示 2020 年我國 DPU 市場規模僅為 3.9 億元,預計至 2025 年增長至565.9 億元,年均復合增速約為 170%。圖圖 1414 全球全球 DPUDPU 市場規模市場規模 圖圖 1515 中國中國 DPUDPU 市場規模市場規模(億元)(億元)資
42、料來源:賽迪顧問、湘財證券研究所 資料來源:賽迪顧問、湘財證券研究所 DPU 可以基于 ASIC、FPGA 或 SoC 技術構建,Allied Market research 的統計數據顯示,FPGA 和 SOC 為市場上的主力產品。DPU 領域的供應商由傳統的半導體設計企業和云廠商構成,海外大廠英偉達、Intel、AMD、Marvell、01002003002020Y2021E2022E2023E2024E2025E市場規模(億美元)01002003004005006002020Y2021E2022E2023E2024E2025E 14 敬請閱讀末頁之重要聲明 行業研究 Broadcom、A
43、mazon、Microsoft 在 DPU 領域布局已久,近年來陸續發布新品。國內市場華為、阿里云、百度云、火山引擎(字節跳動旗下的云計算平臺)、京東云、騰訊、海光信息、新華三等均有產品推出,近年來如沐創集成電路、芯啟源、云豹智能、中科馭數等創業企業的研發出貨進展也備受市場關注。2.2.2 以太網升級,帶動高性能以太網交換機需求上行以太網升級,帶動高性能以太網交換機需求上行 RoCE v2 網絡方案對以太網交換機沒有能力要求,目前大部分數據中心交換機都支持 RDMA 流控技術,和 RoCE 網卡配合,實現端到端的 RDMA 通信。數據中心網絡為三層網絡設計結構,數據的傳輸通過接入層交換機、匯聚
44、層交換機、核心層交換機。圖圖 1616 交換機交換機三層網絡設計圖示三層網絡設計圖示 表表 5 5 交換機簡介交換機簡介 名稱名稱 簡介簡介 接入層交換機 數據中心接入交換機部署于數據中心接入層,用于數據中心各種類型的服務器接入,其中下行鏈路需支持從萬兆、25G 等各種性能服務器接入,而上行鏈路則主要包括 40G、100G 兩種接口,且依據不同收斂比要求,接口數量也各不相同,因此數據中心接入交換機需要具備較高的性能以及豐富的接口形態;匯聚層交換機 匯聚層交換機是多臺接入層交換機的匯聚點,作用是將接入節點統一出口,同時也進行轉發及選路。匯聚層交換機需處理來自接入層設備的所有通信量,并提供到核心層
45、的上行鏈路,因此需要具備高轉發性。核心層交換機 數據中心核心交換機部署在數據中心核心層,用于數據中心接入交換機間的連通以及數據中心接入交換機與上層網絡的連通。隨著數據中心的流量和帶寬呈現指數級增長,數據中心核心交換機除需具備更高的性能、可靠性及吞吐能力外,還需具備更高的帶寬擴展能力、更強的報文緩存能力以及路由表轉發能力。資料來源:騰訊云開發者社區、湘財證券研究所 資料來源:賽迪顧問、湘財證券研究所 隨著數據流量的不斷增長,特別是 5G 時代到來后流量激增,傳統 10G 網絡架構的數據中心面臨著來自應用和數據的巨大網絡壓力,傳統數據中心亟需解決(1)數據中心之間海量數據高速遷移(2)數據中心間帶
46、寬瓶頸(3)數據中心間帶寬利用率低等問題,為了應對這些挑戰,國內主流的數據中心接入層及匯聚層交換機端口速率正在由 10G/40G 向 25G/100G 升級演進,端口速率為 25G/100G 的交換機具有更高的數據遷移效率、更低的功耗,適配于大型數據中心、云計算、人工智能等領域的需求;根據華為發布的數據顯示,以一個 100T 流量規模的數據中心組網為例,采用 400GE 技術,核心匯聚交換機需要 5K 個接口,相對于 100GE 技術減少 75%;接入層與匯聚交換機采用 15 敬請閱讀末頁之重要聲明 行業研究 100GE 技術,則需要 20K 個接口,相對于 25GE 技術減少 75%;同樣服
47、務器與接入層交換機互聯的端口速率若采用 100GE 技術,則相對于 25GE 技術減少 75%。表表 6 高密度高密度 400GE 有利于用戶簡化網絡,提升效率有利于用戶簡化網絡,提升效率 服務器與 TOR(接入層)互聯 Tor 與匯聚交換機互聯 匯聚交換機與核心交換機互聯 端口速率 端口數 端口速率 端口數 端口速率 端口數 10G 200K 10G 200K 40G 50K 25G 80K 25G 80K 100G 20K 100G 20K 100G 20K 400G 5K 資料來源:華為、湘財證券研究所 IDC 發布的報告顯示,2023 年全球以太網交換機收入同比增長 20.1%,達到
48、442 億美元(約 3175 億人民幣)。數據中心領域 200/400 GbE 交換機的收入在 2023 年全年增長了 68.9%,100GbE 交換機占數據中心領域市場收入的 46.3%,全年收入同比增長 6.4%;數據中心領域高速以太網交換機保持中高速增長主要系受益于 AI 發展的浪潮。DellOro 預測 2024 年將是 800GbE以太網部署的重要一年,400GbE 端口出貨量將繼續增長,預計到 2027 年,400 Gbps/800 Gbps 的端口數量滲透率將達到 40%以上。同時,AI 后端網絡將加快向高速的遷移。如下圖所示,預計到 2025 年,AI 后端網絡中的大多數交換機
49、端口將達到 800 Gbps,到 2027 年將達到 1600 Gbps。圖圖 1717 全球以太網交換機市場規模全球以太網交換機市場規模 圖圖 1818 AIAI 后端網絡中高速以太網交換機滲透率上行后端網絡中高速以太網交換機滲透率上行 資料來源:IDC、湘財證券研究所 資料來源:DellOro、湘財證券研究所 中國市場的以太網交換設備市場規模處于快速增長中。根據華經產業研究院的統計數據顯示,2022 年我國以太網交換設備的市場規模約為 449.3 億元,同比增長 12.97%;預計 2025 年我國以太網交換設備的市場規模將達到574.2 億元,2020-2025 年年均復合增長率為 10
50、.8%。16 敬請閱讀末頁之重要聲明 行業研究 圖圖 19 中國以太網交換設備市場規模及增速中國以太網交換設備市場規模及增速 資料來源:華經產業研究院、盛科通信招股說明書、湘財證券研究所 IDC 統計數據顯示,2023 年以太網交換機市場的前五大供應商市占率合計為 77.8%;其中思科 2023 年全年市場份額達到 43.7%,全年以太網交換機收入同比增長 22.2%。Arista Networks2023 年全年市場份額為 11.1%,以太網交換機收入在 2023 年增長了 35.2%,其中,91.4%來自數據中心領域。華為全年市場份額達到 9.4%,以太網交換機總收入年同比增長 10.6%
51、。HPE 的全年市場份額為 9.4%,以太網交換機收入在 2023 年增長了 67.6%。H3C(新華三)全年的市場份額為 4.2%,以太網交換機收入年同比下降了 6.3%。國內中興通訊、銳捷網絡、邁普通信等企業也已推出高端交換機產品,國內市場中華為、新華三和銳捷網絡的合計市場份額占比超 80%,其中 2023 年華為的市場份額占比為 41.5%,穩居中國數據中心交換機市場第一。圖圖 20 2023 年全球以太網交換機市場競爭格局年全球以太網交換機市場競爭格局 圖圖 21 2023YQ1 國內以太網交換機市場競爭格局國內以太網交換機市場競爭格局 資料來源:IDC、湘財證券研究所 資料來源:ID
52、C、湘財證券研究所 太網交換芯片也是決定以太網交換機性能的核心部件之一。根據盛科通信的招股說明書信息分析可知,以太網交換芯片占以太網交換機的成本比例為 4%左右。0%5%10%15%20%0100200300400500600700市場規模(億元)同比增速H3C,34.50%華為,30.90%銳捷網絡,14.90%思科,7%中興通訊,3.50%其他,9.20%17 敬請閱讀末頁之重要聲明 行業研究 表表 7 以太網交換芯片成本占比估算以太網交換芯片成本占比估算 以太網交換芯片以太網交換芯片單價(元單價(元/顆)顆)以太網交換機單價以太網交換機單價(元(元/臺)臺)占比占比 2020Y 763.
53、54 12485.54 6.12%2021Y 354.2 10436.07 3.39%2022Y 386.63 9873.54 3.92%資料來源:盛科通信招股說明書、湘財證券研究所 根據灼識咨詢的數據,以銷售額計算,全球以太網交換芯片的整體市場規模在 2016 年為 318.5 億元,到 2020 年達到 368.0 億元,年均復合增長率為3.6%。預計到 2025 年,全球以太網交換芯片市場規模將達到 434.0 億元,年均復合增長率為 3.4%。商用市場占比逐年提升。圖圖 2222 全球以太網交換芯片市場規模全球以太網交換芯片市場規模 圖圖 2323 全球商用全球商用 VSVS 自用占比
54、自用占比 資料來源:盛科通信招股說明書、灼識咨詢、湘財證券研究所 資料來源:盛科通信招股說明書、灼識咨詢、湘財證券研究所 中國市場云計算的快速滲透、AI 和機器學習的興起、5G 商用、WiFi 6 等通信技術的升級以及企業信息化建設的深入推動著國內以太網交換芯片市場的快速增長。根據灼識咨詢的數據,以銷售額計算,中國商用以太網交換芯片的整體市場規模在 2016 年為 54.1 億元,到 2020 年達到 90.0 億元,年均復合增長率為 13.6%。預計到 2025 年,中國商用以太網交換芯片市場規模將達到 171.4億元,國內市場的以太網市場規模 5年年均復合增長率預計為 13.8%。分應用場
55、景來看,2020 年至 2025 年商用數據中心領域的以太網交換芯片市場規模增速最為亮眼,預計年均復合增速可達 18%;工業用以太網交換芯片市場規模年均復合增速預計為 9.8%。0%20%40%60%80%100%商用占比自用占比 18 敬請閱讀末頁之重要聲明 行業研究 圖圖 2424 中國商用以太網交換芯片中國商用以太網交換芯片 圖圖 2525 中國商用以太網各應用場景市場規模占比中國商用以太網各應用場景市場規模占比 資料來源:盛科通信招股說明書、灼識咨詢、湘財證券研究所 資料來源:盛科通信招股說明書、灼識咨詢、湘財證券研究所 根據中商情報網統計的數據顯示,目前國內商用以太網交換芯片市場中博
56、通穩居龍頭地位,市占率接近 62%;美滿電子市占率約為 20%;臺灣企業瑞昱的市占率約為 16%;盛科通信的市占率約為 1.6%。國內自用以太網交換芯片市場中的主要參與者為華為和思科,其中華為市場份額占比高于 80%。國內中興通訊的以太網交換機芯片也為自研產品。圖圖 2626 國內商用以太網交換芯片競爭格局國內商用以太網交換芯片競爭格局 資料來源:中商情報網、湘財證券研究所 2.2.3 NVMe 技術演進:存儲性能革新推動數據中心升級技術演進:存儲性能革新推動數據中心升級 訓練端存儲訓練端存儲能力能力的提升的提升:NVMe SSD 是一種新型的存儲設備,它使用 NVMe 協議與主機進行通信。N
57、VMe 協議比傳統的 SATA 協議具有更高的效率和更低的延遲,因此 NVMe SSD 可以提供更快的存儲性能。2016 年NVMe 工作組發布 NVMe over Fabric 規范,早期的 NVMe over PCIe 局限在主機的本地盤使用,而通過 Fabrics(如 RDMA 或光纖通道)代替 PCIe,可幫助主機訪問節點外的 NVMe SSD 資源,NVMe-oF 極大地增強了靈活性和 19 敬請閱讀末頁之重要聲明 行業研究 擴展性,將 NVMe 的低延時、高并發等特性,從服務器級別擴展到整個數據中心級別。NVMe over Fabric 及 NVME SSD 的優勢主要包括:(1)
58、更高的性能:NVMe over Fabric 可以提供比傳統網絡存儲更高的性能。(2)更低的延遲:NVMe over Fabric 可以提供比傳統網絡存儲更低的延遲,因為它消除了數據通過 CPU 的傳輸路徑。(3)更高的可擴展性:NVMe over Fabric 可以支持多路連接,從而可以提供更高的存儲容量和更大的帶寬。Nvidia 還開發了 GPU Direct Storage 技術,允許 GPU 直接訪問 NVMe SSD,從而進一步提高 AI 應用的性能。咨詢機構 Markets And Markets 預計受人工智能技術、物聯網、數據安全等多種需求推動,NVMe 市場規模將從 2020
59、 年的 446 億美元增長至 2025 年的 1635 億美元,年均復合增速達 29.7%;NVME 出貨的上行也將帶動高性能 PCIE 接口的需求增長。圖圖 2727 NVMENVME 市場規模市場規模(億美元)(億美元)圖圖 2828 NVMENVME 帶動帶動 PCIEPCIE 接口出貨上行接口出貨上行 資料來源:Markets And Markets、湘財證券研究所 資料來源:IDC、湘財證券研究所 3 3 投資建議投資建議 AI 大模型領域競爭的加劇疊加 AI 大模型參數的持續增長,推動大模型訓練端的算力平臺從依賴單一計算機的算力逐漸演變為依賴計算集群,催生了優化算力集群間跨服務器信
60、息傳輸效率的需求。計算集群數量的提升,持續提振 AI 加速器(GPU、FPGA、ASIC)的市場需求。算力集群間跨服務器傳輸效率的優化會推升 Infiniband 及 RoCE 網絡方案的市場滲透率,高性能 IB 交換機、以太網交換機,IB 網卡、以太網智能網卡、DPU,NVMe SSD 等多種半導體硬件需求有望中長期受益。建議持續關注半導體行業,維持行業“增持”評級。05001000150020002020Y2025ECAGR:29.7%20 敬請閱讀末頁之重要聲明 行業研究 4 4 風險提示風險提示 下游需求不及預期;企業新產品研發落地進展不及預期;政策支持力度不及預期。敬請閱讀末頁之重要
61、聲明 湘財證券投資評級體系(市場比較基準為滬深湘財證券投資評級體系(市場比較基準為滬深 300 指數)指數)買入:買入:未來 6-12 個月的投資收益率領先市場基準指數 15%以上;增持:增持:未來 6-12 個月的投資收益率領先市場基準指數 5%至 15%;中性:中性:未來 6-12 個月的投資收益率與市場基準指數的變動幅度相差-5%至 5%;減持:減持:未來 6-12 個月的投資收益率落后市場基準指數 5%以上;賣出:賣出:未來 6-12 個月的投資收益率落后市場基準指數 15%以上。重要聲明重要聲明 湘財證券股份有限公司經中國證券監督管理委員會核準,取得證券投資咨詢業務許可。本研究報告僅
62、供湘財證券股份有限公司的客戶使用。本公司不會因接收人收到本報告而視其為客戶。本報告由湘財證券股份有限公司研究所編寫,以合法地獲得盡可能可靠、準確、完整的信息為基礎,但對上述信息的來源、準確性及完整性不作任何保證。湘財證券研究所將隨時補充、修訂或更新有關信息,但未必發布。在任何情況下,報告中的信息或所表達的意見僅供參考,并不構成所述證券買賣的出價或征價,投資者應自主作出投資決策并自行承擔投資風險,任何形式的分享證券投資收益或者分擔證券投資損失書面或口頭承諾均為無效。本公司及其關聯機構、雇員對使用本報告及其內容所引發的任何直接或間接損失概不負責。投資者應明白并理解投資證券及投資產品的目的和當中的風
63、險。在決定投資前,如有需要,投資者務必向專業人士咨詢并謹慎抉擇。在法律允許的情況下,我公司的關聯機構可能會持有報告中涉及的公司所發行的證券并進行交易,并可能為這些公司正在提供或爭取提供多種金融服務。本報告版權僅為湘財證券股份有限公司所有。未經本公司事先書面許可,任何機構和個人不得以任何形式翻版、復制、發布、轉發或引用本報告的任何部分。如征得本公司同意進行引用、刊發的,需在允許的范圍內使用,并注明出處為“湘財證券研究所”,且不得對本報告進行任何有悖原意的引用、刪節和修改。如未經本公司授權,私自轉載或者轉發本報告,所引起的一切后果及法律責任由私自轉載或轉發者承擔。本公司并保留追究其法律責任的權利。分析師聲明分析師聲明 本人具有中國證券業協會授予的證券投資咨詢執業資格并注冊為證券分析師,以獨立誠信、謹慎客觀、勤勉盡職、公正公平準則出具本報告。本報告準確清晰地反映了本人的研究觀點。本人不曾因,不因,也將不會因本報告中的具體推薦意見或觀點而直接或間接收到任何形式的補償。