《國產算力行業深度:驅動因素、國產替代、產業鏈及相關企業深度梳理-240315(31頁).pdf》由會員分享,可在線閱讀,更多相關《國產算力行業深度:驅動因素、國產替代、產業鏈及相關企業深度梳理-240315(31頁).pdf(31頁珍藏版)》請在三個皮匠報告上搜索。
1、 1/31 2024 年年 3 月月 15 日日行業行業|深度深度|研究報告研究報告 行業研究報告 慧博智能投研 國產算力行業深度:驅動因素、國產替代、產業鏈及相關企業深度梳理國產算力行業深度:驅動因素、國產替代、產業鏈及相關企業深度梳理 當前,我國算力需求大、國產化率極低,替代空間廣闊。根據工信部發言,2024-2025 年我國算力規模規劃增長將超 100EFLOPS,對應 AI 算力芯片市場規模超 2600 億元,其中智能算力將成為主要增量部分。賽道空間巨大但國產化率極低,目前 GPU 國產化率不足 10%,互聯網等商用 AI 芯片幾乎完全依賴進口。另一方面,大國 AI 競爭背景下,美國出
2、口管制進一步升級,國產芯片替代的緊迫性提升,算力國產化大勢所趨。在此形勢下,國產算力廠商有望迎歷史性機遇,加速進入發展新篇章。以下我們將圍繞國產算力的角度,對國內算力產業發展的現況及趨勢進行分析。當前我國算力行業發展現況如何?有哪些驅動因素?在美國限令持續升級的情況下,國產替代有何進展?算力產業鏈整體情況如何?我國算力國產替代背景下,凸顯出來哪些產業機遇?相應的企業有哪些?以及算力發展趨勢如何?市場空間有多大?針對以上問題,我們將逐一解析,以幫助大家加深對國產算力認知,更好地了解相關問題。目錄目錄 一、行業概況.1 二、驅動因素.3 三、國產替代.7 四、產業鏈分析.11 五、市場機遇及相關企
3、業.14 六、發展趨勢.20 七、市場空間.28 八、參考研報.31 一、行業概況一、行業概況 1、算力是智能世界的基礎,基礎設施從云向算泛在演進、算力是智能世界的基礎,基礎設施從云向算泛在演進智能世界三要素智能世界三要素:數據、算力、算法是智能世界三要素,其中算力平臺是核心基礎。算力算力:即計算能力。算力是通過對信息數據進行處理,實現目標結果輸出的計算能力。2/31 2024 年年 3 月月 15 日日 行業行業|深度深度|研究報告研究報告 算力兩大類算力兩大類:通用算力、HPC(高性能計算,High-performance computing)算力。其中通用算力計算量小,用于常規應用。HP
4、C 算力是一個計算機集群系統,通過各種互聯技術將多個計算機系統連接在一起,利用所有被連接系統的綜合計算能力來處理大型計算問題。算力基礎設施從云向算泛在演進,其位置的分布從中心向邊緣和端側泛在延伸,將出現云、邊、端三級算力架構。2、算力是未來經濟發展基石算力是未來經濟發展基石,對經濟發展影響深遠,對經濟發展影響深遠 算力是未來經濟發展基石算力是未來經濟發展基石。算力對國家經濟發展影響深遠,據 IDC2021-2022 全球計算力指數評估報告數據,平均算力每提高 1 點,數字經濟和 GDP 將分別增長 3.5和 1.8。算力作為數字經濟時代的關鍵生產力要素,已經成為推動數字經濟發展的核心支撐力和驅
5、動力。當一個國家的計算力指數達到40 分/60 分以上時,對 GDP 增長的推動力將提高 1.5/3 倍。從下游細分來看,人工智能計算和邊緣計算成為市場增長重要力量,將引領算力進入新一輪快速增長通道。3、算力全面國產化時代已提前到來算力全面國產化時代已提前到來,從宏觀視角看主要體現在兩個方面從宏觀視角看主要體現在兩個方面 算力全面國產化時代已提前到來算力全面國產化時代已提前到來。算力的基本載體是服務器,服務器的核心部件為 CPU 和類 GPU 等計算芯片,經過多年的技術積累和市場打磨,我國國產 CPU 已從“可用”進入“好用”階段,以運營商和金融為代表的大客戶正有序進行信創服務器的集采和規?;?/p>
6、應用;隨著新一輪 AI 算力升級的浪潮興起以及國際局勢的迅速變化,AI 算力芯片的國產化時點已提前到來。從宏觀視角來看,數字經濟下的算力主要體現在兩個方面:wWmVjZfXjWjZlW9P9RaQoMpPmOqMjMpPtQlOnPnN8OmNpPMYrNtPwMoOsQ 3/31 2024 年年 3 月月 15 日日 行業行業|深度深度|研究報告研究報告 一方面,數字產業化進程中,需要對相關硬件進行投資,建立數據處理、分析等數據中心,來生產能夠實現海量數據計算的算力服務。另一方面,產業數字化進程中,需要滿足各實體產業生產過程中的算力需求。實體企業生產部門的算力需求,既包含了對硬件層面的需求,
7、例如通過通用服務器、AI 加速服務器或存儲設備等硬件設施,由實體企業自行搭建數據中心將算力引入生產過程等;又包含了對服務層面的需求,例如通過租賃公有云、算法服務、數據服務等算力服務實現生產數據的大規模存儲與計算等功能。4、我國算力市場空間大,國產化率有望快速提升我國算力市場空間大,國產化率有望快速提升 政策面,我國陸續出臺全國一體化大數據中心協同創新體系算力樞紐實施方案、算力基礎設施高質量發展行動計劃、“十四五”數字經濟發展規劃等一系列文件推動算力基礎設施建設。此外,國家推動多地智算中心建設,由東向西逐步擴展。當前我國超過 30 個城市正在建設或提出建設智算中心,據科技部出臺政策要求,“混合部
8、署的公共算力平臺中,自主研發芯片所提供的算力標稱值占比不低于60%,并優先使用國產開發框架,使用率不低于 60%”,國產 AI 芯片滲透率有望快速提升。據 IDC 數據我國智能算力未來將快速增長,2021 年到 2026 年期間中國智能算力規模年復合增長率達 52.3%。二、二、驅動因素驅動因素 1、ChatGPT 掀起掀起 AI 大模型熱潮,拉升算力需求大模型熱潮,拉升算力需求 ChatGPT 引起引起 AI 大模型熱潮,大模型熱潮,AI 算力需求高增算力需求高增。2022 年 11 月 30 日,OpenAI 發布了 ChatGPT 聊天機器人程序,2023 年 3 月,發布新一代語言模型
9、 GPT-4,自此 AI 進入“大模型時代”。與此同時,國內大模型也陸續正式上線。8 月 31 日,百度百度、字節字節、商湯商湯、中科院旗下紫東太初紫東太初、百川智能百川智能、智譜華章智譜華章等 8 家企業/機構的大模型,位列首批通過生成式人工智能服務管理暫行辦法備案的名單,正式上線開始面向公眾提供服務。據百度官方平臺數據顯示,文心一言開放首日下載量破百萬,回答了 3342萬個問題。4/31 2024 年年 3 月月 15 日日 行業行業|深度深度|研究報告研究報告 人工智能大模型訓練數據量巨大,對算力尤其是智能算力需求龐大,且將在未來持續高增長,驅動全社人工智能大模型訓練數據量巨大,對算力尤
10、其是智能算力需求龐大,且將在未來持續高增長,驅動全社會算力產業的快速發展會算力產業的快速發展。以 GPT 大模型為例,GPT-3 模型參數約為 1746 億個,訓練一次需要的總算力為 3640PF-days,而新一代 GPT-4 模型參數量將達到 1.8 萬億個,算力需求提高 68 倍。ChatGPT 的轟動引發全球人工智能大模型訓練及應用的浪潮,驅動算力需求進入爆炸式增長階段。尤其是針對人工智能的智能算力,更成為了算力產業未來發展的重要方向。2、MR、車載等數字經濟新型應用場景帶來新的算力需求、車載等數字經濟新型應用場景帶來新的算力需求 MR 的推出更帶來對低延時網絡傳輸和底層算力技術升級的
11、需求的推出更帶來對低延時網絡傳輸和底層算力技術升級的需求。虛擬世界需要強大的圖像實時渲染能力、計算和存儲海量數據資源,頭顯交互設備的出現將進一步增加對云計算和邊緣計算的應用需求。云計算能將終端渲染逐步遷移至云端,基于規模效應攤低運算成本,提升服務器使用效率,提升虛擬世界的可進入性。而邊緣計算則更能滿足實時數據分析需求、緩解中心云的計算負載。汽車智能化需求持續升級帶來數據流量的急劇飆升汽車智能化需求持續升級帶來數據流量的急劇飆升。隨著自動駕駛等級提升,車載信息娛樂系統、長續航電池及 5G 網絡的引入,車輛要面對的計算量越來越大,網絡架構升級、本地實時處理能力、“大容量緩存和存儲”規格將成為硬需求
12、。3、國際環境國際環境:美國加強限制規則,海外高性能芯片進口受限美國加強限制規則,海外高性能芯片進口受限,將反向驅,將反向驅動我國產業發展動我國產業發展 5/31 2024 年年 3 月月 15 日日 行業行業|深度深度|研究報告研究報告 從“性能指標”到“性能密度指標”,英偉達高端芯片進口受限范圍擴大從“性能指標”到“性能密度指標”,英偉達高端芯片進口受限范圍擴大。2023 年 10 月 17 日,美國商務部出臺出口管制清單的 ECNN3A090 和 4A090 要求,以進一步限制高性能 AI 芯片的出口,同時將13 家中國公司列入實體清單。修改后的出國管制設計產品包括但不限于:英偉達 A1
13、00、A800、H100、H800、L40、L40S 以及 RTX4090 產品。實際上,任何集成了一個或多個及以上的芯片的系統,包括但不限于英偉達 DGX、HGX 系統,都在新規涵蓋范圍之內。此前,2022 年 8 月 26 日,美國政府要求英偉達停止向中國(包括中國香港)出口兩款用于人工智能發展的高端計算芯片,涉及英偉達 A100 和 H100 兩款芯片,以及未來推出峰值性能等同或超過 A100 的其他芯片。同時,英偉達應用這些高性能芯片的系統級產品也均在新的管制范圍內。2022 年 9 月 1 日,英偉達發布聲明稱美國政府允許英偉達在 2023 年 9 月 1 日前,通過公司的香港工廠履
14、行 A100 和 H100的訂單和物流運輸,但售賣給中國的終端客戶仍需要受美國政府批準。限制強度加大,新增多款芯片受到新規限制限制強度加大,新增多款芯片受到新規限制。根據英偉達主要芯片規格,可以計算每種芯片的性能密度指標。在新規發布之前,超過舊規性能指標限制的芯片僅為英偉達 A100,但當加入性能密度指標后,新規不僅限制了廠商出略低于性能標準的芯片以規避限制情況,同時針對數據中心芯片與非數據中心芯片進行了不同的限制約定,使更多的英偉達芯片受到禁令限制。4、國內國內政策政策:我國國家和地方我國國家和地方政策持續加碼,國產算力強勢崛起政策持續加碼,國產算力強勢崛起 政策持續加碼,助力國產算力強勢崛
15、起政策持續加碼,助力國產算力強勢崛起:在拜登政府計劃阻止英偉達等出口高性能 AI 芯片之后,我國政策力度明顯加強,國家層面,例如算力基礎設施高質量發展行動計劃,省市層面,例如深圳市等地,可以明顯看到國家對于國產算力的的支持力度,同樣也側面反映 AI 算力的重要性。6/31 2024 年年 3 月月 15 日日 行業行業|深度深度|研究報告研究報告 國家層面國家層面:2023 年 10 月 8 日,工業和信息化部、中央網絡安全和信息化委員會辦公室、教育部、國家衛生健康委員會、中國人民銀行、國務院國有資產監督管理委員會發布算力基礎設施高質量發展行動計劃的通知,自計算力、運載力、存儲力、應用賦能四方
16、面提出建設目標。地方層面地方層面:2023 年 12 月 5 日,深圳市工業和信息化局關于印發深圳市算力基礎設施高質量發展行動計劃(2024-2025)的通知。其中要求,到 2025 年,全市基本形成空間布局科學合理,規模體量與極速先鋒城市建設需求相匹配,計算力、運載力、存儲力及應用賦能等方面與數字經濟高質量發展相適應,綠色低碳和自主可控水平顯著提升的先進算力基礎設施布局,構建通用、智能、超算和邊緣計算協同發展的多元算力供給體系。此外,除算力建設外,算網一體化政策同樣頻出此外,除算力建設外,算網一體化政策同樣頻出:2023 年 12 月 15 日,國家發展改革委、國家數據局、中央網信辦、工業和
17、信息化部、國家能源局發布關于深入實施“東數西算”工程加快構建全國一體化算力網的實施意見,其中重點強調算力是數字經濟時代的新型生產力。算力網是支撐數字經濟高質量發展的關鍵基礎設施,可通過網絡連接多源異構、海量泛在算力,實現資源高效調度、設施綠色低碳、算力靈活供給、服務智能隨需。在國家政策的強力支持下,我國算力產業有望呈現爆發式增長。7/31 2024 年年 3 月月 15 日日 行業行業|深度深度|研究報告研究報告 三、三、國產替代國產替代 1、美禁令持續升級,美禁令持續升級,倒逼國產化提速倒逼國產化提速 美國美國 AI 禁令再升級,禁令再升級,GPU 成管制焦點,倒逼國產化提速成管制焦點,倒逼
18、國產化提速。美國商務部工業和安全局(BIS)于 2023年 10 月 17 日發布新規,旨在進一步遏制中國等國家的芯片與人工智能發展,主要包括收緊高算力芯片出口、擴大半導體制造管控、在實體清單中增加更多中國 GPU 企業。具體內容包括:芯片出口芯片出口:使用三個標準來規定禁止向中國出口的芯片,包括芯片的總算力(TPP)、性能密度(PD)以及芯片的設計或銷售是否用于數據中心。該禁令使得 A800、H800 等曾經的中國特供版 GPU 無法再出口至中國,甚至影響到消費類 GPU:RTX4090。制造管控制造管控:擴大對半導體制造設備的管制如 DUV 光刻機,以及擴大代工廠審查芯片設計文件的地域限制
19、等。實體清單實體清單:在“實體清單”上新增 13 家中國企業,主要包括壁仞科技壁仞科技、摩爾線程摩爾線程等 GPU 公司,為這些公司制造芯片需要 BIS 的許可。美國連續多年出臺相關法規禁令來限制中國大陸半導體發展,包括定點打擊、本國補貼、出口管控等各類措施,此次禁令便是對 2022 年 8 月芯片禁令的升級,英偉達 A800、H800 均為當時禁令后推出的中國特供版 GPU,降低了算力和互聯帶寬,但如今亦被限制。8/31 2024 年年 3 月月 15 日日 行業行業|深度深度|研究報告研究報告 英偉達中國市場特供版芯片性能進一步閹割,國產英偉達中國市場特供版芯片性能進一步閹割,國產 AI
20、發展受阻發展受阻。針對美國新一波禁令限制,英偉達試圖開發符合美國政府政策且不需要許可證的新數據中心產品,將推出 H20、L20 等型號。根據騰訊科技新聞,H20 目前公布的參數規格,其單卡算力為 0.148P(FP16),大約為 A100 的 50%/H100 的 15%,配 6 顆 HBM3e,96G 容量,NVLink 提升到 900G/s。單卡算力的大幅下降,對國產 AI 廠商而言,相較 A/H800,需采購更多數量的 H20 以滿足模型訓練要求。此外,H20 單卡算力較低,可能難以滿足千億參數級 LLM 模型訓練,將更適用于垂類模型的訓練及推理。單卡性能的不足以及資本開支的上升,將很可
21、能倒逼國產 AI 下游廠商加速國產替代。受禁令影響,英偉達受禁令影響,英偉達 2023 年四季度中國大陸收入環比大幅下滑年四季度中國大陸收入環比大幅下滑。受出口管制影響,英偉達在中國市場收入逐漸萎縮,23 年三季度英偉達在中國大陸收入達 40.3 億美元,環比增長 47%,四季度僅為 19.5 億美元,環比下滑 52%。四季度中國大陸占英偉達總營收 8.8%,創歷史新低,此外官方預期下季度占比將保持這一區間。9/31 2024 年年 3 月月 15 日日 行業行業|深度深度|研究報告研究報告 2、Chiplet 技術技術取得突破性進展,取得突破性進展,在芯片國產化道路上具有降本提效作用在芯片國
22、產化道路上具有降本提效作用 目前芯片產業鏈上,我國相關技術積累與海外對比仍處于滯后狀態,在芯片國產化浪潮下,芯片技術有望取得突破性進展,從而助推國內打破海外的技術封鎖。國產化市場增量空間大。Chiplet 技術是一種芯片異構集成技術,能夠顯著提高芯片良率和性能,降低成本和芯片制造中稀缺資技術是一種芯片異構集成技術,能夠顯著提高芯片良率和性能,降低成本和芯片制造中稀缺資源的占用率源的占用率。目前國內有三家公司宣布掌握 Chiplet 技術,分別是通富微電通富微電、長電科長電科技和華天科技華天科技。Chiplet 的技術底座之一是芯片互聯協議。2022 年 2 月,英特爾等十家巨頭公司成立了芯片互
23、聯協議產業聯盟 UCIe 聯盟,致力于打造統一的芯片上下游生態鏈。2023 年 1 月 13 日,中國計算機互連技術聯盟(CCITA)發布小芯片接口總線技術要求,構建了符合中國芯片業實情的互聯標準,既能夠有效預防國際技術封鎖,也為國產芯片行業從 IP 設計到封測的全產業鏈提供了價值增長點。3、國內產業進展可觀,、國內產業進展可觀,國內大模型發展國內大模型發展需求為國產替代增添需求為國產替代增添動力動力 近年來國產近年來國產 AI 芯片進展可觀,本次美國芯片禁令以及國內大模型發展需求為國產替代增添新動力芯片進展可觀,本次美國芯片禁令以及國內大模型發展需求為國產替代增添新動力。目前國內領先 AI
24、芯片廠商包括華為海思華為海思、寒武紀寒武紀、海光信海光信息、壁仞科技壁仞科技、燧原科技燧原科技、沐曦集成電路沐曦集成電路、摩摩爾線程爾線程、天數智芯天數智芯等,部分國產旗艦級產品在算力方面已對標英偉達 A100 等國際領先產品,在內存與互聯等方面也接近國際先進水平。據路透社,英偉達 H20 在某些關鍵領域的 FP32 性能表現不如華為昇騰 910B 產品,但在互連速率方面會比 910B 更具優勢。憑借優異的產品性能,國產芯片廠商逐步獲下游客戶認可憑借優異的產品性能,國產芯片廠商逐步獲下游客戶認可。據中國基金報報道,百度百度為 200 臺服務器訂購了 1600 片昇騰 910B。截至 23 年
25、10 月,華為華為已向百度交付了超過 60%的訂單;科大訊飛科大訊飛在2023Q3 業績說明會表示,公司已于 23 年初與華為昇騰啟動專項攻關,華為發布的昇騰 910B 能力已經基本做到可對標英偉達 A100。除華為昇騰外,寒武紀思元 590、海光深算 3 號等產品也處于積極推進。10/31 2024 年年 3 月月 15 日日 行業行業|深度深度|研究報告研究報告 在美方對華制裁壓力下,H20 為紅線內國內能夠采購的最高端芯片,國產芯片持續迭代將有望超越其性能效果,完善國產算力基礎建設。4、以華為昇騰為首的國產算力迅速填補需求空缺,重點行業國產算力替以華為昇騰為首的國產算力迅速填補需求空缺,
26、重點行業國產算力替換提速換提速(1)NVIDIA GPU 出口管控趨嚴,以華為昇騰為首的國產出口管控趨嚴,以華為昇騰為首的國產 AI 芯片迅速填補需求空缺芯片迅速填補需求空缺 NVIDIA GPU 管控趨嚴,以華為昇騰為首的國產管控趨嚴,以華為昇騰為首的國產 AI 芯片迅速填補需求空缺芯片迅速填補需求空缺。隨著 NVIDIA GPU 管控趨嚴,以華為昇騰為首的國產 AI 芯片成為國內算力基礎設施建設的重要選擇,快速填補 NVIDIA GPU的市場需求空缺。能力側能力側:華為昇騰 910 芯片 FP16 算力已達 320TFLOPS、INT8 算力達到 640TOPS,與 NVIDIA A100
27、 80GB 版本旗鼓相當,并已落地千卡集群項目,且 2023 年 9 月發布的 Atlas 900 SuperCluster 利用華為全新星河 AI 智算交換機 CloudEngine XH16800,可實現等效 18,000 張卡的超大規模無收斂集群組網,在單卡算力與組網能力方面已可以滿足國內智算網絡的建設需求。需求側需求側:客戶受限于美國芯片出口管制,對于國產 AI 芯片的需求不斷提升,華為昇騰等國產算力的占比快速提升。根據全球半導體觀察及路透社消息,國內客戶對于昇騰 910B 等國產 AI 芯片的需求激增,2023 年昇騰910B 已經獲得大客戶至少 5,000 套訂單,預計將于 202
28、4 年交付。(2)全面自主可控大趨勢下,重點行業國產算力替換明顯提速全面自主可控大趨勢下,重點行業國產算力替換明顯提速 自主可控大趨勢下,國內各行業集采的國產化替代持續推進自主可控大趨勢下,國內各行業集采的國產化替代持續推進。在全面自主可控大趨勢下,以鯤鵬、海光、飛騰為代表的國產 CPU 服務器與以昇騰為代表的國產 GPU 服務器在運營商、金融、能源等重點行業側份額持續提升。運營商側運營商側:通用服務器方面:2022 年三大運營商 PC 服務器集采中,國產 CPU 服務器占比達 37.10%,較 2020 年集采同比提升 5.97pct,其中鯤鵬服務器占比基本保持穩定,海光服務器占比同比提升6
29、.50pct。2024 年 2 月,中國移動中國移動發布2024 年 PC 服務器產品集中采購招標公告,預估采購規模為26.45 萬臺,其中 Arm+X86 服務器采購總數為 12.15 萬臺,預計占比 47.34%(去除未公布的 8,000 臺服務器),其中 Arm 服務器或以鯤鵬服務器為主,X86 服務器或以海光服務器為主。AI 服務器方面服務器方面:2023 年 10 月,中國電信 AI 算力服務器(2023-2024 年)集中采購項目中標候選人正式公示,中國電信國電信此次集采共分為 4 個標包 4,175 臺 AI 服務器,其中鯤鵬服務器占比達 47.35%。11/31 2024 年年
30、 3 月月 15 日日 行業行業|深度深度|研究報告研究報告 其他重點行業方面其他重點行業方面:金融行業側金融行業側:2023 年金融行業國產服務器采購數量明顯提升,2023H2 采購大單頻出。2023 年下半年金融行業國產服務器采購速度明顯加快,單筆采購數量皆為千臺、萬臺規模,中中信銀行信銀行、中國農業銀行中國農業銀行單筆服務器采購額皆為 40 余億,顯現出金融行業國產化替代的需求較為旺盛。能源行業側能源行業側:2023 年中國石化中國石化服務器采購中國產服務器占比達 41.55%。2023 年 8 月,中國石化發布信息化基礎設施項目招標公告,采購國產 CPU 服務器 1,500 臺,占總服
31、務器采購份額的 41.55%。四、產業鏈分析四、產業鏈分析 1、算力產業鏈構成算力產業鏈構成 算力產業鏈涵蓋由基礎硬件、基礎軟件、基礎設施構成的上游產業,由第三方數據中心、云計算服務、網絡運營服務、IT 外包服務、系統集成服務構成的中游產業,由互聯網、制造業、金融、能源等各行業企業用戶構成的下游產業。12/31 2024 年年 3 月月 15 日日 行業行業|深度深度|研究報告研究報告 算力下游各類業務場景中智能硬件、工業設備、智能汽車等多類型終端大量接入網絡,對計算實時性、可靠性、吞吐能力、能耗等的要求愈發復雜,算力需求規模不斷擴張的同時,呈現出明顯的專用化、邊緣化、智能化等特點,以通用計算
32、為主的傳統計算范式已然無法滿足需求,將驅動算力供給側不斷提高對需求的適配性,構建由通用算力、智能算力、高性能算力、邊緣算力等構成的多元算力供給體系。2、國內算力產業鏈的三大體系國內算力產業鏈的三大體系 在國內,算力產業鏈整體屬于生產制造業,經過多年發展,上下游廠商往往存在較為密切的股權/業務關系,可分為如下體系:中科院系中科院系以海光為核心芯片,以中科曙光中科曙光及 ODM 為主要整機廠的 x86 信創服務器體系,兼容性好;華為系華為系以鯤鵬+昇騰為核心芯片,以華為華為硬件生態合作伙伴(四川長虹四川長虹、高新發展高新發展、寶德寶德、超聚變超聚變、神州數碼神州數碼、烽火通信烽火通信、拓維信息拓維
33、信息等)為主要整機廠的 Arm 信創服務器體系,自主可控程度更高;中電子系中電子系以飛騰為核心芯片,以中國長城中國長城為主要整機廠的 Arm 信創服務器體系,自主可控程度高;整體上看,我國正在逐步完善產業鏈和生態,以應對日趨復雜的國際局勢整體上看,我國正在逐步完善產業鏈和生態,以應對日趨復雜的國際局勢。3、重點環節分析、重點環節分析(1)服務器拆分服務器拆分芯片組芯片組 BOM 占比最高占比最高 服務器的硬件主要包括:處理器、內存、芯片組、I/O(RAID 卡、網卡、HBA 卡)、硬盤、機箱、電源、風扇。在硬件的成本構成上,CPU 及芯片組、內存、外部存儲是大頭。以一臺普通的服務器生產成本為例
34、,CPU 及芯片組大致占比 50%左右,內存大致占比 15%左右,外部存儲大致占比 10%左右,其他硬件占比 25%左右。13/31 2024 年年 3 月月 15 日日 行業行業|深度深度|研究報告研究報告 (2)服務器市場現狀:國內服務器龍頭主要受益英偉達服務器市場現狀:國內服務器龍頭主要受益英偉達 全球 AI 服務器市場采購主要為全球云計算及互聯網廠商,前四家海外巨頭采購占比 66%,其余為國內互聯網廠商,其中字節跳動字節跳動占比 6%。伴隨全球巨頭大力發展自身大模型,未來其采購算力將大幅增長。全球服務器行業格局層面,主要是 ODM 廠(如工業富聯)及品牌商(如戴爾、HPE、聯想、浪潮等
35、),在 AI 服務器方面,國內浪潮信息浪潮信息份額較高,其次為戴爾戴爾、HPE、聯想聯想、華為華為、IBM 等,當然在 AI 服務器領域不得不提行業龍頭微軟微軟、AWS、DELL、HPE 的 ODM/OEM 廠商工業富聯工業富聯,是全球云服務商的服務器主力供應商之一。(3)數據中心拆分數據中心拆分 14/31 2024 年年 3 月月 15 日日 行業行業|深度深度|研究報告研究報告 五五、市場機遇及相關企業市場機遇及相關企業 隨著智能計算資源需求的大幅增加,AI 芯片、AI 服務器以及云計算算力需求將持續提升,相關廠商有望受益。1、AI 芯片需求上漲,國產替代在即芯片需求上漲,國產替代在即
36、AI 需要多元異構算力提供支持,拉動需要多元異構算力提供支持,拉動 AI 芯片需求芯片需求。人工智能算法需要從海量的圖像、語音、視頻等非結構化數據中挖掘信息。從大模型的訓練、場景化的微調以及推理應用場景,都需要算力支撐。而以CPU 為主的通用計算能力已經無法滿足多場景的 AI 需求。以 CPU+AI 芯片(GPU、FPGA、ASIC)提供的異構算力,并行計算能力優越、具有高互聯帶寬,可以支持 AI 計算效力實現最大化,成為智能計算的主流解決方案。服務器中的 CPU 和 AI 卡的數量并不固定,會根據客戶應用需求調整,對于 AI 服務器來講,較為常見的是配備 2 個 CPU,以及八個 AI 卡。
37、而相比于 AI 服務器,傳統的通用服務器則以CPU 為主。因此,AI 的發展將極大拉動 GPGPU、TPU、NPU 等 AI 芯片的需求。中國中國 AI 芯片市場將保持高速增長,芯片市場將保持高速增長,AI 推理芯片份額有望持續提升,國產化推理芯片份額有望持續提升,國產化 AI 芯片占比有望提升芯片占比有望提升。2022 年,中國的 AI 芯片市場規模約 385 億元。隨著 AI 發展以及智算中心建設浪潮,該市場預計將保持高增長趨勢。據艾瑞咨詢測算,到 2027 年,中國的 AI 芯片市場規模預計將達到 2164 億元。另外,在我國高性能及 AI 服務器中,GPGPU 憑借其優越的性能和通用能
38、力占比 92%,剩下份額由 AISC 和FPGA 分享。隨著 AI 模型的優化落地,AI 推理芯片的占比將日益提升。據艾瑞咨詢,2022 年,中國AI 訓練芯片以及 AI 推理芯片的占比分別為 47.2%和 52.8%。預計 2027 年,中國 AI 訓練芯片與推理芯片的比例將分別達到 23.7%與 76.3%。相比于 AI 訓練芯片,推理芯片的性能要求以及精度要求較低,部分國產 AI 芯片憑借其良好性能以及性價比能夠滿足推理端的需求,我國 AI 芯片國產化占比有望提升。(1)海光信息:海光信息:國產芯片之光,深算芯片性能卓越國產芯片之光,深算芯片性能卓越 公司公司 DCU 基于基于 GPU
39、架構,軟件生態完善架構,軟件生態完善。海光 DCU 系列產品以 GPGPU 架構為基礎,軟件生態完善兼容通用的“類 CUDA”環境,可廣泛應用于大數據處理、人工智能、商業計算等應用領域,主要部署 15/31 2024 年年 3 月月 15 日日 行業行業|深度深度|研究報告研究報告 在服務器集群或數據中心,為應用程序提供高性能、高能效比的算力,支撐高復雜度和高吞吐量的數據處理任務。典型應用場景下,海光深算系列芯片達到國際上同類型高端產品水平典型應用場景下,海光深算系列芯片達到國際上同類型高端產品水平。海光 DCU1 采用 FinFET 工藝,同時支持全精度和半精度訓練,國內市場相對稀缺;DCU
40、2 已量產,實現了在大數據、人工智能、商業計算等領域的商用。相較于深算一號,深算二號的性能實現了翻倍增長。海光海光 DCU 某些硬件性能與英偉達的某些硬件性能與英偉達的 A100、AMD 的的 MI100 相近相近。海光 DCU 雙精度計算能力突出。據北京大學高性能計算系統中標公告(HCZB-2021-ZB0364),海光信息的 DCUZ100 的通用計算核心達到 8192 個。其關鍵性能指標實現:FP6410.8TFlops,顯存 32GB HBM2,對比全球芯片巨頭的高端AI 芯片不遑多讓。英偉達 A100 的相關指標為:FP649.7TFlops、顯存 40/80GB HBM2。AMDM
41、I100的相關指標為:FP6411.5TFlops、顯存 32GB HBM2。2022 年,海光發布國內首個全精度(年,海光發布國內首個全精度(FP64)異構計算平臺)異構計算平臺,該平臺搭載 CPU 海光三號和 DCU 海光深算,涵蓋數值模擬、AI 訓練、AI 推理所需的多樣算力,實現了智能計算與數值運算的深度融合。同時,此平臺可全面支持 TensorFlow、PyTorch、Caffe2 等主流 AI 深度學習框架,目前已超過 1000 種應用軟件部署在該平臺上。16/31 2024 年年 3 月月 15 日日 行業行業|深度深度|研究報告研究報告(2)華為)華為:昇騰引領國產自主:昇騰引
42、領國產自主 AI 生態生態 華為基于自研達芬奇架構架構,推出了華為基于自研達芬奇架構架構,推出了 AI 訓練芯片昇騰訓練芯片昇騰 910 與與 AI 推理芯片昇騰推理芯片昇騰 310:昇騰 910 基于自研華為達芬奇架構 3D Cube 技術,架構靈活伸縮,支持云邊端全棧全場景應用。算力方面,半精度(FP16)算力達到 320TFLOPS,整數精度(INT8)算力達到 640TOPS,功耗 310W,主要用于訓練場景。昇騰 310 是一款高能效、靈活可編程的人工智能處理器,在典型配置下可以輸出 16TOPSINT8,8TOPSFP16,功耗僅為 8W,主要應用于推理場景。華為構建了昇騰計算引擎
43、 CANN、AI 開發框架 MindSpore,以及 AI 開發平臺 ModelArts,為大模型開發和運行提供分布式并行加速、算子和編譯優化、集群級通信優化等關鍵能力。CANN:搭建了從上層深度學習框架到底層 AI 硬件的橋梁,可對標英偉達 CUDA。近期更新至異構計算架構 CANN7.0,支持華為昇思 MindSpore、PaddlePaddle、PyTorch、TensorFlow、Caffe、Jittor等主流 AI 框架。MindSpore:對標 TensorFlow、PyTorch、PaddlePaddle 等流行深度學習框架。截至 2023 年 6 月,MindSpore 已兼容
44、適配 20 余家芯片廠商伙伴的硬件設備,支持 Ascend/GPU/CPU 等,大幅降低 AI 開發門檻。昇騰加入昇騰加入 PyTorch 社區社區共建,生態進一步擴容共建,生態進一步擴容。10 月 18 日,華為作為 Premier 最高級別會員正式加入全球 AI 開源框架 PyTorch 社區,PyTorch2.1 版本已同步支持昇騰 NPU,開發者可直接在 PyTorch 2.1 上基于昇騰進行模型開發?;?PyTorch,昇騰已經適配了 BLOOM、GPT-3、LLaMA 等業界主流大模型。2、中國中國 AI 服務器市場有望快速增長服務器市場有望快速增長 中國加速服務器市場有望快速增
45、長,中國加速服務器市場有望快速增長,GPU 服務器仍占主導,非服務器仍占主導,非 GPU 服務器增長迅速服務器增長迅速。據 IDC,2021年,中國加速服務器市場規模達到 53.9 億美元,同比增長 68.6%。其中,GPU 服務器仍然占據主導地 17/31 2024 年年 3 月月 15 日日 行業行業|深度深度|研究報告研究報告 位,市場份額近 90%。與此同時,NPU、ASIC 和 FPGA 等非 GPU 加速服務器以 43.8%的增速實現了11.6%的市場份額,達到 6.3 億美元。另外,IDC 預測,到 2026 年,中國加速計算服務器市場將達到103.4 億美元。(1)浪潮信息:全
46、球浪潮信息:全球 AI 服務器第一大品牌商服務器第一大品牌商 浪潮電子信息產業股份有限公司是浪潮集團有限公司旗下三家上市公司之一,是全球領先的浪潮電子信息產業股份有限公司是浪潮集團有限公司旗下三家上市公司之一,是全球領先的 IT 基礎架基礎架構產品、方案及服務提供商構產品、方案及服務提供商。公司主要從事服務器等云計算基礎設施產品的研發、生產和銷售,業務覆蓋計算、存儲、網絡三大關鍵領域,提供包括云計算、大數據、人工智能、邊緣計算等全方位數字化解決方案。公司以“智慧計算”為戰略,構建開放融合的計算生態,為客戶構建滿足多樣化場景的智慧計算平臺,全面賦能傳統產業的數字化、智能化轉型與變革,重視算力基礎
47、設施的建設和發展,為中國數字經濟發展提供充足的算力支持。浪潮集團被美國列入實體清單,浪潮信息更改注冊地址免于受限浪潮集團被美國列入實體清單,浪潮信息更改注冊地址免于受限。2023 年 3 月 6 月,美國將浪潮信息的控股股東浪潮集團新列入商務部實體清單。該實體清單明確列出了浪潮集團的地址,即中國山東省濟南市浪潮路 1036 號。浪潮信息原本的公司注冊地與浪潮集團相同。為應對此次制裁,2023 年 3 月 6 日,浪潮發布公告,修改公司注冊地址為“濟南高新區新濼大街 1768 號齊魯軟件園大廈 B 座 B302”,希望在此次實體清單事件的受到的影響盡可能減小。浪潮信息的浪潮信息的 AI 服務器在
48、世界市場和中國市場均蟬聯第一位,是服務器在世界市場和中國市場均蟬聯第一位,是 AI 服務器行業的頂尖巨頭服務器行業的頂尖巨頭。根據國際數據公司 IDC 發布的 2021H2全球人工智能市場半年度追蹤報告,2021H1 全球 AI 服務器市場規模156 億美元,浪潮信息在世界 AI 服務器市場占有率達 20.9%,份額同比提升 3.6pct,銷售額同比增長68.3%,蟬聯全球第一。另外,據 IDC 發布的2021 年下半年度(H2)中國加速計算服務器市場報告,在中國市場,浪潮 AI 服務器占有率達 52.5%,連續 5 年保持中國 AI 服務器市場份額超過 50%。(2)拓維信息:深度融入華為體
49、系,控股湘江鯤鵬布局算力產業拓維信息:深度融入華為體系,控股湘江鯤鵬布局算力產業 拓維信息深度融入華為體系,控股湘江鯤鵬布局算力產業拓維信息深度融入華為體系,控股湘江鯤鵬布局算力產業。拓維信息成立于 1996 年,以湖南為總部,業務涵蓋軟件服務、智能計算、開源鴻蒙操作系統,服務運營商、考試、交通、制造、教育等行業 18/31 2024 年年 3 月月 15 日日 行業行業|深度深度|研究報告研究報告 1500+政企客戶。2019 年,拓維信息牽頭成立湘江鯤鵬,布局智能計算產業,根據天眼查數據,目前持有其 75%的股份。湘江鯤鵬以湘江鯤鵬以“鯤鵬鯤鵬+昇騰昇騰”為技術底座,為多行業提供數字化方案
50、為技術底座,為多行業提供數字化方案。公司以鯤鵬處理器、昇騰處理器為技術底座,研發和生產國產自主品牌的“兆瀚”硬件智能計算產品,構建以臺式機、人工智能產品、通用服務器、軟硬一體產品為核心的兆瀚計算產品矩陣,滿足各行業、各新技術發展下對多樣性算力的需求。作為湖南省專精特新“小巨人”企業,聯合華為在湖南打造首個“硬件+軟件”的鯤鵬生態基地。目前,公司產品和解決方案廣泛應用于全國 22+省份、50+城市,為客戶提供超十萬臺智能計算產品及服務,支持黨政、運營商、金融、交通、電力、醫療、教育等領域數字化轉型。3、眾多廠商積極布局眾多廠商積極布局“云上云上”AI 算力算力 基于云計算的基于云計算的 AI 能
51、力逐步得到驗證。用云服務提供能力逐步得到驗證。用云服務提供 AI 算力的方式可以減少部署和管理本地計算基礎算力的方式可以減少部署和管理本地計算基礎設施的復雜性。隨著設施的復雜性。隨著 AI 技術的發展,中國的技術的發展,中國的 AI 公有云服務業隨之增長公有云服務業隨之增長。目前,中國 AI 公有云服務廠商市場格局較為穩定。據 IDC,2022H1,百度智能云在中國 AI 公有云服務市場占比第一,阿里云位居第二,且與第一名差距逐漸減小。華為云、騰訊云緊跟其后,市場份額不斷提升。除了頭部云廠商,優優刻得刻得、深桑達深桑達旗下中國電子云等第三方中立廠商也有望參與 AI 云服務,持續受益于 AI 算
52、力需求的提升。(1)中科曙光:人工智能云計算平臺提供穩定高效算力中科曙光:人工智能云計算平臺提供穩定高效算力 19/31 2024 年年 3 月月 15 日日 行業行業|深度深度|研究報告研究報告 曙光人工智能云計算平臺提供一站式深度學習訓練與實時推理曙光人工智能云計算平臺提供一站式深度學習訓練與實時推理。曙光人工智能云計算平臺解決方案可以提供基于云的 GPU 計算服務。該系統以主流深度學習框架為基礎,支持 Caffe、TensorFlow 等多種主流深度學習框架。該平臺與 Kubernetes 和 Docker 容器技術相結合,提供實驗環境、離線任務和在線服務三大功能,支持業務從模型研究、批
53、量訓練到在線預測的全流程打通。該解決方案提供一站式深度學習訓練/實時推理、圖形圖像處理以及科學計算等,大大簡化了企業構建深度學習平臺的難度,提高了資源使用率,降低了業務投入成本,使用戶更加專注于深度學習應用本身,是目前性價比最高的整體 AI訓練與推理解決方案之一。(2)深桑達:建立中國電子云,致力建設自研數據底座深桑達:建立中國電子云,致力建設自研數據底座 以以 PKS 技術架構體系為基,深桑達成立中國電子云,提供安全算力服務技術架構體系為基,深桑達成立中國電子云,提供安全算力服務。中國電子云成立于 2021 年,是深桑達以中國電子 PKS 自主安全計算體系為底座建立的數據基礎設施,包含國產化
54、自研可信的計算架構和分布式云原生操作系統,提供涵蓋 IaaS、PaaS 和 SaaS 能力的專屬公有云服務。中國電子云依托的PKS 體系脫胎于中國電子多年的深厚技術積累,名稱中的“P”代表飛騰 CPU,“K”指的是麒麟操作系統,“S”即安全,中國電子云的自研原生技術架構是保障其安全性的最大依托,體系中使用的飛騰 CPU 和麒麟操作系統均為中國電子自主研發,同時中國電子云交付的 60%硬件設備基于國產芯片,有效防范過度依賴進口芯片帶來的斷供危險。憑借著在安全方面的出眾表現,PKS 體系在信創領域具備最大的市場份額,飛騰 CPU 達到 74%的市場份額,麒麟操作系統甚至高達 87%。20/31 2
55、024 年年 3 月月 15 日日 行業行業|深度深度|研究報告研究報告 國資云賦予中國電子云獨特信任優勢,與智源研究院聯手探索本土硬件適配,助力實現智能算力國產國資云賦予中國電子云獨特信任優勢,與智源研究院聯手探索本土硬件適配,助力實現智能算力國產化化。隨著云計算領域不斷發展推進,政務機構和大型國企催生了巨額上云需求,市場份額不斷擴張,發展空間廣闊。云計算開源產業聯盟數據顯示,2021 年我國政務云市場規模達 802.6 億元,預計 2023 年將增長至 1203.9 億元。而中國電子云脫胎于中國電子,出身天生賦予其國內政企領域的充分信任,且自研架構也從技術角度保障了安全性,有效防范后門風險
56、、漏洞風險和斷供風險,保障業務過程中的“本質安全+過程安全”。但目前,中國電子云底層硬件中大比例使用的國產芯片在實現應用遷移時面臨挑戰,一定程度上阻礙了原生架構的建設,難以實現完備的智能算力本土替代化。為建立更完備的自研技術體系,中國電子云與智源研究院智源研究院聯手,共同建立“大模型國產算力云平臺開放實驗室”,合作探索實現國產CPU 的大模型適配部署,未來有望以國產算力支撐 AI 領域的算力需求。六、發展趨勢六、發展趨勢 1、算力國產化算力國產化或為艱難但唯一可選或為艱難但唯一可選長期發展路徑長期發展路徑(1)中美中美 AI 產業算力層存在差距,算力問題凸顯產業算力層存在差距,算力問題凸顯 美
57、國為本輪美國為本輪 AI 浪潮引領者浪潮引領者。從 AI 產業的層級看,自下而上包含算力,算法,應用多個層級,其中算力為 AI 浪潮的底層支撐,算法為 AI 浪潮的重要突破,應用為 AI 浪潮的直接體現。從算力、算法、應用端看,美國在本輪 AI 浪潮中處于引領者位置,具備先發優勢。算力端算力端:美國頭部廠商如英偉達基于GPU 產品打造了 CUDA 生態,將 GPU 能力推向通用計算場景。英偉達打造了 H100 等重要產品,成為本次 AI 浪潮重要算力支撐。算法端算法端:算法層面重要突破同樣由美國引領,GPT 底層架構 Transformer由谷歌首先提出,此外 OpenAI 團隊將 GPT 模
58、型參數量不斷增大,模型進一步涌現出更強的能力。應用應用端端:美國頭部廠商首先將 GPT 為代表的 LLM 能力接入應用,微軟、salesforce 等廠商率先實現了LLM+應用的商業化定價及應用。中美中美 AI 產業在多個層級上均存在一定差距產業在多個層級上均存在一定差距。橫向對比中美 AI 產業,在多個層級上均存在一定的差距。算力端算力端:中美 AI 芯片產品存在算力性能及生態差距,此外在芯片的生產端,核心環節如芯片的設計、流片等均由海外主導;算法端算法端:海外在基礎研究方面較為領先,如谷歌發布底層架構 Transformer 成為GPT 模型的重要基礎。此外海外算法具備先發優勢,在迭代次數
59、上也具備一定優勢;應用端應用端:海外頭部應用多已成為行業標準,擁有較為良好的用戶基礎,有助于 LLM+產品的快速落地,如辦公領域的微軟 21/31 2024 年年 3 月月 15 日日 行業行業|深度深度|研究報告研究報告 Office 產品;此外海外頭部廠商往往基于核心產品打造了完整的產品矩陣及平臺,使 AI 能力的接入具備豐富的場景。算力是中美算力是中美 AI 產業具備重要差距的環節產業具備重要差距的環節。在算法、算力、應用端,中美均存在一定差距,而其中算力層面的差距較為關鍵,主要原因:差距大小差距大??;差距大小反映的是當前靜態狀態下的差距。當前應用端中美均處于從產品化向商業化過渡的階段,
60、算法端通用大模型中 GPT 處于領先地位,但國內同樣擁有眾多大模型逐步實現產品化,有望持續迭代,而算力端國內的算力產品在落地方面與海外頭部廠商相比仍較為落后;追趕難度追趕難度;算力端的核心環節均受海外主導,且規避管制的方式較為有限,此外海外頭部算力廠商圍繞自身產品形成了包含應用、算法的生態壁壘,短期難以突破;差距的影響差距的影響:算力處于基礎支撐地位,直接影響模型的落地和應用的推廣進度。22/31 2024 年年 3 月月 15 日日 行業行業|深度深度|研究報告研究報告 美國法案限制高性能美國法案限制高性能 AI 芯片獲取,算力問題逐步凸顯芯片獲取,算力問題逐步凸顯。2023 年 10 月
61、17 日,美國商務部工業與安全局(BIS)發布針對中國的先進計算及半導體制造物項出口限制,在 2022 年 10 月已公布的出口限制基礎上,進一步升級限制力度。具體來看,本次出口限制主要涉及對高性能芯片的限制,既包括對高性能芯片的出口限制,也包括對國產 GPU 企業的生產流片限制。本次出口限制不再以互聯帶寬為限制標準,新增總處理性能 TPP(Total Processing Performance,即計算速度*字節長度)和性能密度 PD(Performance Density,即每平方毫米的 TPP)兩項要求,具體限制方案:TPP4800 的芯片、TPP1600 且 PD5.92 芯片,屬于高
62、性能芯片,不再被允許出口;4800TPP2400 且 5.92PD1.6的芯片、TPP1600 且 5.92PD3.2 的芯片,屬于次高性能芯片,需要通知 BIS 以獲得例外許可。在美國限制法案的影響下,國內算力問題逐步凸顯。解決算力問題存在多種路徑解決算力問題存在多種路徑。當前國內解決算力問題存在多種路徑。短期內我國廠商在 AI 芯片設計、工藝、生態等方面與英偉達等海外頭部廠商相比還有著一定差距,因此短期內解決算力問題可以通過利用存量可得資源的方式解決,包括:基于現有可用產品;算力租賃?;诂F有可用產品需要海外廠商推出符合法律法規要求的算力產品,算力租賃則是向具有 GPU 資源的廠商租賃 G
63、PU 算力,最大化利用存量資源。而拉長時間維度后,國產自研 AI 芯片才最有可能成為國內 AI 產業發展的重要支撐。(2)算力國產化是長期發力方向算力國產化是長期發力方向 國產國產 AIGPU 性能較英偉達先進產品仍有差距性能較英偉達先進產品仍有差距。根據目前已公開的數據,國產 AIGPU 芯片中,性能表現較好的產品主要包括華為昇騰的 Atlas300T、寒武紀的思元 370、海光的深算一號等。其中基于昇騰910 設計的 Atlas 300T 算力性能較強,FP16 計算性能在不考慮稀疏技術情況下約為英偉達 A800SXM的 90%。但考慮到組網技術、軟件生態等競爭壁壘,國內 GPU 產品較英
64、偉達方案在實際有效算力層面仍存在較大差距。且考慮到英偉達 H 系列算力性能更強、下一代 B 系列產品也已發布規劃,國產 GPU仍需加速追趕海外步伐。23/31 2024 年年 3 月月 15 日日 行業行業|深度深度|研究報告研究報告 卡間互聯速率影響組網效果,國內廠商已接近卡間互聯速率影響組網效果,國內廠商已接近 A800(NVLink3.0)水準)水準。大模型的訓練和推理需要大算力的支持,無論國產 GPU 還是海外 GPU 都需要基于服務器硬件進行大規模組網才能滿足相應需求。而組網過程中,卡間互聯傳輸速率往往成為制約有效算力充分發揮的重要因素。以英偉達為例,NVLink3.0 版本可以實現
65、最高 600GB/s 的傳輸速率,但在國內特供版 A800 上只能實現 400GB/s 的速度,制約了有效算力的發揮。從國內 GPU 企業來看,寒武紀寒武紀、華為華為、海光信息海光信息等均針對自有產品開發了相應互聯技術,但互聯速率都在 400GB/s 以下,最高為華為昇騰 910B(392GB/s),已接近 A800(400GB/s)水準,但與 H100(900GB/s)等海外先進芯片的互聯水平相比,仍存在一定差距。大模型算力需求正加速增長,長期看算力缺口或仍存在大模型算力需求正加速增長,長期看算力缺口或仍存在。從大模型自身的發展過程來看,參數量的變化是一個非常值得關注的指標。從最早的 Res
66、Net、Inception 等模型,到如今的 GPT,模型參數量不斷增長。2018 年前后 OpenAI 先后推出 Transformer 和 GPT-1 模型,參數量來到 1 億級別。隨后谷歌提出 3億參數的 BERT 模型,參數量再次增長。2019、2020 年,OpenAI 加速追趕,陸續迭代出 GPT-2、GPT-3 模型,參數量分別為 15 億、1750 億,實現模型體量質的飛躍。模型參數量的非線性增長或將帶來算力需求的快速釋放,考慮到國內獲取先進算力芯片受限,長期來看,依賴海外芯片的算力租賃模式或也難以滿足算力需求。海外芯片持續迭代,長期來看算力國產化或為艱難但唯一可選路徑海外芯片
67、持續迭代,長期來看算力國產化或為艱難但唯一可選路徑。在大模型帶來算力需求日益增長的背景下,海外 AIGPU 廠商也在不斷迭代自身產品。如英偉達,其下一代產品 B100 預計將于 2024 年問世,在 H100 已經實現算力領先的情況下,或將進一步鞏固自身全球 AI 算力龍頭地位??紤]到國內雖然尚可獲得部分 A/H 系列產品的替代品,但隨著更先進算力芯片的推出,必然面臨無法獲得更好性能GPU 的問題?;诖?,算力國產化雖然在短期內成本較高,且需要克服組網性能、軟件生態等壁壘障礙,但長期來看,似乎是唯一可選路徑。隨著國產生態逐步培育,國產算力性能提升有望幫助國產 GPU 廠商逐步提升國內市場份額。
68、24/31 2024 年年 3 月月 15 日日 行業行業|深度深度|研究報告研究報告 2、國內國內 AI 芯片市場格局或發生改變,國產芯片市場格局或發生改變,國產 AI 芯片及相關生態廠商有望芯片及相關生態廠商有望實現超預期發展實現超預期發展 美國出口管制新規給海外芯片產品限定了性能天花板,從中長期來看可能會對中國美國出口管制新規給海外芯片產品限定了性能天花板,從中長期來看可能會對中國 AI 芯片市場格局產芯片市場格局產生深遠影響生深遠影響。最近幾年,英偉達一直在中國 AI 芯片市場中占據了絕對主導地位,根據 IDC 的統計數據,2020 年及 2021 年英偉達分別占據中國 AI 芯片出貨
69、量的 75%及 80%以上,2022 年以英偉達為主的海外芯片出貨量占比達 85%,2023 年上半年受 AI 芯片禁令下囤貨需求的激發,海外芯片出貨量占比進一步提高至 90%,其市場份額呈現持續提高的態勢。英偉達能夠在中國 AI 芯片市場上持續獲得成功,或主要得益于其強大的芯片性能和軟件生態兩大因素。一方面,英偉達憑借著暢通的先進制程代工渠道,能夠保持每 2 年左右進行一次 AI 芯片架構及工藝制程的升級,從而使其 AI 芯片性能不斷躍升。而國產 AI 芯片公司在美國制裁措施的影響下,無法使用先進制程進行芯片的生產與迭代,與英偉達芯片在計算性能上的剪刀差持續拉大。另一方面,英偉達具有強大的
70、CUDA 軟件生態架構,目前市場上最主流的 AI 框架都圍繞 CUDA 生態展開。英偉達在硬件和軟件上的雙重優勢形成了良性循環,更高的計算性能吸引更多的用戶使用,從而吸引更多的 AI 應用開發者,從而再反哺硬件銷售,二者相互促進,使其市場競爭力不斷增強,市場份額持續提高。然而美國政府此次更新的出口管制新規給海外芯片產品限定了一個明確的算力性能天花板,對英偉達等海外芯片廠商來說相當于自斷一臂。新規規定只要總計算性能達到 4800 或者性能密度達到 5.92 及以上便默認拒絕對中國出口,總計算性能指標相當于將海外芯片的 FP16 算力限定在不超過 300TFLOPS,25/31 2024 年年 3
71、 月月 15 日日 行業行業|深度深度|研究報告研究報告 性能密度指標使得采用先進工藝提升芯片集成度的意義也大幅下降。因此未來如果該管制措施不做修改或取消,海外 AI 芯片的算力性能天花板或已經鎖定,為國產 AI 芯片實現算力性能趕超提供客觀條件,同時海外芯片通過集群互聯方式提高整體計算能力帶來的高額成本也不容忽視,所以從中長期來看,海外芯片廠商的市場優勢可能將逐漸喪失。以華為昇騰為代表的國產以華為昇騰為代表的國產 AI 芯片持續迭代,國內互聯網大客戶正在適配,未來有望實現超預期發展芯片持續迭代,國內互聯網大客戶正在適配,未來有望實現超預期發展。2019 年 3 季度,華為華為發布了面向數據中
72、心場景的 AI 訓練芯片昇騰 910,根據華為官方披露的消息,該芯片采用華為自研的達芬奇架構及 7nm 工藝,FP16 算力達到 256TFLOPS,最大功耗為 310W。但后續由于英偉達在 2020 年及 2022 年推出了性能更強的 A100 及 H100 芯片,且華為的產能受到代工制裁的沖擊,昇騰 910 未能在市場上占據主導地位。盡管面臨著嚴格的代工制裁,華為仍在不斷推動芯片設計的迭代及產能的恢復。根據科大訊飛科大訊飛董事長劉慶峰 2023 年 8 月份的公開演講,基于華為昇騰 910B 芯片打造的全國產化算力底座的單卡性能已經可以對標英偉達 A100,由于 A100 的 FP16 算
73、力達到312TFLOPS,據此可以推測昇騰 910B 芯片的 FP16 算力或許已經接近 312TFLOPS,這已經達到了出口管制新規下海外芯片性能的天花板。如果未來華為能繼續推動芯片的迭代,其在中國市場上與海外芯片的性能差距將反向拉開,國產芯片有望成為性能領先一方。根據華為官網信息,2023 年 8 月 16 日華為華為與百百度度聯合發起飛漿+文心大模型硬件生態共創計劃,雙方將共同推動昇騰 AI 與飛漿+文心大模型的適配,充分發揮軟硬件協同優勢,便利開發者和用戶,促進更多 AI 應用落地,實現惠普 AI。百度飛漿是國內最主流的國產深度學習框架之一,百度文心大模型則是領先的國產大模型之一?;ヂ?/p>
74、網大客戶開始適配國產 AI 芯片生態具有重要意義,互聯網行業是我國 AI服務器最重要的下游客戶,IDC 數據顯示過去幾年互聯網行業占據國內 AI 服務器 50%-60%的下游需求?;ヂ摼W大客戶擁有廣泛且優質的 AI 應用場景,并擁有先進的 AI 應用開發框架及經驗,有望快速推動國產 AI 芯片軟件生態的發展壯大,復刻英偉達軟硬件生態良性互動的成長路徑,推動國產 AI 芯片及相關生態廠商超預期發展。3、華為昇騰產業鏈有望受益華為昇騰產業鏈有望受益 26/31 2024 年年 3 月月 15 日日 行業行業|深度深度|研究報告研究報告 華為是中國算力的重要力量,擁有完整的算力芯片體系華為是中國算力
75、的重要力量,擁有完整的算力芯片體系。旗下鯤鵬、昇騰兩大核心芯片族,均是基于ARMV8 永久授權架構下的自研芯片族。其中,鯤鵬包括服務器和 PC 機芯片,昇騰 AI 芯片包括訓練和推理芯片。依托“鯤鵬+昇騰”雙底座,華為打造出了“算、存、傳、管、智”五個子系統的芯片族,實現了計算芯片領域的全面自研。目前,華為是業界僅有的同時擁有這五類關鍵芯片的廠商,在我國芯片領域具有極強的競爭力。華為針對人工智能領域應用場景,在華為針對人工智能領域應用場景,在 2018 年的華為全鏈接年的華為全鏈接 2018 大會上推出了昇騰系列大會上推出了昇騰系列(HUAWEI Ascend)芯片,主要產品有昇騰芯片,主要產
76、品有昇騰 310 與昇騰與昇騰 910。昇騰 310 芯片是一款高能效、靈活可編程的人工智能處理器,芯片在典型配置下可以輸出 16TOPSINT8,8TOPSFP16,功耗僅為 8W。昇騰 310 芯片采用自研華為達芬奇架構,集成豐富的計算單元,提高 AI 計算完備度和效率,進而擴展該芯片的適用性。芯片實現了全 AI 業務流程加速,大幅提高 AI 全系統的性能,有效降低部署成本。昇騰 910 是業界算力最強的 AI 處理器,芯片基于自研華為達芬奇架構 3D Cube 技術,實現業界極佳 AI 性能與能效。芯片架構靈活伸縮,支持云邊端全棧全場景應用。在算力方面,昇騰 910 完全達到設計規格,半
77、精度(FP16)算力達到 320TFLOPS,整數精度(INT8)算力達到 640TOPS,功耗 310W。據艾瑞咨詢發布的2021 年中國人工智能芯片市場研究報告顯示,2020 年華為昇騰 AI 芯片市場份額達到 26.3%,已經成為中國市場份額領先的人工智能芯片廠商之一。華為昇騰已經構建起覆蓋各個主要環節的產業生態華為昇騰已經構建起覆蓋各個主要環節的產業生態。華為的昇騰計算產業是基于昇騰系列處理器和基礎軟件構建的全棧 AI 計算基礎設施、行業應用及服務,包括昇騰系列處理器、系列硬件、CANN(Compute Architecturefor NeuraI Networks,異構計算架構)、A
78、I 計算框架、應用使能、開發工具鏈、管理運維工具、行業應用及服務等全產業鏈。27/31 2024 年年 3 月月 15 日日 行業行業|深度深度|研究報告研究報告 同時,華為構建了同時,華為構建了“一云兩翼、雙引擎一云兩翼、雙引擎”的產業布局,構筑開放的產業生態的產業布局,構筑開放的產業生態。一云(華為云)一云(華為云):通過全棧創新,為開發者提供安全可靠的云服務以及開發體系。兩翼(智能計算兩翼(智能計算&智能數據與存儲)智能數據與存儲):在智能計算領域,面向端、邊、云,提供“鯤鵬+昇騰+x86+GPU”的多樣性算力。在智能數據與存儲領域,融合了存儲、大數據、數據庫、AI,圍繞數據的全生命周期
79、,讓數據的每比特成本最優、讓數據的每比特價值最大。雙引擎(鯤鵬雙引擎(鯤鵬+昇騰)昇騰):圍繞鯤鵬與昇騰兩大核心基礎芯片加速,構筑滿足未來算力需求的異構計算架構。開發生態開發生態:硬件開發、軟件開源,使能合作伙伴,共建開放的產業生態。28/31 2024 年年 3 月月 15 日日 行業行業|深度深度|研究報告研究報告 昇騰芯片性能較優,華為昇騰芯片性能較優,華為 AI 服務器有望率先受益于國內服務器有望率先受益于國內 AI 發展而快速擴張發展而快速擴張。昇騰整機硬件伙伴為擁有自有品牌產品,能在昇騰產品基礎上二次開發或加工生產,并銷售與服務至最終用戶的合作伙伴。寶寶德德、華鯤振宇華鯤振宇、長江
80、計算長江計算在內的昇騰服務器伙伴可享受 AI 紅利而持續擴張。七、市場空間七、市場空間 1、數據量增長帶來算力需求提升,智能算力規模有望快速增長數據量增長帶來算力需求提升,智能算力規模有望快速增長 數據海量增加,算法模型愈加復雜,應用場景的深入和發展,帶來了對算力需求的快速提升數據海量增加,算法模型愈加復雜,應用場景的深入和發展,帶來了對算力需求的快速提升。根據白皮書數據顯示,從 2012 年開始的 6 年中,Al 計算的需求增加了 30 萬倍。29/31 2024 年年 3 月月 15 日日 行業行業|深度深度|研究報告研究報告 根據根據 IDC 測算,國內智能算力規模正在高速增長測算,國內
81、智能算力規模正在高速增長,2021 年中國智能算力規模達 155.2 每秒百億億次浮點運算(EFLOPS),2022 年智能算力規模將達到 268.0EFLOPS,預計到 2026 年智能算力規模將進入每秒十萬億億次浮點計算(ZFLOPS)級別,達到 1,271.4EFLOPS。2021-2026 年期間,預計中國智能算力規模年復合增長率達 52.3%。通用算力規模也正在高速增長通用算力規模也正在高速增長,根據 IDC 測算,2021 年中國通用算力規模達 47.7EFLOPS,預計到2026 年通用算力規模將達到 111.3EFLOPS。2021-2026 年期間,預計中國通用算力規模年復合
82、增長率為 18.5%。2、算力算力層面層面 AI 芯片和服務器市場規模也將保持快速增長芯片和服務器市場規模也將保持快速增長 AI 包括人工智能芯片、服務器、計算架構、算法及應用等方面,以下我們主要關注算力層面,即 AI 芯片和服務器。全球市場:全球人工智能技術發展逐漸成熟,數字化基礎設施不斷建設完善,推動全球人工智能芯片市全球市場:全球人工智能技術發展逐漸成熟,數字化基礎設施不斷建設完善,推動全球人工智能芯片市場高速增長場高速增長。IDC 全球范圍調研顯示,人工智能芯片搭載率(attachrate)將持續增高。根據 Tractica、寒武紀招股書相關數據,全球人工智能芯片 2022 年市場規模
83、預計約 395 億美金,預計到 2025 年將達到 726 億美金,年復合增長率達到 22%。30/31 2024 年年 3 月月 15 日日 行業行業|深度深度|研究報告研究報告 國內市場:國內市場:22-24 年復合增速有望達到年復合增速有望達到 46%。隨著大數據的發展和計算能力的提升,根據寒武紀寒武紀招股書,2022 年中國人工智能芯片市場規模預計達 368 億元,預計 2024 年市場規模將達到 785 億元,復合增速有望達到 46%。31/31 2024 年年 3 月月 15 日日行業行業|深度深度|研究報告研究報告 AI 服務器市場保持快速發展:國內服務器市場保持快速發展:國內
84、2021 年市場規模超年市場規模超 300 億元,增速近億元,增速近 70%。全球市場全球市場:根據IDC 發布的全球人工智能市場半年度追蹤報告顯示,2021 年全球人工智能服務器市場規模達 156.3億美元,約合人民幣 1045 億元,全球年度人工智能服務器市場首次突破千億元人民幣,同比 2020 年增速達 39%。其中,浪浪潮信息潮信息、戴爾戴爾、HPE 分別以 20.9%、13.0%、9.2%的市占率位列前三,三家廠商總市場份額占比達 43.1%。人工智能服務器市場預計將繼續高速增長,預計 2026 年全球人工智能服務器市場規模將達到 347.1 億美元,五年復合增長率為 17.3%。國
85、內市場國內市場:根據 IDC 數據,2021 年中國人工智能服務器市場規模達到 59.2 億美元,與 2020 年相比增長 68.2%,其中,浪潮信息浪潮信息、新華三新華三、寧暢寧暢、安擎安擎、華為華為等諸多中國廠商正加速推動人工智能基礎設施產品的優化更新。預計到 2026 年,中國人工智能服務器市場規模將達到 123.4 億美元。從工作負載角度而言從工作負載角度而言:企業將把精力更多從人工智能訓練轉移到人工智能推理工作負載上,根據 IDC 數據,2021 年中國數據中心用于推理的服務器的市場份額占比已經過半,達到 57.6%,預計到 2026 年,用于推理的工作負載將達到 62.2%。八、參
86、考研報八、參考研報 1.清華全球產業園&浪潮信息-計算機行業:中國算力發展觀察報告2.浙商證券-計算機行業算力框架報告:擁抱 AI 算力加速國產化時代3.華泰證券-計算機行業專題研究:關注算力租賃&算力國產化機會4.中泰證券-半導體行業 AI 系列之國產算力:01,重視產業鏈歷史機遇5.招商證券-通信行業數字經濟“算力網絡”系列 14:國央企加大算力基礎設施建設,國產算力大有可為6.華龍證券-計算機行業 2024 年度投資策略報告:國產算力持續筑基,AI 終端有望先行7.長江證券-軟件與服務行業:美芯片禁令下國產算力服務器的結構性機會8.國投證券-電子行業:AI 浪潮勢不可擋,昇騰發力鑄造國產算力基石9.國泰君安-計算機行業:英偉達緊急推出新品,長期看國產算力有望崛起10.民生證券-計算機行業深度報告:華為昇騰,國產 AI 算力“扛旗者”11.華西證券-計算機行業:科技拐點已至,算力打響反擊戰12.東方證券-計算機行業:AI 興起,智能算力浪潮來襲13.長江證券-計算機行業:從算力產業圖譜看不同環節的投資機會免責聲明:以上內容僅供學習交流,不構成投資建議。