1、 行業行業報告報告|行業深度研究行業深度研究 請務必閱讀正文之后的信息披露和免責申明 1 計算機計算機 證券證券研究報告研究報告 2024 年年 07 月月 07 日日 投資投資評級評級 行業行業評級評級 強于大市(維持評級)上次評級上次評級 強于大市 作者作者 繆欣君繆欣君 分析師 SAC 執業證書編號:S1110517080003 劉鑒劉鑒 聯系人 資料來源:聚源數據 相關報告相關報告 1 計算機-行業點評:央國企信創有望加速,信創迎來 2.0 階段 2024-06-30 2 計算機-行業專題研究:鴻蒙:AI 與OS 深度融合,開啟 OS Agent 新時代 2024-06-23 3 計算
2、機-行業點評:鴻蒙:華為 2024年“一號工程”,不止萬物互聯更是“AI+OS”2024-06-17 行業走勢圖行業走勢圖 乘大模型之風,乘大模型之風,AI 芯片元老寒武紀芯片元老寒武紀再度起航再度起航 大模型時代來臨,加速計算需求大幅增加大模型時代來臨,加速計算需求大幅增加 以 Transformer 結構為主的生成式帶動了加速計算的需求突破式增長,隨著Scaling law 的進一步拓展,Nvidia 數據中心的收入從 2024 財年 Q1 的 43 億美金增加至 2025 財年一季度的 226 億美金,同期超威電腦和 DELL 的 AI 服務器收入也大幅增加。我們預計未來針對訓練和推理的
3、 AI 算力需求有望長時間高景氣,據 IDC 及 TheNextPlatform 統計,2023 年全球 AI 服務器市場規模預計將超 500 億美元,2027 年預計將超 946 億美元。在這一場科技盛宴中,Nvidia 憑借前瞻的布局、CUDA 生態的壁壘、從 P100 到未來 R100 芯片的快速迭代以及完善的集群產品占據了主要的市場地位。美國限制疊加對美國限制疊加對 AI 算力的需求,自主可控的算力的需求,自主可控的 AI 芯片公司有望重新占領部芯片公司有望重新占領部分國內市場,寒武紀憑借優秀的軟硬件能力有望脫穎而出分國內市場,寒武紀憑借優秀的軟硬件能力有望脫穎而出 美國從 2022
4、年開始逐步加強對國產 AI 芯片的限制,從將國內 AI 芯片企業列入實體清單到限制 Nvidia 的芯片出口,國內企業獲取海外算力的難度日漸加大,同時從 2024 年開始,運營商和地方政府不斷加強對算力基礎設施的建設力度,政策上也在不斷扶持自主算力,在此背景下針對自主可控的 AI算力的需求呼之欲出。參考海外市場,在這一廣闊的市場機遇中,市場份額有望相對集中但難以一家獨大,除去英偉達,我們看到 Google 和 AMD 都在努力提升自身芯片的能力。寒武紀是寒武紀是 AI 芯片的元老,自芯片的元老,自 2016 年成立至今,從年成立至今,從 AI 芯片授權走向自研云芯片授權走向自研云端端 AI 芯
5、片并形成了完整的軟硬件產品與生態芯片并形成了完整的軟硬件產品與生態 寒武紀成立于 2016 年,創始人兼董事長陳天石博士在中科院時就參與到AI 芯片的學術前沿研究并發表多篇論文,Google 在隨后發表的論文中也參考了陳天石博士的研究成果。公司從芯片 IP授權起步,逐步設計并自研了包括邊緣產品線、云端產品線在內的多款芯片,并從底層自建了完善的軟件體系,包括底層 Runtime、構建算子的編程語言 BANG 和較為完備的算子庫。目前,智能計算集群系統業務和云端芯片構成了主要的收入來源,2023 年公司實現營業收入 7.09 億元。作為領先的國產 AI 芯片企業,寒武紀擁有較強的產品研發能力和較高
6、的市占率,在 AI 算力需求高速增長、自主可控的 AI 算力需求不斷加速、算力基礎設施有望加速建設的背景下,寒武紀有望成為國內自主 AI 算力供應商中的主要參與者。建議關注建議關注:自主 AI 算力的國內企業:寒武紀 風險風險提示提示:AI 算力景氣度下降的風險、公司產品供應端的風險、AI 芯片競爭加劇的風險、客戶集中度較高的風險 -40%-34%-28%-22%-16%-10%-4%2%2023-072023-112024-03計算機滬深300 行業行業報告報告|行業深度研究行業深度研究 請務必閱讀正文之后的信息披露和免責申明 2 內容目錄內容目錄 1.大模型時代來臨,加速計算需求突破式增長
7、大模型時代來臨,加速計算需求突破式增長.5 1.1.生成式 AI 帶動訓練和推理的 AI 芯片需求快速上升.5 1.1.1.Nvidia 數據中心與 AI 服務器廠商收入突破式增長.6 1.1.2.互聯網公司資本支出因 AI 逐步增加.7 1.2.Nvidia 軟硬件體系生態緊耦合,占據 AI 芯片主要份額.7 1.2.1.從 P100 到 R100,英偉達 8 年期間多次迭代 AI 芯片.7 1.2.2.CUDA 生態,強大的生態造就高壁壘.11 2.自自主可控帶來國產主可控帶來國產 AI芯片歷史機遇,寒武紀有望脫穎而出芯片歷史機遇,寒武紀有望脫穎而出.11 2.1.國內 AI 芯片與智算中
8、心急速增長.12 2.2.美國芯片禁令政策,自主算力政策扶持.13 2.3.對比海外,AI 芯片市場份額集中但難以一家獨大.15 3.AI 芯片元老,從芯片元老,從 IP 到芯片到芯片.15 3.1.從 IP 到自研芯片,寒武紀為 AI 芯片而生.15 3.2.核心團隊出自中科院,董事長長期耕耘 AI 芯片,引領產業方向.16 4.寒武紀技術能力優秀,具備寒武紀技術能力優秀,具備 AI 芯片完整軟硬件技術棧芯片完整軟硬件技術棧.19 4.1.通用智能芯片系統復雜,寒武紀具備軟硬件全棧技術.19 4.2.產品體系從 IP 到端側再到云端,軟硬件深度耦合.20 4.2.1.硬件覆蓋 IP 和云邊端
9、一體化產品,單芯片最大算力高達 256TOPS.21 4.2.2.Cambricon Neuware:從底層自建適配硬件的軟件生態.23 4.2.3.多芯互聯組網提升并行效率,實現多卡和分布式任務高效執行.24 4.3.智能計算集群貢獻主要收入,研發上更加聚焦,費用率逐步下降.24 4.4.寒武紀在軟/硬件生態綜合能力強,研發針對大模型實現多點突破.27 5.風險提示風險提示.28 圖表目錄圖表目錄 圖 1:Transformer 對 AI 芯片需求快速上升.5 圖 2:AI 高速增長下算力供給與需求的差距在加大.5 圖 3:2020-2027 全球 AI 服務器市場規模(百萬美元).6 圖
10、4:2022-2026 年全球 AI 服務器預估出貨量(千臺).6 圖 5:FY22Q2-FY25Q1 英偉達數據中心收入變化(億美元).6 圖 6:FY23Q1-FY24Q3 超微電腦服務器與存儲系統營收及 YOY.6 圖 7:FY23-FY25Q1 戴爾 AI 服務器營收及 YOY.6 圖 8:22Q2-24Q1 微軟、谷歌、Meta、亞馬遜資本支出對比.7 圖 9:8 年間英偉達 GPU 實現 1053 倍性能增長.7 圖 10:NVIDIANVLink演示圖.8 圖 11:NVLink 性能的迭代歷程.9 圖 12:NVSwitch 的規格迭代對比.10 8XbUeUdX9W9WdXc
11、W8O8Q8OsQqQpNsOlOoOtMlOnNyR9PmNoOwMnMnPNZqQpQ 行業行業報告報告|行業深度研究行業深度研究 請務必閱讀正文之后的信息披露和免責申明 3 圖 13:2007-2021 年全球超級計算機 500 強中 IB及其他網絡供應商技術占比.10 圖 14:NVIDIASpectrum-X 較傳統以太網 AI 性能提升 1.6 倍.11 圖 15:全棧優化的 NVIDIASpectrum-X.11 圖 16:CUDA 發展歷程的持續演進與優化.11 圖 17:2023-2027 年中國加速計算服務器市場預測.12 圖 18:2022-2027 年中國 AI 服務器
12、工作負載預測.12 圖 19:Nvidia/Google 等 AI 加速芯片市場的出貨量.15 圖 20:AI 加速芯片在數據中心市場的份額快速提升.15 圖 21:中科寒武紀發展歷程.16 圖 22:股權結構圖(截至 2024 年一季度末).16 圖 23:GoogleTPU 論文引用寒武紀相關工作的專門段落.17 圖 24:FY2019-FY2023 中科寒武紀研發人員數量及同比.18 圖 25:2023 年中科寒武紀研發人員學歷構成.18 圖 26:FY2020-FY2023 中科寒武紀研發費用(億元)及同比.18 圖 27:FY2019-FY2023 中科寒武紀人均研發費用(萬元)及同
13、比.18 圖 28:中科寒武紀主要產品線.20 圖 29:寒武紀基礎軟件系統平臺.21 圖 30:寒武紀 Cambricon Neuware 架構層級關系.23 圖 31:寒武紀訓練軟件平臺.23 圖 32:寒武紀全新推理加速引擎 MagicMind 結構.23 圖 31:MLU370-X8 中整合了雙芯片四芯粒思元 370.24 圖 32:FY2017-FY2024Q1 中科寒武紀收入(億元)及同比.25 圖 33:FY2021-FY2023 中科寒武紀分業務收入(億元).25 圖 34:FY2017-FY2023 中科寒武紀毛利率.25 圖 35:FY2017-FY2023 中科寒武紀凈利
14、潤(億元).25 圖 36:FY2019-FY2023 中科寒武紀期間費用率.25 圖 37:FY2019-FY2023 中科寒武紀研發費用(億元)及同比.25 圖 38:FY2017-FY2023 中科寒武紀經營凈現金流(億元)及同比.26 圖 39:FY2017-FY2023 中科寒武紀貨幣資金(億元)及同比.26 圖 40:FY2017-FY2023 中科寒武紀存貨(億元)及同比增長.26 圖 41:FY2017-FY2023 中科寒武紀預付款項(億元)及同比增長.26 圖 42:公司應對大模型挑戰實現的多點核心技術突破.28 表 1:P100、V100、A100、H100、GB200
15、規格參數對比.8 表 2:2024 年運營商與部分各地智算中心的招標公告.13 表 3:2022 年以來美國歷次針對算力的禁令.13 表 4:中央到地方政府出臺針對算力基礎設施的支持政策.14 表 5:公司董事簡介.16 表 6:陳天石博士及相關團隊早期相關工作.17 表 7:2023 年寒武紀推出的股權激勵計劃.19 行業行業報告報告|行業深度研究行業深度研究 請務必閱讀正文之后的信息披露和免責申明 4 表 8:中科寒武紀核心技術框架結構.19 表 9:寒武紀終端智能處理器 IP.21 表 10:寒武紀邊緣產品.22 表 11:寒武紀云端產品性能參數.22 表 12:寒武紀訓練整機產品.23
16、 表 15:寒武紀智能芯片技術及其先進性.27 行業行業報告報告|行業深度研究行業深度研究 請務必閱讀正文之后的信息披露和免責申明 5 1.大模型時代來臨,加速計算需求大模型時代來臨,加速計算需求突破式突破式增長增長 1.1.生成式生成式 AI 帶動訓練和推理的帶動訓練和推理的 AI 芯片需求快速上升芯片需求快速上升 Transformer 對對 AI 芯片需求快速上升,算力缺口持續擴大。芯片需求快速上升,算力缺口持續擴大。GPT 和 Sora 等基于 Transformer架構的生成式模型遵循規模效應(ScalingLaw)。ScalingLaw 由 OpenAI 于 2020 年提出,他們
17、認為基于 Transformer 的自然語言和其他模態的模型,其模型性能與模型參數量存在冪律關系。而模型參數量也與實施大模型訓練及部署硬件的計算存儲能力直接相關。OpenAI 公司在 2018 年對 AI 計算的趨勢與硬件發展趨勢做了分析,基于 Transformer 的 AI模型的算力需求增速遠大于傳統的 CNN 模型,并遠超依據摩爾定律的演進速度,硬件算力的增長速度與大模型所需的算力水平之間的差距越來越大。圖圖 1:Transformer對對 AI 芯片需求快速上升芯片需求快速上升 資料來源:摩崖芯公眾號,天風證券研究所 圖圖 2:AI 高速增長下算力供給與需求的差距在高速增長下算力供給與
18、需求的差距在加加大大 資料來源:天翼智庫公眾號、天風證券研究所 全球全球 AI 服務器出貨加速,預計服務器出貨加速,預計 26 年年 AI 服務器占比達服務器占比達 15%。據 IDC 及 TheNextPlatform 統計,2023 年全球 AI 服務器市場規模預計將超 500 億美元,2027 年預計將超 946 億美元,2023 年-2027 年 CAGR 達 17.41%。出貨量方面,根據 TrendForce 數據,2023 年 AI 服務器出貨量約 120 萬臺,占據服務器總出貨量的近 9%,年增長達 38.4%。預計 2026 年,AI 服務器出貨量為 237 萬臺,占比達 1
19、5%,復合年增長率預計保持 25%。行業行業報告報告|行業深度研究行業深度研究 請務必閱讀正文之后的信息披露和免責申明 6 圖圖 3:2020-2027全球全球 AI服務器市場規模(百萬美元)服務器市場規模(百萬美元)圖圖 4:2022-2026年全球年全球AI 服務器預估出貨量(千臺)服務器預估出貨量(千臺)資料來源:TheNextplatform、IDC,天風證券研究所 資料來源:TrendForce、半導體產業縱橫公眾號,天風證券研究所 1.1.1.Nvidia 數據中心與數據中心與 AI 服務器廠商收入服務器廠商收入突破式突破式增長增長 自自 FY24Q2 起,起,英偉達數據中心收入加
20、速增長英偉達數據中心收入加速增長,從 FY24Q1 的 43 億美元增長至 FY24Q2 的103 億美元,FY24Q2 同比增長率達 171%,主要系生成式 AI 競爭已經展開,各大云服務提供商發布了大型 NVIDIAH100AI 基礎架構,以及領先的企業 IT 系統和軟件提供商宣布與英偉達合作,將其 AI 技術引入各行各業。此后,在 FY24Q3、FY24Q4 和 FY25Q1 的同比增長率分別達到 282%、408%和 426%,使其在 FY25Q1 的收入達到 226 億美元。同時,超微電同時,超微電腦(腦(Supermicro)服務器與存儲系統的營收顯著增長,)服務器與存儲系統的營收
21、顯著增長,從 FY24Q1 的 19.67 億美元激增至Q3FY24 的 36.99 億美元,同比增長率高達 217.82%。此外,戴爾的 AI 服務器收入在 FY24達到 16.20 億美元,同比增長率達 625.48%,并在 FY25Q1 單季度營收高達 17 億美元,進一步表明了 AI 服務器市場的強勁需求。圖圖 5:FY22Q2-FY25Q1英偉達數據中心收入變化(億美元)英偉達數據中心收入變化(億美元)資料來源:Wind,天風證券研究所 圖圖 6:FY23Q1-FY24Q3超微電腦服務器與存儲系統營收及超微電腦服務器與存儲系統營收及 YOY 圖圖 7:FY23-FY25Q1戴爾戴爾
22、AI 服務器營收及服務器營收及 YOY 資料來源:VisibleAlpha,天風證券研究所 資料來源:VisibleAlpha,天風證券研究所 85511831504189523698.5%38.4%27.1%26.0%25.0%0%10%20%30%40%50%0500100015002000250020222023(E)2024(E)2025(E)2026(E)AI服務器出貨量YOY注:估算基礎包含搭載AI訓練、推論用的GPU、FPGA、ASIC等加速晶片24293338383836.24310314518422633%53%74%90%58%31%10%13%171%282%408%42
23、6%0%100%200%300%400%500%050100150200250Q2FY22Q3FY22Q4FY22Q1FY23Q2FY23Q3FY23Q4FY23Q1FY24Q2FY24Q3FY24Q4FY24Q1FY25數據中心營收(億美元)YOY1714166111642032196734363699101.57%68.44%1.56%37.11%14.80%106.85%217.82%0%50%100%150%200%250%05001000150020002500300035004000Q1FY23Q2FY23Q3FY23Q4FY23Q1FY24Q2FY24Q3FY24服務器與存儲系統
24、(百萬美元)YOY223.316201700625.48%0%100%200%300%400%500%600%700%020040060080010001200140016001800FY23FY24Q1 FY25AI服務器(百萬美元)YOY 行業行業報告報告|行業深度研究行業深度研究 請務必閱讀正文之后的信息披露和免責申明 7 1.1.2.互聯網公司資本支出因互聯網公司資本支出因 AI 逐步增加逐步增加 自自 2023 年年 Q2 起,起,以微軟、谷歌、亞馬遜、以微軟、谷歌、亞馬遜、Meta 為首的頭部互聯網公司資本支出為首的頭部互聯網公司資本支出整體呈整體呈上升趨勢上升趨勢,多數投向,多數
25、投向 AI 及云服務基礎設施及云服務基礎設施。其中微軟、谷歌資本支大幅增長,創下新高,微軟資本支出由 2022 年 Q2 的 69 億美元增長至 2024 年 Q1 的 110 億美元,近兩年 CAGR達 26.26%,主要用于通過融資租賃收購的資產來滿足云和 AI 產品的需求;谷歌資本支出由2022 年 Q2 的 68 億美元增長至 2024 年 Q1 的 120 億美元,近兩年 CAGR 達 32.84%,主要系其在云計算和 AI 模型算力需求上的大力投資,以保持技術基礎設施領域的領先地位;2024Q1 亞馬遜資本支出為 139 億美元,位居四大頭部互聯網公司第一,且公司宣布計劃在 202
26、4 年大幅增加資本支出,以推進 AWS 云服務和生成式 AI 技術。圖圖 8:22Q2-24Q1微軟、谷歌、微軟、谷歌、Meta、亞馬遜資本支出對比、亞馬遜資本支出對比 資料來源:Wind,天風證券研究所 1.2.Nvidia 軟硬件體系生態緊耦合,占據軟硬件體系生態緊耦合,占據 AI 芯片主要份額芯片主要份額 1.2.1.從從 P100 到到 R100,英偉達,英偉達 8 年期間多次迭代年期間多次迭代 AI 芯片芯片 P100 到到 B100,英偉達英偉達 GPU 性能性能實現超千倍性能增長。實現超千倍性能增長。英偉達數據中心產業從 PascalP100到 BlackwellB100 歷經
27、8 年演進,GPU 性能實現了 1053 倍的增長。性能增長部分得益于浮點精度的降低,從 PascalP100、VoltaV100 和 AmpereA100GPU 的 FP16 性能下降了四倍,轉變為 BlackwellB100 所使用的 FP4 格式。但對于大型語言模型訓練,精度的降低影響較小,主要得益于數據格式的優化、軟件處理的改進以及硬件中應用的復雜數學技術。B100 發布投產,預計發布投產,預計 2024 年年 H2 發貨。發貨。2024 年 3 月,英偉達發布了 BlackwellGPU 架構平臺,6 月 2 日,英偉達 CEO 黃仁勛在 COMPUTEX2024 宣布,英偉達 Bl
28、ackwell 芯片現已開始投產。預計 BlackwellB100 將在 24 年 H2 開始發貨,并持續供應至 2025 年,或將成為英偉達 24-25 年營收重要驅動。圖圖 9:8年間英偉達年間英偉達 GPU 實現實現 1053倍性能增長倍性能增長 69636366899997110769490686265776468731746369801101201411501541311041131341390501001502002022Q22022Q32022Q42023Q12023Q22023Q32023Q42024Q1微軟CAPEX(億美元)META CAPEX(億美元)谷歌CAPEX(億美
29、元)亞馬遜CAPEX(億美元)行業行業報告報告|行業深度研究行業深度研究 請務必閱讀正文之后的信息披露和免責申明 8 資料來源:半導體行業觀察公眾號,天風證券研究所 表表 1:P100、V100、A100、H100、GB200規格參數對比規格參數對比 NVLink 版本版本 P100 NVLink 版本版本 V100 A10080GBSXM H100SXM GB200Blackwell FP32 10.6TFLOPS 15.7TFLOPS 19.5TFLOPS 60TFLOPS 180TFLOPS FP64 5.3TFLOPS 7.8TFLOPS 9.7TFLOPS 30TFLOPS 90TF
30、LOPS GPU 顯存帶寬 732GB/s 900GB/s 2039GB/s 3TB/s 16TB/s 最大功耗 300w 400w 700w 資料來源:英偉達官網,天風證券研究所 多年積累多年積累卡間卡間互聯技術為集群搭建打造全面解決方案互聯技術為集群搭建打造全面解決方案。NVLink 是世界首項高速 GPU 互連技術,與傳統的 PCIe 系統解決方案相比,能為多 GPU 系統提供更快速的替代方案。NVLink 技術通過連接兩塊 NVIDIA 顯卡,能夠實現顯存和性能擴展,從而滿足最大視覺計算工作負載的需求。圖圖 10:NVIDIANVLink演示圖演示圖 資料來源:英偉達官網,天風證券研究
31、所 Nvlink 經歷了經歷了 5 次迭代,卡間帶寬增長多倍。次迭代,卡間帶寬增長多倍。2018 年,NVLink 首次亮相被用于連接兩臺超級計算機Summit 和 Sierra 的 GPU 和 CPU,成為了高性能計算領域的焦點。2020 年,第三代 NVLink 將每個 GPU 的最大帶寬翻倍提高至 600GB/s,每個 Nvidia A100 Tensor Core GPU 中都有十幾條互連通道。如今一個 NVIDIA H100 Tensor Core GPU 中包含 18 條第四 行業行業報告報告|行業深度研究行業深度研究 請務必閱讀正文之后的信息披露和免責申明 9 代 NVLink
32、互聯通道,這項技術已承擔了一項新的戰略任務幫助打造全球領先的 CPU和加速器。第五代第五代 NVLinkNVLink 大幅度提高了大型多大幅度提高了大型多 GPUGPU 系統的可擴展性系統的可擴展性。單個 NVDIA Blackwell Tensor Core GPU 支持多達 18 個 NVLink100GB/s 連接,總帶寬可達 1.8TB/s,比上一代產品提高了兩倍,是 PCle5.0 帶寬的 14 倍之多。圖圖 11:NVLink 性能的迭代歷程性能的迭代歷程 資料來源:英偉達官網,天風證券研究所 英偉達在英偉達在服務器互聯上推出服務器互聯上推出 NVSwitch,為組網提供為組網提供
33、卓越的卓越的性能。性能。通過連接多個 NVLink,NVSwitch在單個節點內和節點之間以全NVLink速度提供All-to-All GPU通信,憑借憑借 NVLink與與 NVSwitch 的結合,英偉達贏得了的結合,英偉達贏得了 MLPerf1.1,這是第一個全行業范圍內的,這是第一個全行業范圍內的 AI 基準測基準測試。試。前三代 NVSwitch 可在一個 NVLink 域內直連多達 8 個 GPU 的數量,最大帶寬可達900GB/s。最新的最新的 NVLinkSwitch 是首款是首款 ASIC 芯片技術機架級交換機芯片技術機架級交換機,能夠在無阻塞計算結構中支持多達 576 個全
34、連接 GPU,以驚人的 1800GB/s 的速度互連每對 GPU。它還支持完整的多對多通信。NVLink 和和 NVLinkSwitch 是整個是整個 NVIDIA 數據中心解決方案的必要基礎模組數據中心解決方案的必要基礎模組,該解決方案融合了來自NVIDIA AI Enterprise 軟件套件和NVIDIANGC目錄中的硬件、網絡、軟件、庫以及優化的 AI 模型和應用。行業行業報告報告|行業深度研究行業深度研究 請務必閱讀正文之后的信息披露和免責申明 10 圖圖 12:NVSwitch的規格迭代對比的規格迭代對比 資料來源:英偉達官網,天風證券研究所 InfiniBand 和和 Spect
35、rum 解決方案為組網通信提供解決方案為組網通信提供卓越優勢卓越優勢。InfiniBand 是一種高性能通信技術協議,起源于 21 世紀初,旨在解決傳統 PCI 總線在數據傳輸中的瓶頸問題。2000 年,InfiniBand 架構規范 1.0 版本發布,引入 RDMA 協議,提供低延遲和高帶寬的 I/O 性能。Mellanox 公司是 InfiniBand 技術的關鍵推動者,自 2001 年推出首款產品后,逐漸成為市場領導者。盡管面臨英特爾和微軟的退出,InfiniBand 仍成功應用于高性能計算和存儲設備連接。2004 年成立的 OFA 組織與 IBTA 協同推進 InfiniBand 標準
36、。到 2009 年,InfiniBand在 TOP500 超級計算機中廣泛應用。2015 年,InfiniBand 在超級計算機內部連接技術上首次超過以太網。2019 年,年,Nvidia 以以 69 億美元收購億美元收購 Mellanox,進一步鞏,進一步鞏固了其在高性能固了其在高性能計算領域的領導地位。計算領域的領導地位。圖圖 1313:20072007-20212021 年全球超級計算機年全球超級計算機500500 強中強中IBIB 及其他網絡供應商技術占比及其他網絡供應商技術占比 資料來源:鮮棗課堂公眾號,天風證券研究所 2022 年 3 月 22 日,英偉達發布新一代的以太網平臺 S
37、pectrum-4,將為大規模數據中心基礎設施提供所需的超高網絡性能和強大安全性。作為全球首個 400Gbps 端到端網絡平臺,NVIDIA Spectrum-4 的交換吞吐量比前幾代產品高出 4 倍,達到 51.2Tbps。2023 年 5 月29 日,英偉達宣布推出 NVIDIA Spectrum-X 網絡平臺,是業界第一款專為 AI 打造的以太網網絡平臺,憑借 NVIDIASpectrum-4 以太網交換機與 NVIDIA BlueField-3SuperNIC 緊密耦合,將將 AI 性能和能效提升至傳統以太網的性能和能效提升至傳統以太網的 1.6 倍,可為倍,可為 AI、機器學習、自然
38、語言處理、機器學習、自然語言處理以及各種行業應用帶來卓越性能,在英偉達的所有軟、硬件端到端平臺上得到了全面優化以及各種行業應用帶來卓越性能,在英偉達的所有軟、硬件端到端平臺上得到了全面優化 行業行業報告報告|行業深度研究行業深度研究 請務必閱讀正文之后的信息披露和免責申明 11 和驗證。和驗證。圖圖 14:NVIDIASpectrum-X較傳統以太網較傳統以太網AI性能提升性能提升 1.6 倍倍 圖圖 15:全棧優化的全棧優化的NVIDIASpectrum-X 資料來源:英偉達官網,天風證券研究所 資料來源:英偉達官網,天風證券研究所 1.2.2.CUDA 生態,強大的生態造就高壁壘生態,強大
39、的生態造就高壁壘 CUDA 生態生態在在 AI 時代時代造就高壁壘。造就高壁壘。2007 年 CUDA1.0 誕生,這一版本首次向開發者開放了GPU的通用計算潛能,為開發者打開了進入GPU編程領域的大門;隨后在2008年,CUDA2.0的推出加入了對雙精度浮點運算的功能,對于科學研究和工程模擬等高精度計算任務具有重大意義;2010 年,CUDA3.0 進一步增強了 GPU 處理并行任務的能力,為執行更為復雜的計算工作提供了強有力的支持;2012 年,CUDA5.0 的問世帶來了動態并行性的特性,GPU 能夠在運行時自我復制內核從而顯著提高了程序的適應性和執行效率。這些版本不僅促進了 CUDA
40、自身的技術演進,同時也在 GPU 并行計算的歷史上占據了重要的位置。圖圖 16:CUDA發展歷程的持續演進與優化發展歷程的持續演進與優化 資料來源:中嘉建信資本匯公眾號,天風證券研究所 2.自主可控帶來國產自主可控帶來國產 AI 芯片歷史機遇,寒武紀有望脫穎而出芯片歷史機遇,寒武紀有望脫穎而出 行業行業報告報告|行業深度研究行業深度研究 請務必閱讀正文之后的信息披露和免責申明 12 2.1.國內國內 AI 芯片與智算中心芯片與智算中心急速急速增長增長 生成式生成式 AI 對中國對中國 AI 市場的發展帶來了明顯的拉動作用市場的發展帶來了明顯的拉動作用,豐富的應用場景和對技術創新迭豐富的應用場景
41、和對技術創新迭代的熱忱,讓中國市場對于代的熱忱,讓中國市場對于 AI 服務器的關注度和需求量均明顯增長。服務器的關注度和需求量均明顯增長。根據 IDC 的數據,2023 年上半年中國加速服務器市場規模達到 31 億美元,同比 2022 年上半年增長 54%,且IDC 預測,到 2027 年中國加速服務器市場規模將達到 164 億美元。隨著生成式 AI 任務的不斷增加,市場對于高性能和高能效的 AI 服務器需求將持續增長,未來的 AI 服務器將注重提高計算能力和處理效率,適應更復雜、更大規模的 AI 應用。圖圖 17:2023-2027年中國加速計算服務器市場預測年中國加速計算服務器市場預測 資
42、料來源:IDC,天風證券研究所 NVIDIA 的財務數據進一步驗證的財務數據進一步驗證 2023 年中國年中國 AI 芯片的市場規模高速增長。芯片的市場規模高速增長。英偉達在 2024財年(截止 2024 年 1 月 28 日)的數據中心收入中大約 14%來自于中國,23 財年則有 19%來自于中國,而其數據中心在 2024 財年的營業收入約為 475 億美元,我們計算出英偉達在2024 財年(接近 2023 年自然年)向中國銷售了 66.5 億美元的數據中心芯片,而 2023 財年中國區數據中心的收入為 28.5 億美金,同比增長約 134%。大模型興起促進訓練市場增長,且未來預計大模型興起
43、促進訓練市場增長,且未來預計推理占比將攀升,到推理占比將攀升,到 2027 年推理占比將達年推理占比將達72.6%。從工作負載來看,2023 年,大模型的興起推動了訓練服務器的增長速度,IDC 數據顯示,中國 2023 上半年訓練工作負載的服務器占比達到 49.4%,預計全年的占比將達到58.7%,但隨著訓練模型的完善與成熟,模型和應用產品逐步進入投產模式,處理推理工作負載的 AI 服務器占比將隨之攀升。IDC 預計,到 2027 年,用于推理的工作負載將達到72.6%。圖圖 18:2022-2027年中國年中國AI 服務器工作負載預測服務器工作負載預測 資料來源:IDC、浪潮信息,天風證券研
44、究所 41.6%58.7%32.3%31.2%29.5%27.4%58.4%41.3%67.7%68.8%70.5%72.6%0%20%40%60%80%100%120%202220232024202520262027訓練推理 行業行業報告報告|行業深度研究行業深度研究 請務必閱讀正文之后的信息披露和免責申明 13 2024 年以來,年以來,政府政府與運營商也在積極部署構建算力基礎設施。與運營商也在積極部署構建算力基礎設施。首先三大運營商陸續發布大額招標,中國移動 2024-2025 年新型智算中心集采項目計劃采購 7994 臺人工智能服務器及配套產品;2024 年中國聯通發布2024 年中國
45、聯通人工智能服務器集中采購項目資格預審公告,計劃采購人工智能服務器 2503 臺。中國電信 AI 算力服務器(2023-2024 年)集中采購規模預計達到 4175 臺,項目總額有望超 80 億元。國內各地方政府的智算中心招標也逐步開啟,包括佛山、山東省、襄陽市、宜昌、武漢等地方均開始了招標,其中不乏有投資額超過 10 億的大項目規劃。表表 2:2024年運營商與部分各地智算中心的招標公告年運營商與部分各地智算中心的招標公告 招標方招標方 招標內容招標內容 中國移動 啟動 2024 年至 2025 年新型智算中心集采,總規模達到 8054 臺,其中包含 7994 臺人工智能服務器及配套產品,6
46、0 臺白盒交換機 中國聯通 2024 年中國聯通人工智能服務器集中采購項目將采購人工智能服務器合計 2503 臺,關鍵組網設備 RoCE 交換機合計 688 臺 中國電信 中國電信 AI 算力服務器(2023-2024 年)集中采購項目,分別為訓練型風冷服務器(I 系列)、訓練型液冷服務器(I 系列)、訓練型風冷服務器(G 系列)、訓練型液冷服務器(G 系列)。預估采購規模為 4175 臺。佛山市人工智能算力公共服務平臺項目 佛山市人工智能算力公共服務平臺作為支撐人工智能算力的重要新型基礎設施,分兩期建設具備 1000P 人工智能算力的智算中心,投資總額 6.8 億元。山東云中心省會經濟圈區域
47、分中心數據機房“德智未來”智算中心項目 該項目建設山東云中心省會經濟圈區域分中心數據機房,算力投運后租賃運營(已實際承租)的算力值不少于 430PFlopsFP16+80PFlopsFP16(非稀疏狀態下)??偼顿Y約為 2.2 億元。漢陽區大模型智算中心項目 建設漢陽區大模型智算中心;建設 50PFlopsFP16 大模型人工智能算力,總投資 1.6 億元。襄陽市東津新區智算中心及大模型建設項目(一期)智算中心總體規劃 500PFP16 算力,一期建設 100PFP16 算力,總投資 4.9 億元。湖北宜昌點軍算力樞紐中心項目 項目分兩期建設,一期建設算力運營平臺、運營中心、調度及交易中心,2
48、38P 智算中心,400個機架及機房配套設施;二期建設人工智能孵化創新中心、算力調度及交易中心、融合算力適配中心、640P 智算中心、9600 個機架及機房配套設施,總投資 10 億元。光谷智算中心 湖北省廣播電視信息網絡股份有限公司發布關于與華鑫信共同投資建設光谷智算中心的公告,計劃基建投資規模為 25 億元人民幣,部署算力規模不少于 25000P。資料來源:C114 通信網公眾號、云頭條公眾號、通信產業網公眾號等,天風證券研究所 2.2.美國芯片禁令政策,自主算力政策扶持美國芯片禁令政策,自主算力政策扶持 美國從美國從 2022 年以來逐步收緊對中國的年以來逐步收緊對中國的 AI 算力供應
49、,行動措施包括將算力供應,行動措施包括將 AI 芯片廠商列入“實芯片廠商列入“實體清單”和禁止向中國出口高性能芯片。體清單”和禁止向中國出口高性能芯片。最早在 2022 年 8 月 26 日,美國要求英偉達將需要獲得許可才能向中國出口任何基于最新架構的 A100 GPU 或 DGX/HGX 等系統,隨后2022 年 12 月 15 日,美國商務部將包括寒武紀在內的 36 家企業列入實體清單。2023 年10 月 17 日,美國更新出口管制標準,要求先進芯片性能超過特定閾值,即需要申請出口許可,限制條款已于 10 月 23 日生效。2024 年 1 月美國商務部開始要求美國 IaaS 提供商驗證
50、外國客戶的身份,并制定措施防止中國使用美國 IaaS 產品進行 AI 訓練。我們認為針我們認為針對中國的對中國的 AI 芯片禁令可能拖慢中國在這次生成式芯片禁令可能拖慢中國在這次生成式 AI 的步伐,但同時也給予了自主的步伐,但同時也給予了自主 AI 芯芯片供應商片供應商廣闊廣闊的市場機遇。的市場機遇。表表 3:2022年以來美國歷次針對算力的禁令年以來美國歷次針對算力的禁令 美國算力禁令政策美國算力禁令政策 主要內容主要內容 時間時間 美國商務部下屬的工業與安全局要求美國 IaaS 提供商驗證外國客戶的身份,并制定措施防止中國使用2024 年 1 行業行業報告報告|行業深度研究行業深度研究
51、請務必閱讀正文之后的信息披露和免責申明 14 (BIS)公布采取額外措施應對與重大惡意網絡行為相關的國家緊急狀態意見稿 美國 IaaS 產品進行 AI 訓練。若有證據表明 IaaS 賬戶被用于惡意網絡活動,商務部長可以對其施加條件或禁令。月 29 日 美國商務部發布聲明稱 BIS 將于 2024年 1 月開始對美國半導體供應鏈展開調查 重點關注美國關鍵行業對中國制造的傳統芯片的使用與采購情況,以評估其半導體供應鏈對中國芯片的依賴程度。2024 年 1 月 18 日 美國商務部 BIS 公布半導體出口管制新規 更新對包括中國在內的武器禁運國家的先進計算半導體和半導體制造設備、及支持超算應用和最終
52、用途的出口管制,并將中國境內更多相關實體列入實體清單。2023 年 10月 17 日 美國聯邦公報官網發布了美國商務部工業和安全局對實體清單的增補和修訂 美國商務部計劃于 12 月 19 日正式將包括長江存儲、寒武紀、上海微電子等 36 家中企列入實體清單。限制中國企業購買半導體和芯片制造設備。2022 年 12月 15 號 英偉達將需要獲得許可才能向中國和俄羅斯出口任何基于最新架構的 A100 GPU 或 DGX/HGX 等系統 DGX 或任何其他采用 A100 或 H100 集成電路和 A100X 的系統的出口需要美國政府許可,未來任何峰值性能能達到等于或高于與 A100 大致相當的閾值的
53、 NVIDIA 集成電路的出口仍受美國政府限制。2022 年 8月 26 日 資料來源:金杜律師事務所官網、中國證券網等,天風證券研究所 與此同時,國內頂層不斷強調與此同時,國內頂層不斷強調 AI 產業發展的重要性,從中央到地方不斷發布支持算力基產業發展的重要性,從中央到地方不斷發布支持算力基礎設施的政策文件。礎設施的政策文件。2024 年政府工作報告提出,在人工智能方面,深化大數據、人工智能等研發應用,開展“人工智能+”行動,打造具有國際競爭力的數字產業集群;算力建設方面,適度超前建設數字基礎設施,加快形成全國一體化算力體系,隨后北京、上海、深圳等地也陸續發布指導性文件,對當地的算力基礎設施
54、建設進行規劃。表表 4:中央到地方政府出臺針對算力基礎設施的支持政策中央到地方政府出臺針對算力基礎設施的支持政策 政策文件政策文件 主要內容主要內容 2024 年政府工作報告 深化大數據、人工智能等研發應用,開展“人工智能+”行動,打造具有國際競爭力的數字產業集群,適度超前建設數字基礎設施,加快形成全國一體化算力體系,培育算力產業生態。國資委中央企業人工智能專題推進會 國資央企需加快推動人工智能發展,著力打造人工智能產業集群,帶頭實現人工智能賦能傳統行業的經濟形態,加快建設一批智能算力中心。并開展 AI+專項行動,構建一批產業多模態優質數據集,打造從基礎設施、算法工具、智能平臺到解決方案的大模
55、型賦能產業生態。深圳市算力基礎設施高質量發展行動計劃 到 2025 年,深圳市將實現數據中心規模達 50 萬標準機架,算力達到 14EFLOPS(FP32)及以上,存儲總量達到 90EB,并建設不少于 20 個邊緣計算中心。計劃強調多元算力供給體系的建設,包括超算中心、智算中心及邊緣計算中心的互聯互通,推動綠色低碳技術應用,提升存儲和計算能力,支持全市高質量發展。上海市新型基礎設施建設貼息管理指導意見 進一步放大財政資金杠桿作用,鼓勵和引導社會資金加大投入;鼓勵合作銀行建立總規模達到1000 億元以上的上海市新型基礎設施建設優惠利率信貸資金,以重點支持新網絡、新算力、新數據、新設施和新終端五個
56、領域。重點對以企事業單位自籌資金為主、能形成顯著規模和經濟社會影響力的建設項目,按有關規定進行貼息支持,同時將對相關產業鏈帶動作用明顯的數據中心建設項目納入貼息范圍。北京市算力基礎設施建設實施方案(2024-2027年)方案提出加快建設智能算力基礎設施,提高自主可控軟硬件技術水平,推動區域算力協同發展,并強調市場主導、政府引導的建設運營機制。目標是在 2025 年實現智算資源供給集群化、設施建設自主化、能力賦能精準化、中心運營綠色化和生態發展體系化,力爭到 2027 年形成國際影響力的智算產業高地。資料來源:中國政府網、北京市人民政府官網、國務院國資委官網等,天風證券研究所 行業行業報告報告|
57、行業深度研究行業深度研究 請務必閱讀正文之后的信息披露和免責申明 15 2.3.對比海外,對比海外,AI 芯片市場芯片市場份額集中但難以一家獨大份額集中但難以一家獨大 在海外市場,在海外市場,英偉達英偉達占據芯片占據芯片市場主導市場主導地位地位,但但 Google 與與 AMD 等公司依然有望在等公司依然有望在 AI浪浪潮中占據一定市場份額。潮中占據一定市場份額。根據 TechInsights 的數據,2023 年,英偉達的 GPU 出貨量達到了 3.8 百萬顆,位居第二名的是 Google 的 TPU,其出貨量達到 200 萬顆,其他廠商的出貨量約為 50 萬顆左右。自 2015 年推出自研
58、的 TPU 以來,Google 在 2023 年自用的 TPU 芯片量已經突破了 200 萬顆大關,就出貨量來看,Google 在 AI 加速器市場的份額約 31.7%,此外,AMD 的數據中心業務部門在 2024 財年 Q1 營收 23.37 億美元,同比增長 80%,遠高于去年四季度的 38%的同比增幅,這反應了其第四代 EPYC CPU 以及 InstinctGPU(主要MI300 系列 AI 芯片)出貨的快速增長,在 24 財年 Q1 的財報會議上,AMD 今年的 AI 芯片目標收入將提高到 40 億美金,MI300 系列 GPU 市場表現良好,已鎖定微軟、Meta 和Oracle 的
59、采購訂單。我們認為我們認為 AI 加速芯片在數據中心芯片的份額快速提升,加速芯片在數據中心芯片的份額快速提升,Nvidia 依靠依靠完善的軟硬件生態成為全球完善的軟硬件生態成為全球 AI 芯片的領導者,但仍然有包括芯片的領導者,但仍然有包括 Google 和和 AMD 等廠商有望等廠商有望占據一定市場份額。占據一定市場份額。圖圖 19:Nvidia/Google 等等 AI加速芯片市場的出貨量加速芯片市場的出貨量 圖圖 20:AI 加速芯片在數據中心市場的份額快速提升加速芯片在數據中心市場的份額快速提升 資料來源:TechInsights、The Register,天風證券研究所 資料來源:T
60、echInsights、The Register,天風證券研究所 3.AI 芯片元老,從芯片元老,從 IP 到芯片到芯片 3.1.從從 IP 到自研芯片,寒武紀為到自研芯片,寒武紀為 AI 芯片而生芯片而生 中科中科寒武紀寒武紀是是 AI 芯片的元老級公司,成立于芯片的元老級公司,成立于 2016 年年 3 月。月。同年公司推出終端智能處理器產品,包括寒武紀 1A、寒武紀 1H 和寒武紀 1M 系列智能處理器,以 IP 形式進行銷售,快速實現了技術的產業化輸出,其中寒武紀智能處理器 IP 產品已集成于超過 1 億臺智能手機及其他智能終端設備中。2018 年公司開始自研芯片,推出思元 100 云
61、端智能芯片,2019 年推出思元 270 云端智能芯片及加速卡。2019 年 11 月,公司推出思元 220 邊緣智能芯片及加速卡,實現了終端、云端、邊緣端產品的完整布局。2020 年公司上市,同年公司推出思元 290 訓練芯片和玄思 1000 智能加速器,補足人工智能訓練產品線,標志著寒武紀已初步建立“云邊端一體、軟硬件協同、訓練推理融合”的新生態。2021 年,公司發布訓推一體的思元 370 智能芯片及加速卡,同年設立子公司行歌科技,開展智能駕駛芯片的研發和產品化。2022 年,公司基于思元 370 推出智能加速卡 MLU370-X8/M8 和訓練整機玄思 1001 智能加速器。年末公司及
62、部分子公司被美國商務部列入“實體清單”。2023 年,公司持續重點迭代優化新一代智能處理器微架構和指令集,針對自然語言處理大模型、視頻圖像生成大模型以及推薦系統大模型的訓練推理等場景進行重點優化,將在編程靈活性、易用性、性能、功耗、面積等方面提升產品競爭力。例如,與智象未來達成了算力產品的合作以及視覺多模態大模型的深度適配,在語言大模型領域與百川智能等頭部客戶進行了大模型適配,并獲得了產品兼容性認證,產品性能達到國際主流產品水平。行業行業報告報告|行業深度研究行業深度研究 請務必閱讀正文之后的信息披露和免責申明 16 圖圖 21:中科寒武紀發展歷程中科寒武紀發展歷程 資料來源:公司年報,公司招
63、股書,天風證券研究所 3.2.核心團隊出自中科院,董事長長期耕耘核心團隊出自中科院,董事長長期耕耘 AI 芯片,引領產業方向芯片,引領產業方向 公司董事長陳天石持股公司董事長陳天石持股 28.69%,為公司最大股東,為公司最大股東。公司董事包括陳天石、劉新宇、劉少禮、王在和葉淏尹。其中劉少禮和王在兼任副總經理,分別畢業于中科院計算所和中國科學技術大學。葉淏尹兼任副總經理、財務負責人和董事會秘書。圖圖 22:股權結構圖(截至股權結構圖(截至2024年一季度末)年一季度末)資料來源:Wind,天風證券研究所 表表 5:公司董事簡介公司董事簡介 姓名姓名 職務職務 簡歷簡歷 陳天石 董事長、總經理
64、陳天石,男,出生于 1985 年,中國科學技術大學計算機軟件與理論專業博士學歷。中國國籍,無境外永久居留權。2010 年 7 月至 2019 年 9 月就職于中科院計算所(2018 年 4 月辦理離崗創業),歷任助理研究員、副研究員及碩士生導師、研究員及博士生導師。2016 年 3 月創立公司,現任公司董事長、總經理 劉新宇 董事 劉新宇,男,出生于 1972 年,哈爾濱工業大學博士學歷。中國國籍,無境外永久居留權。2002 年 7 月至 2004 年 7 月,在中科院計算所博士后工作站從事研究工作;2004 年 5 月至2006 年 2 月,歷任中科院計算所技術發展處主管、分所管理辦主任;2
65、006 年 3 月至今,任蘇州中 科集成電路設計中心有限公司董事長、總經理;2008 年 8 月至今,歷任中科院計算所技術發展處副處長、技術發展處處長、技術發展中心主任;2016 年 11 月至 2020 年 6 月,任北京中科算源資產管理有限公司總經理;現任公司董事 劉少禮 董事、副總經理 劉少禮,男,出生于 1987 年,中科院計算所計算機系統結構博士學歷。中國國籍,無境外永久居留權。2014 年至 2019 年就職于中科院計算所并任副研究員(2018 年 4 月辦理離崗創 行業行業報告報告|行業深度研究行業深度研究 請務必閱讀正文之后的信息披露和免責申明 17 業)。2016 年作為公司
66、創始團隊成員加入公司,現任公司董事、副總經理。王在 董事、副總經理 王在,男,出生于 1984 年,中國科學技術大學計算機應用技術博士學歷。中國國籍,無境外永久居留權。2011 年至 2015 年就職于鄭州商品交易所并任核心交易系統工程師,2015 年至2016 年就職于中原銀行并任信息科技部電子銀行系統主管,2016 年至 2018 年就職于中科院 計算所從事科研工作。2016 年作為公司創始團隊成員加入公司,現任公司董事、副總經理 葉淏尹 董事、副總經理、財務負責人、董事會秘書 葉淏尹,女,出生于 1988 年,北京大學西方經濟學碩士學歷。中國國籍,無境外永久居留權。2012 年至 201
67、6 年就職于中國高新投資集團公司并任投資經理、高級投資經理,2016 年至 2019 年就職于國投創業投資管理有限公司并任投資副總裁。2019 年加入公司,現任公司董事、副總經理、財務負責人及董事會秘書 資料來源:公司年報,天風證券研究所 董事長陳天石多年從事人工智能領域基礎科研工作,理論功底堅實,研發經驗豐富董事長陳天石多年從事人工智能領域基礎科研工作,理論功底堅實,研發經驗豐富。陳天石博士畢業于中國科學技術大學計算機軟件與理論專業,曾在中科院計算所擔任研究員、博士生導師,在人工智能和處理器芯片等相關領域從事基礎科研工作十余年,積累了堅實的理論功底和豐富的研發經驗,創辦并領導公司在智能芯片方
68、向快速躋身全球初創公司前列。陳天石博士是寒武紀系列商用智能芯片的奠基人之一,負責把控公司整體的技術方向、業務進程以及戰略發展方向,并牽頭開展學術研究和產業化工作。陳天石博士是陳天石博士是 AI 芯片的開創者之一,在芯片的開創者之一,在 14 年就提出產業進展中年就提出產業進展中成果得到同行認可。成果得到同行認可。陳天石等研究人員在 2013 年提出了全球首個深度學習處理器,圍繞 DianNao 的研究 Diannao:A Small-Footprint High-Throughput Accelerator for Ubiquitous Machine-Learning獲得ASPLOS 在 2
69、014 年的最佳論文且是亞洲首份獲得計算機硬件頂會的最佳論文。接著在 2014年、2015 年、2016 年,寒武紀又通過論文宣布了對全球首個多核深度學習處理器、攝像頭上的智能識別 IP、全球首個神經網絡指令集的研究。Google 發布的 TPU 論文,全文共引用了寒武紀團隊成員前期發表的 6 篇論文(表 2 第 2第 7 篇論文),并有專門的段落回顧寒武紀團隊這一系列工作,并且在提到 DaDianNao/PuDianNao/ShiDianNao 時還專門用英文注釋這幾個名字的含義(Big computer,general computer,vision computer),對其前期工作顯示了
70、相當的尊重;在世界范圍內,很少有其他工作能受到 Google 同行如此程度的關注,足以看出陳天石博士在 AI 芯片中的前瞻性和貢獻度。圖圖 23:GoogleTPU 論文引用寒武紀相關工作的專門段落論文引用寒武紀相關工作的專門段落 資料來源:Norman P.Jouppi,Cliff Young 等In-Datacenter Performance Analysis of a Tensor Processing Unit,天風證券研究所 表表 6:陳天石博士及相關團隊早期相關工作陳天石博士及相關團隊早期相關工作 發表時間發表時間 論文名稱論文名稱 行業行業報告報告|行業深度研究行業深度研究 請
71、務必閱讀正文之后的信息披露和免責申明 18 2012 BenchNN:On the Broad Potential Application Scope of Hardware Neural Network Accelerators 2014 Diannao:A small-foot print high-through put accelerator for ubiquitous machine-learning.Proceedings of ASPLOS 2014 Dadiannao:A machine-learning supercomputer.2015 ShiDianNao:shift
72、ing vision processing closer to the sensor 2015 Pudiannao:A polyvalent machine learning accelerator 2016 DianNaoFamily:Energy-Efficient Hardware Accelerators for Machine Learning 2016 Cambricon:An instruction set architecture for neural networks 資料來源:21 世紀經濟報道公眾號,In-Datacenter Performance Analysis o
73、f a Tensor Processing Unit,天風證券研究所 公司技術團隊配備齊全,如今更加聚焦于云端公司技術團隊配備齊全,如今更加聚焦于云端 AI 芯片領域。芯片領域。公司在技術研發、供應鏈、產品銷售等方面均建立了成熟團隊,核心骨干均有多年從業經驗。公司核心研發人員大多擁有計算機、微電子等相關專業的學歷背景,畢業于國內外著名的高校和研究所;多名骨干成員擁有知名半導體公司多年的工作經歷。數量上,2019-2021 公司研發人員數量持續提升,2023 年有所下降主要系業務戰略規劃調整,但我們認為公司目前更加聚焦在云端 AI芯片領域。從占比來看,研發團隊中本科及以下學歷占比 21.54%,
74、73.01%的研發人員為碩士學歷,5.45%為博士學歷。2023 年公司研發費用由 2022 年的 15.23 億元縮減至 11.18 億元,但人均研發費用由 2022 年的 126.39 萬元提升至 148.67 萬元,保持了 2020-2022 年的增長趨勢。圖圖 24:FY2019-FY2023中科寒武紀中科寒武紀研發人員數量及同比研發人員數量及同比 圖圖 25:2023年中科寒武紀研發人員學歷構成年中科寒武紀研發人員學歷構成 資料來源:公司年報,天風證券研究所 資料來源:公司年報,天風證券研究所 圖圖 26:FY2020-FY2023中科寒武紀研發費用(億元)及同比中科寒武紀研發費用(
75、億元)及同比 圖圖 27:FY2019-FY2023中科寒武紀中科寒武紀人均人均研發費用研發費用(萬元)及同比(萬元)及同比 資料來源:Wind,天風證券研究所 資料來源:Wind,天風證券研究所 股權激勵目標進一步彰顯了公司的業績增長信心。股權激勵目標進一步彰顯了公司的業績增長信心。2023 年 11 月 18 日,公司發布了中科寒武紀科技股份有限公司 2023 年限制性股票激勵計劃(草案),股權激勵針對收入提出了要求,目標值上,在 2024 年營業收入不低于 11 億元,第二個歸屬期上 24-25 年累計收入不低于 26 億元,第三個歸屬期 24-26 年累計收入不低于 46 億元。結合公
76、司 2023 年6809781213120575243.82%24.03%-0.66%-37.59%-50%-40%-30%-20%-10%0%10%20%30%40%50%020040060080010001200140020192020202120222023研發人員數量YOY5.45%73.01%21.54%博士碩士本科及以下5.437.6811.3615.2311.1841.44%47.92%34.07%-26.59%-40%-30%-20%-10%0%10%20%30%40%50%60%024681012141620192020202120222023研發費用YOY79.8578.5
77、393.65126.39148.67-1.66%19.26%34.96%17.63%-5.00%0.00%5.00%10.00%15.00%20.00%25.00%30.00%35.00%40.00%0.0020.0040.0060.0080.00100.00120.00140.00160.0020192020202120222023人均研發費用YOY 行業行業報告報告|行業深度研究行業深度研究 請務必閱讀正文之后的信息披露和免責申明 19 收入僅 7.09 億元,此次股權激勵彰顯了公司未來充足的業績增長信心。表表 7:2023 年寒武紀推出的股權激勵計劃年寒武紀推出的股權激勵計劃 歸屬期歸屬
78、期 目標值目標值 觸發值觸發值 公司層面歸屬系數 100%公司層面歸屬系數 80%第一個歸屬期 2024 年營業收入值不低于 11 億元 2024 年營業收入值不低于 8.8 億元 第二個歸屬期 2024-2025 年累計營業收入值不低于 26 億元 2024-2025 年累計營業收入值不低于 20.8 億元 第三個歸屬期 2024-2026 年累計營業收入值不低于 46 億元 2024-2026 年累計營業收入值不低于 36.8 億元 資料來源:公司公告,天風證券研究所 4.寒武紀技術能力優秀,具備寒武紀技術能力優秀,具備 AI 芯片完整軟硬件技術棧芯片完整軟硬件技術棧 4.1.通用智能芯片
79、系統復雜,寒武紀具備軟硬件全棧技術通用智能芯片系統復雜,寒武紀具備軟硬件全棧技術 通用智能芯片技術復雜、覆蓋面廣,通用智能芯片技術復雜、覆蓋面廣,而寒武紀而寒武紀是是業內業內少數系統掌握相關技術的企業之一。少數系統掌握相關技術的企業之一。通用型智能芯片及其基礎系統軟件的研發需要全面掌握核心芯片與系統軟件的大量關鍵技術,技術難度大、涉及方向廣,是一個極端復雜的系統工程,其中處理器微架構與指令集兩大類技術屬于最底層的核心技術。寒武紀在智能芯片領域掌握了智能處理器微架構、智能處理器指令集、SoC 芯片設計、處理器芯片功能驗證、先進工藝物理設計、芯片封裝設計與量產測試、硬件系統設計等七大類核心技術;在
80、基礎系統軟件技術領域掌握了編程框架適配與優化、智能芯片編程語言、智能芯片編譯器、智能芯片高性能數學庫、智能芯片虛擬化軟件、智能芯片核心驅動、云邊端一體化開發環境等七大類核心技術。表表 8:中科寒武紀核心技術框架結構中科寒武紀核心技術框架結構 分類分類 名稱名稱 含義含義 基礎系統軟件技術 編程框架適配與優化 支持 Pytorch 和 TensorFlow 等框架,降低代碼遷移成本,提升應用開發速度 智能芯片編程語言 公司研發的 BANG 語言,通用性好、可擴展,用于芯片拓展應用、迭代算法 智能芯片編譯器 將 BANG 語言編譯為機器碼,自動優化挖掘芯片性能潛力 智能芯片高性能數學庫 開發者能夠
81、以調用數學庫的形式實現常用運算,并獲得較好性能 智能芯片虛擬化軟件 將物理芯片虛擬化,供多個虛擬機或容器同時使用,提升數據中心智能芯片利用率,便于數據中心管理 IT 資產 智能芯片核心驅動 保證智能芯片在操作系統中高效運行的底層基礎組件 云邊端一體化開發環境 用于應用開發、功能調試和性能調優的軟件工具鏈,可大幅提升人工智能應用在不同硬件平臺的開發效率和部署速度,使云邊端異構硬件資源統一管理、調度和協同成為可能 智能芯片技術 智能處理器微架構 公司在云、邊、端的智能芯片和智能處理器核均基于自研處理器架構研制 智能處理器指令集 公司軟硬件均構建與自研的 MLU 指令集基礎之上 SoC 芯片設計 公
82、司掌握 SoC 設計的一系列關鍵技術,支撐了云端大型 SoC 芯片和邊緣端中性 SoC 芯片的研發 處理器芯片功能驗證 公司擁有成熟先進的處理器和 SoC 芯片功能驗證平臺,確保了智能處理器和 SoC 芯片邏輯設計按時高質量交付,有效保障多款芯片產品的一次性流片成功 先進工藝物理設計 公司掌握 7nm 等先進工藝下開展復雜芯片物理設計的一系列關鍵技術,成功應用于多款芯片的物理設計之中 芯片封裝設計與量產測試 用于公司云端、邊緣端不同品類芯片產品的封裝設計與量產測試過程 硬件系統設計 用于解決高速信號完整性、大功率供電下的電源完整性、大型芯片散熱、機箱模塊化等關鍵問題,支撐公司加速卡、整機和集群
83、等多樣化的產品形態 行業行業報告報告|行業深度研究行業深度研究 請務必閱讀正文之后的信息披露和免責申明 20 資料來源:公司年報,天風證券研究所 4.2.產品體系從產品體系從 IP 到端側再到云端,軟硬件深度耦合到端側再到云端,軟硬件深度耦合 從從 IP 授權到端側芯片再到云端芯片,伴隨授權到端側芯片再到云端芯片,伴隨 AI 浪潮快速變遷浪潮快速變遷。2016 年,公司推出的首款智能處理器 IP 寒武紀 1A,隨后于 2017 年、2018 年分別推出了升級版本寒武紀 1H 和寒武紀1M,該等處理器 IP 已累計應用于過億臺終端設備中。2018 年和 2019 年,公司相繼發布云端推理芯片思元
84、 100 和思元 270,目前已成功部署在包括聯想、浪潮在內多個廠商的服務器中。2019 年 11 月,隨著邊緣 AI 系列產品思元 220 芯片及加速卡產品的發布,標志著公司在云、邊、端實現了全方位覆蓋,形成了完整的智能芯片產品群。2021 年,公司發布基于第四代智能處理器微架構 MLUarch03 的推訓一體思元 370 智能芯片及加速卡。思元370 是寒武紀首款采用 Chiplet 技術的人工智能芯片,其算力是寒武紀第二代云端推理產品思元 270 算力的 2 倍。2022 年,公司基于思元 370 云端智能芯片,推出了新款智能加速卡 MLU370-X8/M8、訓練整機玄思 1001 智能
85、加速器(MLU-X1001)。2023 年,公司的新一代智能處理器微架構和指令集正在研發中。圖圖 28:中科寒武紀主要產品線中科寒武紀主要產品線 資料來源:公司年報,天風證券研究所 軟件棧方面,寒武紀軟件棧方面,寒武紀擁有擁有全面的基礎軟件系統平臺,專門針對其云、邊、端的智能處理器全面的基礎軟件系統平臺,專門針對其云、邊、端的智能處理器產品打造的軟件開發平臺,采用端云一體、訓推一體架構,可同時支持寒武紀云、邊、端產品打造的軟件開發平臺,采用端云一體、訓推一體架構,可同時支持寒武紀云、邊、端的全系列產品。的全系列產品。寒武紀基礎軟件系統平臺包括 BANG 異構計算平臺、計算庫和工具、AI 框架和
86、開源組件。其中,BANG 異構計算平臺由 3 部分構成,包括編譯、運行和調試。計算庫和工具包括 4 個部分,分別是推理引擎、通信、云工具集和實用工具。在 AI 框架方面,寒武紀提供了 MagicMind 等推理引擎,支持 Pytorch、TensorFlow 框架,同 時提 供TorchDump 作為網絡精度調試工具。此外,寒武紀可在一定程度上兼容 DALI、Triton 等開源組件。寒武紀基礎軟件??蔀榘ɑヂ摼W、金融、能源、運營商在內的行業服務提供有寒武紀基礎軟件??蔀榘ɑヂ摼W、金融、能源、運營商在內的行業服務提供有效支撐。效支撐。行業行業報告報告|行業深度研究行業深度研究 請務必閱讀正
87、文之后的信息披露和免責申明 21 圖圖 29:寒武紀基礎軟件系統平臺寒武紀基礎軟件系統平臺 資料來源:寒武紀 2023 年社會責任報告,天風證券研究所 4.2.1.硬件覆蓋硬件覆蓋 IP 和和云邊端一體云邊端一體化產品,單芯片化產品,單芯片最大算力高達最大算力高達 256TOPS(1)寒武紀初代處理器)寒武紀初代處理器 IP 陸續推出陸續推出 1A、1H 和和 1M,累計出貨量過億,累計出貨量過億。2016 年底,公司推出了全球首款商用終端智能處理器 IP 產品寒武紀 1A。此后,公司推出 1H、1M 處理器IP。其中,Cambricon-1M 系列作為寒武紀第三代架構,具備了更優性能、更低功
88、耗和更強的完備性,混合支持 fp32/fp16/int32/int16/int8/int4 位寬,增加了壓縮解壓縮模塊。在上代產品的基礎上,可支持個性化人工智能應用,也可使用于多路視頻實時處理和自動駕駛等領域。該系列高、中、低產品分別是Cambricon-1M-4K、Cambricon-1M-2K 和Cambricon-1M-1K,在 1GHz 主頻下,進行 8 位定點人工智能運算的峰值速度分別為 8/4/2Tops,進行16 位定點人工智能運算的峰值速度分別為 4/2/1Tops,進行 32 位定點人工智能運算的峰值速度分別為 1/0.5/0.25Tops。表表 9:寒武紀終端智能處理器寒武
89、紀終端智能處理器 IP 架構架構 版本版本 推出時間推出時間 峰值速度峰值速度 INT8 INT16 INT32 FP16 Cambricon-1A 2016 0.5TOPS Cambricon-1H 1H16 2017 1TOPS 0.5TOPS Cambricon-1H 1H8 2017 1TOPS Cambricon-1H 1H8mini 2017 0.5TOPS Cambricon-1M 1M-4K 2018 4TOPS 1TOPS Cambricon-1M 1M-2K 2018 4TOPS 2TOPS 0.5TOPS Cambricon-1M 1M-1K 2018 2TOPS 1TO
90、PS 0.25TOPS 資料來源:公司官網,天風證券研究所(2)寒武紀邊緣產品)寒武紀邊緣產品 MLU220 發布于發布于 2019,2023 年累計銷量過百萬年累計銷量過百萬。邊緣計算是近年來興起的一種新型計算范式,在終端和云端之間的設備上配備適度的計算能力,一方面可有效彌補終端設備計算能力不足的劣勢,另一方面可緩解云計算場景下數據隱私、帶寬與延時等潛在問題。邊緣計算范式和人工智能技術的結合將推動智能制造、智能零售、智能 行業行業報告報告|行業深度研究行業深度研究 請務必閱讀正文之后的信息披露和免責申明 22 教育、智能家居、智能電網等眾多領域的高速發展。公司的邊緣智能芯片為思元 220,M
91、LU220 是 一 款 專 門 用 于 邊 緣 計 算 應 用 場 景 的 AI 加 速 產 品,產 品 集 成 4 核ARMCORTEXA55,LPDDR4x 內存及豐富的外圍接口。用戶既可以使用 MLU220 作為 AI加速協處理器,也可以使用其實現 SoC 方案。該產品和相應的 M.2 加速卡于 2019 年 11月發布。2020 年底 MLU220 實現規?;鲐?,發布至 2023 年,累計銷量過百萬。表表 10:寒武紀邊緣產品寒武紀邊緣產品 芯片芯片 產品產品 推出時間推出時間 AI 性能性能 CPU 內存內存 思元 220 MLU220-SOM 智能模組 2019 16TOPS(I
92、NT8)ARMA55*4 1.5GHz 8GB LPDDR4,64bits,3733MHz 思元 220 MLU220-M.2 邊緣端人工智能加速卡 2019 8TOPS(INT8)LPDDR4x64bits 資料來源:公司年報、公司官網,天風證券研究所(3)云端產品線覆蓋芯片、加速卡和整機,第三代加速卡已與主流互聯網廠商開展深入)云端產品線覆蓋芯片、加速卡和整機,第三代加速卡已與主流互聯網廠商開展深入適配。適配。云端產品線目前包括云端智能芯片、加速卡及訓練整機。其中,云端智能芯片及加速卡是云服務器、數據中心等進行人工智能處理的核心器件,其主要作用是為云計算和數據中心場景下的人工智能應用程序提
93、供高計算密度、高能效的硬件計算資源,支撐該類場景下復雜度和數據吞吐量高速增長的人工智能處理任務。公司的訓練整機是由公司自研云端智能芯片及加速卡提供核心計算能力,且整機亦由公司自研的訓練服務器產品。思元思元 370是寒武紀第三代云端產品,是寒武紀第三代云端產品,最大算力高達 256TOPS(INT8),是寒武紀第二代云端推理產品思元 270 算力的 2 倍。同時,思元 370 芯片支持 LPDDR5 內存,內存帶寬是思元 270 的3 倍,可在板卡有限的功耗范圍內給人工智能芯片分配更多的能源,輸出更高的算力。思元 370 智能芯片采用了先進的 Chiplet 芯粒技術,支持芯粒間的靈活組合,僅用
94、單次流片就達成了多款智能加速卡產品的商用。公司已推出 3 款加速卡:MLU370-S4、MLU370-X4、MLU370-X8,已與國內主流互聯網廠商開展深入的應用適配。表表 11:寒武紀云端產品性能參數寒武紀云端產品性能參數 芯片芯片 智能加速卡智能加速卡 推出時間推出時間 制程制程 峰值性能峰值性能 INT4 INT8 INT16 CINT32 FP16 BF16 FP32 思元100 2018 16nm 32TOPS 16TOPS 思元270 MLU270-F4 2019 16nm 256TOPS 128TOPS 64TOPS 思元270 MLU270-S4 2019 16nm 256T
95、OPS 128TOPS 64TOPS 思元290 MLU290-M5 2020 7nm 512TOPS 256TOPS 64TOPS 思元370 MLU370-S4/S8 2021 7nm 192TOPS 96TOPS 72TFLOPS 72TFLOPS 18TFLOPS 思元370 MLU370-X4 2021 7nm 256TOPS 128TOPS 96TFLOPS 96TFLOPS 24TFLOPS 思元370 MLU370-X8 2021 7nm 256TOPS 128TOPS 96TFLOPS 96TFLOPS 24TFLOPS 資料來源:公司官網,天風證券研究所 (4)結合自研軟硬
96、件形成智能計算集群系統業務,服務)結合自研軟硬件形成智能計算集群系統業務,服務 AI 數據中心數據中心。公司智能計算集群系統業務是將公司自研的加速卡或訓練整機產品與合作伙伴提供的服務器設備、網絡設備與存儲設備結合,并配備公司的集群管理軟件組成的數據中心集群,其核心算力來源是公司自研的云端智能芯片。智能計算集群主要聚焦人工智能技術在數據中心的應用,為人工智能應用部署技術能力相對較弱的客戶提供軟硬件整體解決方案,以科學地配置和管理集群的軟硬件、提升運行效率。行業行業報告報告|行業深度研究行業深度研究 請務必閱讀正文之后的信息披露和免責申明 23 表表 12:寒武紀訓練整機產品寒武紀訓練整機產品 芯
97、片芯片 型號型號 自適應精度算力自適應精度算力 INT8 INT16 CINT32 思元 290 玄思 1000 2.05PetaOPS 1PetaOPS 256TOPS 資料來源:公司官網,天風證券研究所 4.2.2.Cambricon Neuware:從底層自建適配硬件的軟件生態從底層自建適配硬件的軟件生態 Cambricon Neuware 是寒武紀專門針對其云、邊、端得智能處理器產品打造的軟件開發是寒武紀專門針對其云、邊、端得智能處理器產品打造的軟件開發平臺,平臺,采用云邊端一體、訓推一體架構,可同時支持寒武紀云、邊、端的全系列產品,其包括行業應用層、AI 框架層、寒武紀開發工具層、寒
98、武紀硬件層。Cambricon Neuware 全面支持各類主流編程框架(如全面支持各類主流編程框架(如 TensorFlow,Caffe,Caffe2,MXNet和和 ONNX 等)。等)。NeuWare 還提供了包括應用開發、功能調試、性能調優等在內得一些列工還提供了包括應用開發、功能調試、性能調優等在內得一些列工具。具。其中應用開發工具包括機器學習庫、運行時庫、編譯器、模型重訓練工具和特定領域(如視頻分析領域)SDK 等;功能調試工具可以滿足編程框架、函數庫等不同層次得調試需求;性能調優工具包括性能刨析工具和系統監控工具等。圖圖 30:寒武紀寒武紀 Cambricon Neuware 架
99、構架構層級關系層級關系 資料來源:寒武紀官網,天風證券研究所 寒武紀寒武紀訓練軟件平臺支持基于主流開源框架原生分布式通信方式,同時也支持訓練軟件平臺支持基于主流開源框架原生分布式通信方式,同時也支持 Horovod開源分布式通信框架,可實現單卡到集群開源分布式通信框架,可實現單卡到集群得分布式訓練任務。得分布式訓練任務。平臺支持多種網絡拓撲組織方式,并完整支持數據并行、模型并行和混合并行的訓練方法。訓練軟件平臺支持豐富的圖形圖像、語音、推薦以及訓練軟件平臺支持豐富的圖形圖像、語音、推薦以及 NLP 訓練任務。訓練任務。通過底層算子庫 CNNL和通信庫 CNCL,在實際訓練業務中達到業界領先的硬
100、件計算效率和通信效率。同時提供模型快速遷移方法,幫助用戶快速完成現有業務模型的遷移。MagicMind 是寒武紀全新打造的推理加速引擎,也是業界首個基于是寒武紀全新打造的推理加速引擎,也是業界首個基于 MLIR 圖編譯技術達到圖編譯技術達到商業化部署能力的推理引擎。商業化部署能力的推理引擎。借助 MagicMind,用戶僅需投入極少的開發成本,即可將推理業務部署到寒武紀全系列產品上,并獲得頗具競爭力的性能。圖圖 31:寒武紀訓練軟件平臺寒武紀訓練軟件平臺 圖圖 32:寒武紀全新推理加速引擎寒武紀全新推理加速引擎MagicMind 結構結構 行業行業報告報告|行業深度研究行業深度研究 請務必閱讀
101、正文之后的信息披露和免責申明 24 資料來源:寒武紀官網,天風證券研究所 資料來源:寒武紀官網,天風證券研究所 4.2.3.多芯互聯組網提升并行效率,實現多卡和分布式任務高效執行多芯互聯組網提升并行效率,實現多卡和分布式任務高效執行 多芯互聯提供跨芯片直接通訊能力,提高并行效率,多芯互聯提供跨芯片直接通訊能力,提高并行效率,MLU370-X8 帶寬達帶寬達到到 PCIe4.0 的的 3.1倍。倍。MLU-Link 多芯互聯技術,搭載于寒武紀思元 370 芯片,為每顆芯片提供 200GB/s 的額外跨芯片直接通訊能力。在思元370應對多卡多芯并行任務時,提供更高效的并行效率。例如,MLU370-
102、X8 智能加速卡支持 MLU-Link多芯互聯技術,提供卡內及卡間互聯功能。寒武紀為多卡系統專門設計了 MLU-Link 橋接卡,可實現 4 張加速卡為一組的 8 顆思元 370芯片全互聯,每張加速卡可獲得 200GB/s 的通訊吞吐性能,帶寬為 PCIe 4.0 的 3.1 倍,可高效執行多芯多卡訓練和分布式推理任務。圖圖 33:MLU370-X8 中整合了雙芯片四芯粒思元中整合了雙芯片四芯粒思元370 資料來源:公司官網,天風證券研究所 4.3.智能計算集群貢獻主要收入,研發上更加聚焦,費用率逐步下降智能計算集群貢獻主要收入,研發上更加聚焦,費用率逐步下降 2023 年實現營業收入年實現營
103、業收入 7.09 億元,其中智能計算集群系統業務收入為億元,其中智能計算集群系統業務收入為 6.05 億元億元。2018 年公司收入增長至 1.17 億元,2019、2020 年,公司收入達到 4.4、4.59 億元,2021-2023 年,公司收入維持在 7 億元以上,2023 年公司憑借人工智能芯片產品的核心優勢,拓展算力基礎設施項目,深耕行業客戶,實現營業收入 7.09 億元,同比減少 2.74%。分業務來看,2021-2023 年,公司收入主要來自智能計算系統、云端智能芯片及加速卡。2023 年,基于智能計算集群系統業務的競爭優勢和前期落地項目的良好經驗,公司積極參與臺州、沈陽兩地的算
104、力基礎設施建設項目,以公司的訓練整機產品作為核心計算設備,集成配套的軟硬件,行業行業報告報告|行業深度研究行業深度研究 請務必閱讀正文之后的信息披露和免責申明 25 最終形成智能計算集群系統交付給客戶,共實現收入 6.05 億元;依托于智能芯片產品的技術領先優勢,公司智能芯片及加速卡持續在互聯網、運營商、金融、能源等多個重點行業持續落地,并在業界前沿的大模型領域以及搜索、廣告推薦等領域取得了長足的進步,2023年,公司的智能芯片及加速卡實現收入 1.01 億元。圖圖 34:FY2017-FY2024Q1中科寒武紀收入(億元)及同比中科寒武紀收入(億元)及同比 圖圖 35:FY2021-FY20
105、23中科寒武紀中科寒武紀分業務收入(億元)分業務收入(億元)資料來源:Wind,天風證券研究所 資料來源:Wind,天風證券研究所 2023 年年虧損收窄虧損收窄 32.47%,戰略,戰略重點集中于技術創新重點集中于技術創新。2023 年公司毛利率為 69.16%,較上年同期提升 3.4pct;實現歸屬于上市公司股東的凈利潤-8.48 億元,較上年同期虧損收窄4.08 億元,虧損收窄 32.47%。公司尚未實現盈利,主要系行業特性及公司戰略規劃兩方面原因導致:芯片行業是一項高投入、長周期的行業,持續的研發投入對于企業的發展至關重要。只有通過不斷的研發投入,才能推動技術創新和產品升級,提升核心競
106、爭力,從而在激烈的市場競爭中取得優勢地位。盡管受到“實體清單”的影響,寒武紀始終把技術創新作為公司的戰略重點,持續進行研發投入,以打造優質的產品及易用的軟件生態平臺,確保在中國人工智能芯片領域的領先地位。圖圖 36:FY2017-FY2023中中科寒武紀毛利率科寒武紀毛利率 圖圖 37:FY2017-FY2023中科寒武紀凈利潤(億元)中科寒武紀凈利潤(億元)資料來源:Wind,天風證券研究所 資料來源:Wind,天風證券研究所 2023 年公司年公司研發研發和管理費用率和管理費用率均同比均同比下降,下降,進入“實體清單”后進入“實體清單”后暫停部分研發項目縮減費暫停部分研發項目縮減費用率用率
107、。期間費用率方面,公司銷售費用率基本維持不變,管理費用率從 2022 年的 40.74%減少至 2023 年 21.72%。公司按歸屬期分攤的股份支付費用較上年同期減少,從而使 2023年管理費用較上年同期有所減少。就研發費用而言,2019-2022 年,公司研發投入持續提升,由 5.43 億元提升至 15.23 億元。2023 年,公司研發費用為 11.18 億元,占營業收入的比例為 158%,較上年同期減少近 51 個百分點。2022 年 12 月 15 日,美國商務部工業和安全局(BIS)以國家安全和外交利益為由,將公司及部分子公司列入“實體清單”,受此影響,公司調整戰略,陸續暫停部分預
108、期毛利率較低的研發項目。圖圖 38:FY2019-FY2023中科寒武紀期間費用率中科寒武紀期間費用率 圖圖 39:FY2019-FY2023中科寒武紀研發費用(億元)及同比中科寒武紀研發費用(億元)及同比 0.081.174.444.597.217.297.090.261362.50%279.49%3.38%57.08%1.11%-2.74%-200%0%200%400%600%800%1000%1200%1400%1600%012345678營業收入YOY0.002.004.006.008.00202120222023智能計算集群系統云端智能芯片及加速卡邊緣端智能芯片及加速卡終端智能處理器
109、IP其他99.96%99.90%68.19%65.38%62.39%65.76%69.16%0%20%40%60%80%100%120%2017201820192020202120222023毛利率-3.81-0.41-11.79-4.35-8.3-13.25-8.78-89.24%2775.61%-63.10%90.80%59.64%-33.74%-500%0%500%1000%1500%2000%2500%3000%-14-12-10-8-6-4-202017201820192020202120222023凈利潤YOY 行業行業報告報告|行業深度研究行業深度研究 請務必閱讀正文之后的信息披
110、露和免責申明 26 資料來源:Wind,天風證券研究所 資料來源:Wind,天風證券研究所 公司經營凈現金流有公司經營凈現金流有顯著顯著正向增量,正向增量,2023 年年現金流情況良好?,F金流情況良好。2023 年經營活動產生的現金流量凈額變動主要系本期銷售回款較上年同期增加 3.76 億元,以及采購支出減少 2.92億元所致。公司目前現金流狀況良好,截至 2023 年底,貨幣資金為 39.54 億元,公司的現金流狀況可以在未來一段時間內為公司研發投入及日常運營提供有效支撐。公司將持續拓展市場份額、加速場景落地、聚焦技術創新、持續構建生態和品牌,提升公司的核心競爭力。圖圖 40:FY2017-
111、FY2023中科寒武紀中科寒武紀經營凈現金流經營凈現金流(億元)及同比(億元)及同比 圖圖 41:FY2017-FY2023中科寒武紀中科寒武紀貨幣資金(億元)及同比貨幣資金(億元)及同比 資料來源:Wind,天風證券研究所 資料來源:Wind,天風證券研究所 2023 年公司存貨為年公司存貨為 0.99 億元,預付款項為億元,預付款項為 1.48 億元億元。2023 年,公司存貨為 0.99 億元,同比減少 65.51%,主要系存貨賬面余額較上年期末減少,累計計提的存貨跌價準備增加所致;公司預付款項為 1.48 億元,同比增加 1750%。主要系上年預付款項余額較少。圖圖 42:FY2017
112、-FY2023中科寒武紀中科寒武紀存貨(億元)及同比增長存貨(億元)及同比增長 圖圖 43:FY2017-FY2023中科寒武紀預付款項(億元)及同比增長中科寒武紀預付款項(億元)及同比增長 4.28%9.80%9.85%11.39%11.57%237.84%35.95%54.92%40.74%21.72%122.30%167.32%157.56%208.92%157.69%0%50%100%150%200%250%20192020202120222023銷售費用率管理費用率研發費用率5.437.6811.3615.2311.1841.44%47.92%34.07%-26.59%-40%-30
113、%-20%-10%0%10%20%30%40%50%60%024681012141620192020202120222023研發費用YOY-0.24-0.55-2.02-1.32-8.73-13.3-5.96129.17%267.27%-34.65%561.36%52.35%-55.19%-100.00%0.00%100.00%200.00%300.00%400.00%500.00%600.00%-14-12-10-8-6-4-202017201820192020202120222023經營活動產生的現金流量凈額YOY2.3213.543.8348.7529.2124.6739.54483.6
114、2%-71.71%1172.85%-40.08%-15.54%60.28%-200.00%0.00%200.00%400.00%600.00%800.00%1000.00%1200.00%1400.00%01020304050602017201820192020202120222023貨幣資金YOY 行業行業報告報告|行業深度研究行業深度研究 請務必閱讀正文之后的信息披露和免責申明 27 資料來源:Wind,天風證券研究所 資料來源:Wind,天風證券研究所 4.4.寒武紀在軟寒武紀在軟/硬件生態綜合能力強,研發針對大模型實現多點突破硬件生態綜合能力強,研發針對大模型實現多點突破 寒武紀自主研
115、發多項寒武紀自主研發多項智能芯片技術智能芯片技術,覆蓋云邊端和推理訓練產品,覆蓋云邊端和推理訓練產品。公司能為云端、邊緣端、終端提供全品類系列化智能芯片和處理器產品,是同時具備人工智能推理和訓練智能芯片產品的企業,也是國內少數具有先進集成電路工藝(如 7nm)下復雜芯片設計經驗的企業之一。在智能芯片技術領域,寒武紀掌握智能處理器微架構、智能處理器指令集、SoC 芯片設計、處理器芯片功能驗證、先進工藝物理設計、芯片封裝設計與量產測試和硬件系統設計技術均為自主研發,且成熟穩定。累計已經取得專利 829 項,其中境外專利 259 項,2023 年內增加 207 項。寒武紀自研系統軟件打破平臺壁壘,兼
116、具靈活性和可擴展性寒武紀自研系統軟件打破平臺壁壘,兼具靈活性和可擴展性。公司能為自研云端、邊緣端、終端全系列智能芯片與處理器產品提供統一的平臺級基礎系統軟件和編程接口,公司自研的基礎系統軟件平臺徹底打破了云邊端之間的開發壁壘,兼具靈活性和可擴展性的優勢,僅需簡單移植即可讓同一人工智能應用程序便捷高效地運行在公司云邊端系列化芯片/處理器產品之上。在系統軟件技術領域,公司掌握編程框架適配與優化、智能芯片編程語言、智能芯片編譯器、智能芯片數學庫、智能芯片虛擬化軟件、智能芯片核心驅動、云邊端一體化開發環境七大類核心技術,技術均來自自主研發,且成熟穩定。累計已經取得專利 281項,其中境外專利 81 項
117、,2023 年內增加 83 項。表表 13:寒武紀智能芯片技術及其先進性寒武紀智能芯片技術及其先進性 序號序號 技術大類技術大類名稱名稱 在業務、產品中的貢獻和應用在業務、產品中的貢獻和應用 專利或其他技術專利或其他技術保護措施保護措施 成熟程度成熟程度 技術來源技術來源 1 智能處理器微架構 新一代智能處理器微架構正在研發中。公司是國內外在該技術方向積累最深厚的企業之一。公司在云端、邊緣端、終端三條產品線的所有智能芯片和智能處理器核均基于自研處理器架構研制。已取得專利 500項(其中境外專利 175 項),2023 年內增加137 項。成熟穩定 自主研發 2 智能處理器指令集 指令集是處理器
118、芯片生態的基石。公司是國際上最早開展智能處理器指令集研發的少數幾家企業之一。新一代商用智能處理器指令集正在研發中。公司已形成了體系完整、功能完備、高度靈活的智能芯片指令集專利群。公司在云端、邊緣端、終端三條產品線的所有智能芯片和智能處理器核以及基礎系統軟件均構建于自研的 MLU 指令集基礎之上。已取得專利 194項(其中境外專利 53 項),2023年內增加 36項。成熟穩定 自主研發 3 SoC 芯片設計 公司已掌握復雜 SoC 設計的一系列關鍵技術,有力支撐了云端大型 SoC 芯片(思元 100、思元 270、思元 370 和思已取得專利 65項(其中境外專成熟穩定 自主研發 00.050
119、.510.912.872.870.99920.00%78.43%215.38%0.00%-65.51%-200%0%200%400%600%800%1000%00.511.522.533.52017201820192020202120222023存貨YOY0.360.230.110.090.850.081.48-36.11%-52.17%-18.18%844.44%-90.59%1750.00%-500%0%500%1000%1500%2000%00.20.40.60.811.21.41.62017201820192020202120222023預付款項YOY 行業行業報告報告|行業深度研究行
120、業深度研究 請務必閱讀正文之后的信息披露和免責申明 28 元 290)和邊緣端中型 SoC 芯片(思元 220)的研發。利 20 項),2023年內增加 21項。4 處理器芯片功能驗證 公司擁有成熟先進的處理器和 SoC 芯片功能驗證平臺,確保了智能處理器和 SoC 芯片邏輯設計按時高質量交付,有效保障了多款芯片產品的一次性流片成功。已取得專利 14項,2023 年內增加 1 項。成熟穩定 自主研發 5 先進工藝物理設計 公司已掌握 7nm 等先進工藝下開展復雜芯片物理設計的一系列關鍵技術,已將其成功應用于思元 100、思元 220、思元 270、思元 290、思元 370 等多款芯片的物理設
121、計中。非專利技術。成熟穩定 自主研發 6 芯片封裝設計與量產測試 應用于公司云端、邊緣端不同品類芯片產品的封裝設計與量產測試過程,有效支撐了公司處理器芯片的研發。已取得專利 5項,2023 年內增加 2 項。成熟穩定 自主研發 7 硬件系統設計 有效解決了高速信號完整性、大功率供電下的電源完整性、大型芯片散熱、機箱模塊化等關鍵問題,支撐公司基于自研芯片研發模組/智能加速卡、整機、集群等多樣化的產品形態。已取得專利 51項(其中境外專利 11 項),2023年內增加 10項。成熟穩定 自主研發 資料來源:公司年報,天風證券研究所 2023 年年研發成果領先研發成果領先,對大模型挑戰實現的多點核心
122、技術突破對大模型挑戰實現的多點核心技術突破。寒武紀持續進行大模型的優化和適配工作,在芯片能力、核心 IP 能力、芯片間互聯能力、并行計算能力、存儲優化能力和通信優化能力均實現技術突破。2023 年,公司先后開發了 BangTransformer 大模型分布式推理加速引擎,CNDeepspeed/Megatron-LM 大模型分布式訓練加速引擎,大模型推理與訓練性能預估工具、分析工具以及精度分析工具等大模型相關軟件棧,同時基于思元 370 等系列產品,與 LLaMa 系列、BLOOM 系列、GLM 系列、StableDiffusion、T5,以及國內的百川、千象等大模型進行了廣泛的適配和驗證,性
123、能優異,并可支持自然語言處理、視覺、多模態等多種場景的大模型應用。圖圖 44:公司應對大模型挑戰實現的多點核心技術突破:公司應對大模型挑戰實現的多點核心技術突破 資料來源:寒武紀 2023 年社會責任報告,天風證券研究所 5.風險提示風險提示 (1)AI 算力景氣度算力景氣度下降的風險下降的風險 算力支出與下游應用息息相關,若 AI 應用需要更長期才能突破,則算力支出的高景氣可能不可持續(2)公司產品供應端的風險)公司產品供應端的風險 寒武紀收到美國制裁,同時采用 Fabless 的商業模式,在供應端可能受到國際政治風險 行業行業報告報告|行業深度研究行業深度研究 請務必閱讀正文之后的信息披露
124、和免責申明 29 (3)AI 芯片競爭加劇的風險芯片競爭加劇的風險 AI 芯片領域有較多參與者,未來市場競爭可能加?。?)客戶集中度較高的風險)客戶集中度較高的風險 寒武紀現階段客戶集中度較高,單個客戶可能對收入利潤產生較大影響,若某下游大客戶訂單開展不及預期有可能影響公司的收入與現金流 行業行業報告報告|行業深度研究行業深度研究 請務必閱讀正文之后的信息披露和免責申明 30 分析師聲明分析師聲明 本報告署名分析師在此聲明:我們具有中國證券業協會授予的證券投資咨詢執業資格或相當的專業勝任能力,本報告所表述的所有觀點均準確地反映了我們對標的證券和發行人的個人看法。我們所得報酬的任何部分不曾與,不
125、與,也將不會與本報告中的具體投資建議或觀點有直接或間接聯系。一般聲明一般聲明 除非另有規定,本報告中的所有材料版權均屬天風證券股份有限公司(已獲中國證監會許可的證券投資咨詢業務資格)及其附屬機構(以下統稱“天風證券”)。未經天風證券事先書面授權,不得以任何方式修改、發送或者復制本報告及其所包含的材料、內容。所有本報告中使用的商標、服務標識及標記均為天風證券的商標、服務標識及標記。本報告是機密的,僅供我們的客戶使用,天風證券不因收件人收到本報告而視其為天風證券的客戶。本報告中的信息均來源于我們認為可靠的已公開資料,但天風證券對這些信息的準確性及完整性不作任何保證。本報告中的信息、意見等均僅供客戶
126、參考,不構成所述證券買賣的出價或征價邀請或要約。該等信息、意見并未考慮到獲取本報告人員的具體投資目的、財務狀況以及特定需求,在任何時候均不構成對任何人的個人推薦??蛻魬攲Ρ緢蟾嬷械男畔⒑鸵庖娺M行獨立評估,并應同時考量各自的投資目的、財務狀況和特定需求,必要時就法律、商業、財務、稅收等方面咨詢專家的意見。對依據或者使用本報告所造成的一切后果,天風證券及/或其關聯人員均不承擔任何法律責任。本報告所載的意見、評估及預測僅為本報告出具日的觀點和判斷。該等意見、評估及預測無需通知即可隨時更改。過往的表現亦不應作為日后表現的預示和擔保。在不同時期,天風證券可能會發出與本報告所載意見、評估及預測不一致的研
127、究報告。天風證券的銷售人員、交易人員以及其他專業人士可能會依據不同假設和標準、采用不同的分析方法而口頭或書面發表與本報告意見及建議不一致的市場評論和/或交易觀點。天風證券沒有將此意見及建議向報告所有接收者進行更新的義務。天風證券的資產管理部門、自營部門以及其他投資業務部門可能獨立做出與本報告中的意見或建議不一致的投資決策。特別聲明特別聲明 在法律許可的情況下,天風證券可能會持有本報告中提及公司所發行的證券并進行交易,也可能為這些公司提供或爭取提供投資銀行、財務顧問和金融產品等各種金融服務。因此,投資者應當考慮到天風證券及/或其相關人員可能存在影響本報告觀點客觀性的潛在利益沖突,投資者請勿將本報
128、告視為投資或其他決定的唯一參考依據。投資評級聲明投資評級聲明 類別類別 說明說明 評級評級 體系體系 股票投資評級 自報告日后的 6 個月內,相對同期滬 深 300 指數的漲跌幅 行業投資評級 自報告日后的 6 個月內,相對同期滬 深 300 指數的漲跌幅 買入 預期股價相對收益 20%以上 增持 預期股價相對收益 10%-20%持有 預期股價相對收益-10%-10%賣出 預期股價相對收益-10%以下 強于大市 預期行業指數漲幅 5%以上 中性 預期行業指數漲幅-5%-5%弱于大市 預期行業指數漲幅-5%以下 天風天風證券研究證券研究 北京北京 ??诤??上海上海 深圳深圳 北京市西城區德勝國際中心B座 11 層 郵編:100088 郵箱: 海南省??谑忻捞m區國興大道 3 號互聯網金融大廈 A 棟 23 層 2301 房 郵編:570102 電話:(0898)-65365390 郵箱: 上海市虹口區北外灘國際 客運中心 6 號樓 4 層 郵編:200086 電話:(8621)-65055515 傳真:(8621)-61069806 郵箱: 深圳市福田區益田路 5033 號 平安金融中心 71 樓 郵編:518000 電話:(86755)-23915663 傳真:(86755)-82571995 郵箱: