《2023算力芯片應用場景、市場空間及國產廠商發展機遇分析報告(37頁).pdf》由會員分享,可在線閱讀,更多相關《2023算力芯片應用場景、市場空間及國產廠商發展機遇分析報告(37頁).pdf(37頁珍藏版)》請在三個皮匠報告上搜索。
1、2023 年深度行業分析研究報告 目 錄 1 算力芯片壁壘高、發展必要性強.5 1.1 不同算力芯片的特點與區別.5 1.2 CPU 廣泛應用于服務器、工作站、個人計算機等.7 1.3 GPU 等 AI 芯片廣泛應用于高性能運算、深度學習等場景.9 2 份額提升空間大,性能有待突破.9 2.1 國內廠商份額極低,具備廣闊拓展空間.9 2.2 多數參數我國 CPU 具備比肩能力.11 2.3 國內廠商提升 CPU 性能的幾大壁壘.12 2.3.1 指令級架構與生態綁定多年,創新面臨知識產權等多重壁壘 12 2.3.2 EDA 工具軟件基本被壟斷,軟件工具集群被卡脖子 14 2.3.3 材料、設備
2、、晶圓廠國產化率低,在諸多限制下提升困難 14 2.4 AI 芯片的關鍵性能差異.15 2.4.1 AI 芯片的關鍵特征包含數據特點、計算范式、精度、重構能力等 15 2.4.2 AI 芯片設計趨勢 15 3 國產廠商的機遇:數據中心、國產化和先進封裝.16 3.1 數據中心快速發展帶來行業新機遇.16 3.2 在國產化浪潮中不斷突破不同市場.16 3.3 先進封裝助力國產 CPU 企業彎道超車.18 4 投資建議.18 4.1 海光信息:國產服務器算力芯片龍頭.18 4.2 寒武紀:領跑中國 AI 芯片市場.20 4.3 龍芯中科:從指令集到架構全自主的 CPU.22 5 風險提示.25 6
3、 附錄 非上市算力芯片公司.25 6.1 華為:布局五大系列芯片,鯤鵬、昇騰滿足服務器和 AI 需求.25 6.2 飛騰:從 CPU 研發到全棧式方案.28 6.3 兆芯:行業拓展成果顯著.31 6.4 申威:以自研指令集保障關鍵領域.34 5V9YqUoWxUnXjWsOqN8OdN8OsQqQsQsRiNnNoQjMnPqP8OrRvMvPsRnQwMtRpQ 圖表目錄 圖 1:Intel i7 6700K SOC 結構示意圖.6 圖 2:CPU 與 GPU 內部構造對比.6 圖 3:FPGA 并行運算相對 CPU 可提升視覺算法計算效率.7 圖 4:IBM 的 TrueNorth 芯片結
4、構、功能、物理形態圖.9 圖 5:2021 年全球數據中心 CPU 市場份額.10 圖 6:2021-2022 年全球數據中心 CPU 市場份額.10 圖 7:4Q22 全球 GPU 市場占有率.11 圖 8:4Q22 全球獨立 GPU 市場占有率.11 圖 9:我國數據中心機架規模.16 圖 10:CPU 三類市場劃分及特點.17 圖 11:龍芯中科 3D5000 芯片.18 圖 12:3D5000 芯片由 2 顆 3C5000 芯片封裝而成.18 圖 13:海光信息公司及產品發展沿革.19 圖 14:全算力的產品布局.21 圖 15:車云協同助力數據閉環與 AI 調優.21 圖 16:云邊
5、端車協同.21 圖 17:訓練軟件平臺.22 圖 18:推理加速引擎 MagicMind.22 圖 19:龍芯中科股權結構(截至 2023.4.28).23 圖 20:公司龍芯自主指令系統.24 圖 21:龍架構及其特性.24 圖 22:龍芯 3D5000 規格參數.24 圖 23:龍芯 CPU 系列及其應用.25 圖 24:華為五大系列芯片全景圖.26 圖 25:IDC 預測 2023 年全球計算產業投資額.27 圖 26:華為鯤鵬計算產業定位與展望.27 圖 27:華為 5 大關鍵芯片演進策略.27 圖 28:基于飛騰平臺的終端全棧架構.30 圖 29:兆芯芯片產品應用圖譜.33 圖 30
6、:申威 26010.35 圖 31:申威 CPU 基本特征.35 圖 32:“神威 太湖之光”外觀.36 表 1:CPU,GPU,FPG 與 ASIC 的特性與功能.5 表 2:獨立 GPU 與集成 GPU 比較.6 表 3:CPU 的下游應用分類.7 表 4:國內外主流廠商服務器 CPU 性能對比.12 表 5:不同指令集架構對比分析.12 表 6:PC 芯片市場規模測算.17 表 7:2022 年中國服務器芯片市場規模.17 表 8:海光系列 CPU 特性及應用.19 表 9:海光 DPU 規格特點.20 表 10:寒武紀產品行業解決方案示例.22 表 11:鯤鵬 920 處理器產品特性.
7、26 表 12:各行業數字化轉型需求.28 表 13:飛騰公司發展沿革.28 表 14:飛騰 CPU 產品分類及定位.29 表 15:飛騰三大產品系列發展路線及應用.30 表 16:兆芯公司發展沿革.31 表 17:兆芯處理器芯片家族.32 表 18:兆芯行業拓展成果.34 表 19:申威產品特性及應用.35 1 算力芯片算力芯片壁壘高、發展必要性強壁壘高、發展必要性強 英偉達宣布生成式英偉達宣布生成式 AI 引擎引擎 NVIDIA DGX GH200 現已投入量產?,F已投入量產。2023 年 5 月 28 日,英偉達創始人兼 CEO 黃仁勛在 NVIDIA Computex 2023 演講中
8、宣布,生成式 AI 引擎 NVIDIA DGX GH200 現已投入量產。GH200 使用 Nvidia 的 NVLink-C2C 互連技術,將 Nvidia 基于 ARM 的 Grace CPU和 Hopper GPU 架構融合到一個芯片中。NVIDIA DGX GH200 將 256 個 NVIDIA Grace Hopper超級芯片完全連接到單個 GPU 中,支持萬億參數 AI 大模型訓練,能夠處理大規模推薦系統、生成式人工智能和圖形分析,并為巨型人工智能模型提供線性可擴展性。Nvidia 的服務器合作伙伴正計劃基于新的 GH200 Superchip 打造他們自己的系統,首批產品將于今
9、年晚些時候上市。GH200 速度和功耗指標都有顯著提升。速度和功耗指標都有顯著提升。這款新的芯片總帶寬達每秒 900GB,比當今最先進的加速計算系統中采用的標準 PCIe Gen5 通道高出 7 倍。Nvidia 表示,Superchip 的功耗也降低了 5倍,使其能夠更有效地處理那些要求苛刻的 AI 和高性能計算應用。AMD 推出數據推出數據中心中心 APU Instinct MI300。北京時間 2023 年 6 月 14 日凌晨,AMD 推出數據中心APU(加速處理器)Instinct MI300,其旨在幫助數據中心處理人工智能相關數據流量,并在這一快速增長的市場上挑戰英偉達的壟斷地位。
10、Instinct MI300 系列將包括一個 GPU(圖形處理器)MI300X,可以加速 ChatGPT 等聊天機器人所使用的生成式 AI 技術的處理。先進算力國產替代先進算力國產替代在行業變革中有望迎來機遇在行業變革中有望迎來機遇。半導體國產化勢在必行,而算力芯片又是重中之重。AI 算力、低功耗等對服務器算力芯片提出新的要求,市場格局近幾個季度變化較多,英偉達GH200 有望加速全球 AI 服務器算力芯片市場變革,中國芯片企業在面臨挑戰的同時,也有望迎來發展機遇。1.1 不同算力芯片的特點與區別 計算芯片包括 CPU、GPU、FPGA、ASIC 等,都用作計算分析。其中,CPU 是性能最綜合
11、的計算芯片,AI 算法的執行也運用 GPU、FPGA、ASIC 等芯片。表 1:CPU,GPU,FPG 與 ASIC 的特性與功能 指標指標 CPU GPU FPGA ASIC 架構區別 70%晶體管用來構建 Cache,還有一部分控制單元,計算單元少,適用于運算復雜,邏輯復雜的計算。晶體管大部分構建計算單元,運算復雜度低,適合大規模并行計算??删幊踢壿?,不通過指令集,計算效率高,更接近底層IO,通過幾余晶體管和連線實現邏輯可編程。晶體管根據算法定制,不會有冗余,功耗低、計算性能高、計算效率高。定制開發成本高,時間周期長。峰值算力 一般 較高 較高 最高 功耗 高 高 較低 最低 能耗比 最低
12、 較低 較高 最高 通用性 最高 較高 一般 最低 時延 微秒級別 1 毫秒 1 微秒 1 微秒 數據來源:中國信通院,凡億教育,AI 電堂,東方證券研究所 CPU 是綜合計算芯片,擅長邏輯控制和串行運算。是綜合計算芯片,擅長邏輯控制和串行運算。計算機的運算器和控制器一起組成了 CPU,CPU 是整臺計算機的大腦,也是一個有多種功能的優秀領導者。它的優點在于調度、管理、協調 能力強,計算能力則位于其次。CPU 有大量的緩存和復雜的邏輯控制單元,非常擅長邏輯控制、串行的運算,但因計算單元占 30%左右,不擅長復雜算法運算和處理并行重復的操作。GPU 相比相比 CPU計算單元大大增加,擅長大量并行
13、計算。計算單元大大增加,擅長大量并行計算。而作為通用芯片的 GPU相當于一個接受CPU 調度的“擁有大量計算能力”的員工,計算單元相比 CPU 大大增加。GPU 最初承擔圖像計算任務,能夠進行并行計算,因此 GPU 架構本身比較適合深度學習算法,通過對 GPU 的優化,進一步滿足深度學習大量計算需求。其主要缺點在于功耗較高。圖 1:Intel i7 6700K SOC 結構示意圖 圖 2:CPU 與 GPU 內部構造對比 數據來源:Intel,東方證券研究所 數據來源:芯智訊,東方證券研究所 GPU 按照接入類型可以分為獨立按照接入類型可以分為獨立 GPU 和集成和集成 GPU。獨立 GPU
14、即獨立顯卡,需要插在主板的相應接口上,具備單獨的顯存,不占用系統內存,能夠提供更好的顯示效果和運行性能。全球知名供應商主要包括 AMD 和 NVIDIA 兩家。集成 GPU 即集成顯卡,是將圖形核心以單獨芯片的方式集成在主板上,并且動態共享部分系統內存作為顯存使用,能夠提供簡單的圖形處理能力,以及較為流暢的編碼應用。全球知名供應商主要包括英特爾和 AMD 兩家。表 2:獨立 GPU 與集成 GPU 比較 獨立 GPU 集成 GPU 主要區別 CPU 占用 自帶 GPU 占用部分 CPU 內存 內存占用 自帶顯存 需要一部分內存作為顯存 圖形計算能力 較強 較弱 功耗 較高 較低 優勢 自帶顯存
15、、不占用內存、擁有強大的圖像處理能力 價格低、兼容性好、升級成本低 劣勢 價格偏高、升級成本高 無獨立顯存、占用內存、影響電腦性能 圖片示例 數據來源:英特爾官網,東方證券研究所 GPU 按照應用場景不同可分為按照應用場景不同可分為 PC GPU、服務器、服務器 GPU 和移動和移動 GPU。1)集成 GPU 一般運用于PC 以輕辦公、文字編纂為主;獨立 GPU 則一般運用于 PC 以制作高清圖片、編輯視頻、渲染游戲等。2)服務器 GPU 主要以獨立 GPU 為主。服務器 GPU 主要應用于服務器,可做專業可視化、計算加速、深度學習等應用。3)移動 GPU 以集成 GPU 為主。隨著移動端向著
16、輕薄化不斷 發展,終端內部凈空間隨著多種功能模組的增加呈快速下降趨勢。此外,就目前的移動端視頻和圖片的處理要求而言,集成 GPU 的性能尚可滿足移動端的需要。FPGA 又稱半定制化芯片,具有足夠的計算能力、較低的試錯成本和足夠的靈活性。又稱半定制化芯片,具有足夠的計算能力、較低的試錯成本和足夠的靈活性。FPGA 的計算速度快是源于它本質上是無指令、無需共享內存的體系結構,“無指令”即使用硬件描述語言編程,直接編譯為晶體管電路的組合,所以 FPGA 實際上直接用晶體管電路實現用戶的算法,沒有通過指令系統的翻譯;“無需共享內存”是指對于保存狀態的需求,FPGA 中的寄存器和片上內存(BRAM)是屬
17、于各自的控制邏輯的,無需不必要的仲裁和緩存。因此 FPGA 運算速度足夠快,優于 GPU。同時,相比量產成本高昂的 ASIC 芯片,因為 FPGA 是一種半定制的硬件,通過編程可定義其中的單元配置和鏈接架構進行計算,因此在靈活性上優于ASIC,具備較低試錯成本。圖 3:FPGA 并行運算相對 CPU 可提升視覺算法計算效率 數據來源:AI 電堂,東方證券研究所 ASIC 是全定制芯片,性能強但是前期開發是全定制芯片,性能強但是前期開發久、久、成本高。成本高。是根據產品的需求進行特定設計和制造的集成電路,能夠在特定功能上進行強化,具有更高的處理速度和更低的能耗。缺點是成本高,且由于定制化,可復制
18、性一般,因此只有用量足夠大時才能夠分攤前期投入,降低成本。1.2 CPU 廣泛應用于服務器、工作站、個人計算機等 CPU 可以應用在服務器、工作站、個人計算機(臺式機、筆記本電腦)、移動終端和嵌入式設備等不同設備上,根據應用領域的不同,其架構、功能、性能、可靠性、能效比等技術指標也存在一定差異。表 3:CPU 的下游應用分類 類型類型 主要性能指標主要性能指標 典型應用場景典型應用場景 技術特點技術特點 服務器 1、單顆處理器核心數一般在8核64核,20核以上居多 2、支持多路互連,兩路、四路、八路等 3、可靠性、穩定性要求高,常年無故障運行 4、高端內存,支持 ECC 等可靠性要求 5、功耗
19、比較高,一般 100W 以上 1、行業關鍵應用(電信、金融、教育、互聯網)2、政府國計民生關鍵應用(稅務、電力公安、社保等)1、微結構復雜、先進,制造工藝先進,核心數多,單核及多核性能皆優異 2、指令集功能齊全 3、片上集成緩存容量大 4、內存通道數多 5、I/O 帶寬高 6、支持多處理器一致性互連 7、可靠性高,RAS 功能豐富 8、TDP 功耗較高 工作站 1、單顆處理器核心數一般在 10 核以下,4核、8 核居多 2、單路或雙路形式 3、可靠性、穩定性要求較高 4、內存容量要求較高 5、一般配有獨立顯卡 6、功耗一般在 100W 以下 1、圖形工作站 2、計算工作站 1、微結構復雜、先進
20、,制造工藝先進,單核及多核性能優異 2、指令集功能齊全 3、片上集成緩存容量大 4、I/O 能力要求較強 5、可靠性較高 PC 1、單顆處理器核心數一般在 10 核以下,4核、8 核居多 2、主要是單路形式 3、可靠性、穩定性要求低 4、低成本內存,可靠性要求相對較低,內存容量要求低 5、功耗一般在 100W 以下 1、臺式機 2、筆記本電腦 1、微結構復雜、先進,制造工藝先進 2、性能與功耗較平衡 3、指令集功能較齊全 4、I/O 接口功能齊全 5、內存通道數為 12 個 移動終端 1、單顆處理器核心數一般在 10 核以下,4核、8 核居多 2、主要是單路形式 3、可靠性、穩定性要求相對較低
21、 4、內存成本低,可靠性要求低,內存容量要求低 5、功耗要求嚴格,關注低功耗設計 1、手機 2、平板電腦 3、智能電視 4、POS 機 1、微結構較復雜,制造工藝先進 2、性能功耗比優異 3、指令功能較齊全 嵌入式設備 1、處理器一般采用 SoC 方案,CPU 內部集成豐富的外圍設備 2、功耗要求苛刻,功耗一般很低 1、智能汽車 2、網絡設備 3、物聯網設備 4、工業控制系統 應用領域非常廣泛,針對不同應用領域有不同規格 數據來源:海光信息招股書,東方證券研究所 服務器處理器服務器處理器需長時間運行,需長時間運行,數據處理能力最強、設計工藝最復雜、可靠性最高。數據處理能力最強、設計工藝最復雜、
22、可靠性最高。服務器具有高速的數據處理能力、強大的 I/O 數據吞吐能力、良好的可擴展性,并需要長時間可靠運行,其CPU 芯片在性能、可靠性、可擴展性和可維護性等方面要求較為苛刻。因此,服務器處理器是數據處理能力最強、設計工藝最復雜、可靠性最高的處理器。服務器的應用領域包括實時分析、5G應用、人工智能、機器學習、金融、大數據和云計算等領域。工作站主要為單用戶提供比個人計算機更強大的性能。工作站主要為單用戶提供比個人計算機更強大的性能。工作站是一種高端微型計算機,主要為單用戶提供比個人計算機更強大的性能,尤其是在數據并行處理能力和圖形處理能力等方面。工作站的典型應用領域包括科學和工程計算、軟件開發
23、、計算機輔助設計等。個人計算機主要滿足個人需求,核心數量較少。個人計算機主要滿足個人需求,核心數量較少。個人計算機包括臺式機和筆記本電腦兩大類,主要用于滿足個人的工作、學習、娛樂需求,以及企業員工的辦公需求。個人計算機處理器核心數量較少,具有較少 I/O。移動終端具有低功耗、輕量化等特點,關注對多媒體功能的增強。移動終端具有低功耗、輕量化等特點,關注對多媒體功能的增強。移動終端包括手機、筆記本、平板電腦、POS 機等。隨著集成電路技術的進步和移動網絡向寬帶化發展,移動終端正從簡單通話工具逐步轉變為綜合信息處理平臺。移動終端處理器具有低功耗、輕量化等特點,關注對多媒體功能的增強,具有較少 I/O
24、。嵌入式設備對功耗、穩定性、可擴展能力要求高。嵌入式設備對功耗、穩定性、可擴展能力要求高。嵌入式設備需要具有高穩定性和低功耗,其處理器對環境(如溫度、濕度、電磁場、振動等)的適應能力強,體積小,且集成度高,適用于工業控制、移動便攜設備、物聯網終端等場合。其中,大多數物聯網設備需要額外的 CPU處理能力來支持可升級的額外功能。因此,針對特定的物聯網應用程序的 CPU不僅必須支持安全特性,而 且必須同時具有可擴展的性能,實現更高的時鐘頻率。物聯網應用處理器芯片具有面向高集成度、高抗干擾能力和低功耗的發展趨勢。1.3 GPU 等 AI 芯片廣泛應用于高性能運算、深度學習等場景 AI 芯片主要指面向人
25、工智能應用的芯片。芯片主要指面向人工智能應用的芯片。大致包含三類:1)通用、半定制化芯片:經過軟硬件優化可以高效支持 AI 應用的通用芯片,如 GPU,FPGA;2)專門為特定的 AI 產品或者服務而設計的芯片:側重加速機器學習(尤其是神經網絡、深度學習),如 ASIC;3)神經形態計算芯片:不采用經典的馮諾依曼架構,而是基于神經形態架構設計,類似人腦,具備較高的集成度和能效比,以 IBM Truenorth 為代表。圖 4:IBM 的 TrueNorth 芯片結構、功能、物理形態圖 數據來源:Science,東方證券研究所 2 份額提升空間大,性能有待突破份額提升空間大,性能有待突破 2.1
26、 國內廠商份額極低,具備廣闊拓展空間 全球全球 CPU 商用市場基本被商用市場基本被 Intel、AMD 兩家兩家壟斷,壟斷,國產國產 CPU 具備廣闊拓展空間。具備廣闊拓展空間。CPU 目前從市場占有率來說,Intel 依靠其強大的 X86 生態體系和領先的制造能力,在通用 CPU 市場占據領先地位。2021 年,Intel 市場份額不低于 80%,AMD 近期追趕勢頭明顯,其他廠商整體市場份額不超過 7%。圖 5:2021 年全球數據中心 CPU 市場份額 數據來源:Counterpoint Analysis,東方證券研究所 英特爾優勢降低,英特爾優勢降低,數據中心領域集中度有所降低。數據
27、中心領域集中度有所降低。2022 年,數據中心領域 Intel 市場占有率為71%,較 21 年下降 10pcts,AMD 22 年市占率快速提升 8pcts 至 20%,亞馬遜、Ampere 等新興玩家份額快速提升,給總計份額不足 5%的國產廠商發展帶來了借鑒意義。圖 6:2021-2022 年全球數據中心 CPU 市場份額 數據來源:Counterpoint,東方證券研究所 全球全球 GPU 市場市場為為三足鼎立的寡頭競爭格局三足鼎立的寡頭競爭格局,英偉達在獨顯領域一家獨大,英偉達在獨顯領域一家獨大。在獨立顯卡市場上,長期以來都是 AMD及 NVIDIA 兩家的二人轉,2022年 Inte
28、l正式殺入了顯卡市場,目前獨立 GPU市場則主要由 NVIDIA、AMD 和英特爾三家公司占據,2022 年 Q4 全球獨立 GPU 市場占有率分別為 85%、9%和 6%,其中,NVIDIA 在 PC 端獨立 GPU 領域市場占有率優勢明顯。英特爾80.71%AMD11.74%其他廠商4.62%aws1.82%userid:93117,docid:130737,date:2023-12-26, 圖 7:4Q22 全球 GPU 市場占有率 圖 8:4Q22 全球獨立 GPU 市場占有率 數據來源:JPR,東方證券研究所 數據來源:JPR,東方證券研究所 2.2 多數參數我國 CPU 具備比肩能
29、力 影響國內影響國內CPU市占率的主要是技術差異,即產品性能。市占率的主要是技術差異,即產品性能。CPU性能的主要影響因素為頻率和IPC,其他影響 CPU 性能的因素還有總線寬度、制程、存儲、內核數、封裝技術等。(1)主頻,外頻和倍頻和)主頻,外頻和倍頻和 IPC。主頻是 CPU的時鐘頻率,即 CPU的工作頻率,一般來說,一個時鐘周期完成的指令數是固定的,所以主頻越高,CPU單位時間運行的指令數越多。外頻即CPU和周邊傳輸數據的頻率,具體是指 CPU 到芯片組之間的總線速度,CPU 的外頻決定著整塊主板的運行速度。產生的輸出信號頻率是輸入信號頻率的整數倍稱為倍頻,倍頻和外頻相乘就是主頻,當外頻
30、不變時,提高倍頻,CPU主頻也就越高。IPC指CPU每一個頻率周期里處理的指令數量。(2)地址總線寬度。)地址總線寬度。地址總線是專門用來傳送地址的,CPU 通過地址總線來選用外部存儲器的存儲地址,總線寬度決定了 CPU 可以訪問的物理地址空間(尋址能力),簡單地說就是 CPU 到底能夠使用多大容量的內存。例如 32 位的地址總線,最多可以直接訪問 4GB 的物理空間。8 位微機的地址總線為 16 位,則其最大可尋址空間為 216=64KB。(3)數據總線寬度。)數據總線寬度。數據總線寬度決定了 CPU 與內存以及輸入、輸出設備之間一次數據傳輸的信息量。(4)制程和封裝。)制程和封裝。CPU
31、的生產需要經過硅提純、切割晶圓、影印、蝕刻、分層、封裝、測試 7個工序,制程工藝的提升或更小的制程對于 CPU 性能的提升影響明顯,主要表現為 CPU 頻率提升以及架構優化兩個方面。一方面,工藝的提升與頻率緊密相連,使得芯片主頻得以提升;另一方面工藝提升帶來晶體管規模的提升,從而支持更加復雜的微架構或核心,帶來架構的提升。(5)工作電壓。)工作電壓。指的是 CPU 正常工作所需的電壓。低電壓能夠解決耗電多和發熱過高的問題,使 CPU 工作時的溫度降低,工作狀態穩定。(6)高速緩沖存儲器。)高速緩沖存儲器。它是一種速度比內存更快的存儲設備,用于緩解 CPU 和主存儲器之間速度不匹配的矛盾,進而改
32、善整個計算機系統的性能。很多大型、中型、小型以及微型計算機中都采用高速緩存。(7)除上述性能指標外,CPU 還有其他如接口類型、多媒體指令集、裝封形式、整數單元和浮點單元強弱等性能影響指標。英特爾71%AMD12%英偉達17%英偉達85%AMD9%英特爾6%多數參數我國多數參數我國 CPU具備比肩能力,具備比肩能力,IPC 性能是最主要差距。性能是最主要差距。目前通過公開信息可以看出,主頻、核心數、內存類型等指標我國 CPU廠商差異不大,具備一定的比肩能力,但落實到具體性能決定指標 IPC,僅 Intel 和 AMD 會公布 IPC“相比上一代提升了多少”,其他國產 CPU 從 IPC 性能來
33、看大致落后于 Intel、AMD 幾年水平。表 4:國內外主流廠商服務器 CPU 性能對比 品牌品牌 Intel AMD 海光海光 兆芯兆芯 海思海思 飛騰飛騰 龍芯龍芯 申威申威 型號 Xeon Gold 6330N EPYC 7542 海光 7285 開勝 KH-30000 鯤鵬 920-7260 S2500 3D5000 申威 1621 指令集 x86 x86 x86 x86 ARM ARM LoongArch SW_64 核心數 28 32 32 8 64 64 32 16 超線程 56 64 64 不支持 不支持 不支持 不支持 不支持 主頻 2.2GHz 2.9GHz 2.0GHz
34、 3.0GHz 2.6GHz 2.2GHz 2.0GHz 2.0GHz 內存類型 DDR4 DDR4 DDR4 DDR4 DDR4 DDR4 DDR4 DDR3 內存通道數 8 8 8 2 8 8 8 8 最高內存頻率 3400MHz 3200MHz 2666MHz 2666MHz 2933MHz 3200MHz 3200MHz 2133MHz PCIe 通道數 64 128 128 16 40 17 32 16 數據來源:Intel 官網,龍芯中科官網,海光信息招股書,東方證券研究所 2.3 國內廠商提升 CPU 性能的幾大壁壘 2.3.1 指令級架構與生態綁定多年,創新面臨知識產權等多重壁
35、壘 指令集是 CPU所執行的指令的二進制編碼方法,是軟件和硬件的接口規范。日常交流中有時也把指令集稱為架構。CPU按照指令集可分為 CISC(復雜指令集)和 RISC(精簡指令集)兩大類,CISC 型 CPU目前主要是 x86 架構,RISC型 CPU主要包括 ARM、RISC-V、MIPS、POWER架構等。指令指令集集架構與生態綁定多年,創新面臨知識產權、時間等多重壁壘。架構與生態綁定多年,創新面臨知識產權、時間等多重壁壘。歷經幾十年的發展,全球形成了 Wintel(Windows+Intel)和 AA(Android+ARM)兩大信息化生態體系,并且都由美國主導,在生態和知識產權上都形成
36、了自己的“領地”。中國之前沒有指令集,重新搭建或者在現有的開源指令集基礎上修改,會面臨知識產權問題以及前期需要大量的試錯優化過程。且新的指令集需要新的生態來適配,所需要的操作系統、基礎軟件和各種應用軟件都需要重新適配,這也是目前新指令集發展的一個難點。表 5:不同指令集架構對比分析 指令集架構指令集架構 自主指令自主指令 ARM X86 MIPS POWER RISC-V 來源 公司自研 ARM 公司 Intel/AMD/臺灣威盛 MIPS 公司 IBM 加州大學伯克利分校 分類 精簡指令集(RISC)復雜指令集(CISC)精簡指令集(RISC)精簡指令集(RISC)精簡指令集(RISC)是否
37、開源 未開源 未開源 未開源 已開源 已開源 已開源 優點 全自主/供應鏈安全/免費/靈活 生態完善/自主程度較高 高性能/生態完善 自主程度高/供應鏈安全/免費 性能強大/自主程度高/供應鏈安全/免費 自主程度高/供應鏈安全/免費/靈活 缺點 生態不完善 供應鏈風險/需要授權費 授權費高/供應鏈風險/授權層級低 生態不完善 生態不完善 生態不完善 國內外應用公司 龍芯中科/電科申泰 Apple/華為海思/飛騰信息/兆易創新 Intel/AMD/海光信息/上海兆芯 北京君正 國芯科技/中晟宏芯 平頭哥/國芯科技 數據來源:海光信息,龍芯中科,兆易創新,國芯科技等公司資料,東方證券研究所 (1)
38、x86 架構:主導桌面架構:主導桌面/服務器服務器 CPU 市場市場 基于 CISC(復雜指令集)的 x86 架構是一種為了便于編程和提高存儲器訪問效率的芯片設計體系,包括兩大主要特點:一是使用微代碼,指令集可以直接在微代碼存儲器里執行,新設計的處理器,只需增加較少的晶體管電路就可以執行同樣的指令集,也可以很快地編寫新的指令集程式;二是擁有龐大的指令集,x86 擁有包括雙運算元格式、寄存器到寄存器、寄存器到存儲器以及存儲器到寄存器的多種指令類型。x86 架構主要參與者包括 Intel、AMD、海光、兆芯等。(2)ARM 架構:崛起移動市場和架構:崛起移動市場和 MCU 市場市場 ARM 架構過
39、去稱作進階精簡指令集機器,是一個 32 位精簡指令集處理器架構,其廣泛地使用在許多嵌入式系統設計,近年來也因其低功耗多核等特點廣泛應用在數據中心服務器市場。早期ARM 指令集架構的主要特點:一是體積小、低功耗、低成本、高性能;二是大量使用寄存器,且大多數數據操作都在寄存器中完成,指令執行速度更快;三是尋址方式靈活簡單,執行效率高;四是指令長度固定,可通過多流水線方式提高處理效率。ARM 架構的 CPU 參與者包括飛騰、鯤鵬等,還有諸多 MCU 廠商用 ARM 架構設計相關產品,包括意法半導體、兆易創新、普冉股份、恒爍股份等。(3)RISC-V 架構:物聯網時代的新選擇架構:物聯網時代的新選擇
40、RISC-V是加州大學伯克利分校設計并發布的一種開源指令集架構,其目標是成為指令集架構領域的 Linux,主要應用于物聯網(IoT)領域,但可擴展至高性能計算領域。RISC-V 采用BSDLicense 發布,由于允許衍生設計和開發閉源,吸引了一大批公司的關注,目前已有不少公司開發基于 RISC-V 的 IP 核,如 Si-Five、臺灣晶心、阿里平頭哥等已可提供基于 RISC-V 的處理器 IP 核,部分企業如兆易創新、北京君正等已開發出基于 RISC-V 的 MCU 芯片等。但整體上,由于 RISC-V 產業生態還比較薄弱,未來的發展仍有較長一段路要走。RISC-V 架構的參與者包括阿里平
41、頭哥,MCU 廠商包括國芯科技、賽昉科技等。(4)MIPS 架構:架構:在學術界影響廣泛在學術界影響廣泛 MIPS 是高效精簡指令集計算機體系結構中的一種,MIPS 的優勢主要有三點:一是發展歷史早,MIPS 在 1990 年代已經廣泛使用在服務器、工作站設備上。二是在學術界影響廣泛,計算機體系結構教材都是以 MIPS為實際例子。三是 MIPS在架構授權方面更為開放,授權門檻遠低于 x86、ARM,在2019年曾經有開放授權的實際動作,并且MIPS允許授權商自行更改設計、擴展指令,允許二次授權。(5)POWER 架構:架構:在部分汽車控制中有所應用在部分汽車控制中有所應用 POWER 架構是由
42、 IBM 設計的一種 RISC 處理器架構,POWER 在大型機領域獨具優勢。POWER3 是全球首款 64 位架構處理器,開始應用銅互聯和 SOI(絕緣體上硅)技術。直至 POWER9 依然追求最高性能,不僅具備亂序執行、智能線程等技術,還實現了 SMP(對稱多處理技術)的硬件一致性處理。POWER 架構 CPU價格高昂,主要應用于高端服務器領域,市場份額逐漸減少。POWER 架構目前恩智浦、飛思卡爾和國芯科技的部分產品中有采用。2.3.2 EDA 工具軟件基本被壟斷,軟件工具集群被卡脖子 EDA 工具軟件可大致可分為芯片設計輔助軟件、可編程芯片輔助設計軟件、系統設計輔助軟件等三類,可用于邏
43、輯綜合、布局布線、仿真、時序分析、物理驗證等。目前國內廠商使用的 EDA 軟件主要是 Synopsys、Cadence 和 Mentor Graphics、華大九天,其中美國公司 Synopsys、Cadence和Mentor Graphics三巨頭占據了EDA設計軟件市場95%以上的市場份額,控制了EDA設計軟件的發展。Synopsys、Cadence 等公司還將自己的軟 IP 集成在設計軟件中,壟斷了優化服務和基于設計庫的解決方案,進一步增加了用戶黏性,也提高了行業壁壘。CPU 專用專用 EDA 國產替代難度大國產替代難度大。我國的 CPU 專用 EDA 工具例如數字仿真、邏輯綜合、建模、
44、布局布線等水平比較差,長期依賴國外產品,尚無法完成完整集成電路的功能設計、綜合驗證和物理設計等全流程的軟件工具集群,完全替換應用的難度大。2.3.3 材料、設備、晶圓廠國產化率低,在諸多限制下提升困難 2022 年年制造設備幾家巨頭占市場份額制造設備幾家巨頭占市場份額 80%以上。以上。2022 年在半導體制造設備領域,美國的 AMAT公司、Lam Research 公司、KLA-Tencor 公司,荷蘭的 ASML 公司,日本的 Tokyo Electron 和Dainippon Screen 公司的銷售額幾乎占全球市場的 80%以上。尤其是光刻機,核心技術掌握在荷蘭的 ASML 公司,該公
45、司是全球唯一的高端光刻機生產商,其高端光刻機不僅售價高,而且產量低,優先被英特爾、臺積電、三星電子搶購,三家公司均占有股份。相較之下,國內晶圓廠面臨先進制程擴產的設備進口貿易管制。2022 年年境內晶圓廠市場份額比重低于境內晶圓廠市場份額比重低于 10%,工藝水平,工藝水平低于境外晶圓廠。低于境外晶圓廠。芯片制造環節主要涉及的企業有臺積電、三星、GlobalFoundries、中芯國際等,其中 2022 年境內企業占全球市場份額的比重低于 10%。工藝水平上,臺積電、三星等壟斷了先進制程代工,美國針對中國算力芯片公司的貿易管制給發展帶來挑戰。2021 年年半導體材料國產化率不足半導體材料國產化
46、率不足 15%。半導體材料整體國產化率低,關鍵材料國產化替代的需求十分迫切。2021年晶圓制造材料整體國產化率不足15%,其中工藝制程和先進封裝領域,半導體材料的國產化率更低。封測環節中國企業具備優勢。封測環節中國企業具備優勢。封測行業位于半導體產業鏈末端,其附加價值較低,勞動密集度高,技術壁壘較低,涉及的企業有 Amkor、ASE 日月光、KYEC、通富微電子等??傮w來看,在芯片產業鏈的六大環節中,唯有封測環節,中國企業具有明顯優勢,不會受到其他國家和地區制約。2.4 AI 芯片的關鍵性能差異 2.4.1 AI 芯片的關鍵特征包含數據特點、計算范式、精度、重構能力等 1)新型的計算范式:控制
47、流程簡化、計算量增大)新型的計算范式:控制流程簡化、計算量增大 AI 計算包括傳統計算和新的計算特質,處理的內容往往是非結構化數據(視頻、圖片等)。處理的過程通常需要很大的計算量,基本的計算主要是線性代數運算(如張量處理),而控制流程則相對簡單。2)訓練和推斷)訓練和推斷:需要高效的數據處理能力:需要高效的數據處理能力 AI 系統通常涉及訓練(Training)和推斷(Inference)過程。簡單來說,訓練過程是指在已有數據中學習,獲得某些能力的過程;而推斷過程則是指對新的數據,使用這些能力完成特定任務(比如分類、識別等)。滿足高效能機器學習的數據處理要求是 AI 芯片需要考慮的最重要因素。
48、3)數據精度:低精度成為趨勢)數據精度:低精度成為趨勢 低精度設計是 AI 芯片的一個趨勢,在針對推斷的芯片中更加明顯。對一些應用來說,降低精度的設計不僅加速了機器學習算法的推斷(也可能是訓練),甚至可能更符合神經形態計算的特征。2.4.2 AI 芯片設計趨勢 1)云端訓練和推斷:大存儲、高性能、可伸縮)云端訓練和推斷:大存儲、高性能、可伸縮 存儲的需求(容量和訪問速度)越來越高,處理能力推向每秒千萬億次(Peta FLOPS),并支持靈活伸縮和部署。隨著 AI 應用的爆發,對推斷計算的需求會越來越多,一個訓練好的算法會不斷復用。推斷和訓練相比有其特殊性,更強調吞吐率、能效和實時性,未來在云端
49、很可能會有專門針對推斷的 ASIC芯片(如 Google的第一代TPU),提供更好的能耗效率并實現更低的延時。2)邊緣設備:)邊緣設備:也需要具備一定的學習、本地訓練能力也需要具備一定的學習、本地訓練能力 相對云端應用,邊緣設備的應用需求和場景約束要復雜很多,針對不同的情況可能需要專門的架構設計。拋開需求的復雜性,目前的邊緣設備主要是執行“推斷”。在這個目標下,AI 芯片最重要的就是提高“推斷”效率。目前,衡量 AI 芯片實現效率的一個重要指標是能耗效率TOPs/W,這也成為很多技術創新競爭的焦點。未來,越來越多的邊緣設備將需要具備一定的“學習”能力,能夠根據收集到的新數據在本地訓練、優化和更
50、新模型。這也會對邊緣設備以及整個 AI 實現系統提出一些新的要求。最后,在邊緣設備中的 AI 芯片往往是 SoC 形式的產品,AI部分只是實現功能的一個環節,而最終要通過完整的芯片功能來體現硬件的效率。這種情況下,需要從整個系統的角度考慮架構的優化。因此,終端設備 AI 芯片往往呈現為一個異構系統,專門的 AI 加速器和 CPU,GPU,ISP,DSP 等其它部件協同工作以達到最佳的效率。3)軟件定義芯片)軟件定義芯片:能夠實時動態改變功能,滿足軟件不斷變化的計算需求能夠實時動態改變功能,滿足軟件不斷變化的計算需求 在 AI 計算中,芯片是承載計算功能的基礎部件,軟件是實現 AI 的核心。這里
51、的軟件即是為了實現不同目標的 AI 任務,所需要的 AI 算法。對于復雜的 AI 任務,甚至需要將多種不同類型的 AI 算法組合在一起。即使是同一類型的 AI 算法,也會因為具體任務的計算精度、性能和能效等需求不同,具有不同計算參數。因此,AI 芯片必須具備一個重要特性:能夠實時動態改變功能,滿足軟件不斷變化的計算需求,即“軟件定義芯片”。3 國產國產廠商的機遇:數據中心、國產化和先進封裝廠商的機遇:數據中心、國產化和先進封裝 3.1 數據中心快速發展帶來行業新機遇 我國數據中心業務規模持續高速增長。我國數據中心業務規模持續高速增長。根據工信部信息通信發展司數據,2017 年我國數據中心市場總
52、機架數量 166 萬架,2022 年預測達到 670 萬架,2017-2022E 復合增速達 32.2%。根據信通院發布的數據中心白皮書,隨著我國各地區、各行業數字化轉型的深入推進,我國數據中心市場收入將保持增長態勢。圖 9:我國數據中心機架規模 數據來源:工信部信息通信發展司,信通院,東方證券研究所 東數西算東數西算工程工程帶來大量服務器帶來大量服務器相關軟硬件相關軟硬件需求。需求。東數西算工程將通過構建數據中心、云計算、大數據一體化的新型算力網絡體系,將東部算力需求有序引導到西部,優化數據中心建設布局,促進東西部協同聯動。于2022年 2月,在京津冀、長三角、粵港澳大灣區、成渝、內蒙古、貴
53、州、甘肅、寧夏 8 地啟動建設國家算力樞紐節點,并規劃了 10 個國家數據中心集群。各地數據中心都將集聚大量服務器,如韶關數據中心集群提升網絡級別至國家級骨干網絡樞紐節點,預計到 2025年,韶關數據中心集群將建成 50 萬架標準機架、500 萬臺服務器規模,投資超 500 億元。3.2 在國產化浪潮中不斷突破不同市場 國產國產 CPU 在在政務、企業、消費級市場層層突破。政務、企業、消費級市場層層突破。CPU 市場主要分為三類:政務及重點行業市場、企業級市場以及消費級市場,它們的需求特點各異。政務及重點行業市場,對安全性和定制化的要求遠高于消費級市場,同時對產業生態的要求相對較低,與國產 C
54、PU當前的發展現狀非常契合,所以此板塊是近期國產 CPU的核心市場。企業級市場對產業生態的要求高于政務但低于消費級市場,此板塊是國產 CPU未來重要的增量市場。消費級市場對產業生態的要求最高,對性價比較為敏感,迭代周期短,是國產 CPU 長期需突破的目標市場,尤其是在桌面 CPU 生態方面還有較大的差距,還需要重點彌補。166226315401520670831672373094205400100200300400500600700800201720182019202020212022E總機架數量(萬架)大型規模以上機架數量(萬架)圖 10:CPU 三類市場劃分及特點 數據來源:龍芯中科,東方
55、證券研究所 政府及國有企事業單位政府及國有企事業單位為國產為國產 CPU 主陣地,主陣地,PC 芯片芯片已成已成百百億級市場。億級市場。政府機關和國有企事業單位是國產 CPU 的主陣地,根據國家統計局公布數據,推斷我國今年國有單位就業人數在 5600-5700 萬人(2020 年為 5563 萬人),根據統計局 2018 年公布的數據,規上企業計算機人均保有量為 0.29,考慮到政府和一些重要行業存在內網機需求,則假設人均保有量大約在 0.29-0.58 之間。;根據海光信息公布的 CPU 價格數據,預計 PC 芯片價格在 1k 左右,則 PC 芯片市場規模在 162-330 億元之間。表 6
56、:PC 芯片市場規模測算 名稱 悲觀情形 樂觀情形 國有單位就業人數(萬人)5600 5700 每人配備 PC 數量(臺/人)0.29 0.58 PC 數量(萬臺)1624 3306 PC 芯片價格(萬元)0.1 0.1 PC 芯片市場規模(億元)芯片市場規模(億元)162 330 數據來源:國家統計局,海光信息,東方證券研究所測算 黨政和重要行業的企業級市場為國產服務器主陣地,黨政和重要行業的企業級市場為國產服務器主陣地,2022年年服務器芯片市場規模約服務器芯片市場規模約130億億美美元。元。黨政、國有企業和部分重要領域的民營企業是國產服務器主陣地,根據 IDC 數據,政府需求占服務器總需
57、求比重約 9.1%,重要行業包括金融、電信、公共事業、能源、交通、教育、醫療等需求約占比 38.4%,2022 年合計服務器芯片的銷售額約為 130 億美元。表 7:2022 年中國服務器芯片市場規模 行業 服務器芯片市場規模(億美元)黨政 24.9 金融 30.6 電信 49.3 公共事業 5.6 能源 4.5 交通 6.1 教育 5.7 醫療 3.3 總計總計 130 數據來源:IDC,東方證券研究所 消費級市場空間廣闊,國產化勢在必行。消費級市場空間廣闊,國產化勢在必行。國產CPU在關鍵性能指標、使用體驗、生態建設等方面與海外廠商仍存在差異,目前很難在消費級市場具備競爭力。但底層硬件、基
58、礎建設自主化是勢在必行的,信創政策不斷強調關鍵技術自主可控原則,在關鍵平臺、關鍵組件以及關鍵信息基礎 設施上形成自主研發能力,降低外部依賴、避免單一依賴,消費級市場雖然不及政務和重要領域央國企對信息安全要求那么高,但是也屬于信息化的關鍵平臺和組件,推行自主化會不斷投入人力物力持續進行,與海外廠商的差距年限也呈逐步縮小趨勢,終將進入消費級市場。3.3 先進封裝助力國產 CPU 企業彎道超車 后摩爾時代的到來,我國我國CPU企業有望通過封測技術彎道超車企業有望通過封測技術彎道超車。從芯片制造工藝來看,一方面,CPU 制程進入后摩爾定律時期升級速度趨緩,國產 CPU 性能與國際主流水平逐步縮??;另一
59、方面,先進封裝技術成為競爭新賽道,我國封測廠商長電科技和通富微電在全球前五中占據兩席,通富與AMD緊密合作,在全球市場具備一定話語權。先進封裝的出現,讓業界看到了通過封裝技術推動芯片高密度集成、性能提升、體積微型化和成本下降的巨大潛力,先進封裝技術正成為集成電路產業發展的新引擎,我國 CPU企業有望通過封測技術彎道超車,彌補先進制程能力不足的缺陷。國產國產 CPU已經已經可以通過先進封裝技術實現性能提升與應用場景拓展??梢酝ㄟ^先進封裝技術實現性能提升與應用場景拓展。龍芯中科最新的 3D5000通過 Chiplet 把兩個 3C5000 硅片封裝在一起,是一款 32 核 CPU產品,已經可以面向
60、服務器市場使用,可滿足通用計算、大型數據中心、云計算中心的計算需求。圖 11:龍芯中科 3D5000 芯片 圖 12:3D5000 芯片由 2 顆 3C5000 芯片封裝而成 數據來源:龍芯中科,東方證券研究所 數據來源:龍芯中科,東方證券研究所 4 投資建議投資建議 AI 算力、低功耗等對服務器算力芯片提出新的要求,英偉達 GH200 有望加速全球 AI 服務器算力芯片市場變革,中國芯片企業在面臨挑戰的同時,也有望迎來發展機遇。我們建議關注海光信息(688041,買入)、寒武紀-U(688256,未評級)、龍芯中科(688047,未評級)、國芯科技(688262,未評級)、芯原股份(6885
61、21,未評級)、北京君正(300223,買入)、通富微電(002156,未評級)、長電科技(600584,買入)、深科技(000021,未評級)等。4.1 海光信息:國產服務器算力芯片龍頭 海光信息技術股份有限公司成立于2014年,主要從事高端處理器、加速器等計算芯片產品和系統的研究、開發,目標成為中國最重要的計算機芯片設計企業,為中國信息產業的強盛提供核心計算引擎。圖 13:海光信息公司及產品發展沿革 數據來源:海光信息招股書,東方證券研究所 上游公司與上游公司與 AMD 共建子公司,拿下共建子公司,拿下 IP 授權關鍵核心技術。授權關鍵核心技術。海光處理器源于 AMD 的技術授權,采用 X
62、86 架構,支持國內外主流操作系統、數據庫、虛擬化平臺或云計算平臺,能夠有效兼容目前存在的數百萬款基于 X86 指令集的系統軟件和應用軟件,具有優異的生態系統優勢。目前海光處理器性能參數上與國際同類型主流處理器產品相當,提供從 4 到 32 物理核心,8 到 64 線程,最多 128 路 PCle 擴展,8 通道內存支持,以及針對虛擬機性能優化的大容量緩存設計,能夠為云計算、大數據分析、分布式元存儲、Web 應用,人工智能、數據庫等眾多場景,提供強勁計算能力,具有國際先進水平的競爭力。海光擁有海光擁有 CPU 和和 DCU 兩類高端處理器產品,兩類高端處理器產品,覆蓋覆蓋服務器、工作站等計算、
63、存儲設備中對高端處服務器、工作站等計算、存儲設備中對高端處理器的功能需求。理器的功能需求。CPU 穩步迭代,穩步迭代,滿足互聯網、金融、電信、交通、能源等多行業需求滿足互聯網、金融、電信、交通、能源等多行業需求。海光 CPU 系列產品兼容x86 指令集以及國際上主流操作系統和應用軟件,性能優異,軟硬件生態豐富,安全可靠,可按應用場景劃分為 7000,5000,3000 三大產品系列。公司堅持自主創新,通過多代處理器產品的送代設計與開發,已基本形成“量產一代、研發一代、規劃一代”的產品持續演進節奏。目前,海光 CPU系列產品中海光二號為主力銷售產品,海光三號已經實現小批量銷售,海光四號、海光五號
64、處于研發階段。表 8:海光系列 CPU 特性及應用 系列系列 核心數核心數 PCIe 通道數通道數 內存通道數內存通道數 內存容量內存容量 最高加速頻率最高加速頻率 應用領域應用領域 7000 16-32 128 8 2TB/對計算能力、擴展能力、吞吐量有高要求的領域(包括云計算、大數據、數據庫、分布式存儲、人工智能等)5000 8-16 64 4 1TB/云計算、邊緣計算、分布式存儲等應用場景(滿足互聯網、金融、電信、交通、能源等多行業和企業的運算需求)3000 4-8 32 2/3.2GHz 入門級服務器、工作站、工業控制等市場(面向中小企業客戶和專業人員)數據來源:海光官網,東方證券研究
65、所 DPU 步入商業化,持續投入研發。步入商業化,持續投入研發。海光 DCU 系列產品以 GPGPU 架構為基礎,兼容通用的“類CUDA”環境以及國際主流商業計算軟件和人工智能軟件,軟硬件生態豐富,可廣泛應用于大數據處理、人工智能、商業計算等應用領域。目前海光 DCU 系列產品中,海光 DCU 系列產品深算一號為公司 GPGPU 主要在售產品,深算二號、深算三號處于研發階段。表 9:海光 DPU 規格特點 海光海光 8100 產品圖片產品圖片 典型功耗典型功耗 260-350W 典型運算類型典型運算類型 雙精度、單精度、半精度浮點數據和各種常見整型數據 計算計算 60-64 個計算單元(最多
66、4096 個計算核心)支持 FP64、FP32、FP16、INT8、INT4 內存內存 4 個 HBM2 內存通道 最高內存帶寬為 1TB/s 最大內存容量為 32GB I/O 16LanePCIeGen4 DCU 芯片之間高速互連 數據來源:海光信息招股說明書,東方證券研究所 4.2 寒武紀:領跑中國 AI 芯片市場 中科寒武紀科技股份有限公司成立于 2016年3月,自成立來專注于人工智能芯片產品的研發與技術創新,致力于打造人工智能領域的核心處理器芯片。寒武紀在人工智能芯片設計領域積累了較強的技術和研發優勢,是目前國際上少數幾家全面系統掌握了智能芯片及其基礎系統軟件研發和產品化核心技術的企業
67、之一,能提供云邊端一體、軟硬件協同、訓練推理融合、具備統一生態的系列化智能芯片產品和平臺化基礎系統軟件。公司產品公司產品體系成熟,覆蓋云邊端全矩陣。體系成熟,覆蓋云邊端全矩陣。公司主要產品包括終端智能處理器 IP、云端智能芯片及加速卡、邊緣智能芯片及加速卡以及與上述產品配套的基礎系統軟件平臺。自2016年3月成立以來,寒武紀快速實現了技術的產業化輸出,以約每年 1-2 件產品的速度推出了用于終端場景的寒武紀 1A、寒武紀 1H、寒武紀 1M 系列智能處理器;基于思元 220 芯片的邊緣智能加速卡及智能模組;基于思元 100、思元 270、思元 290 芯片和思元 370 的云端智能加速卡系列產
68、品。圖 14:全算力的產品布局 數據來源:2022 寒武紀企業社會責任報告,東方證券研究所 新一代訓練芯片寒武紀新一代訓練芯片寒武紀 590 訓練能力突出。訓練能力突出。據寒武紀在 2022 年 9 月介紹,思元 590 采用全新的MLUarch05 架構,訓練性能較在售產品有了顯著提升。思元 590 可提供更大的內存容量和更高的內存帶寬,其 PCIe 接口也較上代實現了升級。借助借助車云車云協同與高效開發優勢,開拓車載芯片領域。協同與高效開發優勢,開拓車載芯片領域。子公司寒武紀行歌借助既有優勢布局,滿足智能汽車市場不同的算力需求。1)通過車云協同獲得的數據迭代)通過車云協同獲得的數據迭代 A
69、I 模型,優化用戶體驗。模型,優化用戶體驗。自動駕駛芯片可以與寒武紀既有的云端訓練產品協作,通過車云協同,將車端的數據快速回傳,實現AI 模型的快速迭代升級,優化自動駕駛客戶體驗;2)提供可以在云端開發自動駕駛模型的軟件)提供可以在云端開發自動駕駛模型的軟件開發平臺。開發平臺。提供統一的軟件開發平臺,方便客戶在云端開發相應的自動駕駛模型,并省去不同平臺之間的移植、遷移和模型量化的工作,從夠縮減模型升級迭代周期,提高開發效率。圖 15:車云協同助力數據閉環與 AI 調優 圖 16:云邊端車協同 數據來源:寒武紀微信公眾號,東方證券研究所 數據來源:寒武紀微信公眾號,東方證券研究所 公司芯片和處理
70、器產品能應用于多個公司芯片和處理器產品能應用于多個“智能“智能+”產業”產業。公司的智能芯片和處理器產品可高效支持視覺、語音和自然語言處理等技術相互協作融合的多模態人工智能任務,輻射智慧互聯網、智能制造、智能交通、智能教育、智慧能源、智慧電力、智慧物流、智慧畜牧、智慧金融、智能家居、智慧醫療等“智能+”產業。表 10:寒武紀產品行業解決方案示例 行業行業 解決方案解決方案 作用效果作用效果 智慧智慧交通交通 車路協同、智慧鐵建等解決方案 提升云端及邊緣端算力,增強智慧軌道及交通系統的可靠性,推動交通行業的智能化升級。智慧智慧電力電力 變電站在線巡視系統、輸電線路巡檢方案 用智能裝備取代人工例行
71、巡檢,將視頻圖像高速傳輸,節省成本,簡化運維工作,支撐電網企業數字化、智能化轉型。智慧智慧醫療醫療 超聲智能篩查解決方案 以超聲視頻 AI 為切入點,對超聲視頻流進行實時智能分析,實現毫米級讀取超聲影像,快速、精準地抓取病灶,大幅減輕醫生閱片負擔。有效賦能基層醫療機構,為邊遠地區的醫院等提供高效的 AI 輔助篩查。數據來源:寒武紀微信公眾號,東方證券研究所 統一的基礎系統軟件平臺打破開發壁壘,加速產品落地。統一的基礎系統軟件平臺打破開發壁壘,加速產品落地。公司為云邊端智能芯片和處理器產品研發了統一的基礎系統軟件平臺,徹底打破云端、邊緣端、終端之間的開發壁壘,無須繁瑣的移植即可讓同一人工智能應用
72、程序便捷高效地運行在公司云邊端所有產品之上。云邊端體系化的智能芯片和處理器產品以及完全統一的基礎系統軟件平臺可大幅加速人工智能應用在各場景的落地,加快公司生態的拓展。圖 17:訓練軟件平臺 圖 18:推理加速引擎 MagicMind 數據來源:寒武紀官網,東方證券研究所 數據來源:寒武紀官網,東方證券研究所 4.3 龍芯中科:從指令集到架構全自主的 CPU“龍芯”系列是我國最早研制的通用處理器系列之一,于2001年在中科院計算所開始研發,得到了中科院、國家自然科學基金、863、973、核高基等項目的大力支持。2008 年 3 月 5 日,公司前身龍芯服務由轉移中心和中科算源共同出資設立,開始進
73、行處理器產品產業化的前期探索。2020 年,公司推出了自主指令系統 LoongArch(龍芯架構),公司整體變更為股份有限公司。公司實控人為胡偉武和晉紅夫婦,胡偉武長期擔任公司董事和總經理,晉紅長期擔任公司投資總監。胡偉武持有天童芯源 47.67%的股權,晉紅持有芯源投資 15.02%的合伙份額。胡偉武和晉紅通過天童芯源、芯源投資、天童芯正和天童芯國合計控制龍芯中科 33.61%的表決權。圖 19:龍芯中科股權結構(截至 2023.4.28)數據來源:龍芯中科招股書,龍芯中科公告,東方證券研究所 自主研發自主研發 LoongArch 指令集,芯片性能追趕國際主流產品指令集,芯片性能追趕國際主流
74、產品。公司自研 IP 和架構分為兩步,首先基于開源 MIPS 指令集定義自主指令集系統,然后基于自主指令集推出龍芯架構。第一步第一步:摒棄直接獲?。恨饤壷苯荧@取 IP 核授權或指令系統授權,自主定義上百條指令,形成核授權或指令系統授權,自主定義上百條指令,形成 MIPS 兼容的兼容的LoongISA 指令系統。指令系統。2018 年至 2020 年,公司銷售主要產品基于 MIPS 指令系統,但公司區別于國內其他 CPU 設計企業多數采用的 IP 核授權或指令系統授權模式,一直致力于自主研發指令系統,自研發初期即選擇基于開放度較高的指令系統并結合自研的模式,在授權體系相對開放的MIPS 指令系統
75、基礎上擴展了數百條自定義指令,形成了 MIPS 兼容指令系統 LoongISA,并在多款 CPU 芯片中得到應用。第二步第二步:推出了自主指令系統:推出了自主指令系統 LoongArch(龍芯架構),具備更高運行效率。(龍芯架構),具備更高運行效率。公司在經過長達十余年的潛心研發之后,于 2020 年推出了自主指令系統龍芯架構 LoongArch。龍芯指令系統具有較好的自主性、先進性與兼容性。龍芯指令系統從整個架構的頂層規劃,到各部分的功能定義,再到細節上每條指令的編碼、名稱、含義,在架構上進行自主重新設計,具有充分的自主性。LoongArch 吸納了現代指令系統演進的最新成果,運行效率更高,
76、同原有兼容指令系統相比,不僅在硬件方面更易于高性能低功耗設計,而且在軟件方面更易于編譯優化和操作系統、虛擬機的開發,相同的源代碼編譯成 LoongArch 比編譯成 MIPS 平均動態指令數可減少 10%-20%。圖 20:公司龍芯自主指令系統 數據來源:龍芯中科,東方證券研究所 LoongArch 架構能兼容架構能兼容 X86、ARM,且通過了知識產權評估。,且通過了知識產權評估。該架構可充分融合 X86、ARM 等國際主流指令特性,可實現跨指令平臺應用兼容。并通過國內權威第三方機構中國電子信息產業發展研究院的知識產權評估,認定 LoongArch 指令系統與 ALPHA、ARM、MIPS、
77、POWER、RISC-V、X86 為不同的指令系統設計。目前,龍架構已得到國際開源軟件界廣泛認可與支持,正成為與 X86/ARM 并列的頂層開源生態系統?;诨?LoongArch 架構的芯片產品已上市銷售,架構的芯片產品已上市銷售,實現服務器等領域的應用實現服務器等領域的應用。經過長期積累,龍芯中科基本完成技術“補課”,基于LoongArch架構的芯片產品龍芯3A5000已于2020年底流片,并于 2021 年 5 月開始銷售,面向服務器市場的 32 核產品 3D5000 已于 2023 年 4 月 8 日發布,集成了 32 個高性能 LA464 處理器核,頻率 2.0GHz,支持動態頻率
78、及電壓調節;片內集成 64MB片上 L3 共享緩存以及 8 個 72 位 DDR 3200 內存控制器,支持 ECC 校驗;搭載 5 個 HT3.0 高速接口,支持自研橋片及雙路、四路 CPU 擴展。圖 21:龍架構及其特性 圖 22:龍芯 3D5000 規格參數 數據來源:龍芯中科官網,東方證券研究所 數據來源:快科技,東方證券研究所 相關領域一通百通便于跨界,也具備相關領域一通百通便于跨界,也具備 MCU、GPU 核心技術實力。核心技術實力。公司掌握了處理器核及相關 IP核設計的核心技術,包括 CPU、GPU、內存控制器、IO 接口控制器、高速 SRAM、高速接口、鎖相環等核心 IP。龍芯
79、產品覆蓋桌面服務器、工控和嵌入式領域。龍芯產品覆蓋桌面服務器、工控和嵌入式領域。龍芯中科自研的芯片系列包括龍芯 1 號、龍芯 2號、龍芯 3 號三大系列處理器芯片及橋片等配套芯片。其中,龍芯 1、2、3 號系列處理器芯片分別服務于嵌入式領域、工業控制與終端等領域和桌面和服務器領域。而龍芯中科的配套芯片包括橋片及正在研發尚未實現銷售的電源芯片、時鐘芯片等,主要與龍芯 1 號、2 號、3 號處理器芯片配套使用。龍芯 1 號、2 號、3 號處理器芯片及配套芯片的主要客戶是板卡、整機廠商,系列產品在電子政務、能源、交通、金融、電信、教育等行業領域已獲得廣泛應用。圖 23:龍芯 CPU 系列及其應用 數
80、據來源:龍芯生態白皮書(2022 年),東方證券研究所 5 風險提示風險提示 與頭部廠商技術差距縮小不及預期:與頭部廠商技術差距縮小不及預期:CPU、GPU市場被國外廠商占領多年,目前呈對海外產品進行國產替代的態勢,如與頭部廠商技術差距縮小不及預期,勢必影響國產替代進程進而影響行業內相關公司業績。信創市場增長不及預期:信創市場增長不及預期:信創市場目前仍是國產 CPU、GPU 等重要下游,若信創市場增長不及預期,勢必影響行業內相關公司業績。產業鏈供應鏈保障不及預期:產業鏈供應鏈保障不及預期:CPU、GPU領域是美國貿易管制的重點領域,產業鏈供應鏈面臨層層封鎖,設計、生產和迭代升級面臨阻礙,若管
81、制進一步嚴苛,可能進一步影響行業內相關公司正常生產進而影響業績。假設條件變化影響測算結果的風險:假設條件變化影響測算結果的風險:前文測算基于國有單位就業人數、人均配備 PC 和單價等假設,若假設條件變化,也將影響測算結果。6 附錄附錄 非上市算力芯片公司非上市算力芯片公司 6.1 華為:布局五大系列芯片,鯤鵬、昇騰滿足服務器和 AI需求 布局五大系列芯片。布局五大系列芯片。華為公司自 1991 年起投身芯片事業,到目前共有五大系列芯片,逐步實現了全場景布局。五大系列芯片包括手機消費級設備領域的麒麟芯片、服務器領域的鯤鵬芯片、人工智能領域的昇騰芯片、5G 手機基帶領域的巴龍芯片以及家用路由器領域
82、的凌霄芯片。圖 24:華為五大系列芯片全景圖 數據來源:華為官網,東方證券研究所 鯤鵬芯片鯤鵬芯片在非在非 x x8686 指令集產品中有明顯優勢指令集產品中有明顯優勢?!蚌H鵬芯片族”是集合“算、存、傳、管、智”功能為一體的處理器。其中,2019 年發布的鯤鵬 920 是華為鯤鵬獲得 ARMv8 指令集永久授權后,自主研發設計的最具代表性的產品。鯤鵬 920 處理器是業界第一顆采用 7nm 工藝的數據中心級的 ARM 架構處理器,集成最多 64*自研核,支持 64 核、48 核、32 核等多種型號。通過優化分支預測算法、提升運算單元數量、改進內存子系統架構等一系列微架構設計,大幅提高處理器性能
83、。典型主頻下,SPECint Benchmark 評分超過 930,超出業界標桿 25%,同時,能效比優于業界標桿 30%,在非 x86 指令集產品中算力有明顯優勢。表 11:鯤鵬 920 處理器產品特性 高性能高性能 鯤鵬 920 處理器的整型測試性能超過 930 分,是鯤鵬 916 的三倍性能。高吞吐高吞吐 內存帶寬高:內存通道數量提升到 8 通道,內存速率提升至 2933MHz,帶寬提升 2.4 倍。IO 帶寬高帶寬高 PCIe3.0 升級到 PCIe4.0,速率翻番,IO 總帶寬提升 1.7 倍。網絡帶寬高網絡帶寬高 集成 100GRoCE 以太網卡功能,網絡帶寬提升 10 倍 高集成
84、高集成 鯤鵬 920 處理器集成了 CPU、南橋、網卡、SAS 存儲控制器等 4 顆芯片的功能,能夠釋放出服務器更多槽位,用于擴展更多加速部件功能,大幅提高系統的集成度。高效能高效能 鯤鵬 920 處理器在相同功耗下性能表現提高了 35%。數據來源:世界互聯網大會官網,百度百科-鯤鵬 920 處理器,東方證券研究所 基于鯤鵬處理器,華為基于鯤鵬處理器,華為在云計算、大數據等領域在云計算、大數據等領域進行進行重要戰略布局。重要戰略布局。新應用、新技術、新計算架構,百億級聯接、爆炸式數據增長將重塑 ICT 產業新格局,催生新的計算產業鏈條,涌現出新的廠家和新的生態體系。在此趨勢下,華為作為鯤鵬計算
85、產業的成員之一,推出了鯤鵬生態伙伴計劃,推動和完善華為鯤鵬生態。鯤鵬計算產業包括全棧 IT 基礎設施、行業應用及服務,涵蓋 PC、服務器、存儲、操作系統、中間件、虛擬化、數據庫、云服務、行業應用以及咨詢管理服務等。鯤鵬計算滿足高性能、低功耗、低延時的綠色計算要求,有巨大的市場空間。圖 25:IDC 預測 2023 年全球計算產業投資額 圖 26:華為鯤鵬計算產業定位與展望 數據來源:鯤鵬計算產業發展白皮書,東方證券研究所 數據來源:鯤鵬計算產業發展白皮書,東方證券研究所 生態兼具兼容性與自主性,兼容生態兼具兼容性與自主性,兼容 ARM 生態也針對多場景建設自主生態。生態也針對多場景建設自主生態
86、。在鯤鵬生態建設上,華為與全球生態廠家合作,重點投入了操作系統、編譯器、工具鏈、算法優化庫等的開發和維護,同時針對數據中心大數據、分布式存儲、云原生應用等場景,開發基于鯤鵬處理器的解決方案產品和參考設計。由于擁有 ARMv8 指令集永久授權,鯤鵬計算產業能兼容全球 ARM 生態,二者共享生態資源,互相促進、共同發展。而為了保證鯤鵬計算產業的可持續演進,鯤鵬處理器還從指令集和微架構兩方面進行兼容性設計,確保既可以適應未來的應用和技術發展演進的需求,又能后向兼容保護用戶已有投資。圖 27:華為 5 大關鍵芯片演進策略 數據來源:鯤鵬計算產業發展白皮書,東方證券研究所 鯤鵬處理器在行業數字化轉型過程
87、中發揮重要作用。鯤鵬處理器在行業數字化轉型過程中發揮重要作用。數字化和行業的結合正在向縱深發展。制造業從大規模傳統制造走向大規模智能制造;服務業(如金融、電信、醫療)從簡單服務走向綜合服務,公共事業從被動服務走向主動服務(如政府、交通)。行業從端到端打通各種數據,實現行業自身服務升級的同時,提升效率、降低運營成本和快速迭代成為各行各業對 IT 技術、計算產 業的基礎訴求。鯤鵬處理器端云同構、綠色節能與多核高并發的強勁算力底座,在制造業、服務業與公共事業的數字化轉型中發揮重要作用。表 12:各行業數字化轉型需求 行業行業 需求來源需求來源 端端-云云同構同構 綠色綠色節能節能 高高并并發發 互聯
88、網互聯網 云端數據中心服務器走向同構,移動應用將受益于架構和指令集的兼容;數據擁有海量、瞬時的特性。電信電信 5G 打破數據中心與邊緣終端界限,催生新興業務。政府政府 需要海量數據管理與分析、海量數據聯接和海量城市終端感知,共享城市資源。制造業制造業 工業互聯網催生低功耗嵌入式芯片需求,需要通過傳感器、嵌入式控制器和應用系統聯網,構建“端-云”體系架構,結合 AI,實現制造業的集中化和智能化。交通交通 端測需要全景全量感知周邊態勢和環境信息,及時執行扣費;邊緣側需要及時準確的智能決策信息;云端需要可持續迭代演進的大腦。金融金融 渠道與實時交易類場景進行全分布式轉型,需要更高算力能效比;經營分析
89、場景將切換為開放架構,需要高分布式并發能力;智慧金融需要兼顧高并發和移動端的協同;傳統業務場景向云化改造,需要低功耗降成本。醫療醫療 大數據和 AI 技術將驅動實現疾病預測、個性化精準醫療、個性化藥物、醫療圖譜、醫學影像分析等的智慧醫療;醫療數據多樣且海量,催生綠色低功耗和大算力的計算需求。數據來源:鯤鵬計算產業發展白皮書,東方證券研究所 6.2 飛騰:從 CPU 研發到全棧式方案 飛騰信息技術有限公司由中國電子信息產業集團、天津市濱海新區政府和天津先進技術研究院于2014 年聯合支持成立。飛騰公司致力于飛騰系列國產高性能、低功耗通用計算微處理器的設計研發和產業化推廣。表 13:飛騰公司發展沿
90、革 年份年份 飛騰公司發展重要事件飛騰公司發展重要事件 2014 8 8 月月,天津飛騰信息技術有限公司成立 2015 3 3 月月,飛騰發布 FT-1500A 系列 CPU,主要面向桌面終端和服務器領域 2016 8 8 月月,飛騰于 Hotchips-28 大會發布 FT-2000/64 高性能服務器 CPU 2017 飛騰推出 FT-2000+/64 高性能服務器 CPU,填補了我國高端通用 CPU 領域的空白 飛騰推出 FT-2000A/2 嵌入式 CPU,飛騰形成了桌面、服務器和嵌入式完善的自主 CPU 產品譜系 2018 1 1 月月,基于飛騰 CPU 的“中國電子網絡安全和信息化
91、科技創新工程”獲國家科技進步一等獎 1111 月月,飛騰 FT-2000+/64 獲“中國芯”年度重大創新突破產品獎 1212 月月,飛騰“國產高性能微處理器創新團隊”入選國家科技部“重點領域創新團隊”2019 9 9 月月,飛騰發布 FT-2000/4 高效能、高安全桌面 CPU 1111 月月,飛騰發布從端到云基于飛騰平臺的全棧解決方案白皮書 1212 月月,飛騰安全平臺架構標準 PSPA(Phytium Security Platform Architecture)發布 2020 1 1 月月,飛騰 FT-1500A 系列 CPU 及應用榮獲國家科技進步一等獎 4 4 月月,飛騰發布解決
92、方案方陣,聚焦信創領域應用落地“最后一公里”問題 5 5 月月,飛騰發布軟件生態手冊,“軟硬兼施”加速信創產業進程 7 7 月月,飛騰發布新一代多路服務器 CPU 飛騰騰云 S2500 8 8 月月,FT-2000/4 銷量突破 100 萬片 1111 月月,基于飛騰 CPU 的全國產化 DCS 在華電集團、華能集團旗下多個電廠成功投運 1212 月月,飛騰發布 8 核高效能桌面 CPU 飛騰騰銳 D2000 1212 月月,飛騰人工智能生態聯合實驗室正式成立 2021 4 4 月月,公司更名為“飛騰信息技術有限公司”6 6 月月,推出飛騰套片 X100 7 7 月月,飛騰攜手 35 家金融行
93、業知名生態伙伴重磅發布金融解決方案白皮書 7 7 月月,飛騰發布飛騰基礎軟件聯合實驗室、飛騰數據庫聯合實驗室、飛騰云計算聯合實驗室 8 8 月月,飛騰發布首個硬件生態產品手冊 1010 月月,飛騰公司啟動“共飛騰”計劃二期項目征集令 1010 月月,基于飛騰騰銳 D2000 的國產化 PC 整機成功在中國移動溫州分公司信創示范營業廳落地應用 數據來源:飛騰公司官網,東方證券研究所 從仿從仿英特爾架構指令集轉向應用英特爾架構指令集轉向應用 ARM 指令集。指令集。公司致力于飛騰系列國產高性能、低功耗通用計算微處理器的設計研發和產業化推廣。前兩代飛騰芯片均停留在學術層面,均采用仿英特爾架構及指令集
94、的方法對芯片基礎技術進行學習消化。自第三代產品 FT-1000 以來,飛騰芯片轉而采用SPARC 指令架構下的 OpenSPARC 指令集。而隨著 Sun 公司被 Oracle 收購,SPARC 架構的支持逐步減弱,飛騰芯片逐步轉向應用 ARM 指令集,并推出在原有 FT-1500 芯片上改進得來的探索性產品 FT-1500A。2015年 8月飛騰已設計出世界上第一款基于 ARM架構的 64核 CPU。飛騰CPU 同樣像華為鯤鵬一樣,基于 ARMV8 架構永久授權,其產出成果中,飛騰 2000+/64 核產品性能已經與英特爾主流 E5 部分產品性能相當。飛騰公司產品譜系全、性能高、飛騰公司產品
95、譜系全、性能高、低功耗、低功耗、生態完善、自主化程度高。生態完善、自主化程度高。目前產品主要包括高性能服務器 CPU(飛騰騰云 S 系列)、高效能桌面 CPU(飛騰騰銳 D 系列)、高端嵌入式 CPU(飛騰騰瓏 E 系列)和飛騰套片四大系列,為從端到云的各型設備提供核心算力支撐。其中,飛騰騰云S系列、飛騰騰銳 D系列、飛騰騰瓏 E系列均采用飛騰自主研發的處理器核心?;陲w騰 CPU的產品覆蓋多種類型的終端(臺式機、一體機、便攜機、瘦客戶機等)、服務器和工業控制嵌入式產品等,在國內政務辦公、云計算、大數據以及金融、能源和軌道交通等行業信息系統領域已實現批量應用。表 14:飛騰 CPU 產品分類及
96、定位 類型類型 特性特性 定位定位 高性能服務器高性能服務器 CPU(飛騰騰云(飛騰騰云 S 系列)系列)業界領先的事務處理能力和單位功耗性能 高吞吐率、高性能的服務器領域(如行業大型業務主機、高性能服務器系統和大型互聯網數據中心等)高效能桌面高效能桌面 CPU(飛騰騰銳(飛騰騰銳 D 系列)系列)高能效處理器核心,性能卓越、功耗適度 最新產品內置硬件級安全機制 PC、一體機、筆記本、5GRRU 基站、可信終端、高端交換機、圖形工作站和一些邊緣輕量級服務器產品(同時滿足信息化領域對性能、能耗比和高安全的應用需求)高端嵌入式高端嵌入式 CPU(飛騰騰瓏(飛騰騰瓏 E 系列)系列)高安全、高可靠、
97、強實時、低功耗 嵌入式行業(滿足行業終端產品、工業控制領域應用產品需求)數據來源:飛騰官網,信創產業發展公眾號,東方證券研究所 飛騰研發進展快速,產品迭代迅猛。飛騰研發進展快速,產品迭代迅猛。在自主核心技術的加持下,成立當年 2014 年,飛騰就完成了第一款兼容 ARM指令集的 CPUFT-1500A的研制,各項產品指標被鑒定為“國際先進、國內領先”,獲得了 2019 年度國家科技進步一等獎。2019 年,飛騰推出的國際 ARM 體系首款 64 核通用 CPUFT-2000+/64 處理器,填補了國產高端通用 CPU 領域的空白。2022 年,飛騰推出了新一代嵌入式CPU芯片飛騰騰瓏E2000
98、,采取了“柔性架構”大小核設計,可充分滿足云終端、行業平板、電力、軌道交通、服務器 BMC、網絡設備等行業領域和場景的多樣化需求。成立至今,飛騰從兩年研發一代產品,到一年研發 2-3 款新產品,創新速度不斷升級,行業賦能效應也愈發凸顯。目前飛騰已面向不同的應用領域自主研發十余款量產芯片。表 15:飛騰三大產品系列發展路線及應用 年份年份 2014 2015 2016 2017 2018 2019 2020 2021 2022 騰云騰云 S 系列系列 高性能服務器 CPU(應用于計算和存儲服務器、云計算、數據中心等)FT-1500A/16 16 核,4DDR3 15GHz 35W FT-2000
99、+/64 64 核,8DDR4 2.0-2.3GHz 100W S2500 64 核,28 路直連 2.02.2GHz 150W TBD S5000 PSPA1.0 TBD S6000 PSPA2.0 騰銳騰銳 D 系列系列 高能效桌面 CPU(應用于桌面整機、一體機、便攜機等)FT-1500A/4 4 核,2DDR3 1.5-2GHz 15W FT-2000/4 4 核,2.6-3.0GHz 10W TBD D2000 PSPA1.0 TBD D3000 PSPA2.0 騰瓏騰瓏 E 系列系列 高端嵌入式 CPU(應用于嵌入式裝備信息系統、工業控制等)FT-2000A/2 2 核 1.0GH
100、z 3W TBD E2000 PSPA1.0 TBD E3000 PSPA2.0 數據來源:從端到云-飛騰平臺全棧解決方案白皮書,東方證券研究所 飛騰飛騰從從芯片設計逐步轉變提供系統級解決方案。芯片設計逐步轉變提供系統級解決方案。飛騰從信息系統整體規劃與建設角度出發,為集成商和最終用戶梳理飛騰生態圖譜,并面向各行業需求提供一套從端到云的全棧解決方案。目前飛騰與國內伙伴單位展開合作,形成了基于飛騰平臺的云計算全棧、邊緣計算全棧、終端全棧、嵌入式全棧生態,為集成商和客戶提供了更豐富的選擇空間。合作伙伴數量快速突破。合作伙伴數量快速突破。截至 2022 年 6 月底,飛騰的生態伙伴數量已經突破 44
101、00 家,包括集成商合作伙伴 300+家、硬件合作伙伴930家、軟件合作伙伴3100+家。目前,飛騰已聯合數千家國內軟硬件廠商,支撐了 2400 多款飛騰平臺設備上市,已經和正在適配的軟件和外設超過 8300 種,與 8200 多款開源軟件產品完成了適配,兼容 200 萬級移動 APP 應用。圖 28:基于飛騰平臺的終端全棧架構 數據來源:從端到云-飛騰平臺全棧解決方案白皮書,東方證券研究所 6.3 兆芯:行業拓展成果顯著 上海兆芯集成電路有限公司于 2013 年 4 月 27 日在自貿區市場監督管理局登記成立,是一家以從事研究和試驗發展為主的企業?,F如今掌握了自主通用處理器及其系統平臺芯片研
102、發設計的核心技術,全面覆蓋其微架構與實現技術等關鍵領域,構建了較為完整的知識產權體系,截至目前已申請 1500 余件專利,獲權約 1300 件。2023 年 4 月 12 日起從上海兆芯集成電路有限公司變更為上海兆芯集成電路股份有限公司。表 16:兆芯公司發展沿革 年份年份 兆芯公司發展重要事件兆芯公司發展重要事件 2013 4 月月,上海兆芯集成電路有限公司正式成立。2014 5 月月,成功完成 ZX-C 系列處理器自主設計研發工作。2015 4 月月,ZX-C 系列處理器實現規模量產。2016 6 月月,ZX-C+系列 8 核處理器規模量產。8 月月,兆芯首款采用 SoC 設計的開先KX-
103、5000 系列處理器成功流片。8 月月,開先ZX-C+系列 4 核處理器、ZX-100S 芯片組規模量產。8 月月,正式形成“開先系列 PC/嵌入式處理器”和“開勝系列服務器處理器”兩大產品體系。10 月月,開先ZX-C 系列處理器榮獲中國國際工業博覽會金獎。2017 3 月月,開先ZX-C 系列處理器榮獲“第十一屆(2016 年度)中國半導體創新產品和技術”和“2017 年度大中華 IC設計成就獎”兩大獎項。12 月月,開先KX-5000/開勝KH-20000 系列處理器及 ZX-200IO 擴展芯片成功發布。2018 3 月月,采用 16nmFFC 工藝,主頻高達 3.0GHz 的開先KX
104、-6000 系列處理器成功流片。12 月月,上??萍即髮W兆芯國產化云桌面實訓教室正式掛牌并開放服務。6 月月,ZX-200IO 擴展芯片通過 USB 協會 Platform Interoperability Lab(PIL)測試認證工作,被正式列入USB3.1CertifiedProducts 列表。兆芯因此成為大陸首家自主設計開發該 IP,并且成功實現量產的公司。9 月月,開先KX-6000 系列處理器榮獲第 20 屆中國國際工業博覽會金獎。9 月月,采用兆芯通用處理器的聯想昭陽 CF03 筆記本圓滿完成 2018 年中非合作論壇北京峰會會務保障工作,全程零故障。2019 3 月月,兆芯開先
105、KX-6000 系列處理器榮獲 2019 年中國 IC 設計成就獎(年度最佳 FPGA/處理器),兆芯 CPU 研發團隊榮獲 2019 年中國 IC 設計成就獎(中國優秀 IC 設計團隊)。6 月月,開先KX-6000/開勝KH-30000 系列處理器正式發布,主頻高達 3.0GHz,率先在國產通用處理器主頻關鍵技術指標上實現重大突破。2020 2 月月,兆芯北京喬遷至中關村集成電路設計園,開啟全新發展征程。2021 1 月月,張江兆芯項目順利奠基開工。2022 11 月月,開勝KH-40000 系列服務器處理器、開先KX-6000GPC/嵌入式處理器成功發布。2023 1 月月,開先KX-6
106、000G 系列處理器榮獲第十七屆“中國芯”優秀技術創新產品獎。4 月月,公司名稱變更為“上海兆芯集成電路股份有限公司”。數據來源:兆芯官網,東方證券研究所 產品包括產品包括“開先”“開先”PC/嵌入式處理器和“開勝”服務器處理器系列。嵌入式處理器和“開勝”服務器處理器系列。兆芯基于 X86 的 CPU產品性能優異,生態成熟,具有杰出的軟硬件兼容性。根據中國軟件評測中心的測試結果,2019 年兆芯推出的開先 KX-6000 系列處理器/開勝 KH-30000 系列處理器單芯片性能已經達到了 7 代 i5 的同等水平。同時開先 KX-6000/開勝 KH-30000 系列處理器均通過了 Windo
107、ws 硬件認證,對Windows7、Windows10、中科方德、中標麒麟、普華等國內外主流操作系統進行了適配,從多方面保證了產品的穩定性、可靠性和兼容性。2022 年,開勝KH-40000 系列服務器處理器、開先KX-6000GPC/嵌入式處理器成功發布。與上一代產品相比,開先 KX-6000G 系列處理器能效比提升多達 60%,GPU 性能達到上一代產品的 4 倍,可支持雙路 4K 視頻解碼,芯片空閑功耗降低 50%,能夠進一步支撐無風扇 BoxPC、工業平板、電力通訊管理機、OPS 模塊等嵌入式計算平臺,對于高性能、低功耗、高可靠、高品質圖形圖像等方面的應用需求,大幅提升用戶體驗。表 1
108、7:兆芯處理器芯片家族 型號型號 圖例圖例 架構架構 代號代號 工藝工藝 發布發布 日期日期 最高最高 工作頻率工作頻率 內核數內核數 應用領域應用領域 PC/嵌入式嵌入式 處理器處理器 開先KX-6000G 系列處理器 陸家嘴 16nm Q422 3.3GHz 4 核 一體機、筆記本、便攜式終端以及物聯網計算平臺等(兼顧高性能、低功耗需求)開先KX-6000 系列處理器 陸家嘴 16nm Q219 3.0GHz 8 核/4 核 高性能桌面、便攜終端、嵌入式等 開先KX-5000 系列處理器 五道口 28nm Q417 2.0GHz 8 核/4 核 桌面、嵌入式等 開先ZX-C+系列處理器 張
109、江 28nm Q316 2.0GHz 4 核 高性能運算 開先ZX-C 系列處理器 張江 28nm Q215 2.0GHz 4 核 高性能運算 服務器服務器 處理器處理器 開勝KH-40000 系列處理器 永豐 16nm Q422 2.7GHz 32 核/16 核/12 核 云計算、大數據分析、視頻處理、數據庫備份、高性能存儲及超融合一體機 開勝KH-30000 系列處理器 陸家嘴 16nm Q219 3.0GHz 8 核 服務器、存儲等 開勝KH-20000 系列處理器 五道口 28nm Q417 2.0GHz 8 核 服務器、存儲等 開勝ZX-C+FC-1080/1081 系列處理器 張江
110、 28nm Q216 2.0GHz 8 核 高性能運算 IO 擴展擴展芯片芯片/芯片組芯片組 ZX-200IO 擴展芯片 /40nm Q417/(對擴展性要求較高的)桌面/便攜終端,服務器,嵌入式等 ZX-100S 芯片組 /40nm Q316/服務器、存儲、對擴展性要求較高的桌面 數據來源:兆芯官網,東方證券研究所 兆芯產品應用覆蓋全面,兆芯產品應用覆蓋全面,在金融信創在金融信創桌面桌面 PC 領域擁有高領域擁有高市占率。市占率。目前,基于“開先”、“開勝”系列自主處理器,兆芯攜手產業伙伴已經打造出多品牌臺式機、筆記本、一體機、云終端、服務器及多品類的物聯網計算平臺。產品應用覆蓋 20多個省
111、市自治區、國家電網、南方電網,五大國有銀行、多家股份制銀行、城商行、農信和證券保險機構,在金融信創領域桌面 PC 市占率達 8成。圖 29:兆芯芯片產品應用圖譜 數據來源:兆芯微信公眾號,東方證券研究所 行業解決方案行業解決方案遍布多領域,助力應用創新與數字化升級遍布多領域,助力應用創新與數字化升級。在政務、金融、電信、能源等行業領域,兆芯平臺 PC 及物聯網計算平臺的產業化應用也取得了持續性突破,正在以優越、可靠的品質和使用體驗,為用戶業務的有序開展與數字化創新提供保障和支撐。2022 年,兆芯還聯合統信軟件與麒麟軟件兩大國產基礎軟件供應商,圍繞數字辦公、安全防護、云服務、基礎通用、智慧校園
112、、工控安全等方向,面向多元行業領域,提供一系列完整的國產化應用解決方案,進一步為政企及行業的應用創新和數字化轉型升級創造發展空間。表 18:兆芯行業拓展成果 政務政務 廣泛服務于全國 30 多個省、自治區及直轄市的政務部門;深度支撐 40 多家部委辦公及業務應用;實現法治信息化建設項目垂直領域桌面產品全應用;入駐全國 30 多家省級電商平臺和 200 多家地市級電商平臺;金融金融 基于兆芯的桌面終端在金融信創市場占有率達 80%,被廣泛應用于銀行、保險、證券等金融機構,支撐超過 200 家用戶單位的日常辦公、柜面業務等有序開展,得到金融行業用戶的廣泛青睞;基于兆芯的金融機具類產品是目前主要的信
113、創路線之一,在超過 100 家的金融機構中保障行業安全;電信電信 以絕對優勢的份額落地國內大型運營商 11 家下屬單位全年桌面辦公產品采購項目;成功入圍國內大型運營商 2022-2023 年終端集中采購項目;能源能源 電力行業信創終端產品整體市場占有率位列前茅;成功應用于石油行業云桌面項目,并入圍中國石化信創終端設備框架協議采購;基于兆芯的嵌入式產品已經被應用于 4 大類電力核心控制系統,在超過 1000 個核心節點中大量使用;稅務稅務 2021 年、2022 年,連續 2 年國稅集采領域兆芯平臺信創整機市場占有率第一;教育教育 借助處理器和終端產品的性能以及生態優勢,基于兆芯 CPU的信創整
114、機及嵌入式產品已在全國 17 個省市、100 余所學校實現應用落地;基于兆芯的 3 類信創電教室核心產品,已經落地有超過 100 家教室,交通交通 基于兆芯的信創整機在軌道交通、民航等領域均取得了實質性的突破;基于兆芯的嵌入式產品已經被公路、鐵路等客戶列為主流信創路線之一,4 個案例落地,保障交通安全;醫療醫療 率先牽頭在近 20 家醫療單位開展基于兆芯 CPU 的信創整機適配及部署工作;基于兆芯的 4 類嵌入式計算產品已在 6 家醫院成功應用;數據來源:兆芯微信公眾號,東方證券研究所 共創應用生態,共建開源社區。共創應用生態,共建開源社區。2022 年,兆芯通過主動適配以及與統信軟件、麒麟軟
115、件建立聯合實驗室的三方認證方式,共計完成 23,000 余份生態兼容適配工作,覆蓋基礎軟件、應用軟件、應用系統、云平臺、硬件外設、網絡安全、開發框架等類型,包含云桌面/云平臺、網絡安全、人工智能、大數據、OA 辦公、區塊鏈等應用,持續助推信創生態的完善和繁榮。兆芯還積極助推開源社區發展,先后參與 openKylin、OpenKunlun、Deepin、OpenCloudOS 等開源社區共建,通過自主創新、兼容主流的發展路線,利用兆芯處理器自主定義、設計和演進方面的創新能力,以及產品性能、兼容性等方面優勢,積極深化社區合作,推動各類產品應用的適配和技術創新,助力社區繁榮,服務產業發展。6.4 申
116、威:以自研指令集保障關鍵領域 成都申威科技有限責任公司成立于 2016 年 11 月 25 日,公司以“自主創新”“安全可控”為研發首要,成立至今相繼推出了一系列基于申威處理器的可控、可信并具有自主知識產權的產品。2003 年,在我國超算芯片受制于人的情況下,為解決在超算和國防、信息安全無“芯”可用的困境,具有軍工背景的總參謀部第五十六研究所(無錫江南計算技術研究所)于2003年開始著手設計中國人自己的高性能芯片,申威由此應運而生。依靠依靠 Alpha 指令集起家,自研指令集起家,自研 SW64 指令集指令集構建基礎生態構建基礎生態。指令集架構上,申威的 CPU 屬于Alpha指令集陣營,技術
117、來源于美國DEC公司的 Alpha21164。Alpha架構被經轉手、收購之后,如今指令集和微結構都已經不再更新,技術專利大多過期或臨近過期。而申威是目前 Alpha 陣營中僅存的碩果,擁有自主擴展指令和發展路線的自主權。申威在 Alpha21164 基礎上開發出自己的擴展指令、神威睿智編譯器以及基于 Linux的神威睿思操作系統。而后申威推出了 100%自研的SW64 指令集,放棄了 Alpha 指令集。CPU 產品 2003 年第一代申威處理器完全兼容 ALPHA 指 令,所有功能實現均獨立完成。在第二代申威處理器研發過程中,已經不再參考、兼容ALPHA相關指令系統,根據應用需要,自主設計
118、實現指令系統,同時基于此構建了申威自主基礎軟件生態。SW64 完全自主,顯著降低技術與完全自主,顯著降低技術與 IP 依賴性。依賴性。知識產權評估權威機構工業和信息化部軟件與集成電路促進中心(CSIP)對申威指令系統的評估結論是:“申威指令系統是一種與之前常見指令系統(ALPHA、MIPS、ARM、X86、POWER 等指令集)不同的自主指令系統?!鄙晖軜嬘袆e于引進 CPU架構,是完全自主的架構,知識產權和自主研發能力不受限制。申威可自主發展,不會有被斷供、制裁或停止授權的風險,可為關鍵領域提供長遠的、可控的供應鏈和技術支撐。如今國產系統基本都接入了 SW64 指令集,如麒麟操作系統信操作系
119、統,歐拉操作系統。圖 30:申威 26010 圖 31:申威 CPU 基本特征 數據來源:申威官網,東方證券研究所 數據來源:鐵君微信公眾號,東方證券研究所 申威申威是是國內自主設計、擁有完全自主處理器架構國內自主設計、擁有完全自主處理器架構的芯片的芯片。作為目前唯一國內自主設計、擁有完全自主的處理器架構,申威真正實現了全流程安全可控的國產處理器。申威處理器具有高計算性能、高集成度、高訪存帶寬、高 I/O 性能的特點。申威芯片覆蓋高性能、服務器、桌面和嵌入式 CPU以及配套的外圍 IO 橋片,形成“大、中、小”系列化、多品種國產自主芯片。申威處理器的全面推廣應用打破了國外處理器知識產權的壟斷和
120、生產工藝的技術封鎖,是保障國家信息安全的必要戰略儲備。表 19:申威產品特性及應用 產品產品 產品類型產品類型 發布發布時間時間 核心數核心數 內存容內存容量量 工作頻率工作頻率 工藝工藝 應用領域應用領域 SW26010 高性能 多線程 處理器 2014 260 32GB 1.5GHz 28nm 超算服務器等 SW111 高性能 單核 處理器/1 8GB 800MHz1.0GHz 40nm 軍工、工控等 SW221 高性能 多核 處理器/2 32GB 2.0GHz 28nm 高密度計算型嵌入式領域 SW411 2017 2/4 16GB 1.01.6GHz 40nm 中低端服務器和高端桌面計
121、算機 SW421 2017 4 64GB 2.0GHz 28nm 中低端服務器和高端桌面計算機 SW421M 2017 2/4 32GB 2.0GHz 28nm 中低端桌面計算機 SW1621 2017 16 256GB 2.0GHz 28nm 高性能計算和中高端服務器 數據來源:申威官網,東方證券研究所 申威申威 26010 實現量產并在超算領域得以應用實現量產并在超算領域得以應用。申威 26010 處理器解決了 260 個核心構成 SoC 芯片帶來的各種挑戰,具有接近工藝極限的 Die 面積。整個處理器支持亂序執行,頻率 1.45GHz,包括 4 個 MPE(Management Proc
122、essing Element)管理單元、4 個 CPE(Computing Processing Element)計算單元及 4 個 MC 內存控制器單元組成,其中 CPE 單元又由 8x8 陣列的64 核心組成,所以總計是 260 個核心(4x64+4=260)。申威 26010 實現了量產,并在 2016 年部署的“神威 太湖之光”超級計算機系統中應用?!吧裢?太湖之光”包含4萬多顆“申威26010”芯片,連續四次在世界超級計算機 TOP500 榜單中排名第一,并榮獲多項科技與計算領域頂級榮譽?!吧裢狻笔侵袊売嬎銘妙I域近年來的重大突破。圖 32:“神威太湖之光”外觀 表 20
123、:“神威太湖之光”性能及參數 測試性能測試性能 93.015PFLOPS 系統峰值系統峰值 125.436PFLOPS 主要參數主要參數 40 機柜/160 超級節點/40960 個計算節點 40960 顆 SW26010260C1.45GHzCPU 單節點 32GB 內存,全系統 1.31PB 內存 自主高速網絡 國產申威睿智操作系統(RaiseOS)2.0.5 整機功耗 15371MW 數據來源:中存儲網,東方證券研究所 數據來源:DeepTech 深科技微信公眾號,東方證券研究所 信息披露信息披露 依據發布證券研究報告暫行規定以下條款:依據發布證券研究報告暫行規定以下條款:發布對具體股票作出明確估值和投資評級的證券研究報告時,公司持有該股票達到相關上市公司已發行股份1%以上的,應當在證券研究報告中向客戶披露本公司持有該股票的情況,就本證券研究報告中涉及符合上述條件的股票,向客戶披露本公司持有該股票的情況如下:就本證券研究報告中涉及符合上述條件的股票,向客戶披露本公司持有該股票的情況如下:截止本報告發布之日,資產管理、私募業務合計持有長電科技(600584)占發行量 1%以上 提請客戶在閱讀和使用本研究報告時充分考慮以上披露信息。