1、2022 年深度行業分析研究報告 2 2 5 目 錄 一、服務器及CPU綜述 二、全球CPU市場格局 三、服務器視角看CPU發展趨勢 四、國產CPU行業篇 1.1 服務器的定義及分類 1.2 CPU的定義及分類 五、國產CPU廠商篇 3 Q1:CPU占服務器的成本比重? 根據IDC,在經典的基礎服務器中CPU成本約占服務器整體硬件成本的32%; 在在更高高性能的服務器中,如面向計算推理的AI服務器,處理器相關成本占比高達50%-83%。 本章導讀 Q2:服務器CPU的分類? 按指令集架構分類,主要可分為復雜指令集(CISC)服務器和精簡指令集(RISC)服務器。 CISC:一條指令完成一個復雜
2、的基本功能。單條指令集功能強,指令類型豐富完善,編譯后指令數量較少,通用場景下性能具有優勢。以x86架構為代表,主要用于桌面PC及服務器領域,配套軟硬件豐富完善。 RISC:一條指令完成一個基本動作,多條指令組合完成一個復雜的基本功能。指令集架構在不斷完善,譯碼效率高,偏向低功耗領域優化。以ARM架構為代表,還包括MIPS、Power、Risc-V等,過去主要用于手機、平板等移動終端,軟硬件生態逐步建設完善。 1.1 服務器信息化時代的基石產品 4 服務器的定義 服務器是一種高性能計算機,其中包含向網絡用戶提供特定服務的軟件和硬件,它比普通計算機運行更快、負載更高、價格更貴。服務器的定義包含了
3、以下兩個方面的內容:一方面,服務器可以為網絡提供特定服務,人們通常會以服務器所能提供的服務來命名服務器;另一方面,服務器是軟件和硬件的統一體,特定的服務程序需要運行在特定的硬件或一般通用的微機上才能完成服務功能,由服務程序完成服務策略,并通過硬件實現所需的服務。 服務器的功能 服務器可以為網絡中的客戶機(如PC、智能手機、大型系統設備等終端)提供特定應用服務,主要完成數據的存儲、傳輸、處理和發布。 服務器的構成 由處理器(CPU)、內存、磁盤、網卡、監視器、電源、機箱系統總線等軟硬件構成。其中最重要的部分是CPU和內存,CPU 用于實現判斷和計算功能,內存用于暫時存放CPU 的運算數據,以及與
4、硬盤、外部存儲交換數據。 服務器的性能 由于需要提供高可靠的服務,服務器在處理能力、穩定性、可靠性、安全性、可擴展性、可管理性等方面的要求比普通的個人電腦高。同時服務器具有高速的CPU運算能力、長時間的可靠運行、強大的I/O外部數據吞吐能力以及更好的擴展性。 1.1 全球服務器發展歷程 5 第一代電子管計算機時代 1946年,第一臺電子計算機ENIAC研制成功;1951年,IBM生產出第一臺用于科學計算的大型機IBM 701;1953年,IBM推出了第一臺用于數據處理的大型機IBM702和第一臺小型機IBM650,為第一代商用計算機描繪出了一個豐滿而生動的形象。 1946-1954年年 晶體管
5、造就第二代計算機 1954年,第一臺使用晶體管的第二代計算機TRADIC誕生于美國貝爾實驗室,采用了浮點運算,實現計算能力的飛躍;1958年,大型科學計算機IBM 7090誕生,實現了晶體化;1961年,第一臺流水線計算機IBM7030研制成功,其成為了超級計算機的雛形 1954-1964年年 集成電路使第三代計算機脫胎換骨 1964年,第一臺通用計算機IBM/360研制成功,其采用了集成電路技術,實現了通用性(集科學計算、數據處理和實時控制功能于一身)、系列化(區分了小型機、大型機和超級計算機,統一了指令格式、數據格式、字符編碼、IO接口和中斷系統,實現了不同型號兼容)和可擴展性(具有開發價
6、值),成為了計算機發展史上的一個重要里程碑; 1964-1970年年 第四代計算機時代 1970年,IBM S/370問世,單晶硅電路技術、虛擬存儲器技術、多處理技術相繼應用其中,到1976年,S/370已發展成為具有17種型號的龐大家族。 1981年,S/370系列的地址線位數被增加到了31位,大大增強了其尋址能力,并且在存儲方面還增加了擴展存儲器,與主存分離,改善了系統性能。80代年上半葉以前,服務器主要是面向高端用戶。80年代下半葉,大型機系統體系機構更新步伐加快。1986年,IBM 9370系列發布,標志著S/370開始向低端方向延伸,目標是服務于中小型企業。 1970年至今年至今 1
7、.1 服務器的構成 6 服務器的主要組成部分 服務器的邏輯架構仍然遵循馮諾依曼架構,主要包含:處理器(CPU、GPU、DPU等)、存儲器、I/O接口,以及SSD、BMC、PCIe插槽、主板、電源、風扇和相關軟件等。 處理器是服務器的大腦,根據IDC,以經典x86服務器E5高配為例,CPU成本在基礎型服務器中約占32%,在更高高性能的服務器中,處理器相關成本占比高達 50%-83%。 三大核心零部件(處理器、內存、硬盤)成本占服務器總成本比例約為服務器總硬件成本的80%。 服務器內部結構圖 各類服務器成本構成 1.1 服務器的分類 7 按服務器形態分類 刀片式服務器: 塔式服務器: 機架式服務器
8、: 標準高度的機架式機箱內可插裝多個卡式的服務器單元,實現高可用和高密度。每一塊“刀片”實際上就是一塊獨立的服務器。 正面類似PC機,但側面較長,無統一標準,一般無需和機柜搭配 外形類似交換機,有1U(1U=1.75英寸)、2U、4U等標準規格。 優點:價格低 缺點:體積較大 使用場景:中小企業及入門級客戶 優點:體積小,統一工業標準生產 缺點:擴充性受限,散熱問題 使用場景:大型企事業單位及IDC 優點:空間密度較高 缺點:存儲能力不如機架式服務器 使用場景:特殊應用行業及高性能計算機、云計算等 機柜式服務器: 面向新一代數據中心的形態,功能模塊和支撐模塊分離,容易實現統一集中管理和業務自動
9、部署。 優點:高密度、模塊化、節省電能 缺點:定制化設備,對機房稱重要求嚴苛 使用場景:大型數據中心 1.2 CPU服務器的大腦 8 處理器作為服務器的核心組成部分,對于服務器的整體性能發揮有著決定性的作用。此處列舉中央處理器(CPU),圖形處理器(GPU)以及深度學習處理器(DPU)這三大對于現今服務器行業有著長遠影響的處理器。 CPU 中央處理器(CPU),是電子計算機的主要設備之一,電腦中的核心配件。其功能主要是解釋計算機指令以及處理計算機軟件中的數據。CPU主要包括兩個部分,即控制器、運算器,其中還包括高速實現緩沖處理器之間聯系的數據、控制的總線。其功效主要為處理指令、執行操作、控制時
10、間、處理數據。在計算機體系結構中,CPU 是對計算機的所有硬件資源(如存儲器、輸入輸出單元) 進行控制調配、執行通用運算的核心硬件單元。CPU 是計算機的運算和控制核心。計算機系統中所有軟件層的操作,最終都將通過指令集映射為CPU的操作。 1.2 CPU服務器的大腦 9 處理器作為服務器的核心組成部分,對于服務器的整體性能發揮有著決定性的作用。此處列舉中央處理器(CPU),圖形處理器(GPU)以及深度學習處理器(DPU)這三大對于現今服務器行業有著長遠影響的處理器。 GPU DPU 圖形處理器(GPU),又稱顯示核心、視覺處理器、顯示芯片,是一種專門在個人電腦、工作站、游戲機和一些移動設備(如
11、平板電腦、智能手機等)上做圖像和圖形相關運算工作的微處理器。GPU使顯卡減少了對CPU的依賴,并進行部分原本CPU的工作,尤其是在3D圖形處理時GPU所采用的核心技術有硬件T&L(幾何轉換和光照處理)、立方環境材質貼圖和頂點混合、紋理壓縮和凹凸映射貼圖、雙重紋理四像素256位渲染引擎等。GPU的構成相對簡單,有數量眾多的計算單元和超長的流水線,特別適合處理大量的類型統一的數據。但GPU無法單獨工作,必須由CPU進行控制調用才能工作。 數據處理器(DPU)最早由國內深鑒科技提出,基于Xilinx可重構特性的FPGA芯片,設計專用的深度學習處理單元,且抽象出定制化的指令集和編譯器,從而實現快速的開
12、發與產品迭代。DPU集三個關鍵要素于一身,分別為: 行業標準的、高性能及軟件可編程的多核CPU,通?;谝褢脧V泛的Arm架構,與其的SOC組件密切配合。 高性能網絡接口,能以線速或網絡中的可用速度解析、處理數據,并高效地將數據傳輸到GPU和CPU。 各種靈活和可編程的加速引擎,可以卸載AI、機器學習、安全、電信和存儲等應用,并提升性能。 1.2 CPU的分類指令集 10 按照設計思路的不同,CPU可分為復雜指令集(CISC)架構和精簡指令集(RISC)架構。 CISC(Complex Instruction Set Computer):一條指令完成一個復雜的基本功能。單條指令集功能強,指令類
13、型豐富完善,編譯后指令數量較少,通用場景下性能具有優勢。以x86架構為代表,主要用于桌面PC及服務器領域,配套軟硬件豐富完善。 RISC(Reduced Instruction Set Computer):一條指令完成一個基本動作,多條指令組合完成一個復雜的基本功能。指令集架構在不斷完善,譯碼效率高,偏向低功耗領域優化。以ARM架構為代表,過去主要用于手機、平板等移動終端,軟硬件生態逐步建設完善。 CISC RISC 指令系統 復雜、龐大 精簡 指令數目 一般大于200條 一般小于200條 指令字長 不固定 定長 可訪存指令 不限制 只有Load/store指令 通用寄存器數 較少 多 各種指
14、令使用頻率 相差較大 都比較常用 控制方式 絕大多數為微程序控制 絕大多數為組合邏輯控制 指令流水線 可通過一定方式實現 必須實現 代表架構 x86 ARM、MIPS、RISC-V等 特點 高性能、生態完善 低功耗、生態逐步完善 應用場景 桌面PC、服務器 移動終端、服務器 CISC RISC 處理器性能: = 兩種指令集設計思路 兩種指令集差異 優化每個程序的指令數量 犧牲每個指令的時鐘周期 犧牲每個程序的指令數量 減少每個指令的時鐘周期 x86 ARM、MIPS、Power、RISC-V等 1.2 CPU的分類x86 11 按CPU體系架構分類 X86架構簡介: X86架構應用場景: X8
15、6架構(The X86 architecture)是微處理器執行的計算機語言指令集,指一個intel通用計算機系列的標準編號縮寫,也標識一套通用的計算機指令集合。X86指令集是美國Intel公司為其第一塊16位CPU(i8086)專門開發的,同時電腦中為提高浮點數據處理能力而增加的X87芯片系列數學協處理器則另外使用X87指令,后續就將X86指令集和X87指令集統稱為X86指令集。雖然隨著CPU技術的不斷發展,Intel陸續研制出更新型的i80386、i80486直到今天的Pentium 4(以下簡為P4)系列,但為了保證電腦能繼續運行以往開發的各類應用程序以保護和繼承豐富的軟件資源,所以In
16、tel公司所生產的所有CPU仍然繼續使用X86指令集。X86架構具有性能高、速度快、兼容性好的特點,目前占據了服務器、桌面及移動PC的主要市場份額。 適用于高主頻、高功耗,覆蓋高性能和通用計算場景,主要運用于PC和自動化設備,也有應用在手機和平板電腦上。X86運行的主要為DOS,非ARM版Windows,舊版MacOS等操作系統,起步早,基于Wintel聯盟,生態完善。 1.2 CPU的分類ARM 12 按CPU體系架構分類 ARM架構簡介 ARM架構,曾稱進階精簡指令集機器(Advanced RISC Machine)更早稱作Acorn RISC Machine,是一個32位精簡指令集(RI
17、SC)處理器架構,此外還有基于ARM設計的派生產品,包括Marvell的XScale架構和德州儀器的OMAP系列。ARM架構具有成本低、低費用、低功耗、小體積、高性能的特點,同時是業界領先的微處理器體系結構,為系統和軟件工程師提供了開發低耗能、高性能消費類和工業產品的硅驗證解決方案,其完整產品線包括微控制器、微處理器、圓形處理器、實現軟件、單元庫、嵌入式內存、高速連接產品、外設以及開發工具。 ARM架構應用場景 類別 領域 應用 嵌入式 家用電器、HVAC系統、智能測量平臺、觸摸屏控制器、遠程醫療、安全/監視、航空電子 ARM將嵌入式歸類為利用微控制器作為主處理器的所有應用程序。在家用電器、H
18、VAC系統、智能測量平臺、觸摸屏控制器等應用程序中,ARM Cortex-M系列處理器是理想解決方案的核心。ARM Cortex-A系列處理器在遠程醫療、安全/監視、航空電子領域的應用同樣屬于類別。 企業 閃存卡和UFD、家庭網絡 ARM將企業應用程序定義為提供網絡連接和/或存儲功能的完整系統或子系統。這包括家庭和公司網關、企業路由器、以太網交換機、無線訪問點、基站、多服務配置平臺、硬盤驅動器、網絡連接存儲和固態磁盤。隨著更高性能的多核處理器核心和經過優化的性能改進物理邏輯IP的問世,可通過ARM技術滿足需求的上述應用領域得到了拓展。 家庭 藍光和DVD、計算數字機頂盒、靜態數碼相機、數字電視
19、、游戲 ARM為用戶在所有屏幕類型上隨時隨地地訪問和享受媒體內容,并與這些內容交互提供了技術平臺。 移動 智能手機、功能手機連接和調制解調Trustzone和移動支付 ARM在提供支持一系列移動設備的處理器和其他關鍵模塊方面占據著市場領先地位,這些設備可在提供卓越性能的同時延長電池壽命。將PC性能、優異的多媒體性能和卓越連接融入到移動設備的功率范圍中耗費了ARM和芯片合作伙伴的大量設計精力。 1.2 CPU的分類MIPS 13 按CPU體系架構分類 MIPS架構簡介 MIPS是高效率、低功耗CPU設計原則中的閃耀明星,已經在移動和嵌入式工業領域銷售了近三十年。這一架構于20多年前由斯坦福大學開
20、發,是一種簡潔、優化、具有高度擴展性的RISC架構。它的基本特點是:包含大量的寄存器、指令數和字符、可視的管道延時時隙,這些特性使MIPS架構能夠提供最高的每平方毫米性能和當今SoC設計中最低的能耗。MIPS公司的R系列就是在此基礎上開發的RISC工業產品的微處理器。這些系列產品為很多計算機公司采用構成各種工作站和計算機系統。 MIPS架構應用場景 領域 應用 聯網 基于MIPS的FourGee-3100芯片組用于多款Chromebook筆記本電腦,例如惠普Chromebook 11和華碩Chromebook 13.3。 基于MIPS 34K多線程CPU的RT6856被廣泛用于眾多知名品牌的家
21、用無線路由器中,例如華碩、友訊(D-Link)、領勢(Linksys)和合勤(ZyXEL)。 消費類多媒體 松下、LG等品牌的數字電視搭載了晨星半導體(MStar)的SoC,而34K MIPS CPU則廣泛用于這些SoC中。 企業存儲 博安思通信(PMC-Sierra)利用多線程功能為其企業服務器專用maxRAID架構提供極具競爭力的性能。 汽車 MIPS因受到Mobileye的青睞而在汽車行業占據了舉足輕重的地位。Mobileye是ADAS(高級駕駛輔助系統)領域的全球領導者,目前大部分ADAS都采用了Mobileye的技術。 物聯網 Creator Ci40物聯網中心開發板使用了運行頻率5
22、50MHz的多線程MIPS inter Aptiv CPU。 14 2 5 目 錄 一、服務器及CPU綜述 二、全球CPU市場格局 三、服務器視角看CPU發展趨勢 2.1 CPU產業鏈 2.2 CPU市場規模 2.3 CPU全球市場格局 2.4 CPU全球主要廠商 四、國產CPU行業篇 五、國產CPU廠商篇 15 Q3:服務器市場格局? x86仍是主力,ARM奮起直追。2018年前,x86架構的服務器占據全球服務器99%以上市場份額;2020年,采用ARM架構服務器的市場份額快速提升至2.7%。 在x86領域里,Intel仍是王者,AMD挑戰勢頭正盛。Intel在全球服務器市場的份額一直保持在
23、90%以上,AMD自從推出基于Zen架構的EYPC系列服務器后開始不斷侵蝕Intel的地盤,截至2021年H1,AMD服務器出貨量占比超過10%。 本章導讀 Q4:CPU的主要玩家? 基于x86架構的王者Intel與挑戰者AMD;基于ARM架構的挑戰者Apple。 本章亦詳細梳理了三家廠商在UMA(Unified Memory Architecture,統一內存架構)方向的嘗試與布局,探討CPU未來演進的方向眾核、異構、集成。 2.1 CPU產業鏈 上游包括晶體代工、設備、封裝測試和內核授權四個方面,覆蓋面廣。上游中相關產業存在超額利潤率,CPU產業市場集中,能夠對上游縱向壟斷,且壟斷性強。
24、中游包括CPU設計企業、ARM授權及嵌入式處理器三部分。全球龍頭包括英特爾(IDM模式)、AMD,國內廠商包括中科曙光、中國長城、華為海思等。 下游包括PC、服務器、消費電子、物聯網等。下游產業在國內外都擁有巨大市場,整體利潤率高,但壟斷情況相對較低。 上游 安全集成 中游 下游 晶體代工 設備 封裝測試 內核授權 CPU處理器 ARM授權 嵌入式處理器 PC、服務器 消費電子 物聯網 16 2.2 集成電路市場規模 17 全球集成電路行業穩步增長,重心由歐美轉向亞太 數據來源: WSTS,2011-2019全球集成電路行業市場規模及增速 (億美元) 2020年全球前十大集成電路廠商銷售收入
25、(億美元) 亞太地區經濟水平快速發展,居民消費能力提升,對集成電路產品的需求增加,因此世界集成電路市場重心也轉移至亞太地區。2020年,根據數據統計,亞太地區(除日本外)已成為全球最大的集成電路市場,銷售額占全球市場的62.0%。2019 年受全球宏觀經濟低迷影響,行業景氣度有所下降,下半年開始逐步回暖。伴隨5G、可穿戴設備及云服務器市場的穩健成長,行業收入較2019年有所增長。預計2021年全球集成電路行業將持續保持復蘇勢頭,至2025年將保持穩步增長的趨勢。 從全球競爭格局的角度看,集成電路產業的頭部效應較為明顯,少數領軍企業占據了市場的主導地位。目前,全球集成電路市場主要由美國、韓國、日
26、本以及中國臺灣企業所占據。 702.4 562 252.7 221 179.1 157 130.7 110.1 102.1 111 01002003004005006007008002470 2382 2517 2773 2745 2766 3432 3933 3304 -3.6% 5.7% 10.2% -1.0% 0.8% 24.1% 14.6% -16.0% -20%0%20%40%050010001500200025003000350040004500201120122013201420152016201720182019全球集成電路行業銷售額 增速 2.2 CPU市場規模 18 CPU
27、市場規模穩健回升,國內市場增長空間巨大 2015-2020年全球及中國桌面出貨量(億臺) 2015-2020年全球服務器出貨量(億臺) CPU的重要應用領域包括桌面和服務器,每臺桌面通常只有一顆CPU,而每臺服務器的CPU數量不定。桌面領域,2015年-2018年全球出貨量增速呈現緩慢下降的趨勢,但是整體出貨量依然保持在2.6億臺/年左右。2019年開始,全球桌面出貨量出現回升,2020年全球桌面出貨量較前5年有較大增長。服務器領域,根據IDC數據,2020年全球服務器出貨量達1,220萬臺,同比增長3.9%。 國內桌面領域,近年來出貨量同樣呈現緩慢下降的趨勢,但是整體出貨量依然保持在 0.5
28、 億臺/年左右。近兩年采用國產 CPU 的桌面產品發展迅速,但市場份額仍不足 5%,增長空間巨大。國內服務器領域,根據 IDC 數據,2020 年中國服務器出貨量為 350 萬臺,同比增長 9.8%。 0.1 0.1 0.1 0.1 0.1174 0.122 -1.6% 6.6% 15.8% -0.4% 3.9% -4%1%6%11%16%00.020.040.060.080.10.120.14201520162017201820192020出貨量 增長率 2.8 2.6 2.6 2.6 2.7 3.0 0.6 0.6 0.5 0.5 0.5 -5.8% 0.0% -0.4% 3.1% 13.
29、5% -4.2% -3.9% -2.5% -2.7% -10%-5%0%5%10%15%00.511.522.533.5201520162017201820192020全球出貨量 中國出貨量 全球增長率 中國增長率 2.3 CPU全球競爭格局 19 X86領域:Intel和AMD占領市場 X86架構目前占據服務器、桌面及移動PC的主要市場份額,非X86架構產品不斷發起進攻。 2018-2019年,在X86領域,AMD市場規模增長了1.0%,Intel市場份額小幅度下滑,但仍然呈現出主導態勢。 在服務器領域,Intel市占率仍然高達96%以上,同時AMD公司正在努力提升自己的市場份額,從2018
30、年的1.8%增長到2019年的3.9%,同比增長117.0%。 在筆記本電腦領域,AMD市占率大幅上升,從2018年的10%增長到2019年的14.6%,Intel則下降了5.1%。 在桌上型電腦領域中,AMD市占率持續上升,兆芯也占據了一定市場份額。 全部X86 桌上型電腦 服務器 筆記本電腦 20182018 85.4% 14.6% IntelAMD90.0% 10.0% IntelAMD98.2% 1.8% IntelAMD96.1% 3.9% IntelAMD86.0% 14.0% IntelAMD85.0% 15.0% IntelAMD86.4% 13.4% 0.2% IntelAM
31、D兆芯 82.3% 17.6% 0.1% IntelAMD兆芯 20192019 2.3 CPU全球競爭格局 20 非X86領域:ARM占據絕對優勢 非X86架構CPU重要參與廠商 幾種非X86架構對比 在非X86領域,ARM以低能耗、高效率、發展時間長的優勢占據移動終端市場的主導地位,使用最廣泛、發展最成熟,市占率達到43.2%;RISC-V發展時間短且更加靈活,在物聯網領域備受關注,近幾年以其開源性質被重點關注發展,后續有望在新興領域嶄露頭角;MIPS主要應用在網關、機頂盒等網絡設備中,市占率達到9%;Power所代表的小型機是企業IT基礎設施的核心,但在相關市場的占有率僅1%左右;Alp
32、ha指令集基本已退出國際主流應用;SPARC早先被Sun公司開源,后被Oracle公司并購,如今已消失。 在移動終端方面,ARM占據絕對優勢,通過授權占據移動設備端90%以上的市場,構成市場上的標準架構;在服務器方面,非X86目前參與者有華為、飛騰、高通、亞馬遜等,華為的鯤鵬服務器是ARM服務器的重要參與者,而國產龍芯是基于MIPS的服務器重要廠商;在桌面PC市場,ARM正逐漸被跟多企業應用,2011年微軟開始采用ARM的Windows系統,ARM開始進入X86的傳統優勢領域,如今蘋果MacOS、新版Windows等均采用了ARM。 公司名稱公司名稱 架構架構 主要產品主要產品 蘋果蘋果 AR
33、M A12x、A14、M1等芯片廣泛應用于蘋果iPad,Mac等熱門產品中 三星電子三星電子 ARM Exynos系列芯片 高通高通 ARM 經典高通驍龍系列芯片在手機市場應用廣泛 聯發科聯發科 ARM 天璣系列芯片在手機上應用廣泛 龍芯龍芯 MIPS 網絡相關硬件、激光打印機、視頻游戲等具有優勢應用地位。龍芯3B4000屬于龍芯服務器CPU產品線 MIPSMIPS AlphaAlpha PowerPower SPARCSPARC 代表公司代表公司 龍芯 申威 IBM Oracle 主要應用領域主要應用領域 黨政辦公 超算 高性能計算 超算 可控性可控性 國產龍芯2020年底準備研發完全采用中
34、國技術的可兼容指令集 服務器和桌面領域,申威初步建立了包括CPU、操作系統、數據庫、辦公軟件等在內的國產生態,實現從不可用到基本可用的初突破 在高性能計算領域有重要地位,其一些技術特性可與Intel一較高下 - 市占率市占率 黨政辦公領域占一定比例 超算領域占一定比例 1%左右 將近消失 2.4 CPU廠商- 21 產品布局: X86:英特爾在服務器CPU領域的布局,自首款產品Pentium Pro推出以來,已經有25年之久。近12年來,英特爾服務器CPU的平臺包括:Thurley 、 Romley、Grantley、Purley和Whitley,公司預計2021年發布全新的Eagle Str
35、eam。這些服務器CPU的演化幾乎采用了和桌面CPU相同的“Tick-Tock”(鐘擺)戰略,即在“Tick”時升級CPU的制程,而在“Tock”時升級微架構。2017年以來,英特爾將服務器CPU的原有的E7、E5、E3產品線由高到低細分為Platinum(鉑金)、Gold(金)、Silver(銀)、Bronze(銅),滿足從低階的中小企業到高階的人工智能,不同的性能需求。2020年6月,英特爾發布了最新的Whirley平臺的Cooper Lake服務器CPU,使用14nm+制程,支持8通道DDR4 ECC內存和PCIE3.0協議。 ARM/MIPS/Power:為了保證電腦能繼續運行以往開發
36、的各類應用程序以保護和繼承豐富的軟件資源,所以很長一段時間內Intel公司所生產的所有CPU仍然繼續使用X86指令集。 2.4 CPU廠商- 22 產品布局: RISC-V : 2021年10月英特爾就已推出了基于RISC-V架構的Nios V處理器。2022年2 月 ,以X86架構為主的英特爾宣布加入RISC-V 國際基金會,并設立了10億美元基金用于扶持初創和成熟企業進行代工生態的創新,其中很大一部分資金將用于RISC-V。 RISC-V基金會白金成員 5月,Intel推出史上第一個雙核處理器Pentium D系列,采用90nm工藝核心,每核心擁有1MB L2緩存,均是800MHz的FSB
37、,隨后還推出了帶超線程技術的Pentium Extreme Edition 840處理器,雙核四線程,FSB也提升到了1066MHz,頻率也更高。 2005年年 2006年年 2013年年 2014年年 Intel的單核到多核之路:自Intel在1978年推出第一顆x86處理器8086后,CPU的發展方向一直都是整合更多的指令集與外部控制器,以及更高的主頻。當CPU的單核效能與頻率都到瓶頸之后,Intel與AMD都開始向多核發展。 2.4 CPU廠商- Pentium D處理器的繼任者是非常經典的Core 2 Due處理器,而且他們還用當年炮制首款雙核處理器的手法造出了首款四核處理器Core
38、2 Quad。而首款桌面級的四核處理器誕生于2006年11月2日,首發產品為Core 2 Extreme Edition QX6700。 3月16日推出的Core i7-980X是首款6核處理器,核心代號Gulftown,它基于Westmere架構,處理器每核心擁有256KB L2緩存,共享12MB L3緩存,主頻是3.33GHz,最高睿頻3.6GHz。 桌面市場的第一顆真八核處理器是Intel在2014年推出的Core i7-5960X,屬于22nm的Haswell-E架構,基礎頻率3GHz,最高睿頻3.5GHz,擁有20MB L3緩存,屬于HEDT的X99平臺。 23 Intel在5月發布
39、的Core i7-6950X是首款桌面的十核處理器,它所用的Broadwell-E架構其實就是Haswell-E的制程升級版,生產工藝從22nm升級到14nm,核心數量從上代Core i7-5960X的8核增加到10核,晶體管數量也從26億增加到32億,但因為更先進的制程工藝,芯片面積從355.52mm2縮減到246mm2。 2016年年 2017年年 2020年年 Intel的單核到多核之路:自Intel在1978年推出第一顆x86處理器8086后,CPU的發展方向一直都是整合更多的指令集與外部控制器,以及更高的主頻。當CPU的單核效能與頻率都到瓶頸之后,Intel與AMD都開始向多核發展。
40、 2.4 CPU廠商- 6月份,Intel推出了第七代Core X系列處理器,包括Skylake-X與Kabylake-X兩種不同架構的處理器,Skylake-X處理器多了12核、14核、16核、18核的產品,并且用Core i9取代Core i7成為Intel消費級市場上最強處理器的代名詞。 Intel的Lakefield項目于2019年正式公開,2020年正式上市,這款產品的實驗性質很重,它是首款采用Intel Foveros 3D堆疊工藝的產品,也是首款采用混合架構的x86五核處理器。從此Intel開啟混合架構新時代。 24 25 UMA(Unified Memory Architect
41、ure):傳統的CPU和GPU雖位于同一個SoC芯片上,但由于于內存的不同訪問習慣和數據結構,導致它們雖使用相同的內存RAM,但其存取空間仍然是分開的。而UMA基于異構計算,將CPU、GPU、NPU、FPGA等通用、專用處理器集成到一起,協同計算、各司其職,從而提升帶寬、延遲和性能表現。 2.4 CPU廠商- Intel的UMA嘗試 Intel第六代酷睿處理器(Skylake,2015年)i7-6700K的ring互聯架構集成了Intel Gen9核顯。CPU核心、LLC(last level cache)、GPU和System Agent之間通過SoC Ring Interconnect相連
42、,而且每個連接對象都有專門的本地接口。所有來自或者去往CPU核心,以及來自或者去往Intel GPU的(片外)系統內存數據交換事務,都經由這條互聯ring實施,通過System Agent以及統一DRAM內存控制器。該LLC也與GPU共享。對于CPU核心與GPU而言,LLC著力于降低訪問系統DRAM的延遲,提供更高的有效帶寬。Intel處理器內部的核顯其實是連片內的LLC cache都是可以訪問的,和CPU核心算是平起平坐。也就是說,從很多年前開始,Intel就開始嘗試UMA架構。 2.4 CPU廠商- 26 產品布局: X86:AMD 2022年的旗艦產品將是EPYC Genoa服務器,它基
43、于Zen 4架構,擁有龐大的96核。此外,AMD還計劃在2022年底發布基于Zen 4c的128核EPYC Bergamo服務器。AMD在發布7nm產品之后得到許多公有云服務商采用,如Google Cloud Platform、Microsoft Azure與Tencent,占比逐漸在2021年提升,目前滲透率已達一成以上。TrendForce集邦咨詢預估,2022年AMD滲透率在全球服務器領域可望達到約15%。 ARM/MIPS/Power/RISC-V:ADM在CPU市場中是堅定的X86追隨者?;邶嫶蟮能浖鶖狄约八莆盏墓ぞ呒夹g資源,X86可以最快速度、最便捷途徑去優化提高。 2022
44、年AMD的旗艦產品將是EPYC Genoa服務器芯片 雙核 安全集成 2.4 CPU廠商- AMD的雙核處理器Athlon 64 X2誕生于200 5年5月。 但與Intel的Pentium D不同,AMD的Athlon 64 X2是在同一塊芯片內整合了兩個K8核心,兩個核心之間可透過System Request Queue實現數據互通,因此執行效率遠高于競爭對手產品。 三核、四核 2007年K10架構的四核于11月11日發布,它確實是首款原生四核處理器,并且首次把L3緩存引入到消費級市場,但整體效能不如對手的Core 2 Quad。通過改進B3步進的工藝,AMD還推出了首款三核處理器Phen
45、om X3。每個核心獨享512KB L2緩存,所有核心共享2MB L3緩存。 八核、12核、16核 32核、64核 2011年的Bulldozer推土機是首款八核處理器。因備受爭議,沒有進入主流市場。主流平臺的八核處理器,是2017年Zen架構的第一代Ryzen7系列處理器,它正式引發了Intel與AMD在處理器市場的核心數量大戰。同年,首個12核和16核處理器銳龍Threadripper 1920X和1950X上市。 2018年發布的第二代銳龍Threadripper,最大核心數量已達到3 2 核 。 到 了 銳 龍Threadripper 3000,CPU被拆分成CCD計算核心和IOD輸入
46、輸出核心,解決了每個核心之間訪問內存和PCI-E時延遲不一的問題,于是2020年,64核的銳龍T h r e a d r i p p e r 3990X從此誕生。 27 2.4 CPU廠商- AMD的UMA嘗試APU的提出 AMD在很早就發現在以游戲為代表的多媒體體驗上,比起CPU,更強的GPU才是大勢所趨??紤]到Intel有自家的集成顯卡技術,AMD另辟蹊徑,以GPU作為突破口,在筆記本領域取代Intel成為市場的主流。 隨后,AMD又提出APU概念“Accelerated Processing Units”,中文名字叫加速處理器,是AMD基于Fusion融聚理念且已醞釀3年之久的戰略級產品
47、。APU最大的特色就是將AMD的CPU、DX11級別的GPU和北橋芯片整合在一個單元中,首次將AMD引以為豪的3A平臺“融聚”到了一顆APU上。 為了實現此目的,AMD在2006年收購了擁有21年歷史的全球領先圖形IC廠商ATI。隨后提出了著名的AMD+ATI芯片組+ATI顯卡的“3A”平臺概念,一時間聲名鵲起。 28 29 2.4 CPU廠商- AMD的UMA嘗試七代APU產品 第一代:Llano 允許Radeon HD 6000M系列獨立顯卡可通過PCI-E X16通道和處理器相連,與APU內置的圖形核心組成雙顯切換、混合使用。(2011年) 第二代:Trinity 支持Turbo COR
48、E 3.0動態超頻技術,將Barts架構引入APU,加深GPU與CPU的聯系,實現顯示輸出與通用計算性能的同步提升。(2012年) 第三代:Richland/Kabini Richland最高主頻3.5GHz,集成RadeonHD8650G顯卡,和獨顯組成交叉火力后可以實現更強大的3D性能。Kabini是三代的低功耗版。(2013年) 第四代:Kaveri 首次實現了HSA架構特性,讓GPU與CPU同時成為一件任務的處理媒介,從而使處理任務的效率得到大幅提升,達到1+12的效果。(2014年) 第五代:Beema Kabini的升級版,在近乎一半的TDP下帶來50的頻率提升。(2014年) 第
49、六代:Carrizo 在架構、操作系統、加速計算等方面做到CPU/GPU的真正融合與異構計算。(2014年) 第七代:Bristol Ridge/Stoney Ridge 較上代產品主要在游戲性能、視頻渲染以及文件壓縮性能上有所改進。(2016年) 30 2.4 CPU廠商- AMD的UMA嘗試高開低走的APU 在2017年以前,雖然AMD APU和英特爾酷睿都經歷了七次更新迭代,但能被消費者口熟能詳的卻大都為酷睿家族,作為首創Fusion融聚理念的APU卻逐漸被邊緣化。AMD的APU產品如今集成的GPU核顯,在性能上并未能如十多年前剛誕生之時預期的那樣,顯著優于競爭對手。 強勁的競爭對手:在
50、AMD籌備第一代Llano APU之際,Intel搶先一步推出了第一代酷睿處理器(Westmere架構),將CPU和GPU打包封裝,在物理結構上實現了“二合一”。2011年,第二代酷睿處理器(Sandy Bridge)進一步實現了CPU和GPU的融合。雖然AMD的融合理念提出的最早,但在落實方面卻還是落在了Intel后面。隨后,歷代酷睿家族不斷強化集成顯卡性能,最終導致APU在GPU性能上的優勢逐漸被稀釋。 落后的工藝:生產工藝是制約處理器性能發揮的最核心指標,AMD的上游晶圓公司廠Globalfounderies的生產效率難以跟上,使第一代Llano APU就因GF 32nm量產遇阻而從20
51、10年延期到了2011年。給Intel搶先一步融合CPU和GPU的機會。 落伍的核心架構:AMD APU從誕生之初,核心架構經歷了K10Bulldozer(推土機)Piledriver(打樁機)Steamroller(壓路機)Excavator(挖掘機),就AMD自身來看的確是越來越先進,但與同期的英特爾酷睿家族相比,AMD的核心架構卻早已落伍。受制于工藝和TDP的限制,APU在3D性能上幾乎沒什么提升。近些年AMD移動顯卡和NVIDIA同期產品相比性能也是明顯落后的,這就導致AMD筆記本在高端游戲市場的集體失利。 APU逐漸邊緣化的原因 31 2.4 CPU廠商- AMD的UMA嘗試HSA的
52、成立與沒落 2012年6月,AMD聯合ARM、Imagination、聯發科、德州儀器共同組建了非營利組織“異構系統架構基金會”(HSA Foundation),隨后吸引了三星電子、高通以及大批行業公司、科研機構的加盟。 異構系統架構(HSA)聯盟的目標:1) 實現節能,提高性能;2) 提高異構處理器的可編程性; 3) 增加處理器和平臺之間代碼的可移植性;4) 增加整個行業中異構解決方案的普遍性 HSA的結局:除了游戲主機這個主場完整踐行了APU思路,在PC領域APU完全體的HSA聯盟和生態基本處于荒廢狀態。如今應用于PC的APU更像是單純將CPU、GPU放在同一顆die上的普通處理器;而且A
53、MD的APU產品如今集成的GPU核顯,在性能上也沒能像剛誕生之時預期的那樣,顯著優于競爭對手。 HSA失敗的原因:1)AMD對這個方向不再看好,對生態疏于維護;2)在PC領域,HSA需要開發者響應,鑒于AMD在PC市場上的號召力不足,HSA難以真正實現;3)AMD如今的Zen架構處理器,在性能和效率上與推土機大相逕庭,也實現了對Intel酷睿處理器的超越,不再需要運用APU概念進行競爭。 2.4 CPU廠商- 32 產品布局: ARM:蘋果在2020年11月發布會中推出了新的面向Mac計算機的M1芯片,將為其新一代基于A的Mac提供動力。M1擁有160億個晶體管,包括CPU、GPU、神經引擎和
54、統一的內存架構,5納米制程。蘋果表示,新處理器將專注于電源效率,它有一組八核CPU,提供了世界上最好的CPU每瓦特的性能,能以四分之一的功耗提供與典型筆記本電腦CPU相同的峰值性能。 X86/Power: 33 2.4 CPU廠商- Apple的UMA嘗試 M1的誕生:Apple M1是由蘋果公司研發的處理器芯片,基于UMA統一內存架構。于2020年11月11日在蘋果新品發布會上發布,適用于部分Mac、iPad設備。 為什么研發M1:1) 擁有核心技術是蘋果的重要戰略;2)Intel的制造能力相對落后;3)不僅能延長電池壽命,還有可能提升性能,甚至讓筆記本電腦像手機一樣工作。 Apple研發M
55、1的優勢:1)蘋果公司采用垂直整合的封閉系統,不受兼容性需求的限制;2)蘋果在過去Ax系列處理器自行定義獨特功能,使蘋果累計了雄厚的軟件資產,布局了相對成熟的生態系統;3)蘋果的強勁的技術實力和自主研發能力;4)蘋果在移動領域和PC領域的號召力。這些優勢使得蘋果雖然晚于其他市場競爭者很久才進入市場,但卻有著得天獨厚的發展基礎。 M1的基本思想:將RAM作為處理器的所有部分都可以訪問的單個內存池。當GPU需要更多的系統內存,則可以提高使用率,而SoC的其他部分則可以降低。另外,GPU,CPU和處理器的其他部分可以在相同的內存地址訪問相同的數據。無需為SoC的每個部分分配部分內存,然后在處理器的不
56、同部分的兩個空間之間穿梭數據。 M1的未來展望:蘋果在3月9日的發布會上推出自研的M1 Ultra芯片,通過UltraFusion架構將兩個M1 Max芯片拼在一起,使芯片的各項硬件指標翻倍,性能也得到大幅提升。蘋果的UltraFusion技術充分結合封裝互連技術、半導體制造和電路設計技術,為整合面積更大、性能更高的算力芯片提供巨大的想象空間。 34 2 5 目 錄 一、服務器及CPU綜述 二、全球CPU市場格局 三、未來處理器的演進 3.1 CPU優化歷程回顧 3.2 后摩爾時代的展望 3.3 服務器視角展望邊緣服務器 3.4 服務器視角展望公有云服務器 3.5 服務器視角展望AI服務器 四
57、、國產CPU行業篇 五、國產CPU廠商篇 35 Q5:處理器演進的方向? 背景:1)后摩爾定律時代,單靠制程工藝的提升帶來的性能受益已經十分有限,Dennard Scaling規律約束,芯片功耗急劇上升,晶體管成本不降反升;單核的性能已經趨近極限,多核架構的性能提升亦在放緩。2)AIoT時代來臨,下游算力需求呈現多樣化及碎片化,通用處理器難以應對。 方向: 1)從通用到專用:面向不同的場景特點定制芯片,XPU、FPGA、DSA、ASIC應運而生。 2)從底層到頂層:軟件、算法、硬件架構。架構的優化能夠極大程度提升處理器性能,例如AMD Zen3將分離的兩塊16MB L3 Cache合并成一塊3
58、2MB L3 Cache,再疊加改進的分支預測、更寬的浮點unit等,便使其單核心性能較Zen2提升19%。 3)異構與集成:蘋果M1 Ultra芯片的推出帶來啟迪,利用逐步成熟的3D封裝、片間互聯等技術,使多芯片有效集成,似乎是延續摩爾定律的最佳實現路徑。 主流芯片廠商已開始全面布局:intel已擁有CPU、FPGA、IPU產品線,正加大投入GPU產品線,推出最新的Falcon Shores架構,打磨異構封裝技術;NvDIA則接連發布多芯片模組(MCM,Multi-Chip Module)Grace系列產品,預計即將投入量產;AMD則于近日完成對塞靈思的收購,預計未來走向CPU+FPGA的異
59、構整合。 此外,英特爾、AMD、Arm、高通、臺積電、三星、日月光、Google云、Meta、微軟等十大行業主要參與者聯合成立了Chiplet標準聯盟,正式推出通用Chiplet的高速互聯標準“Universal Chiplet Interconnect Express”(通用小芯片互連,簡稱“UCIe”)。在UCIe的框架下,互聯接口標準得到統一。各類不同工藝、不同功能的Chiplet芯片,有望通過2D、2.5D、3D等各種封裝方式整合在一起,多種形態的處理引擎共同組成超大規模的復雜芯片系統,具有高帶寬、低延遲、經濟節能的優點。 本章導讀 3.1 CPU優化歷程回顧 36 從單核到多核 從單
60、線程到多線程 以多核提升性能功耗比 多核處理器把多個處理器核集成到同一個芯片之上,每個單元的計算性能密度得以大幅提升。同時,原有的外圍部件可以被多個CPU系統共享,可帶來更高的通信帶寬和更短的通信時延,多核處理器在并行性方面具有天然的優勢,通過動態調節電壓/頻率、負載優化分布等,可有效降低功耗,提升性能。 以多線程提升總體性能 通過復制處理器上的結構狀態,讓同一個處理器上的多個線程同步執行并共享處理器的執行資源,可以極小的硬件代價獲得相當比例的總體性能和吞吐量提高。 3.1 CPU優化歷程回顧 37 英特爾的制程及微架構演進 制程的提升 根據摩爾定律,集成電路芯片上、所集成的電路數目每隔18個
61、月翻一番,微處理器性能每隔18個月提高一倍。 CPU的制程工藝越小,意味著單個晶體管的尺寸越小,同樣的內核面積可以放下更多的晶體管,同樣的空間內可以增加更多內核;同時制程工藝越小,元件的電容就越小,電流在晶體管中的傳輸距離越短,CPU的主頻可以進一步提升,功耗也能不斷降低。 微架構的改進 眾多算數單元、邏輯單元、寄存器在三態總線和單項總線,以及各個控制線的連接下共同組成CPU微架構。不同的微架構設計,對CPU性能和效能的提升發揮著直觀重要的作用。 微架構的升級,一般涉及到指令集拓展、硬件虛擬化、大內存、亂序執行等等一系列復雜的工作,還涉及到編譯器、函數庫等軟件層次的修改,牽一發而動全身。 全球
62、頭部晶圓制造廠商的制程工藝演進 3.1 CPU優化歷程回顧 38 數據來源:CSDN 摩爾定律放緩 從“Tick-Tock”到“PAO” 摩爾定律放緩 摩爾定律于上世紀60年代提出,直至2011年前,計算機元器件的小型化是提升處理性能的主要因素。2011年后,摩爾定律開始放緩,制硅工藝的改進將不再提供顯著的性能提升。 “Tick-Tock”模式失效 自2007年開始,英特爾開始實施“Tick-Tock”發展模式,以兩年為周期,在奇數年(Tick)推出新制成工藝,在偶數年(Tock)推出新架構的微處理器。 在14nm轉10nm接連推遲后,英特爾自2016年起宣布停止 “Tick-Tock”處理器
63、升級周期,改為處理器升級的三步戰略:制程工藝(Process)-架構更新(Architecture)-優化(Optimization)。 3.2 后摩爾時代的展望從底層到頂層 39 算力提升或更依賴頂層優化 后摩爾時代,頂層優化或更為重要 新的底層優化路徑被提出,例如3D堆疊、量子計算、光子學、超導電路、石墨烯芯片等,技術目前仍處于起步階段,但后續有望突破現有想象空間。 根據MIT在Science發布的文章,后摩爾定律時代,算力提升將更大程度上來源于計算堆棧的頂層,即軟件、算法和硬件架構。 通用指令集為了覆蓋更多應用,往往需要支持上千條指令,導致流水線前端設計(取指、譯碼、分支預測等變得十分復
64、雜),對性能功耗會產生負面影響。 領域專用指令集可大大減少指令數量,并且能夠增大操作粒度,融合訪存優化,實現數量級提高性能功耗比。 專用指令集可大幅提升性能功耗比 3.2 后摩爾時代的展望從通用到專用 40 牧村波動 新興場景出現,CPU從通用向專用發展 1972年,戈登貝爾(Gordon Bell)提出,每隔10年,會出現新一類計算機(新編程平臺、,新網絡連接、新用戶接口,新使用方式且更廉價),形成新的產業。 1987 年, 原日立公司總工程師牧村次夫(Tsugio Makimoto) 提出,半導體產品未來可能將沿著“標準化”與“定制化”交替發展的路線前進,大約每十年波動一次。 經歷了桌面P
65、C、互聯網時代和移動互聯網時代后,“萬物智聯”已成為新的風向標,AIoT正掀起世界信息產業革命第三次浪潮。而AIoT最明顯的特征是需求碎片化,現有的通用處理器設計方法難以有效應對定制化需求。 處理器從通用到專用 底層驅動 41 數據來源:Science 幾類處理引擎比較 幾類處理器適用領域 通用與性能,難以兼得 CPU是最通用的處理器引擎,指令最為基礎,具有最好的靈活性。 Coprocessor,是基于CPU的擴展指令集的運行引擎,如ARM的NEON、Intel的AVX、AMX擴展指令集和相應的協處理器。 GPU,本質上是很多小CPU核的并行,因此NP、Graphcore的IPU等都和GPU處
66、于同一層次的處理器類型。 FPGA,從架構上來說,可以用來實現定制的ASIC引擎,但因為硬件可編程的能力,可以切換到其他ASIC引擎,具有一定的彈性可編程能力。 DSA,是接近于ASIC的設計,但具有一定程度上的可編程。覆蓋的領域和場景比ASIC要大,但依然存在太多的領域需要特定的DSA去覆蓋。 ASIC,是完全不可編程的定制處理引擎,理論上最復雜的“指令”以及最高的性能效率。因為覆蓋的場景非常小,因此需要數量眾多的ASIC處理引擎,才能覆蓋各類場景。 3.2 后摩爾時代的展望從通用到專用 靈活性 性能 單位成本 co-processor DSA 3.2 后摩爾時代的展望異構與集成 42 后摩
67、爾定律時代,從蘋果M1(Ultra)展望CPU未來發展之路 不可逆轉的SoC集成:由于集成電路集成度不斷提高,將完整計算機所有不同的功能塊一次直接集成于一顆芯片上的 SoC 片上就成為整個半導體行業發展的一個趨勢,可以顯著降低系統成本和功耗,提高系統可靠性。M1 并不是傳統意義上的 CPU,而是一顆SoC。CPU采用了8核心,包括4個高性能核心和4個高能效核心。每個高性能核心都提供出色的單線程任務處理性能,并在允許的范圍內將能耗降至最低。 異構能力的大幅提升:M1還采用了統一內存架構(UMA),CPU、GPU、神經引擎、緩存、DRAM內存全部通過Fabric高速總線連接在一起,得益于此,SoC
68、中的所有模塊都可以訪問相同的數據,而無需在多個內存池之間復制數據,帶寬更高、延遲更低,大大提高了處理器的性能和電源效率。此外,最新一代的M1 Ultra本質上是兩個M1 MAX的有效組合,通過UltraFusion架構,提供高達128G統一內存,相較M1的GPU性能提高8倍。 蘋果M1處理器完成了一次從多芯片走向一體化的過程,這也是蘋果打造完整PC生態鏈的必經之路,讓我們看見了CPU未來發展的更多可能性。 M1芯片架構 M1 Ultra與蘋果Chiplet專利 3.2 后摩爾時代的展望異構與集成 43 數據來源 后摩爾時代,異構與集成 海外芯片巨頭積極布局異構計算:英特爾現已布局CPU、FPG
69、A、IPU、GPU產品線,并接連公布Alder Lake、Falcon Shores等新架構;英偉達接連發布多芯片模組(MCM,Multi-Chip Module)Grace系列產品,預計即將投入量產;AMD則于近日完成對塞靈思的收購,預計未來走向CPU+FPGA的異構整合。 晶圓廠和封裝廠亦積極投入異構集成:異構計算需要有先進的集成封裝技術,得益于近十年來先進封裝與芯片堆疊技術的發展,例如3D堆疊、SiP等,也使得異構集成成為了大幅存在可能。目前,2.5D封裝技術已發展較為成熟,例如臺積電的CoWoS,三星的I-Cube,3D封裝成為各大晶圓廠發力方向。英特爾已開始量產Foveros技術,三
70、星已完成X-Cube的驗證,臺積電亦提出了SoiC的整合方案。 異構集成有望成為延長摩爾定律的第四波技術浪潮 封裝從2D逐漸發展至3D來提升性能 3.2 后摩爾時代的展望異構與集成 44 數據來源 UCIe標準推出 后摩爾時代,異構與集成 CPU+XPU已廣泛應用,但仍有優化空間。傳統的異構計算架構存在IO路徑較長,輸入輸出資源損耗等固有問題,并且仍然無法完全兼顧極致性能與靈活性。 Chiplet聯盟組建,探索超異構可能性。2022年3月3日,英特爾、AMD、Arm、高通、臺積電、三星、日月光、Google云、Meta、微軟等十大行業巨頭聯合成立了Chiplet標準聯盟,正式推出了通用Chip
71、let的高速互聯標準“Universal Chiplet Interconnect Express”(通用小芯片互連,簡稱“UCIe”)。 在UCIe的框架下,互聯接口標準得到統一。各類不同工藝、不同功能的Chiplet芯片,有望通過2D、2.5D、3D等各種封裝方式整合在一起,多種形態的處理引擎共同組成超大規模的復雜芯片系統,具有高帶寬、低延遲、經濟節能的優點。 Intel在超異構的布局 3.3 服務器視角展望邊緣服務器 45 數據來源邊緣服務器示意圖 邊緣計算服務器是解決AIoT時代“算力荒”的必備產物 云計算無法滿足海量、實時的處理需求。伴隨人工智能、5G、物聯網等技術的逐漸成熟,算力需
72、求從數據中心不斷延伸至邊緣,以產生更快的網絡服務響應,滿足行業在實時業務、應用智能、安全與隱私保護等方面的基本需求。 市場規模爆發式增長。根據IDC,中國邊緣計算服務器整體市場規模達到33.1億美元,較2020年增長23.9%,預計2020-2025年CAGR將達到22.2%,高于全球的20.2%。 定制服務器快速增加。當前通用服務器和邊緣定制服務器占比分別為87.1%和12.9%,隨著邊緣應用場景的逐漸豐富,為適應復雜多樣的部署環境和業務需求,對于具有特定外形尺寸、低能耗、更寬工作溫度以及其他特定設計的邊緣定制服務器的需求將快速增加。IDC預計邊緣定制服務器將保持76.7%的復合增速,202
73、5年滲透率將超過40%。 邊緣計算服務器市場規模 3.3 服務器視角展望邊緣服務器 46 邊緣服務器CPU示意圖 根據業務場景多樣定制,集成化是趨勢 區別于數據中心服務器,邊緣服務器配置并不一味追求最高計算性能、最大存儲、最大擴展卡數量等參數,而是在有限空間里面盡量提供配置靈活性。當前邊緣服務器多用于工業制造等領域,需根據具體環境(高壓、低溫、極端天氣)等選擇主板、處理器等,下游需求呈現碎片化,未有統一的標準。 伴隨越來越多的計算、存儲需求被下放至邊緣端,當前趨勢通常涉及更緊密的加速集成,以滿足包括AI算力在內的多種需求。超大規模云提供商正在開始研究分類體系結構,為了減少熟悉的多租戶方法不可避
74、免的碎片化,其中計算、存儲、網絡和內存成為一組可組合的結構,機柜式架構(RSA)分別部署了CPU、GPU、硬件加速、RAM、存儲和網絡容量。 邊緣計算服務器亦呈現集成化趨勢 3.4 服務器視角展望-公有云服務器 47 數據來源華為云服務器架構 騰訊云提供多種服務器租用 云服務器正在全球范圍內取代傳統服務器 云服務器的發展使中國成為全球服務器大國。隨著移動終端、云計算等新一代信息技術的發展和應用,企業和政府正陸續將業務從傳統數據中心向云數據中心遷移。雖然目前中國云計算領域市場相比美國相對落后,但近年來我國的云計算發展速度顯著高于全球云計算市場增長速度,預計未來仍將保持這一趨勢。 面向不同需求,提
75、供多樣性算力。一般小型網站請求處理數據較少,多采用1、2核CPU;地方門戶、小型行業網站,需要4核以上的CPU;而電商平臺,影視類網站等,則需要16核以上的CPU。此外,云服務器亦提供靈活的擴容、升級等服務,一般均支持異構類算力的加載 48 AWS Nitro架構 CPU+ASIC,云服務器異構趨勢明顯 在傳統的計算機虛擬化架構中,業務層為虛擬機,管理層為宿主機,業務和管理共存于CPU運行,導致CPU大概只有七成的資源能夠提供給用戶。 AWS創造性進行架構重構,將業務和管理分離到兩個硬件實體中,業務運行在CPU,管理則運行在NITRO芯片中,既將虛擬化的損耗挪到定制的Nitro系統上,又提高了
76、安全性。 Nitro架構不僅性能強大,而且特別靈活,可以基于一些常用的Hypervisor(如qemu-kvm,vmware)運行虛擬機,甚至可以直接裸跑操作系統,可節省30%CPU資源。 3.4 服務器視角展望-公有云服務器 49 英偉達推出數據中心專屬CPU GRACE ARM或成重要挑戰者,英偉達推出首款數據中心專屬CPU GRACE 公有云巨頭價格競爭激烈,國內一線城市能耗管控嚴格,ARM移動端的優勢和低能耗特征是超大型數據中心解決節能和成本問題的重要方案之一;國內自主可控趨勢背景下,若能夠搭建強有力的生態聯盟,是未來可能顛覆原有格局的最有力挑戰者。 英偉達宣布推出首款面向AI基礎設施
77、和高性能計算的數據中心專屬CPUNvDIA Grace,由兩個CPU芯片通過最新一代NVLink-C2C技術互聯組成。 Grace基于最新的ARMv9架構,單個socket擁有144個CPU核心,利用糾錯碼(ECC)等機制提供當今領先服務器芯片兩倍的內存帶寬和能效,兼容性亦十分突出,可運行NvDIA所有的軟件堆棧和平臺,包括NvDIA RTX、HPC、Omniverse等。 3.4 服務器視角展望-公有云服務器 50 數據來源:DPU帶寬性能增速比失調,DPU應運而生 從CPU到CPU+DPU DPU,即數據處理單元(Data Processing Unit),主要作為CPU的卸載引擎,主要處
78、理網絡數據和IO數據,并提供帶寬壓縮、安全加密、網絡功能虛擬化等功能,以釋放CPU的算力到上層應用。 2013年,AWS研發的的Nitro和阿里云研發的X-Dragon均可看作DPU前身;英偉達在2020年正式發布一款命名為“DPU”的產品,將其定義為CPU和GPU之后的第三顆主力芯片,DPU的出現是異構計算的另一個階段性標志。 DPU是CPU和GPU的良好補充,據英偉達預測,每臺服務器可能沒有GPU,但必須有DPU,用于數據中心的DPU的量將達到和數據中心服務器等量的級別。 NvDIA BlueField-3 DPU 3.4 服務器視角展望-公有云服務器 51 2021H1全球AI服務器市場
79、份額 AI服務器產品示意圖 浪潮信息 20.2% 戴爾 13.8% HPE 9.8% 聯想 6.1% 華為 4.8% IBM 3.9% 新華三 3.9% 思科 2.6% Oracle 1.2% 富士通 1.0% 其他 32.6% AI算力已成為驅動人工智能發展的核心動力 人工智能是全球IT產業發展最快的新興技術應用之一,在人工智能發展的三要素中,無論是數據還是算法,都離不開算力的支撐。2020年,深度學習模型對算力的需求已達到了每天百億億次的計算需求。目前先進模型的參數量和復雜程度正呈現指數級的增長趨勢,人工智能所需算力每四個月即翻一倍,AI算力已成為驅動人工智能發展的核心動力。承載AI的新型
80、算力基礎設施的供給水平,是直接影響AI創新迭代及產業AI應用落地的關鍵因素。 目前,全球AI服務器占AI基礎設施市場的84.2%以上,是AI基礎設施的主體。未來AI服務器將保持高速增長,預計在2024年全球市場規模將達到251億美元。浪潮聯合IDC發布的2020全球計算力指數評估報告顯示,AI計算在整體計算市場占比正逐年提高,全球增長的AI計算支出50%來自中國。 3.5 服務器視角展望-AI服務器 52 英偉達Grace Hopper芯片 從CPU到CPU+XPU AI模型通過數千億的參數進行訓練,增強包含數萬億字節的深度推薦系統,其復雜性和規模正呈現爆炸式增長。這些龐大的模型正在挑戰當今系
81、統的極限,僅憑CPU的優化難以滿足其性能需求。 因此,AI服務器主要采用異構形式,表現形態多為機架式。在異構方式上,可以為CPUGPU、CPUFPGA、CPUTPU、CPUASIC或CPU多種加速卡。 現在市面上的AI服務器普遍采用CPU+GPU的形式,因為GPU與CPU不同,采用的是并行計算的模式,擅長梳理密集型的數據運算,如圖形渲染、機器學習等。繼續擴展模型以實現高度準確性和實用性,需要能夠快速訪問大型內存池并使 CPU 和 GPU 緊密耦合。 3.5 服務器視角展望-AI服務器 53 谷歌第一代TPU架構 從CPU到CPU+TPU TPU,即張量處理單元(Tensor Processin
82、g Unit),是Google為加速深度學習所開發的專用集成電路(DSA),采用專用CISC指令集,自定義改良邏輯、線路、運算單元、內存系統架構、片上互聯等,并針對Tensorflow等開源框架進行優化。 2015年起,谷歌發布TPUv1,應用于Alpha Go等特定內部項目;2018年,谷歌發布TPUv3,開始向第三方出售,TPU開始逐漸走向商用。 2021年,谷歌發布TPUv4i,其性能相較第三代TPU提升2.7倍;256塊TPU僅用1.82分鐘便完成NLP領域著名的“BERT”模型訓練,而同樣條件下,利用Nvdia A100 GPU則需要3.36分鐘。 進行深度學習時性能遠優于GPU 3
83、.5 服務器視角展望-AI服務器 54 2 5 目 錄 一、服務器及CPU綜述 二、全球CPU市場格局 三、服務器視角看CPU發展趨勢 四、國產CPU行業篇 五、國產CPU廠商篇 4.1 國產CPU發展歷程及市場概況 4.2 國產CPU核心驅動一:需求旺盛,空間擴容 4.3 國產CPU核心驅動二:形勢所迫,信創如火如荼 55 Q6:國內服務器CPU市場概況? 服務器市場規模與出貨量增速遠快于全球。2020年中國x86服務器市場出貨量為343.9萬臺,同比增長8.1%(全球增速為1.8%);市場規模達到218.7億美元,同比增長16.5%(全球增速為3.3%)。 國內服務器CPU市場規模:根據服
84、務器路數分布情況測算,預計2025年中國x86服務器芯片可達1066.2萬顆,相應市場規模約為226億美元。 國產服務器CPU市場規模:假設2025年國產化率到達70%,預計2025年國產x86芯片出貨量超700萬顆,市場規模約為158億美元。 本章導讀 Q7:為何看好服務器CPU的國產替代? 增量部分:數字經濟、新基建作為國家戰略,持續推進,下游智能汽車、企業上云等需求并起,賽道維持高景氣度。 國產替代部分:行業信創正處爆發元年,確定性強:1)黨政信創進入深化階段,過去黨政信創的CPU替換主要集中在桌面PC端,現逐步轉移至服務器、2)行業信創正處爆發階段,服務器采購量大,金融、電信率先開啟規
85、?;涞?,2020年、2021年已有邏輯驗證,未來1-2年每年要求的國產化率仍呈翻倍態勢提升。3)國內廠商新一代CPU性能差距逐步縮小,生態適配不斷完善,有迎接市場化挑戰的潛力。 4.1 服務器CPU未來趨勢-國產化潛力巨大 56 (1)我國政府對國產CPU領域持續頒布助推政策。政府相關部門對該領域的支持力度逐步加大,政策日趨完善,為產業后續實現跨越式發展創造了良好的外部環境。未來在科技領域競爭加劇的背景下,預計我國政府將繼續對國產CPU的大力支持。 (2)中國將長期保持最大CPU消費市場地位,下游需求旺盛。首先,中國計算機用戶基數十分龐大,迭代更新創造較大的CPU需求。其次,CPU市場將繼續
86、在云計算與企業數字化轉型中受益。最后,工業控制領域嵌入式CPU需求廣闊,CPU作為智能化的核心部件,將廣泛應用于工控系統中。 (3)國際供應鏈斷裂和信息安全風險加劇,國產CPU發展步伐加快。我國對進口通用處理器的過度依賴是我國信息產業發展的一大軟肋。近年來,受國際供應鏈不確定性的負面影響,部分企業的CPU供應也成為問題。 (4)未來國產CPU潛力巨大。政務及重點行業是國產CPU市場確定性最強的領域,相關行業的關鍵信息基礎設施正在廣泛開展國產CPU的應用。 (5)國產CPU存在超車機會。國內CPU知識儲備趨于完善,國內技術人才積累也日趨豐富,CPU產業進入后摩爾定律時期升級速度趨緩,國產CPU性
87、能與國際主流水平逐步縮小,存在趕超的可能。 國內服務器市場主要廠商市占率變化 2021年CPU專利申請數量 中國大陸 58% 美國 16% 日本 13% 韓國 4% 其他 7% 57 4.1 國產CPU發展歷程 國產CPU之路:幾經波折,終迎騰飛 起步階段(1950s-1970s):1956年,半導體科技被列為國家新技術四大緊急措施之一。此后,中科院計算所、109廠、半導體所先后成立,半導體器件相繼取得突破。1975年,我國第一臺集成電路百萬次計算機013研制成功,彼時與國際先進水平相差不大。 迎來低谷(1980s-1990s):CPU開始進入市場化商用階段,“Wintel”聯盟組建并火速攻占
88、全球市場,但與此同時我國的半導體產業政策支持力度明顯下滑,國產CPU研制進度陷入停滯,與海外差距開始拉大。 重新啟航(2000s-2010s):自主可控問題再次提上國家議程,“十五”期間,國家啟動發展國產CPU的泰山計劃及863計劃,產業政策開始不斷加碼。2002年,我國首款通用CPU龍芯1號流片成功;2006年,“核高基”重大專項推出;2014年,我國發布國家集成電路產業發展推動綱要,國家集成電路產業投資基金(簡稱國家大基金)第1期成立,主要投資集成電路制造企業。政策和資金傾斜下,國產CPU開始步入正軌,提速追趕。 加速騰飛(2010s-至今):歷經數十年的艱辛探索,國產CPU產業已經初具規
89、模。以鯤鵬、海光、飛騰、龍芯、兆芯、申威為代表的六大國產CPU領軍企業在設計能力上已逐步接近全球領先水平,與此同時軟件生態正逐步完善。巨大的下游市場配合積極的國家政策,疊加國際形勢催生國產替代的緊迫性,國產CPU產業乘風而上,正式進入高質騰飛階段。 1950s-1970s 1980s-1990s 2000s-2010s 2010s-至今 起步階段 政 策 助 力 , 109 機 、156機、013機等相繼自主研發成功,與國際先進水平相差不大。 迎來低谷 受制于政策力度下滑、彼時國內的經濟發展水平、國際技術封鎖等原因,與海外差距拉大 重新啟航 泰山計劃、863計劃、核高基專項等推出,國產CPU開
90、始補課追趕,陸續誕生一批領軍企業 加速騰飛 設計能力逐步追上,生態不斷完善,下游需求擴容,疊加國際形勢所迫,國產CPU迎來爆發 58 4.1 國產CPU市場概況 集成電路產業整體:高速發展,重心向高端設計制造轉移 2020年中國集成電路產業市場規模高達8848億元,同比增長17.01%,2013-2020年CAGR達到19.7%,接近全球增速的4倍。 分解來看:2020年,我國集成電路設計產業銷售收入3778.4億元,同比增長23.3%,所占比重從2013年的32.2%增加到42.7%;芯片制造銷售收入2560.1億元,同比增長19.1%,所占比重從2013年的24.0%增加到28.9%;封裝
91、測試業銷售收入2509.5億元,同比增長6.8%,所占比重從2013年的43.8%降低到28.4%。 芯片設計產業規模占比逐年攀升,象征著我國集成電路產業逐漸從低端走向高端,產業發展也呈現高速且高質的特征。 中國集成電路產業市場規模 中國集成電路產業細分領域規模(億元) 2509 3015 3610 4336 5411 6531 7562 8848 20% 20% 20% 25% 21% 16% 17% 0%5%10%15%20%25%30%01000200030004000500060007000800090001000020132014201520162017201820192020中國集
92、成電路產業規模(左軸,億元) 同比增速(右軸) 809 1047 1325 1644 2074 2519 3064 3778 601 712 901 1127 1448 1818 2149 2560 1099 1256 1384 1564 1890 2194 2350 2510 0%20%40%60%80%100%20132014201520162017201820192020集成電路設計 芯片制造 封裝測試 59 4.1 國產CPU市場概況 芯片設計企業:不斷增加,但話語權仍然較弱 縱觀全球競爭格局,集成電路設計位于產業鏈上游環節,對技術研發實力要求極高,具有產品附加值高,細分門類眾多等特點
93、,企業的頭部效應尤為明顯,高通、英特爾、博通、英偉達等少數幾家企業長期占據市場大部分份額。 自2012年以來,我國集成電路設計企業數量逐年增加,并逐步進入到全球市場的主流競爭格局中;截至2020年底,我國集成電路設計企業達到2218家,2013-2020年CAGR為19.6%,其中銷售額過億的企業為289家,市場集中度還較低,處于百花齊放的發展初期。 目前全球集成電路設計仍以美國為主導,市占率達到55%;隨后依次是韓國公司21%,歐洲公司7%,中國臺灣地區公司6%,日本公司6%;中國大陸地區公司市占率僅為5%,雖是全球重要的參與者之一,但話語權仍然較弱。 數據來源: 中國大陸集成電路設計企業數
94、量 全球集成電路設計企業格局 55% 21% 7% 6% 6% 5% 美國 韓國 歐洲 中國臺灣 日本 中國大陸 632 681 734 1362 1380 1698 1780 2218 125 134 143 161 191 208 238 289 0500100015002000250020132014201520162017201820192020中國大陸集成電路設計企業數量(家) 其中:銷售額過億企業數量(家) 60 4.1 國產CPU市場概況 服務器整機:x86仍是主流,增速遠快于全球 無論全球還是國內,由于x86處理器起步較早,生態適配有明顯優勢,應用x86處理器的服務器銷售額占全
95、部服務器銷售額的比例約90%以上,銷量占比更是超過97%。 根據IDC,2020年中國x86服務器市場出貨量為343.9萬臺,同比增長8.1%(全球增速為1.8%);市場規模達到218.7億美元,同比增長16.5%(全球增速為3.3%)。 2019年和2020年,服務器出貨量和銷售額兩項增速較前期平均水平有所下降,主要是新冠疫情和全球互聯網企業Capex收縮等原因所致。伴隨 “數字經濟”戰略的持續落地與推進,預計未來服務器需求將持續旺盛,增速呈現回暖態勢。預計2025年中國服務器出貨量達到525.2萬臺,市場規模達到350億美元。 全球服務器出貨結構 中國x86服務器出貨量及預測 177.9
96、215.2 236.6 262.1 330.4 318.1 343.9 375.1 408.4 445 483.8 525.2 20.6% 21.0% 9.9% 10.8% 26.1% -3.7% 8.1% 9.1% 8.9% 9.0% 8.7% 8.6% -10%-5%0%5%10%15%20%25%30%010020030040050060020142015201620172018201920202021E 2022E 2023E 2024E 2025E中國x86服務器出貨量(左軸,萬臺) 同比增速(右軸) 99.43% 99.44% 99.39% 99.93% 99.67% 98.68%
97、 97.30% 0.57% 0.56% 0.61% 0.07% 0.33% 1.32% 2.70% 80%100%2014201520162017201820192020x86服務器銷量 非x86服務器銷量 61 4.1 國產CPU市場概況 CPU芯片:預計2025年國內芯片出貨量超千萬顆,國產替代空間廣闊 根據IDC,中國x86服務器以雙路服務器為主,占比在80%以上;單路、4路服務器合計占比約為10%+;8路以上服務器較少,占比未超過1%。 結合服務器出貨量及路數分布進行測算,2020年中國x86CPU芯片出貨量為698.1萬顆。芯片占服務器成本約為1/3,以此推算出2020年中國x86芯
98、片市場規模約為150億美元。 假設2021-2025年路數分布情況與2020年保持一致,預計2025年中國x86服務器芯片可達1066.2萬顆,相應市場規模約為226億美元。 根據國務院印發的新時代促進集成電路產業和軟件產業高質量發展的若干政策,中國芯片自給率要在2025年達到70%(當前不到20%),預計2025年國產x86芯片出貨量超700萬顆,市場規模約為158億美元。 中國x86服務器路數分布情況 中國x86服務器芯片出貨量及預測 11.3% 8.4% 7.4% 7.6% 6.6% 80.0% 84.7% 87.0% 87.7% 88.8% 8.4% 6.7% 5.3% 4.5% 4.
99、5% 0.3% 0.3% 0.2% 0.2% 0.1% 0%20%40%60%80%100%20162017201820192020單路 雙路 4路 8路及以上 490.5 542.5 674.7 644.5 698.1 761.5 829.1 903.4 982.1 1066.2 10.6% 24.4% -4.5% 8.3% 9.1% 8.9% 9.0% 8.7% 8.6% -10%-5%0%5%10%15%20%25%30%020040060080010001200201620172018201920202021E2022E2023E2024E2025E中國x86芯片出貨量(左軸,萬顆)
100、同比增速(右軸) 62 4.2 核心驅動(一):需求旺盛,空間擴容 數字經濟戰略定調,底層新基建率先受益 2018年,中央經濟工作集會首次提出“新型基礎設施”概念;2020年,國家多次部署“新基建”相關任務,確定5G基站、大數據中心、人工智能、工業互聯網等七大領域;2022年,“十四五”數字經濟發展規劃頂層設計出臺,首次將數字經濟地位提升至國家戰略層面,緊隨其來的重要文章不斷做強做優做大我國數字經濟進一步強調加快新型基礎設施建設。 我們認為,傳統產業的數字化轉型將是未來長期的發展主線,以云計算為代表的底層IT基礎設施則是核心之一;根據IDC,云平臺建設的硬件成本中,服務器所占比重最大,達到75
101、%左右。 伴隨5G逐步商用,物聯網、智能汽車等新場景的加速落地,海量數據運算和存儲的需求將快速增長,疊加數據中心等新基建建設要求,相關主體有望開展新一輪的設備采購計劃,中國服務器整體空間擴容的趨勢明朗。 數據來源: 云平臺建設硬件成本分布 中國云計算市場規模 服務器 75% 網絡設備 8% 其他設備 6% 軟件 3% 其他 8% 514.9 691.6 962.8 1334.5 1781.8 2308.2 2951.5 34.3% 39.2% 38.6% 33.5% 29.5% 27.9% 0%5%10%15%20%25%30%35%40%45%050010001500200025003000
102、3500201620172018201920202021E2022E中國云計算市場規模(左軸,億元) 同比增速(右軸) 63 4.2 核心驅動(一):需求旺盛,空間擴容 東數西算工程啟動,看好后續市場擴容 數據處理需求爆發,我國機架數持續增長。根據中國信通院,我國2019年數據中心機架達到315萬架,2020年機架數超過400萬架。根據最新的國家發改委高技術司數據,截止目前,我國機架規模已達500萬架,算力達到130EFLOPS,CAGR超過32%。 東數西算規劃IDC集群,后續建設拉動服務器采購需求。2022年2月,國家發改委等部門聯合引發文件,同意在京津冀、長三角、粵港澳大灣區、成渝、內蒙
103、古、貴州、甘肅、寧夏等8地啟動建設國家算力樞紐節點,并規劃了10個國家數據中心集群,“東數西算”工程正式全面啟動,有望帶動服務器采購需求。 東數西算布局 中國數據中心機架數 124 166 226 315 400 500 49 83 167 237 0100200300400500600201620172018201920202021總機架數量(萬架) 大型規模以上機架數量(萬架) 64 大部分樞紐省市原本已對數據中心做出積極規劃,中西部省市規劃本就相對積極,例如成渝機架數量在十四五翻5倍,內蒙古翻3倍,寧夏翻24倍。 此次東數西算工程是數字經濟戰略的重要落子,將進一步強化相關落地。 樞紐地區
104、 十三五期間目標 十四五期間目標 長三角 上海:2020年底,互聯網數據中心103個,機柜總量14萬架; 江蘇:2020年全省在用數據中心機架數35萬架; 浙江:2020年底建成數據中心193個,數據中心機架達17.3萬架。 上海:2025年互聯網數據中心機架28萬架,算力14000PFLOPS 江蘇:2020年數據中心標準機架數達70萬架 浙江:2025年底數據中心標準機架數達45萬架 京津冀 河北:2019年底在線運營服務器規模突破120萬臺 河北:2025年大數據服務器運營規模達300萬臺 粵港澳 廣東:2019年底在用機架數7.2萬架,規劃再見18.5萬架,服務器86.4萬臺 廣東:2
105、025年標準機架數約100萬個,平均上架率75%,平均PUE值小于1.25 成渝 重慶:2020年底數據中心標準機架數11.9萬架 四川:2020年在用機架數超10.5萬個 重慶:2025年數據中心標準機架數50萬架 四川:2025年數據中心機架數達50萬架 貴州 2020年全省數據中心規劃安裝服務器290萬臺 2025年全省數據中心規劃安裝服務器400萬臺,建成P級算力中心 內蒙古 2020年底大數據中心建設穩步推進,服務器達到120萬臺 以烏蘭察布、和林格爾為重點布局大數據中心,2025年大數據裝機突破300萬臺 甘肅 2020年機架規模達到11.05萬架 2021、2023、2025年總
106、算力分別超過3.5、5.5、6.5EFLOPS 寧夏 數據中心標準機架數達到3萬架,服務器總裝機能力達到50萬臺 目標建成國家樞紐寧夏中衛節點,標準裝機數達72萬架 4.2 核心驅動(一):需求旺盛,空間擴容 65 4.3 核心驅動(二)形勢所迫,信創如火如荼 數據來源 三次信創浪潮 長期以來,我國對海外IT產品的依賴度較高,以Intel、Microsoft、Oracle、Cisco等為代表的IT廠商在芯片、操作系統、數據庫、中間件等領域占領了較大市場份額,高度滲透了政府、金融、民航、鐵路、醫療等各行業環節。 自2008年以來,由海外產品引發的信息安全事件頻出,IT技術的自主可控勢在必行。 2
107、018年,中興、華為被納入“實體清單”,成為信創產業真正進入爆發階段的導火索,我國第三次“整芯鑄魂”信創浪潮正式開啟。 微軟黑屏事件 2008年10月,微軟中國為警示盜版用戶,對盜版XP專業版采取60分鐘黑屏一次的 做法, 對盜 版Office采取對話框提醒,此次事件引起了國內對信息安全的思考。 棱鏡門事件 2013年6月,美國“棱鏡計劃”被披露,美國國安局對電話、即時消息等進行秘密監控,范圍涉及谷歌、微軟、蘋果等多家跨國互聯網公司,掀起了“去IOE”浪潮。 2008 2013 蘋果后門事件 2013年12月,蘋果IOS操作系統被爆發現多個未經披露的“后門”程序,這些后門可以繞開IOS的加密功
108、能,竊取用戶的私人信息。 Intel芯片漏洞 2018年,英特爾芯片被爆存在技術缺陷導致重大安全漏洞,黑客可利用該漏洞讀取設備內存,獲得密碼、密鑰等敏感信息 2018 實體清單 2018年,美國商務部宣布7年內禁止美國企業向中興通訊銷售零部件,直接導致中興通訊當年虧損69.8億元。 隨后,美國陸續將華為等上百家中國公司列入實體清單,采取出口管制措施。 以中美貿易戰為導火索,美國加大對中國的制裁,國內開始意識到攻克“卡脖子”技術的緊迫性。 66 4.3 核心驅動(二)形勢所迫,信創如火如荼 數據來源信創的歷史沿革 1993-2007 2008-2016 2017-2019 2020-至今 預研起
109、步 1993年,中軟推出第一代基于UNIX為底層的國產Linux操作系統“COSIX1.0”,國產操作系統橫空出世。 1993年,浪潮信息研發SMP2000系列服務器。 2000年,紅旗Linux發布。 2006年,中國中長期科學和技術發展規劃( 2006-2020 ) 將“核高基”列為16個重大科技專項之一。 芯片、操作系統等關鍵技術領域出現實驗性結果。 自主創新思維覺醒,從實驗室科研起步,但道阻且長。 加速發展 2008年,阿里巴巴內部IT技術全面進行自主和可控研發。 2010年,民用“中標Linux”和軍用“銀河麒麟”合并。 2013年,銀監會明確提出國產化安全要求,浪潮天梭K1小型機系
110、統上市,標志著中國掌握新一代主機技術。 2015年,信創工委會成立,國家信息化發展戰略綱要提出,到2025年形成安全可控的信息技術產業體系。 民用實踐下,國產軟硬件產品可用性提升。 國家政策頂層設計,信創工委會統籌組織,為信創產業打造良好發展環境。 試點實踐 2017年,核高基重大轉向第二批工程啟動會召開。 2018年,我國將信創行業納入國家戰略,提出“2+8”發展體系。 2019年,國產CPU迎來收獲期,兆芯、飛騰、鯤鵬等新一代處理器接連兩項,性能大幅提升。 2019年,中國建設銀行與中軟合作開發的國產化辦公自動化系統在境內外分支機構全面部署上線。 國產自主化產品性能提升,從可用轉向好用,產
111、業生態日益豐富。 黨政軍率先開啟自主可控項目,重點行業積極推動醞釀。 融合落地 2020年,中國電信、中國移動集采指定國產化標包,各省份信創項目逐漸啟動招標。 2020年,發改委、科技部、工信部等聯合發布指導意見,要求加快關鍵芯片、關鍵軟件等核心技術攻關,大力推動重點工程及項目建設,積極擴大有效投資。 2021年,建設銀行信用卡核心系統全棧信創體系通過驗收,性能提升10%。 金融、電信、電力、交通等重點行業逐步開始信創產品和項目的融合落地。 從小范圍試點開始大面積鋪開。 67 4.3 核心驅動(二)形勢所迫,信創如火如荼 近年來信創相關政策 國家政策持續牽引,地方政策跟進落地 近年來,“自主可
112、控”、“國家創新體系建設”、“國產替代”等成為國家政策關鍵詞,關鍵技術領域的攻關突破已納入國際戰略層面的重點工作。 地方政府積極響應,通過財政補貼、政府背書等形式扶持產業落地,重點打造信創產業集群、培育龍頭企業。 時間 具體文件 關鍵內容 國家政策 2020年9月 關于擴大戰略性新興產業投資培育壯大新增長點增長極的指導意見 加快基礎材料、關鍵芯片、高端元器件、新型顯示器件、關鍵軟件等核心技術攻關,積極擴大合理有效投資。 2021年3月 “十四五”發展規劃和2035年遠景目標綱要 制定科技強國行動綱要,健全社會主義市場經濟條件下新型舉國體制,打好關鍵核心技術攻堅戰,提高創新鏈整體效能。培育壯大人
113、工智能、大數據、區塊鏈、云計算、網絡安全等新興數字產業,提升通信設備、核心電子元器件、關鍵軟件等產業水平。 2021年12月 “十四五”國家信息化規劃 強化市場化和產業化引導,推動計算芯片、存儲芯片等創新,面向關鍵基礎軟件、高端工業軟件、云計算、大數據、信息安全、人工智能、車聯網等重點領域和重大需求,加強重點軟件的開發。加快軟件知識產權保護與信息服務體系建設。 2022年3月 政府工作報告 推進科技創新,促進產業優化升級,突破供給約束堵點,依靠創新提高發展質量,培育壯大集成電路、人工智能等數字產業,提升關鍵軟硬件技術創新和供給能力。 地方政策 2020年5月 關于培訓鯤鵬計算產業促進數字廈門創
114、新發展的指導意見 建成全國性的基于鯤鵬全生態的產業集群,聚集一批國內知名的鯤鵬產業鏈上下游優秀企業,形成千億級鯤鵬產業集群。 2020年10月 關于印發金東區促進制造業重點細分行業 發展政策意見(試行)的通知 打造全國信創產業示范基地,打造電子信息關鍵材料-芯片設計和封測-系統整機集成-智能終端應用產業體系。 2021年2月 深圳市中國特色社會主義先行示范區科技創新行動方案 支持深圳強化關鍵核心技術攻關,優化和創新支持方式,采用“立軍令狀”、“滾動立項”等組織方式,集中突破集成電路等領域關鍵核心技術攻關。 2021年3月 武漢市加快推進武漢云建設實施方案的通知 建設武漢云信創資源池,使用國產芯
115、片、服務器和密碼保護系統等構建軟硬件 信創體系,提供基于信創環境的信息基礎設施服務,實現全程自主創新 68 4.3 核心驅動(二)形勢所迫,信創如火如荼 數據來源 信創的推進節奏 2013-2018 2019-2020 2021 2022-2025 2025-以后 黨政 金融、電信、電力 石油、交通、航空航天 教育、醫療 汽車、物流、建筑 2 8 N 2013年開始,黨政從公文系統開始替換計劃,預計2023年左右基本完成公文系統的改造;當前開始進入電子政務系統的國產化替代。 八大行業中,金融最早開始信創試點,電信緊隨其后,再之后是能源、交通、航空航天,教育和醫療領域起步較晚,但已逐步開始籌劃推
116、進;N+行業預計于2023年后開始啟動。 信創整體在經歷政策驅動引導的前期階段后,逐漸走向需求導向的市場化階段。 試點起步-規?;涞?深化成熟 政策驅動 市場驅動 69 4.3 核心驅動(二)形勢所迫,信創如火如荼 金融、電信、電力三大領域信創需求各有側重 金融行業業務種類多、復雜度高,數據量巨大,核心業務要求高吞吐、超低延時等,對產品性能要求極高,同步保障安全穩定,兼容性強。 電信行業業務系統復雜、技術難度大,對產品穩定性和運行性能要求高,尤其是數據庫技術等,同時要求日常運維、故障恢復等服務能力。 電力行業集中化程度高,對安全性、穩定性要求高,對兼容性要求一般,并且需要優秀的遷移改造及平滑
117、過渡能力。 信創招投標常見選型指標 指令集 授權情況 產品要求 性能 產品各方面符合國家、行業及采購人規定的質量和性能要求,保證產品高可用性 安全性 產品各方面符合國家標準,通過國家級安全測評機構檢測 穩定性 產品具備高穩定性,保證使用期間的穩定可靠運行 兼容性 供應商應對產品的軟件、硬件兼容能力進行描述,針對常用軟硬件進行雙向認證,提供詳細的官方的兼容性說明 服務要求 日常運維 供應商提供日產運維支持,包括但不限于電話、郵件、現場支持、例行運維、專項駐場等 故障恢復 供應商應及時解決產品故障,提供應急保障方案 任務類 供應商需提供遷移、擴容等技術支持服務 培訓類 供應商需提供現場及集中技術培
118、訓,具備成熟的培訓課程和團隊 案例要求 過往相似案例經驗 供應商應在某個時限內具備若干個相似項目的實施經驗,需提供相關佐證材料 70 4.3 核心驅動(二)形勢所迫,信創如火如荼 黨政信創深化,行業信創爆發 2018年以來,華為、中興等事件凸顯卡脖子風險,倒逼信創進入“整芯鑄魂”的高速發展階段,國家確立“2+8”安全可控體系,在相關領域逐步試點推廣。 黨政信創于2020年進入規?;涞卦?,現正加速向區縣一級下沉滲透;同時,過去的黨政信創主要集中在電子公文領域,以桌面產品終端為主;2022年1月國家發改委印發“十四五”推進國家政務信息化規劃,國產服務器的采購有望成為后續黨政信創的主體。 行業信
119、創于2022年正式進入規?;涞仉A段,其中電信和金融兩大領域已經率先啟動:1)三大電信運營商自2020年起便在招標中指定國產化標包,根據中國移動目前公布的2021-2022年第1批PC服務器集采公示,“鯤鵬+海光”國產服務器滲透率已達到28.8%;根據產業調研,2022年目標國產化率為40%,相較2021年的20%左右水平提升明顯;2)金融信創緊隨其后,2021年下半年中國銀行發布“國芯服務器選型”項目公示;根據產業調研,2021年金融行業服務器采購國產化率達到12%左右水平,預計2022年目標國產化率為30%左右。 中國移動服務器集采公示 中國銀行“國芯服務器選型”公示 4.3 核心驅動(二
120、)形勢所迫,信創如火如荼 數據來源 基礎硬件 芯片 存儲 存儲 基礎軟件 數據庫 中間件 操作系統 云 應用軟件 辦公軟件 版式軟件 OA ERP 其他 信息安全 信創產業大而全,多而垂直,主要由基礎硬件、基礎軟件、云計算、應用軟件和信息安全組成。 整個產業的核心是芯片與操作系統,發展邏輯是圍繞CPU和操作系統打造國產生態體系。 71 72 2 5 目 錄 一、服務器及CPU綜述 二、全球CPU市場格局 三、服務器視角看CPU發展趨勢 四、國產CPU行業篇 五、國產CPU廠商篇 5.1 六大國產服務器CPU廠商詳解 5.2 中科曙光核心受益標的 73 Q8:國內服務器CPU市場的主要玩家? 按
121、指令集分類: 基于x86架構的兆芯、海光:性能起點較高,生態遷移難度小,替換空間大。 基于ARM架構的飛騰、鯤鵬:架構迭代空間廣闊,性能提升較快,生態適配較好。 基于自研指令集架構的龍芯、申威:全棧自研,自主可控程度極高,在當前緊迫性和必要性進一步提升的背景下,有望加速迭代迎來重大發展機遇。 本章導讀 Q9:市場格局演進? 從當前行業信創的推進節奏看:短期內鯤鵬、海光兩家,憑借領先的性能+較為完善的生態適配+被驗證過的項目經驗,最為受益;飛騰于2021年發布新產品,性能表現突出,預計后續將實現訂單增長。 長維度看:客觀來看,當下國產服務器CPU無論在性能還是生態方面都有較大的進步空間,短期訂單
122、的爆發是前期“天時、地利、人和”的集中表現,遠期格局還存在不確定性;長遠來看,各家均有彎道超車的機會,仍然是資金投入、技術團隊、迭代升級情況等關鍵能力決定未來的企業核心競爭力。 Q10:建議關注標的? 當前海光、兆芯、飛騰、鯤鵬、龍芯、申威六大國產CPU廠商均為上市,其中海光信息、龍芯中科已提交招股說明書;上市主體中,建議關注海光信息的第一大股東中科曙光。 曙光與海光業務可形成良好協同:海光提供性能優異的國產CPU,為曙光的戰略轉型提供支點;曙光在計算產業的全面布局已積累大量優質的客戶資源和銷售渠道,為海光芯片的放量打下基礎。 數字經濟戰略背景下,ICT行業或長期維持高景氣度;行業信創帶來國產
123、化機遇,曙光戰略轉型成效明顯;再疊加曙光在手訂單充裕,后續利潤有望進一步釋放。 74 5.1 六大國產CPU公司詳解 六大領軍企業,三條路徑發展 當前階段,國內主流的CPU廠商主要有海光、兆芯、飛騰、海思、龍芯、申威六家領軍企業,從指令集授權的角度看,主要可以分為三類: 1)IP內核授權:以兆芯為代表,獲得x86內核層級的授權,可基于指令集系統進行SoC集成設計,具備良好的生態和性能起點,當下階段具備快速放量潛質,但自主可控程度較低。 2)指令集架構授權:以海光為代表,獲得x86指令集授權;以鯤鵬和飛騰為代表,獲得ARM架構級授權,可基于指令集架構進行核心CPU設計,安全可控程度較高,但ARM
124、的生態適配需進一步打造。 3)指令集架構授權+自研:以龍芯和申威為代表,分別獲得MIPS和Alpha架構授權,并在此基礎上進行自主研發,形成自有的指令集架構,安全可控程度極高,但當前生態適配極為困難。 指令集 授權情況 團隊背景 代工廠 優勢 劣勢 兆芯 x86 VIA授權,架構較老 上海市國資委、威盛電子 臺積電 性能起點較高,生態遷移成本小 自主化程度較低,技術創新受限制 海光 x86 AMD Zen 指令集授權 中科曙光 格芯、三星 飛騰 ARM v8架構層級永久授權 CEC、 中國長城 臺積電 ARM架構潛在空間廣,產品線豐富 兼容性和生態需進一步打造 鯤鵬 ARM v8架構層級永久授
125、權 華為 臺積電 龍芯 LoongArch 基于MIPS,逐步全面切換 中科院計算所 意法半導體 自主可控程度極高 性能相對較弱,生態應用匱乏 申威 SW_64 基于Alpha,完全自主可控 江南計算所 中芯國際 自主化程度 弱 強 IP內核授權 指令集架構授權 授權+自研 75 兆芯合資CPU探路者 公司成立于2013年,由上海聯合投資有限公司(上海市國資委控股)和臺灣威盛電子合資創建,同時掌握CPU、GPU、芯片組三大核心技術,形成臺式機、筆記本、一體機、云終端、服務器以及嵌入式工業主板和工業計算平臺等產品線,利用x86生態優勢,為黨政、金融、教育、工業、交通等行業提供可靠的解決方案。 兆
126、芯的核心理念是“自主創新和兼容主流”,公司產品可兼容Win7、Win10等主流操作系統,桌面端可流暢運行日常辦公應用、主流游戲及4K視頻解碼;持續引入知名整機合作伙伴,聯想、同方、AOC、東海、浪潮等產品已上線京東、淘寶等電商平臺。 兆芯代表產品解決方案 兆芯股權結構 上海兆芯集成電路有限公司 上海聯合投資有限公司 上海市國資委 100% 51.56% 威盛電子 3.40% 其他 45.04% 76 兆芯合資CPU探路者 CPU方面,公司已形成PC處理器“開先”和服務器處理器“開勝”兩大產品系列,實現了“從雙核心到八核心”、“從1.6GHz到3.0GHz”、“從處理器+芯片組方案到SoC單芯片
127、方案”等多方面的發展與創新,具備自主演進發展的能力和條件。 公司主力產品為2019年發布的開先-KX6000和開勝KH-30000,制程達到16nm,是首款主頻達到3.0GHz的國產通用處理器,支持雙通道DDR4-3200內存,采用SoC設計,包含CPU、GPU和芯片組,芯片集成度進一步增強,性能功耗比上一代產品提升3倍,單芯片性能接近intel7代i5水平,SPEC 2006 INT RATE成績為170分。 型號 工藝 發布日期 最高主頻 內存(設計功耗) PC/嵌入式處理器 開先KX-6000系列 16nm Q219 3.0GHz 8核/4核 開先KX-5000系列 28nm Q417
128、2.0GHz 8核/4核 開先ZX-C+系列 28nm Q316 2.0GHz 4核 開先ZX-C系列 28nm Q215 2.0GHz 4核 服務器處理器 開勝KH-30000系列 16nm Q219 3.0GHz 8核 開勝KH-20000系列 28nm Q417 2.0GHz 8核 開勝ZX-C+系列 28nm Q216 2.0GHz 8核 IO擴展芯片/芯片組 ZX-200 IO擴展芯片 40nm Q417 - 6W ZX-100S 芯片組 40nm Q316 - 15.5W(集顯)/13W 77 兆芯合資CPU探路者 由于兆芯獲得的是源自威盛電子相對老舊的x86CPU架構,其版權已于
129、2018年到期,導致兆芯過去的產品性能相較同期競品仍有所差距;但隨著威盛電子將其IP產權的出售,兆芯以獲得了大部分后續x86芯片開發所需的核心技術和專利,自主可控能力開始強化。 根據公司公布的CPU路線圖,公司已著手7nm一下工藝產品的定義和研發工作,預計于近期推出KX-7000和KH-40000產品系列。KX-7000采用全新CPU微架構,不僅支持DDR5,還將演進到PCIe 4.0總線,預計對標AMD Zen2;KH-40000單核性能將比上一代提升60%以上,多核性能提升高達5倍,支持多路互聯、128PCIe Lane、16內存通道,具有高效的虛擬化性能,并且采用的是可插拔的LGA封裝,
130、能夠有效減低開發維護成本,可全面支持國內外主流的OS。 兆芯下一代產品值得期待 測試項目 i5-9400F I5-7400 兆芯KX-U6780 與i5-7400對比 CPU-Z單線程 481 391 181 -53.7% CPU-Z多線程 2685 1487 1401 -5.8% 3DMark物理分數 17791 7354 6557 -10.6% 性能百分比(單線程) 122% 100% 44% -56% 性能百分比(多線程) 185% 100% 82% -18% 性能百分比(浮點) 187% 100% 72% -28% 性能百分比(整數) 178% 100% 106% +6% 兆芯CPU與
131、同類競品比較 78 海光性能領先的實干者 公司成立于2014年,從事高端處理器、加速器等計算芯片產品和系統的研究和開發;2016年海光信息同AMD達成合作,共同成立兩家子公司,引入x86以及Zen微架構授權,其中成都海光微電子擁有授權IP所有權,并負責芯片生產,成都海光集成電路設計有限公司負責芯片設計及銷售工作;2018年中科曙光受讓海光信息1948億股股權,成為海光信息第一大股東。 公司以“性能強勁、安全可信、完善生態”作為主打標簽,提供通用處理器(CPU)和協處理器(DPU)兩大類別,能夠適配主流的x86、Linux操作系統,支持多個版本的數據庫、中間件、AI算法、云計算平臺等,已廣泛應用
132、于電信、金融、教育、科研、人工智能、大數據等領域的服務器及工作站。 海光代表產品解決方案 海光股權結構 海光信息 中科曙光 32.1% 49% 海光微電子 70% 海光集成 51% AMD 30% 79 CPU方面,面向不同的市場需求,公司已形成高中低端的全方位覆蓋,分別對應7000、5000、3000三大產品系列;其產品節奏按照“量產一代、研發一代、規劃一代”穩步推進,海光一號和海光二號兩代產品實現了商業化應用,海光三號已經完成產品驗證,海光四號處于研發階段。 DPU方面,公司產品兼容“類CUDA”環境,軟硬件生態豐富,遷移成本低,典型應用場景下性能達到國際同類高端水平。 7200 5200
133、 3200 功耗 175-225W 90-135W 45-105W 計算能力 SPECrate2017_int_base:348 SPECrate2017_fp_base:308 SPECrate2017_int_base:158 SPECrate2017_fp_base:148 SPECrate2017_int_base:40.7 SPECrate2017_fp_base:36.3 核心 16/24/32核 8/16核 4/8核 內存 8個DDR4 4個DDR4 2個DDR4 I/O 128 Lane PCLe Gen3 64 Lane PCLe Gen3 32 Lane PCLe Gen3
134、 應用場景 云計算、大數據、AI等對計算能力、擴展能力、吞吐量要求較高的領域 滿足互聯網、金融、電信、交通、能源等多行業的運算需求 應用于入門級服務器、工作站、工業控制、邊緣計算等市場,為中小企業提供系列解決方案 海光性能領先的實干者 海光產品命名方式 海光CPU主要參數 80 基于AMD Zen1架構的優勢明顯,產品性能起點較高,典型場景下,公司最新一代CPU和DPU相關產品均已接近國際同類高端產品水平。 2019年公司被列入美國出口管制條例“實體清單”,AMD不再提供相關技術服務,公司自行實現了后續產品和技術的迭代開發。 海光DPU與主流競品比較 發布時間 雙路Speccpu_INT 雙路
135、Speccpu_FP 與海光數據對比 海光7285 2020年Q1 348 308 - Intel8380HL(鉑金) 2020年Q2 392 329 +12.64%/+6.66% Intel8376HL(鉑金) 2020年Q2 383 321 +9.91%/+4.06% Intel8360HL(鉑金) 2020年Q3 345 300 -0.86%/-2.76% 海光CPU與Intel競品比較 海光性能領先的實干者 制程工藝 核心數量 內核頻率 顯存容量 顯存位寬 顯存頻率 顯存帶寬 海光深算1號 7nm FinFET 4096 (64 CUs) Up to 1.5GHz(FP64) Up t
136、o 1.7Ghz(FP32) 32GB HBM2 4096 bit 2.0 GHz 1024 GB/s NVIDIA Ampere100 7nm FinFET 2560 CUDA processors 640 Tensor processors Up to 1.53Ghz 80GB HBM2e 5120 bit 3.2 GHz 2039 GB/s AMD MI100 7nm FinFET 120CUs Up to 1.5GHz(FP64) Up to 1.7Ghz (FP32) 80GB HBM2e 4096bit 2.4 GHz 1228 GB/s 81 生態方面,公司高性能CPU已經得到眾
137、多OEM支持,自2018年起,浪潮、聯想、新華三、同方等國內知名服務器廠商已經搭載海光CPU芯片,并成功應用到工商銀行、中國銀行等金融領域客戶,中國石油、中國石化等化工領域客戶,以及三大運營商的數據中心類業務。 伴隨產品功能的不斷升級完善,公司自2020年開始進入放量拐點,2021年整體CPU收入規模達到20.7億,同比增長103%。 2021年主要應用于服務器領域的7000系列貢獻主要收入,實現收入15.0億元,平均單價達到8573.5元/顆,整體呈現量價齊升態勢。 海光性能領先的實干者 2019 2020 2021 7000系列 324.9 785.9 1502.0 海光7100 324.
138、9 426.8 280.9 海光7200 - 359.1 1221.1 5000系列 5.4 129.3 191.9 海光5100 5.4 11.9 0.7 海光5200 - 117.4 191.1 3000系列 48.9 106.6 377.5 海光3100 48.9 71.1 10.0 海光3200 - 35.5 367.5 海光CPU收入情況(百萬元) 海光CPU單價情況(元) 2019 2020 2021 7000系列 6913.32 7494.22 8573.52 海光7100 6913.32 5206.51 4269.56 海光7200 - 11162.28 15687.72 50
139、00系列 4189.83 7721.51 6695.86 海光5100 4189.83 2839.70 508.78 海光5200 - 9363.17 7029.77 3000系列 1250.45 963.77 1046.24 海光3100 1250.45 833.67 522.50 海光3200 - 1402.33 1075.66 82 根據收入及單價計算得到海光CPU出貨情況,2021年7000系列出貨14.4萬顆;其中7200芯片出貨達到7.8萬顆,同比增長143.8%,7100芯片出貨量達6.6萬顆,相較2020年有所下降。由此可推斷,當前市場對于性能的要求或大于性價比的考量。國內服務
140、器以雙路為主,預計2021年搭載海光7000系列CPU的服務器出貨量大約為7.2萬臺。 行業信創相較黨政信創更為市場化,而海光的服務器CPU性能優異疊加生態遷移難度低,對于原有的x86服務器有較大替換空間,我們預計海光或成為行業信創浪潮下最為受益的國產CPU廠商之一。 此外,海光于2021年實現DPU的規?;鲐?,當期即實現收入2.4億元,表現亮眼;后續伴隨新基建智算中心的建設,DPU有望迎來訂單高增。 海光性能領先的實干者 2019 2020 2021 7000系列 4.7 11.4 14.4 海光7100 4.7 8.2 6.6 海光7200 3.2 7.8 5000系列 0.1 1.7
141、2.9 海光5100 0.1 0.4 0.1 海光5200 1.3 2.7 3000系列 3.9 11.1 36.1 海光3100 3.9 8.5 1.9 海光3200 2.5 34.2 海光CPU出貨量(萬顆) 海光DPU情況收入及單價情況 2021 收入(百萬元) 238.9 單價(元) 19285.7 出貨量(萬顆) 1.24 83 飛騰PK生態的主導者 公司由國防科技大學研究團隊創造,起步于1999年,由中國電子信息產業集團、天津市濱海新區政府和天津先進技術研究院于2014年聯合支持成立。目前,CEC通過中國長城控股公司28.04%股份,是公司最大股東。 飛騰CPU產品具有譜系全、性能
142、高、生態完善、自主化程度高等特點,基于飛騰CPU的產品覆蓋多種類型的終端(臺式機、一體機、便攜機、瘦客戶機等)、服務器和工業控制嵌入式產品等,在國內政務辦公、云計算、大數據以及金融、能源和軌道交通等行業信息系統領域已實現批量應用。 飛騰代表產品解決方案 飛騰股權結構 飛騰信息技術有限公司 中國長城 39.35% 28.04% 天津先進技術研究院 26.70% 天津濱海新區科技金融投資集團 25.37% 中國電子信息產業集團 84 飛騰PK生態的主導者 數據來源:飛騰S2500發布會,飛騰 CPU方面,公司經歷20余年研發,形成高性能服務器CPU(飛騰騰云S系列)、高效能桌面CPU(飛騰騰銳D系
143、列)和高端嵌入式CPU(飛騰騰瓏E系列)三大產品系列。 服務器CPU方面,公司于2020年發布S2500處理器,采用16nm工藝,集成64個FTC663內核,2.0到2.2GHz頻率。面向多路互聯市場,S2500重點改進體系架構,高可擴展性是該芯片的最大特點,增加了64MB L3 Cache,配備4個直連接口,帶寬800Gbps,支持8通道DDR4-3200內存,功耗為150W,并提升了可靠性。 根據飛騰負責人表示,該芯片性能相較上一代FT-2000產品有大幅提升,整體表現與intel Xeon E5相當。 飛騰最新一代服務器芯片S2500參數 飛騰CPU路線圖 85 飛騰PK生態的主導者 數
144、據來源:飛騰官網,飛騰S2500發布會,飛騰公眾號, 公司在2006年曾經研制出兩代國產CPU,曾先后嘗試過x86、Epic、SPARC、ARM四個指令集,并以SPARC開源代碼為基礎設計了FT-1000、FT-1000A、FT-1500等CPU。之后出于生態考慮,重點轉向ARM系列產品的開發。 生態方面是飛騰最大的優勢,公司與國內1000余家軟硬件廠商構建起了國內最完善最龐大的生態體系,僅2019年就新開案板卡設計430余款,已與千余家軟件進行了適配和應用。此外,飛騰兼容安卓生態,在飛騰臺式機上可以運行200萬級安卓應用,極大拓展了飛騰生態。 此外,公司作為聚焦國家戰略需求和重大項目的CPU
145、國家隊,還是CEC主導的PK體系(即飛騰Phytium CPU+麒麟Kylin操作系統)的重要參與者之一,已經建立起覆蓋云邊端的全棧體系。 基于飛騰的全棧式解決方案 飛騰部分生態合作伙伴 86 鯤鵬是華為在芯片領域布局的重要一環,主要聚焦通用計算領域;華為針對不同的計算場景,自研打造了一系列芯片矩陣,除了主要應用在服務器領域的鯤鵬,還包括手機SoC芯片麒麟、人工智能芯片昇騰、5G基站芯片天罡、5G終端芯片巴龍,以及凌霄、NB IoT等一系列其他專用芯片。 在一系列芯片矩陣中,華為致力于圍繞“鯤鵬+昇騰”雙引擎形成兩大計算產業,其中鯤鵬計算產業是基于鯤鵬處理器的基礎軟硬件設施,行業應用及服務,涵
146、蓋從底層硬件、基礎軟件到上層行業應用的全產業鏈條,可為下游各大行業應用提供全面、完整、一體化信息化解決方案。 鯤鵬代表產品解決方案 華為全產業芯片矩陣 華為全產業芯片布局 手機SoC芯片 麒麟系列 服務器芯片 鯤鵬系列 AI芯片 昇騰系列 5G通信芯片 巴龍、天罡系列 其他專用芯片 凌霄、NB IoT 鯤鵬垂直生態的領導者 87 近年來,華為先后推出Hi1610、Hi1612、Hi1616等服務器CPU產品,不斷實現主頻與核數的提升,并最終開發出當下的旗艦產品鯤鵬920與鯤鵬920s,分別用于服務器和PC機。 鯤鵬920基于ARM V8架構,是首款國產的7nmARM服務器,其處理器核、微架構和
147、芯片均由華為自主研發設計,相比X86異構最高能夠提升3倍性能。規格方面,支持64內核,主頻可達2.6GHz,集成8通道DDR4,支持PCIe4.0及CCIX接口,可提供640Gbps總帶寬。鯤鵬920主打低功耗、強性能,在典型主頻下,SPECint Benchmark評分超過930,超出intel Xeon 8180系列25%,并且能效比優于Xeon30%。 與鯤鵬920同期推出的還有基于鯤鵬920的TaiShan服務器和華為云服務,形成獨特的“端邊云算力同構”的優勢,通過軟硬件協同進一步提升處理器性能。 鯤鵬920與intel性能對比 鯤鵬920性能參數 鯤鵬垂直生態的領導者 88 鯤鵬垂直
148、生態的領導者 華為堅持“硬件開放、軟件開源,使能合作伙伴”的生態策略,自身作為生態領導者,主要聚焦計算架構創新、處理器和開源基礎軟件的研發,以及華為云服務,推動鯤鵬計算產業蓬勃發展。目前已有超過12家整機廠商基于鯤鵬主板推出自有品牌的服務器及PC產品,openEuler和openGauss開源社區合作伙伴超過17家,另有數千家應用軟件合作伙伴。 優異的性能+良好的生態,促使鯤鵬服務器在發售后迅速開始放量。根據中國移動2021-2022年第1批PC服務器集采公示,鯤鵬服務器或占到總體招標量的18.8%,合計中標金額約28.4億元。 同時,也正因華為的垂直整合型發展策略,市場上也具有一定的排他性。
149、鯤鵬芯片只通過整機或主板出售,下游集成商或整機廠商的利潤空間有所壓縮,疊加美國制裁等風險,鯤鵬的發展挑戰與機遇并存。 鯤鵬生態合作伙伴 鯤鵬計算產業生態策略 89 龍芯自主架構的先驅者 2001年,龍芯起步于中科院計算所,曾得到863、973、核高基等項目的支持,先后成功流片我國首款通用CPU龍芯1號、首款64位通用CPU龍芯2B、首款主頻超過1GHz的通用CPU龍芯2E、首款四核CPU龍芯3A等,完成底層核心技術的積累。2010年,中科院、北京市政府共同牽頭出資,龍芯中科技術有限公司正式成立,開始產業化運作。 經歷20年深耕,龍芯CPU已實現工控類和信息類的全方位覆蓋。工控類芯片主要面向嵌入
150、式專用設備、工業控制終端等,賦能通信、能源、交通等領域;信息類芯片面向桌面和服務器等,在政務、金融、電信、教育等行業廣泛應用。 龍芯代表產品解決方案 龍芯股權結構 龍芯中科技術股份有限公司 北京天童芯源科技 100% 23.98% 北京中科算源資產管理 21.52% 寧波中科百孚股權投資 14.35% 中國科學院計算技術研究所 北京工業發展投資管理有限公司 7.17% 創始人 胡偉武 47.67% 北京市人民政府 100% 90 龍芯自主架構的先驅者 龍芯亦有完善的高中低端產品矩陣,主要分為龍芯1號、龍芯2號、龍芯三號三大系列:龍芯1號系列為低功耗、低成本專用嵌入式SoC或MCU處理器,通常集
151、成1個32位低功耗處理器核;龍芯2號系列為低功耗通用處理器,采用單芯片SoC設計,通常集成1-4個64位低功耗處理器核;龍芯3號系列為高性能通用處理器,通常集成4個及以上64位高性能處理器核。 公司于2021年發布最新一代龍芯3號5000系列芯片產品,采用12/14nm工藝,處理器核升級為LA464微結構,主頻最高為2.5GHz,集成雙通道DDR4-3200和HT3.0接口。單核SPEC CPU2006 Base定浮點分值均超過26分,是上一代4000系列的1.5倍水平,逼近市場主流水平。 龍芯3號5000系列性能對比 龍芯3號CPU性能簡介 型號 推出時間 制程 主頻 核數 內存 I/O 3
152、A1000 2012年 65nm 0.8-1.0GHz 4 雙通道DDR3-667 HT1.0 3A2000/3B2000 2016年 40nm 0.8-1.0GHz 4 雙通道DDR3-1066 HT3.0 3A3000/3B3000 2017年 28nm 1.2-1.5GHz 4 雙通道DDR3-1600 HT3.0 3A4000/3B4000 2019年 28nm 1.8-2.0GHz 4 雙通道DDR4-2400 HT3.0 3A5000/3B5000 2021年 12nm 2.3-2.5GHz 4 雙通道DDR4-3200 HT3.0 3C5000L 2021年 12nm 2.0-2
153、.2GHz 16 雙通道DDR4-3200 HT3.0 龍芯3A5000 Intel i5 9500 推出時間 2021年 2019年 核數 4 6 UnixBench 單核 1685 1888.9 SPEC2006 單核定點 25.1 62.8 SPEC2006 單核浮點 26.6 67.3 Stream內存 copy單核 16864 15936.5 Stream內存 Copy多核 21873 13637.6 91 龍芯自主架構的先驅者 公司在過去取得了MIPS架構授權,并以此為基礎研發出自有的LoongISA指令系統,但部分關鍵IP仍需向MIP付費。為徹底解決關鍵技術“卡脖子”問題,龍芯于
154、2020年推出自主指令系統LoongArch,從整個架構的頂層規劃,到各部分的功能定義,再到細節上每條指令的編碼、名稱、含義,均為自主重新設計。 性能方面,LoongArch相較MIPS運行效率更高,動態執行指令數平均可以減少10%-20%,并且仍留有一半的指令編碼空間,可用于未來擴展。生態兼容方面,LoongArch指令系統融合X86、ARM等國際主流指令系統的主要功能特性,可實現跨指令平臺應用兼容,高效運行MIPS、X86、ARM平臺上的二進制應用程序?;A軟件方面,公司基于LoongArch構建了完整的基礎軟件技術生態體系,開展操作系統內核、編譯器、編程語言虛擬機、云計算等基礎軟件領域的
155、研發工作,形成了面向信息化應用的基礎版操作系統Loongnix、面向工控類應用的基礎版操作傳統LoongOS以及面向云計算的龍芯云。 至此,公司已完成技術補課,形成從指令集到芯片再到OS的全面自主可控的生態體系,有望在進一步迭代優化后全面走向商用領域開放市場。 龍芯生態合作伙伴 自主指令系統LoongArch 92 申威特種領域的引領者 申威研發中心成立于2003年,在國家863計劃支持下,于2006年成功研制出第一代國產64位通用處理器“申威1”;在國家“核高基”專項支持下,于2010年成功研發世界首款16核通用處理器SW1600,該芯片成功應用于國內首臺采用國產處理器的千萬億次計算機系統神
156、威藍光超級計算機系統;2016年,搭載40960顆申威2610處理器的神威太湖超級計算機榮獲世界性能榜首,速度比第二名“天河二號”快近2倍,效率提升3倍。 2016年,成都申威科技有限責任公司成立,從事對申威處理器的產業化推廣,現已形成申威高性能計算處理器、服務器/桌面處理器、嵌入式處理器三個系列的國產處理器產品線,以及申威國產I/O套片產品線。 申威代表產品解決方案 申威26010處理器與太湖之光超級計算機 40960顆顆 93 申威特種領域的引領者 公司最初取得了Alpha指令集的所有涉及資料,并基于此架構研制出首顆芯片SW-1;后續出于安全可控考慮,公司設計出完全自主可控的指令集SW_6
157、4,完全區別于原有Alpha指令集,主要面向軍用等對安全性要求極高的特種領域提供CPU處理器及其相關解決方案。 性能方面,申威26010雙精度峰值算力可達到3.168TFLOPS,達到同期產品的國際領先水平,在超算領域表現突出。 生態方面,雖然采用完全自主的指令系統在兼容方面有天生劣勢,但公司仍舊秉持“全國產自主研發,全流程安全可控”宗旨,積極建設申威信息安全產業聯盟,現已發展出中標軟件、中電科技、deepin、達夢數據等在內的50多家成員,形成了覆蓋芯片設計、硬件平臺、系統軟件、支持平臺、數據庫、中間件、應用軟件的全鏈條自主生態。 申威生態 申威26010處理器性能對比 推出時間 處理器類型
158、 雙精度峰值 SW26010 2014.12 異構眾核CPU 3.168TFLOPS Intel Xeon Phi2 2015.11 眾核CPU 3TFLOPS Intel Xeon Phi 2012.11 眾核CPU 1.01TFLOPS NVDIA Kepler GK110 2012.05 GPU 1.32TFLOPS AMD GCN 2011.12 GPU 1.01TFLPOS 94 Intel AMD 海光 兆芯 飛騰 鯤鵬 龍芯 申威 產品 Xeon6354 EPYC7542 海光7285 開盛KH-30000 S2500 鯤鵬920-7260 企業級3C5000L 申威1621 發
159、布時間 2020 2020 2020 2019 2020 2019 2021 2017 制程 10nm 7nm 14nm 16nm 16nm 7nm 12nm 28nm 指令集 x86 x86 x86 x86 ARM ARM LoongArch SW_64 核心數 18 32 32 8 64 64 16 16 超線程 36 64 64 - - - - - 主頻 3.0GHz 2.9GHz 2.0GHz 3.0GHz 2.2GHz 2.6GHz 2.2GHz 2.0GHz 內存類型 DDR4 DDR4 DDR4 DDR4 DDR4 DDR4 DDR4 DDR3 內存通道數 8 8 8 2 8 8
160、 4 8 最高內存頻率 3200MHz 3200MHz 2666MHz 2666MHz 3200MHz 2933MHz 3200MHz 2133MHz Pcle通道數 64 128 128 16 17 40 32 16 各廠商主流服務器CPU性能對比 5.1 六大國產服務器CPU格局演繹 從性能角度看,海光7000系列、鯤鵬920分別是x86、ARM架構下的性能領先,飛騰在最新一代S2500發布后性能參數也躋身第一梯隊;兆芯、龍芯、申威三家產品相對性能較弱,核心數僅為8/16核,內存通道、Pcle通道等參數也較弱,影響處理器I/O性能。 從生態角度看,海光、兆芯基于x86指令系統的天生優勢,生
161、態適配度最高,當前x86架構仍占據服務器市場90%以上份額,替換空間巨大;以飛騰和鯤鵬為代表的ARM架構近年來生態遷移成本逐漸降低,且兩家廠商已分別主導構建“PK生態”與“鯤鵬計算產業生態”,正快速發展成為市場另一極;申威、龍芯由于自研指令集系統,雖然在自主可控方面有其必要性和緊迫性,但其生態成熟度還有待完善。 95 5.1 六大國產服務器CPU格局演繹 綜合考慮各項因素: 1)兆芯成立于2013年,獲得x86授權較早,在早期安全可控項目中占據一定份額,但其產品主要是桌面端,且x86 IP授權來自威盛電子,架構較為落后使其性能產品受到一定影響,IP內核授權的自主性也較低。 2)海光雖然進入市場
162、較晚且只有AMD服務器授權,但憑借其先進的Zen架構和良好的生態起點,于2020年開始在電信、金融等行業信創領域快速放量,伴隨行業信創的爆發,預計海光訂單有望持續提升。 3)飛騰老一代產品性能相對落后,在信創前期主要集中在PC端出貨,但伴隨其新一代產品S2500發布后,性能已躋身國內先進水平,并且公司主導的PK生態正逐步完善,預計后續滲透率將持續提升。 4)鯤鵬920發布之初表現十分亮眼,憑借國際先進的制程工藝與性能,疊加鯤鵬生態的組建完備,快速取得電信、金融等行業訂單,但仍需注意美國制裁帶來的產量受限等一系列負面影響,預計后續將在行業的選擇上有所側重,限制其爆發式增長。 5)龍芯研發起步最早
163、,在黨政市場原始份額較大,其產品集中于桌面PC和工業領域,伴隨其新一代產品和全自主的指令集發布,后續在服務器市場的商業應用能力還有待驗證。 6)申威主要聚焦軍用市場,產品側重特種超算服務器領域,全可控技術與生態均有獨家壁壘,預計后續仍將專注深耕原有領域。 96 5.1 六大國產服務器CPU格局演繹 結合上文分析,當前服務器行業主要有兩條主線驅動:1)數字經濟新基建:主要為超算中心、智算中心等建設過程中的增量采購;2)信創:黨政信創進入常態化模式,行業信創接棒爆發,對國產化率有明確目標。整體而言,服務器行業進入更為市場化發展的階段,除考慮自主可控的強弱要求和股東背景外,性能、生態、性價比、功耗等
164、均是相關企業衡量的重要指標。 因此,我們認為短期內鯤鵬、海光、飛騰三家最有望受益于行業信創及新基建的爆發節奏??陀^來看,當下國產服務器CPU無論在性能還是生態方面都有較大的進步空間,短期訂單的爆發是前期“天時、地利、人和”的集中表現,遠期格局還存在不確定性;長維度看,各家均有彎道超車的機會,仍然是資金投入、技術團隊、迭代能力決定未來的企業核心競爭力。 T0 T1 T2 短期行業信創受益程度推演 生態優勢明顯,性能得到驗證,在手訂單充裕 新品性能亮眼,預計后續能夠獲得部分訂單,逐步放量 曾經的桌面王者,服務器領域勢微,期待后續迭代 專注軍用及特種超算領域,較少參與行業信創 97 5.2 中科曙光
165、數字經濟及信創浪潮下的核心標的 當前六大CPU廠商均未上市,其中海光信息與龍芯中科已提交招股說明書;與六大CPU廠商相關聯的上市主體中,我們認為中科曙光或最為受益。 1993年我國自行研制的第一臺基于微處理芯片構成的超級計算機“曙光一號”問世,在操作系統核心代碼并行化和多線程技術等方面取得了一系列的突破,同時作為具有市場競爭力的產品,在中國科學院的大力推動下,曙光一號折價2000萬人民幣知識產權,吸引資金成立曙光信息產業有限公司。 經歷20余年發展,公司在高端計算、存儲、安全、數據中心等領域擁有深厚的技術沉淀和領先的計算優勢,擁有完整的IT基礎架構產品線;同時公司積極布局智能計算、云計算、大數
166、據的技術研發和產品服務,在全國50十多個城市部署了云計算中心,并不斷延伸上下游產業鏈合作,參股中科星圖及海光信息等業內領先企業,打造完備計算產業生態,為數字經濟發展、新型基礎設施建設、傳統產業轉型等提供可信的支撐。 中科曙光產品矩陣 98 5.2 中科曙光“實體名單”事件,倒逼積極轉型 從業務結構看,公司主要包含高性能計算機(包括服務器和其相關配套產品)、存儲產品、以及圍繞高端計算機的軟件開發、系統集成與技術服務三大類別。自2013年起公司業務結構便整體保持穩定,其中服務器相關產品維持80%左右比重,存儲產品、軟件開發及技術服務分別占比10%左右。 可以觀察到,2014-2018年,公司高性能
167、計算機業務整體保持高速增長,CAGR達到33.7%;自2019年后,該業務增速驟然降低至個位數,2020年該業務實現收入80.5億元,同比增長7.2%。 同時,公司存儲產品和“軟件開發、系統集成、技術服務”業務在2014-2018年的復合增速分別為30.4%和42.5%,2019年起增速亦出現明顯下滑,2020年兩項業務的同比增速分別為4.2%和4.7%。 81.7% 79.8% 80.6% 80.0% 77.1% 80.4% 79.5% 78.8% 79.2% 6.9% 9.4% 10.7% 11.1% 11.1% 9.2% 9.6% 10.1% 9.9% 11.4% 10.8% 8.6%
168、8.8% 11.8% 10.3% 10.9% 11.1% 10.9% 0%20%40%60%80%100%201220132014201520162017201820192020高性能計算機 存儲產品 軟件開發、系統集成及技術服務 公司業務結構自2013年起保持穩定 13.6 16.0 22.5 29.3 33.6 50.6 72.0 75.0 80.5 17.6% 41.2% 30.1% 14.7% 50.6% 42.2% 4.2% 7.2% 0%10%20%30%40%50%60%0102030405060708090201220132014201520162017201820192020
169、高性能計算機(左軸,億元) 同比增速(右軸) 公司高性能計算機業務營收情況 99 5.2 中科曙光轉型成效顯著,盈利能力提升 增速下降的主要原因為公司與參股的海光信息在2019年時被美國商務部列入出口管制條例實體清單,公司在集成服務器整機或存儲產品整機時,Intel CPU芯片等部分元器件的采購將受到影響;而根據IDC數據,CPU在服務器的成本構成中占比約為1/3。 公司對此積極采取應對措施,重新梳理產品線,調整業務布局。例如,公司于2019年6月發布公告,以3億元的價格轉讓中科可控信息產業有限公司30%股權,將部分涉及到限制的元器件采購、集成、銷售業務剝離,導致公司營收增速下滑,但仍保留其余
170、不受影響的硬件業務。 若還原制裁之前口徑,并假設CPU毛利率為0%,假設80億元的高性能計算機業務中有60%-70%來自服務器相關硬件產品,寬幅口徑下2020年公司營收或可達120億元左右。 同時,公司積極抓住信創帶來的產業機遇,適當降低毛利率低的通用產品銷售規模,并積極加大對海光、龍芯等國產CPU服務器的軟硬件適配支持,公司利潤結構得到大幅改善。觀察2019、2020年,公司營收增速僅為個位數的情況下,利潤增速仍保持38%左右水平。2020年公司毛利率為22.1%,相較2018年提升3.83pp,公司凈利率為8.1%,相較2018年提升3.34pp。 公司總營收情況 公司歸母凈利潤情況 16
171、.6 20.0 28.0 36.6 43.6 62.9 90.6 95.3 101.6 20.5% 39.9% 30.9% 19.1% 44.4% 43.9% 5.2% 6.7% 0%5%10%15%20%25%30%35%40%45%50%020406080100120201220132014201520162017201820192020總營業收入(左軸,億元) 同比增速(右軸) 1.5 1.0 1.2 1.8 2.2 3.1 4.3 5.9 8.2 -36.1% 19.8% 52.7% 26.8% 37.7% 39.4% 37.9% 38.5% -50%-40%-30%-20%-10%0
172、%10%20%30%40%50%60%0123456789201220132014201520162017201820192020歸母凈利潤(左軸,億元) 同比增速(右軸) 24.5% 21.4% 20.0% 20.9% 17.4% 18.3% 22.1% 22.1% 4.8% 4.1% 4.8% 5.1% 4.9% 4.8% 6.2% 8.1% 0%5%10%15%20%25%30%20132014201520162017201820192020毛利率 凈利率 公司盈利能力提升 100 5.2 中科曙光與海光的協同效應 2018年中科曙光受讓海光信息1948億股股權,成為海光信息第一大股東,
173、當前合計持股比例達到32.1%。 公司與海光信息形成良好協同,海光提供性能優異的國產CPU,為曙光的戰略轉型提供支點;曙光在計算產業的全面布局已形成優質的客戶資源和銷售渠道,為海光芯片的放量打下基礎。 搭載海光芯片的服務器于2020年伴隨行業信創的試點進入放量拐點,海光信息的營收規模已從2018年的4825萬元攀升至2021年的23.1億元,并于2021年首次實現盈利,歸母凈利潤達到3.2億元。 從近期公布的移動和電信2021-2022年服務器集采結果來看,海光的占比分別達到10.5%和19.2%,其x86架構下優異的性能仍是運營商、金融企業的首選之一。伴隨重點行業的國產化率提升,預計1-3年
174、內海光信息仍有望維持高增速成長,曙光的聯營企業投資收益有望快速增加。 海光信息營業收入情況 海光信息歸母凈利潤情況 48.25 379.17 1021.97 2310.42 686% 170% 126% 0%100%200%300%400%500%600%700%800%050010001500200025002018201920202021營業收入(左軸,百萬元) 同比增速(右軸) -124.15 -82.9 -39.14 327.11 33% 53% 936% 0%100%200%300%400%500%600%700%800%900%1000%-150-100-500501001502002503003502018201920202021歸母凈利潤(左軸,百萬元) 同比增速(右軸)