《2023算力AI龍頭英偉達發展歷程及國產算力公司發展機遇分析報告.pdf》由會員分享,可在線閱讀,更多相關《2023算力AI龍頭英偉達發展歷程及國產算力公司發展機遇分析報告.pdf(51頁珍藏版)》請在三個皮匠報告上搜索。
1、2023 年深度行業分析研究報告 -2-內容目錄內容目錄 1、英偉達:算力芯片巨頭領跑、英偉達:算力芯片巨頭領跑 AI 時代時代.-6-1.1 公司簡介:全球領先的 GPU 龍頭廠商.-6-1.2 公司產品:多元化產品矩陣助力公司長期增長.-9-1.3 公司財務:財務狀況良好,反哺研發投入上升.-14-2、英偉達發展歷程三部曲、英偉達發展歷程三部曲.-17-2.1 1993-2000:初具規模,提升研發效率戰勝對手.-17-2.2 2001-2006:寡頭壟斷,逐步成為獨顯市場霸主.-19-2.3 2007-2023:重“芯”開始,引領人工智能計算.-20-3、英偉達發展歷程總結,借鑒意義、英
2、偉達發展歷程總結,借鑒意義.-23-3.1 深耕 GPU 算力領域,研發為導向不斷提升產品競爭力.-23-3.2 CUDA 自成體系:從單一產業到生態鏈,構建強護城河.-26-3.3 抓住人工智能發展浪潮,順利轉型切入算力芯片領域.-32-4、算力是、算力是 AI 底層土壤,從英偉達看國產發展機遇底層土壤,從英偉達看國產發展機遇.-36-4.1 ChatGPT 激起 AI 浪潮,大模型升級推動算力提升.-36-4.2 算力芯片快速增長,GPU 占據 AI 芯片主流地位.-40-4.3 AI 芯片領域,國產芯片迅速崛起.-43-4.4 國產算力公司梳理.-45-5、投資建議及風險提示、投資建議及
3、風險提示.-51-圖表目錄圖表目錄 圖圖 1:引領:引領GPU市場的巨頭,英偉達的崛起和發展歷程市場的巨頭,英偉達的崛起和發展歷程.-6-圖圖 2:英偉達時間線:英偉達時間線.-7-圖圖 3:“CPU+GPU+DPU”業務布局業務布局.-7-圖圖 4:英偉達三芯布局產品線英偉達三芯布局產品線.-8-圖圖 5:架構發展歷程:架構發展歷程.-8-圖圖 6:產品及相應架構:產品及相應架構.-9-圖圖 7:英偉達產品線總覽:英偉達產品線總覽.-10-圖圖 8:英偉達游戲顯卡重要時間點:英偉達游戲顯卡重要時間點.-10-圖圖 9:英偉達游戲顯卡詳細參數:英偉達游戲顯卡詳細參數.-11-圖圖10:英偉達數
4、據中心:英偉達數據中心GPU發展歷程發展歷程.-11-圖圖11:英偉達數據中心:英偉達數據中心GPU及其參數及其參數.-12-圖圖 12:英偉達:英偉達Grace與與x86+Hopper對比對比.-12-圖圖 13:英偉達自動駕駛芯片時間軸:英偉達自動駕駛芯片時間軸.-13-圖圖 14:英偉達幾代汽車芯片對比:英偉達幾代汽車芯片對比.-13-圖圖 15:英偉達:英偉達專業可視化產品重要時間點專業可視化產品重要時間點.-14-3-圖圖 16:英偉達專業可視化產品及其參數:英偉達專業可視化產品及其參數.-14-圖表圖表 17:英偉達歷年營業收入及:英偉達歷年營業收入及yoy(百萬美元)(百萬美元)
5、.-15-圖表圖表 18:英偉達歷年凈利潤及:英偉達歷年凈利潤及yoy(百萬美元)(百萬美元).-15-圖表圖表 19:英偉達:英偉達2003財年分地區收入占比財年分地區收入占比.-15-圖表圖表 20:英偉達:英偉達2023財年分地區收入占比財年分地區收入占比.-15-圖表圖表 21:英偉達:英偉達2019-2023財年分業務收入增速財年分業務收入增速.-16-圖表圖表 22:英偉達:英偉達2019-2023財年分業務收入(百萬美元)財年分業務收入(百萬美元).-16-圖表圖表 23:英偉達:英偉達2000-2023財年凈資產收益率財年凈資產收益率.-16-圖表圖表 24:英偉達:英偉達20
6、00-2023財年凈利率和毛利率財年凈利率和毛利率.-16-圖表圖表 25:2000-2005年英偉達、年英偉達、ATI研發費用研發費用.-17-圖表圖表 26:2005-2022年英偉達、年英偉達、AMD研發費用研發費用.-17-圖表圖表 27:1999-2023財年英偉達研發費用率財年英偉達研發費用率.-17-圖表圖表 28:2001-2023財年英偉達研發人員數量財年英偉達研發人員數量.-17-圖表圖表 29:3D圖像市場競爭圖圖像市場競爭圖.-18-圖表圖表 30:Riva 128與與i740對比對比.-19-圖表圖表 31:2002-2013年英偉達收購匯總年英偉達收購匯總.-20-
7、圖表圖表 32:英偉達產品線:英偉達產品線.-20-圖表圖表 33:2014年年3G/4G市場份額市場份額.-21-圖表圖表 34:英偉達:英偉達2007-2023財年凈利潤財年凈利潤.-22-圖表圖表 35:英偉達:英偉達2007-2023財年研發費用財年研發費用.-22-(百萬美元)(百萬美元).-22-圖表圖表 36:英偉達終端用戶收入情況(:英偉達終端用戶收入情況(百萬美元)百萬美元).-22-圖表圖表 37:英偉達終端用戶收入年增長率:英偉達終端用戶收入年增長率.-22-圖表圖表 38:1998年操作系統占比年操作系統占比.-23-圖表圖表 39:英偉達追隨:英偉達追隨DirectX
8、升級開發產品升級開發產品.-23-圖表圖表 40:英偉達商業布局:英偉達商業布局.-24-圖表圖表 41:2016-2025年自動駕駛規模(十億美元)年自動駕駛規模(十億美元).錯誤!未定義書簽。圖表圖表 42:英偉達顯卡合作伙伴多于:英偉達顯卡合作伙伴多于AMD.-25-圖表圖表 43:AMD的研發費用被英偉達反超的研發費用被英偉達反超.-25-圖表圖表 44:英偉達在天梯圖覆蓋面廣,高端產品領先:英偉達在天梯圖覆蓋面廣,高端產品領先AMD.-26-圖表圖表 45:CUDA加速計算解決方案加速計算解決方案.-27-圖表圖表 46:CUDA 軟件層軟件層.-27-圖表圖表 47:CUDA 11
9、.0 主要特點主要特點.-28-圖表圖表 48:大學教授:大學教授CUDA數量(所)數量(所).-29-圖表圖表 49:CUDA成為英偉達生態基礎成為英偉達生態基礎.-29-4-圖表圖表 50:GPU編程平臺發展歷史編程平臺發展歷史.-30-圖表圖表 51:英偉達人工智能生態系統英偉達人工智能生態系統.-31-圖表圖表 52:CUDA對應對應GPU架構發展架構發展.-31-圖表圖表 53:CUDA通過并行架構的改進通過并行架構的改進.-31-圖表圖表 54:全球數據總量(:全球數據總量(ZB).-32-圖表圖表 55:Intel測算的數據流測算的數據流.-32-圖表圖表 56:全球:全球ADA
10、S市場規模擴大市場規模擴大.-33-圖表圖表 57:全球自動駕駛功能市場規模擴大:全球自動駕駛功能市場規模擴大.-33-圖表圖表 58:智能駕駛層級越高所需傳感器越多:智能駕駛層級越高所需傳感器越多.-33-圖表圖表 59:2018-2025年年AI硬件市場收入(十億美元)硬件市場收入(十億美元).-34-圖表圖表 60:GPU打破摩爾定律打破摩爾定律.-34-圖表圖表 61:AI芯片產業鏈芯片產業鏈.-35-圖表圖表 62:P4傳輸速度大于傳輸速度大于FPGA架構芯片架構芯片.-35-圖表圖表 63:FPGA和和GPU對比對比.-36-圖表圖表 64:AI人工智能與半導體計算芯片發展歷程人工
11、智能與半導體計算芯片發展歷程.-37-圖表圖表 65:GPT模型迭代過程模型迭代過程.-38-圖表圖表 66:大語言模型(:大語言模型(LLM)舉例)舉例.-39-圖表圖表 67:Transformer架構示意圖架構示意圖.-40-圖表圖表 68:國外部分:國外部分AIGC預訓練模型一覽預訓練模型一覽.-40-圖表圖表 69:中國:中國AI算力規模及預測算力規模及預測.-41-圖表圖表 70:全球全球AI芯片市場規模及預測芯片市場規模及預測.-41-圖表圖表 71:AI芯片特點及具體參數對比芯片特點及具體參數對比.-42-圖表圖表 72:CPU的基本結構的基本結構.-42-圖表圖表 73:GP
12、U的基本結構的基本結構.-42-圖表圖表 74:CPU與與GPU對比對比.-43-圖表圖表 75:國內外國內外AI芯片產品對比(芯片產品對比(1)圖形渲染圖形渲染GPU.-44-圖表圖表76:國內外:國內外AI芯片產品對比(芯片產品對比(2)GPGPU.-44-圖表圖表77:國內外:國內外AI芯片產品對比(芯片產品對比(3)FPGA/ASIC.-45-圖表圖表 78:龍架構:龍架構LoongArch.-46-圖表圖表 79:海光:海光CPU與與Intel產品性能對比產品性能對比.-47-圖表圖表 80:深算一號與國際同類型產品性能對比:深算一號與國際同類型產品性能對比.-47-圖表圖表 81:
13、高性能通用圖形處理器芯片及系統研發項目情況及進程安排:高性能通用圖形處理器芯片及系統研發項目情況及進程安排.-48-圖表圖表82:公司發展歷程時間表:公司發展歷程時間表.-48-圖表圖表83:FPGA芯片產品線芯片產品線.-49-圖圖 84:公司發展歷程:公司發展歷程.-50-5-圖圖 85:公司:公司FPGA芯芯片產品線片產品線.-50-6-1、英偉達、英偉達:算力芯片巨頭:算力芯片巨頭領跑領跑 AI 時代時代 1.1 公司公司簡介:全球領先的簡介:全球領先的 GPU 龍頭廠商龍頭廠商 公司是公司是全球全球 GPU 龍頭龍頭,市場份額遙遙領先,市場份額遙遙領先。英偉達(NVIDIA)是一家全
14、球知名的技術公司,成立于 1993 年,最初以圖形處理器(GPU)起家,通過不斷的創新和發展,逐漸成為了高性能計算領域的領導者。根據 Jon Peddie Research 發布的 GPU 市場數據統計報告,英偉達 2022 年全年 PC GPU出貨量高達 3034 萬塊,是 AMD 的近 4.5 倍;截至 2022 年四季度,在獨立GPU 市場,英偉達占據 84%的市場份額,遠超同業競爭公司。圖圖 1:引領引領GPU市場的巨頭市場的巨頭,英偉達的崛起和發展歷程英偉達的崛起和發展歷程 來源:WRDS,中泰證券研究所整理 英偉達的產品創新和迭代英偉達的產品創新和迭代從未止步從未止步。自英偉達成立
15、以來,其經歷了多個重要的發展時間點。其中包括 1999 年推出全球第一款 GPU、2006 年發布 Fermi架構、2012 年發布 Kepler 架構、2016 年推出 AI 加速器 Tesla P100 和 Volta架構、以及 2020 年發布 Ampere 架構等。這些重要時間點的創新和進步,為英偉達在高性能計算、人工智能、虛擬現實等領域的發展奠定了堅實的基礎。-7-圖圖 2:英偉達時間線英偉達時間線 來源:英偉達官網,中泰證券研究所整理 橫向拓展豐富業務橫向拓展豐富業務產品線產品線,實現實現“CPU+GPU+DPU”三芯布局。三芯布局。英偉達的三芯戰略側重于在數據中心市場實現CPU、
16、GPU和DPU三類硬件的布局,旨在全面提升競爭力,滿足云計算、人工智能及機器學習等高端應用領域的需求。CPU 的加入使英偉達能夠更好地應對各種計算任務,尤其是那些需要快速邏輯判斷和高度并行處理能力的應用。而 DPU 則針對數據中心和網絡設備的需求,具有高效處理數據包和協議的能力,為英偉達的產品線增添了新的價值。通過將 CPU、GPU 和 DPU 集成到同一平臺上,英偉達可以為客戶提供更加全面、高效的計算解決方案。目前 CPU+GPU 的產品組合獲得超級計算中心的采用并即將廣泛部署于大型服務器,三芯戰略初顯成效。圖圖 3:“CPU+GPU+DPU”業務布局”業務布局 來源:英偉達官網,中泰證券研
17、究所整理 -8-圖圖 4:英偉達三芯布局英偉達三芯布局產品線產品線 來源:英偉達官網,中泰證券研究所整理 芯片架構是英偉達的技術核心,快速迭代的芯片架構是英偉達的技術核心,快速迭代的新架構為新架構為產品產品帶來帶來不斷不斷的創的創新與升級新與升級。自英偉達 GPU 問世以來,其架構經歷了多個重要發展階段。2006 年,Fermi 架構在 GPU 計算領域實現了重大突破,Kepler 架構進一步提高了能效比和 GPU 性能,并引入了動態并行處理技術。隨后,Maxwell 架構實現了更加節能和高效的設計,Pascal 架構則引入了深度學習計算中的 Tensor Core 和 NVLink 技術,以
18、及更多的 AI 加速功能。Volta 架構則實現了更高的計算能力和存儲帶寬,并引入了深度學習加速器 Tensor Cores V100。Turing 架構則進一步提高了光線追蹤和圖形渲染性能,而 Ampere 架構則在 AI 加速、性能和能效方面實現了重要進展。每一代架構的創新和進步,都為 GPU 技術在高性能計算、人工智能、虛擬現實等領域的應用奠定了堅實的基礎。圖圖 5:架構發展歷程:架構發展歷程 -9-來源:英偉達官網,中泰證券研究所整理 圖圖 6:產品及相應架構:產品及相應架構 來源:英偉達官網,中泰證券研究所整理 1.2 公司產品公司產品:多元化產品矩陣助力公司長期增長多元化產品矩陣助
19、力公司長期增長 英偉達產業布局多元化,解決客戶不同需求。英偉達產業布局多元化,解決客戶不同需求。GPU 產品為英偉達主要收入來源,收入占比穩定在 80%以上。相比較于 CPU,GPU 在機器學習算法有天生的優勢。英偉達一直專注于 GPU 的設計,同時由于 GPU 的并行計算能力,可以通過數千個計算核心進行深度學習,英偉達開始將服務和系統、軟硬件和可編程算法結合在一起,提出 CUDA 架構。從下游應用來看,英偉達產品主要集中于游戲、專業可視化、數據中心以及自動駕駛領域:1)游戲市場)游戲市場:英偉達提供的產品包括 PC 游戲的 GeForce RTX 和 GeForce GTX,用于游戲和流媒體
20、的 SHIELD 設備,用于云端游戲的 GeForce NOW,以及用于專門控制臺游戲設備的平臺和開發服務;2)專業可視化市場)專業可視化市場:英偉達除了加速 GPU 計算解決方案,同時也為汽車、娛樂、建筑工程、石油和天然氣、醫療等行業引入新的解決方案;3)數據中心市場)數據中心市場:英偉達使用 NVlink 技術將多個 GPU 結合在一起,加速神經網絡訓練和推理。同時開發出 DGX 超級計算機,進行科學計算、深度學習和機器學習;4)自動駕駛市場)自動駕駛市場:英偉達 Drive 作為一個人工智能汽車平臺,涵蓋了從交通擁堵到機器人出租車自動駕駛的所有領域。2018 年有超過 370 家自動駕駛
21、汽車公司開始使用 Drive,共同開發自動駕駛的人工智能系統。-10-圖圖 7:英偉達產品線總覽英偉達產品線總覽 來源:英偉達官網,中泰證券研究所整理 游戲業務游戲業務:是英偉達主要產品線,作為基本盤見證了是英偉達主要產品線,作為基本盤見證了其其里程碑式的革新。里程碑式的革新。英偉達在游戲業務領域持續不斷的技術升級,以應對玩家日益增長的畫質需求。游戲業務一直是英偉達的核心領域,每年都以引人注目的新產品展現其持續的創新力。與前一代產品相比,每一代新顯卡都帶來了顯著的性能提升。從核心數量來看,英偉達顯卡產品的 CUDA 核心數量已從最初的 640 顆增長到現在的高達 16384 顆,技術上不斷突破
22、,包括實時光線追蹤技術等。另外,英偉達在游戲顯卡市場上有著廣泛的布局,從入門級到專業級,都提供了相應的產品。這一策略允許英偉達滿足從獨立游戲玩家到專業電競選手的多元需求。圖圖 8:英偉達游戲顯卡重要時間點英偉達游戲顯卡重要時間點 來源:英偉達官網,中泰證券研究所整理 -11-圖圖 9:英偉達英偉達游戲顯卡詳細參數游戲顯卡詳細參數 來源:英偉達官網,中泰證券研究所整理 數據中心數據中心:持續發力,持續發力,高市占率源自于英偉達持續不斷的研發與創新。高市占率源自于英偉達持續不斷的研發與創新。英偉達長期占據高端 GPU 市場的領導地位,截至目前英偉達占據全球算力芯片 90%的市場份額。高端芯片領域的
23、霸主地位主要源自于公司不斷的技術提升所形成強大的技術壁壘。從 2017 到 2022 這五年間,公司先后推出了Volta、Ampere、Hopper 等針對高性能計算和 AI 訓練的架構,以此為基礎發布了 V100、A100、H100 等高端 GPU。通過不斷的技術革新,英偉達GPU 產品向量雙精度浮點算力已從 7.8 TFLOPS 增至 30 TFLOPS。圖圖10:英偉達數據中心:英偉達數據中心GPU發展歷程發展歷程 來源:英偉達官網,中泰證券研究所整理 英偉達數據中心英偉達數據中心 GPU 在在 11 年間從制程工藝到核心數量,各參數全方位提年間從制程工藝到核心數量,各參數全方位提升。升
24、。從 2011 年的 Tesla M2090 開始英偉達不斷更新迭代數據中心產品,到 -12-了 2022 年發布的英偉達全新 GPU 產品 NVIDIA H100,性能上已經出現了質的飛躍。此外,英偉達在數據中心的布局不僅僅停留在 GPU,在 CPU 方面英偉達也全面發力,在 2022 年發布了首款 CPU 產品 Grace。Grace 內臵下一代 Arm Neoverse 內核,采用第四代 NVIDIA NVLink,從 CPU 到 GPU 連接速度超過 900GB/s,相當于目前服務器 14 倍的帶寬速度;從 CPU 到 CPU 的速度超過 600GB/s。并且 Grace 擁有最高的內
25、存帶寬,采用的新內存 LPDDR5x 技術,帶寬是 LPDDR4 的 2 倍,能源效率提高了 10 倍,能提供更多計算能力。圖圖11:英偉達數據中心:英偉達數據中心GPU及其參數及其參數 來源:英偉達官網,中泰證券研究所整理 圖圖 12:英偉達:英偉達Grace與與x86+Hopper對比對比 來源:英偉達官網,中泰證券研究所整理 自動駕駛業務自動駕駛業務:為英偉達提供中長期增長曲線為英偉達提供中長期增長曲線。英偉達的自動駕駛 SoC 產品線以其高性能、高能效和創新技術而著稱,致力于滿足不斷增長的計算需求。英偉達推出的自動駕駛 SoC 產品包括先進的 Atlan 和 Orin 芯片,它們集成了
26、安培架構 GPU 核心、基于 Arm 的 Grace CPU 核心、深度學習和計算機視覺加速器單元以及 BlueField DPU 核心,以實現卓越的算力和性能。英偉達的 SoC 產品線不斷創新,為客戶提供卓越的性能和可靠性,幫助推動未來智能駕駛和高度互聯的汽車發展。-13-圖圖 13:英偉達:英偉達自動駕駛芯片時間軸自動駕駛芯片時間軸 來源:英偉達官網,中泰證券研究所整理 最新款最新款 Atlan SoC 算力獲得指數級提升,為自動駕駛提供充足算力算力獲得指數級提升,為自動駕駛提供充足算力。2021年,英偉達推出了自動駕駛 SoC Atlan,其單顆算力高達 1000TOPS,是上一代 Or
27、in SoC(254TOPS)的近四倍。Altan 還支持 400Gbs(40 萬兆)網絡和安全網關,可以滿足高速通信需求。同時,Atlan 可與為上一代芯片組編寫的軟件堆棧(如 Orin 或 Xavier)兼容,使得汽車制造商和 AV 開發人員不需要重新設計軟件就能利用新 SoC 的性能提升,大大提升使用的便捷程度。圖圖 14:英偉達幾代英偉達幾代汽車芯片汽車芯片對比對比 來源:英偉達官網,中泰證券研究所整理 可視化業務:可視化業務:技術革新助力卓越視覺與計算體驗技術革新助力卓越視覺與計算體驗。在過去幾年,英偉達專業可視化業務持續推出了一系列的技術革新,包括新的GPU架構(如Pascal、V
28、olta、Ampere、Ada Lovelace),更高效的顯存技術(如 GDDR6X),以及更加智能化的軟件工具(如 RTX Studio)。這些創新大幅提升了英偉達專業顯卡在高性能計算、人工智能、虛擬現實等領域的性能和可靠性,為專業用戶提供了更加卓越的視覺體驗和計算能力。-14-圖圖 15:英偉達:英偉達專業可視化專業可視化產品產品重要時間點重要時間點 來源:英偉達官網,中泰證券研究所整理 英偉達專業顯卡技術不斷進步,性能顯著提升英偉達專業顯卡技術不斷進步,性能顯著提升。隨著英偉達專業可視化顯卡的不斷升級,計算能力和相關性能得到了顯著提升。從最初的幾百萬個CUDA 核心、數百 GB/s 的
29、顯存帶寬,到現在的數千萬個 CUDA 核心、TB/s級別的顯存帶寬,英偉達專業顯卡已經成為高性能計算、人工智能、虛擬現實等領域不可或缺的重要組成部分,為專業用戶提供了更加卓越的視覺體驗和計算能力。圖圖 16:英偉達:英偉達專業可視化專業可視化產品及其參數產品及其參數 來源:英偉達官網,中泰證券研究所整理 1.3 公司財務:公司財務:財務狀況良好,反哺研發投入上升財務狀況良好,反哺研發投入上升 公司營業收入高速增長,公司營業收入高速增長,1999-2023 財年財年 CAGR 24%。1996 年英偉達的營業收入僅 391 萬美元,凈利潤虧損超過 300 萬美元。此后,英偉達的體量快速增長,到
30、2023 財年營收和凈利潤分別達 270 億美元和 44億美元,1999-2023 財年營收 CAGR 24%,凈利潤 CAGR 34%。-15-圖表圖表 17:英偉達歷年營業收入及:英偉達歷年營業收入及yoy(百萬美元)(百萬美元)圖表圖表 18:英偉達歷年凈利潤及:英偉達歷年凈利潤及yoy(百萬美元)(百萬美元)來源:英偉達,中泰證券研究所 來源:英偉達,中泰證券研究所 新興市場成為英偉達主要收入來源地。新興市場成為英偉達主要收入來源地。分地區看,中國大陸在 2023 財年營業收入達到 58 億美元,占總收入的 21%,而在 2003 財年中國大陸營業收入只有 2.4 億美元,占總收入的比
31、例僅為 13%。和中國大陸市場一樣,亞太其他地區以及美洲其他地區都出現了較大的增長幅度。相反,中國臺灣市場出現了較大的衰退。2003 財年,中國臺灣市場占總營收的比例為 45%,到 2023 財年下降到 32%,而美國市場收入則保持穩定在 31%左右。圖表圖表 19:英偉達:英偉達2003財年分地區收入占比財年分地區收入占比 圖表圖表 20:英偉達:英偉達2023財年分地區收入占比財年分地區收入占比 來源:英偉達,中泰證券研究所 來源:英偉達,中泰證券研究所 隨人工智能發展,數據中心業務收入增速最高,逐步成為公司最大營收隨人工智能發展,數據中心業務收入增速最高,逐步成為公司最大營收占比。占比。
32、從業務板塊看,英偉達下游應用包括游戲、數據中心、專業化視覺、汽車、OEM 及其他。其中,數據中心業務收入在 2023 財年達到 150億美元,占據英偉達營業總收入的 56%,數據中心業務收入同比增長41%,主要增長來源于 AI 發展及美國云服務提供商的推動。游戲業務收入 90.7 億美元,占總營業收入的 34%,受全球游戲行業需求下行影響同比下降 27%。汽車、代工以及專業可視化業務都保持著低速增長。-16-圖表圖表 21:英偉達:英偉達2019-2023財年分業務收入增速財年分業務收入增速 圖表圖表 22:英偉達:英偉達2019-2023財年分業務收入(百萬美財年分業務收入(百萬美元)元)來
33、源:英偉達,中泰證券研究所 來源:英偉達,中泰證券研究所 英偉達凈資產收益率周期波動,毛利率和凈利率總體呈現上升趨勢。英偉達凈資產收益率周期波動,毛利率和凈利率總體呈現上升趨勢。2000 財年之后,英偉達開始負責 Xbox(微軟公司開發并于 2001 年發售的一款家用電視游戲機)的芯片設計工作,因為 Xbox 相比較于英偉達其他產品有著相對較少的利潤率,所以 ROE 和凈利率都呈現下降趨勢。在此之后英偉達依靠新產品的開發,使得 ROE 重新上升到 34%。2008 財年英偉達已成長為全球圖像處理器行業龍頭,但因全球經濟危機影響,公司 ROE和凈利率創新低,至 2010財年分別達-2.69%和-
34、2.04%。2010 年后,全球經濟復蘇,游戲市場在新興市場蓬勃發展,英偉達游戲部門業務及圖形處理器收入平穩上升。2017 財年,英偉達迎來了新一輪的增長期,產品全面發力,GeForce、Tesla、GRID 和 Quadro 銷售收入相較于 2016 年都出現大幅度增長。圖表圖表 23:英偉達:英偉達2000-2023財年凈資產收益率財年凈資產收益率 圖表圖表 24:英偉達:英偉達2000-2023財年凈利率和毛利率財年凈利率和毛利率 來源:英偉達,iFind,中泰證券研究所 來源:英偉達,iFind,中泰證券研究所 良好的營收狀況是公司增加研發投入的基本,研發投入也保障了公司營良好的營收狀
35、況是公司增加研發投入的基本,研發投入也保障了公司營收的持續健康成長。收的持續健康成長。相比較于競爭對手 ATI 和 AMD,英偉達在競爭初期都處于下風。隨著研發投入的不斷增長,英偉達通過技術進步降低成本和產品價格,不斷推出新的產品吸引更多消費者,優勢逐漸凸顯。在與ATI 競爭的周期中,英偉達的研發費用從 1999 財年的 2507 萬美元,以年均 55%的增長率趕上 ATI的研發費用,在 2005財年達到 3.6億美元。ATI 被 AMD 收購后,英偉達在獨立顯卡的競爭對手就變為了 AMD。2005年,AMD 的研發費用為 11 億美元,是英偉達的 3.2 倍左右,而到了 2022 -17-年
36、,英偉達的研發費用達到了 73.4 億美元(對應 2023 財年),是 AMD的 1.47 倍。圖表圖表 25:2000-2005年英偉達、年英偉達、ATI研發費用研發費用(百萬美元)(百萬美元)圖表圖表 26:2005-2022年英偉達、年英偉達、AMD研發費用研發費用(百萬美元)(百萬美元)來源:英偉達,ATI,中泰證券研究所 來源:英偉達,AMD,中泰證券研究所 注釋:各家公司取統一自然年數據對比。研發費用率保持高位,不斷吸引優秀人才加入。研發費用率保持高位,不斷吸引優秀人才加入。從早期的“三團隊-兩季度”研發迭代模式開始,英偉達的研發目標就一直走在市場的前端。英偉達研發團隊分為軟件工程
37、、硬件工程、超大規模集成電路工程、工藝工程、架構和算法團隊,負責研究開發統一的硬件和軟件架構,提供領先市場的圖像加速技術。英偉達研發人員數量持續增長,截至 2023 財年達到 19532 人。圖表圖表 27:1999-2023財年英偉達研發費用率財年英偉達研發費用率 圖表圖表 28:2001-2023財年英偉達研發人員數量財年英偉達研發人員數量 來源:英偉達,中泰證券研究所 來源:英偉達,中泰證券研究所 2、英偉達發展歷程三部曲、英偉達發展歷程三部曲 2.1 1993-2000:初具規模,:初具規模,提升研發效率提升研發效率戰勝對手戰勝對手 1993 年黃仁勛、克里斯馬拉科夫斯基和柯蒂斯普利姆
38、在美國加州創立了英偉達。在創建之初,公司設想著個人電腦將會成為游戲、多媒體的主流消費設備。90 年代初,高性能圖像被使用在工作站和視頻游戲機上,在此之后,3 件獨立事件改變了這樣的情況,推動了 3D 圖像市場的發展:-18-(1)微軟推出的 Windows 95 包括了視頻、音頻功能,刺激了多媒體市場發展。3D 圖形逐漸增加的重要使得個人電腦制造商的差異性更加明顯;(2)電腦仿真渲染動畫出現,3D 動作游戲登陸 PC 平臺;(3)在摩爾定律的推動下,IC 的集成度不斷提高,能夠將大量 3D 圖形處理器放在一個芯片上。半導體設計和制造的不斷進步,使得以前只能在工作站級別獲得的高性能 3D 圖形技
39、術,現在能夠以合理的價格獲得。而圖形處理器的不斷發展也帶動英偉達整體規模不斷增長。推進“三團隊推進“三團隊-兩季度”研發模式,新品不斷迭代滿足下游需求。兩季度”研發模式,新品不斷迭代滿足下游需求。一般圖形市場產品有兩個開發周期:6-9 個月和 12-18 個月,英偉達執行了“三團隊-兩季度”的運營模式,具體方式包括三個并行開發團隊,專注于三個獨立的分階段產品開發。一個在第一年秋季,一個是在第二年春季以及第二年秋季。這樣的運行方式允許公司每 6 個月推出一次新產品,與圖形市場產品周期一致,并且領先市場 1-2 個研發周期,從而滿足下游需求變化。不斷豐富產品矩陣滿足下游客戶不同需求。不斷豐富產品矩
40、陣滿足下游客戶不同需求。GeForce 系列是英偉達為臺式機提供圖像處理的芯片。2002 年 11 月,英偉達推出為個人電腦市場消費者開發的產品線 GeForce FX 系列。GeForce 系列的其他產品,比如 GeForce2、GeForce3、GeForce4 都能夠為不同價位的主流產品提供最高的性能。高研發帶來技術水平不斷升級,英偉達在高研發帶來技術水平不斷升級,英偉達在 1996 年后接連推出旗艦產品,年后接連推出旗艦產品,擊敗行擊敗行業競爭者。業競爭者。英偉達在 1996 年,推出 NV3 系列的 Riva 128 芯片,在性能方面具有優勢,并且芯片尺寸更小,因此結構成本更低,通過
41、數據對比,RIVA128 甚至優于下一年 Intel 推出的 i740,而且 i740 不支持任何 OpenGL 驅動程序。在英偉達推出 RIVA TNT 時已經沒有產品能夠和其匹敵。1999 年,Intel 宣布完全退出獨立顯卡芯片組業務。而在 2000年英偉達推出 GeForce 256,全面超過當時行業最大競爭者 3dfx,最終3dfx 宣布破產并且被英偉達收購。圖表圖表 29:3D圖像市場競爭圖圖像市場競爭圖 來源:英偉達,H&Q,中泰證券研究所 -19-圖表圖表 30:Riva 128與與i740對比對比 RIVA 128ZX i740 填充率(百萬像素/秒)100 66 多邊形率
42、1.5 0.5 晶片大小 8.2mm 11.4mm 最大電容 3.5W 5.8W(散熱片需求)DAC 230MHz 205MHz 儲存器接口 128-bit 64-bit 幀緩沖總線帶寬 1.6GB/s 800MB/s 紋理緩存 8192byte 256byte 來源:英偉達,Intel,中泰證券研究所 總結:英偉達在成立初期,面對著技術不成熟、行業競爭激烈等難題,總結:英偉達在成立初期,面對著技術不成熟、行業競爭激烈等難題,依靠“三團隊依靠“三團隊-兩季度”的研發模式和以兩季度”的研發模式和以 Direct X、OpenGL 為代表的為代表的API 出現,不斷進行技術更新、降低產品價格,擠壓
43、同業競爭對手的生出現,不斷進行技術更新、降低產品價格,擠壓同業競爭對手的生存空間,從而在早期的存空間,從而在早期的 GPU 市場上存活下來。市場上存活下來。2.2 2001-2006:寡頭壟斷,逐步成為獨顯市場霸主:寡頭壟斷,逐步成為獨顯市場霸主 英偉達在游戲市場率先取得突破。英偉達在游戲市場率先取得突破。自 1999 年 Geforce 系列推出以來,它一直在游戲性能的創新和提升方面保持領先地位。GeForce 系列顯卡被廣大游戲愛好者和電子競技玩家所推崇,因為它們能提供極高的圖形渲染能力和實時光線追蹤技術,以實現更加真實的游戲體驗。與此同時,Xbox 為代表的游戲主機興起助力了英偉達在游戲
44、 GPU 行業的發展。英偉達為 Xbox 視頻游戲系統設計的處理器利用雙處理架構推動了其優秀的圖形、音頻和網絡功能,確立了英偉達在游戲機市場的穩固地位。雖然后續英偉達未能持續成為 Xbox GPU 供應商,但是早期在 Xbox 上的成功已經為英偉達在游戲市場的發展奠定基礎。通過收購,技術開發以及廣納人才,英偉達進一步開拓市場,增強自身通過收購,技術開發以及廣納人才,英偉達進一步開拓市場,增強自身實力,保持市場領先地位實力,保持市場領先地位。英偉達預測未來能夠實現通話和多媒體功能的手機半導體將會大放異彩,因此積極通過收購移動端公司來布局移動端圖像芯片產業,并緊密融合 Direct3D 和 Ope
45、nGL 以最大程度地支持第三方軟件。Direct3D 和 OpenGL 作為應用程序編程接口,使軟件開發人員能夠在不需要深入了解硬件特性的情況下編寫應用程序,從而在 3D圖形、視頻媒體通信以及超低功耗方面保持其技術的領先地位。為了維護市場的領導地位,英偉達積極地招募業界經驗豐富的 3D 圖形和通信工程師,并持續開發新一代的 GPU、MCP 以及 UMP。-20-圖表圖表 31:2002-2013年英偉達收購匯總年英偉達收購匯總 年份年份 收購公司收購公司 收購目的收購目的 2002 Exluna 提供設計人才,推動 CG 語言進入電影行業 2003 MediaQ 打開快速增長的移動和手持市場領
46、域 2004 iReady 獲得用于支持超高性能以太網絡的傳輸技術 2005 ULI Electronics ULI 為 ATI 提供南橋部件 2006 Hybrid Graphics 打開手持設備領域,開發圖像解決方案 2006 PortalPlayer 將 GPU 和 PortalPlayer 應用處理器結合,完善手持產品戰略分布 2008 Ageia 將 PhysX 物理引擎和 GPU 集成 2011 Icera 幫助代工廠商縮短產品上線時間,滿足下一代移動計算需求 2013 PGI 為 HPC 系統提供關鍵組件 來源:各公司年報,中泰證券研究所 英偉達全面完善產品線,產品覆蓋高中低端下
47、游各應用市場。英偉達全面完善產品線,產品覆蓋高中低端下游各應用市場。經過了不斷的發展,英偉達的產品線逐漸豐富,覆蓋了多種不同的下游應用。首當其沖的是 GeForce 系列顯卡,主要針對的是個人電腦的游戲領域。同時,為了滿足科研和企業市場的需求,英偉達推出了 Tesla 和 Quadro系列的 GPU,這些產品被廣泛應用于機器學習、數據科學、計算機視覺等領域。此外,英偉達還在汽車自動駕駛等前沿領域推出了專門的解決方案,如 Jetson 和 DRIVE 系列。圖表圖表 32:英偉達產品線:英偉達產品線 來源:英偉達,中泰證券研究所 總結:在經歷了行業發展初期洗牌之后,英偉達在獨立顯卡市場上的主總結
48、:在經歷了行業發展初期洗牌之后,英偉達在獨立顯卡市場上的主要競爭對手只剩下要競爭對手只剩下 ATI,整個獨立顯卡行業逐步向寡頭壟斷轉變。在這,整個獨立顯卡行業逐步向寡頭壟斷轉變。在這六年時間里,公司曾因產品定位和市場需求貼合度不夠而落后,但通過六年時間里,公司曾因產品定位和市場需求貼合度不夠而落后,但通過堅持投入研發,完善產品線,競爭力持續提升。堅持投入研發,完善產品線,競爭力持續提升。2006 年年 AMD 收購收購 ATI后,英偉達終成行業霸主。后,英偉達終成行業霸主。2.3 2007-2023:重“芯”開始,引領人工智能計算:重“芯”開始,引領人工智能計算 智能手機浪潮來臨,但是由于時機
49、和定位上的失誤,英偉達錯失機遇。智能手機浪潮來臨,但是由于時機和定位上的失誤,英偉達錯失機遇。自蘋果系列產品推出后,智能手機成為一大熱點,引領時代風潮。在這 -21-樣的背景下,Intel 推出了 Atom,英偉達推出了 Tegra。然而手機芯片市場并沒有像 PC 市場一樣被這兩個大場占領,相反高通依靠著基帶技術的壟斷成為了移動端市場的主流。Tegra 系列在最初是依靠英偉達在圖像處理的優勢為平板和游戲機研發的。當英偉達推出 Tegra 2 系列時,3G/4G 技術開始成為移動端市場追逐的目標。但由于 Tegra 3 沒有能夠整合基帶技術從而失去了占領市場的必要條件,而 Tegra 4 遲遲沒
50、有發布以及低性價比也失去了市場的青睞。圖表圖表 33:2014年年3G/4G市場份額市場份額 來源:Strategy Analytics,中泰證券研究所 英偉達退出手機市場,轉向汽車、人工智能市場,調整競爭策略。英偉達退出手機市場,轉向汽車、人工智能市場,調整競爭策略。在經歷了手機市場的挑戰后,英偉達進行了戰略調整,從手機市場退出,并將其研發重心轉向了汽車和人工智能市場。這一轉變對于英偉達來說,不僅是其業務發展的一次機遇,更是對于行業趨勢的敏銳洞察。在汽車市場中,英偉達通過自己的技術優勢,推出了一系列高效能的自動駕駛處理器,逐漸在此領域確立了自己的領導地位。而在人工智能市場,英偉達的 GPU
51、產品憑借其超強的并行計算能力,成為了支撐深度學習和機器學習應用的核心設備,展現出強大的市場競爭力。事實證明英偉達的轉型抓住了市場需求的改變,英偉達事實證明英偉達的轉型抓住了市場需求的改變,英偉達 2015-2023 年營年營收增速可觀。收增速可觀。在 2008 年全球經濟危機爆發之后,英偉達的業務收入也受到了經濟危機的影響,在 2009 年和 2010 年財報中凈利潤呈現負值,虧損達到三千萬和六千萬美元,但在之后的幾年中,英偉達依靠著在游戲行業中的基礎,繼續拓寬在可視化計算、人工智能業務,并且借助于比特幣和區塊鏈對于顯卡芯片的高增長需求,在 2016 年之后,保持著高增長的營業收入增長趨勢。高
52、增長的凈利潤得益于英偉達每年研發費用的投入,使得英偉達的產品領先同行業的競爭對手,更快地拓展新業務,更早地形成進入壁壘。而凈利潤的增長又會使得英偉達有更多的資金進行新產品的研發,從而達成良性循環,占據市場領先的地位。-22-圖表圖表 34:英偉達:英偉達2007-2023財年凈利潤財年凈利潤(百萬美元)(百萬美元)圖表圖表 35:英偉達:英偉達2007-2023財年研發費用財年研發費用(百萬美元)(百萬美元)來源:英偉達,中泰證券研究所 來源:英偉達,中泰證券研究所 具體從各終端來看,英偉達各方面業務保持收入增長,全面發展具體從各終端來看,英偉達各方面業務保持收入增長,全面發展。從英偉達終端用
53、戶劃分來看,各終端產品收入都保持著穩定增長。數據中心發展加速,游戲終端依舊是英偉達重要的業務收入基礎。圖表圖表 36:英偉達終端用戶收入情況(百萬美元):英偉達終端用戶收入情況(百萬美元)圖表圖表 37:英偉達終端用戶收入年增長率:英偉達終端用戶收入年增長率 來源:英偉達,中泰證券研究所 來源:英偉達,中泰證券研究所 英偉達不斷更新產品技術,英偉達不斷更新產品技術,AI 市場成為主要目標,給英偉達帶來新的市場成為主要目標,給英偉達帶來新的增長增長。隨著 AI 市場的蓬勃發展,英偉達敏銳地將其定位為公司的主要發展目標。英偉達開發了一系列專門針對 AI 應用的 GPU,如 Tesla、Titan以
54、及 Quadro 系列。這些產品能夠高效處理深度學習和機器學習的大規模并行計算,極大地推動了 AI 的發展。2020 年在 SC20 超級計算大會上,NVIDIA 發布了新一代 DGX Station A100 以及 NVIDIA A100 80GB GPU 支持諸如 BERT Large 推理等復雜的對話式 AI 模型。此后在 2022年 3 月,NVIDIA 又宣布推出第四代 NVIDIA DGX系統,是全球首個基于全新 NVIDIA H100 Tensor Core GPU 的 AI 平臺,徹底占據 AI 市場領先地位??偨Y:當總結:當 iPhone 出現后,全球智能手機市場的帷幕被拉開
55、。移動端出現后,全球智能手機市場的帷幕被拉開。移動端 GPU市場逐漸成為了大家的焦點。但英偉達并沒有能夠在手機市場逐漸成為了大家的焦點。但英偉達并沒有能夠在手機 GPU 市場取市場取得較打的成功,但英偉達將手機得較打的成功,但英偉達將手機GPU芯片芯片Tegra用在了其他應用領域,用在了其他應用領域,為公司打開了新的業務市場為公司打開了新的業務市場。-23-3、英偉達發展歷程總結,借鑒意義、英偉達發展歷程總結,借鑒意義 3.1 深耕深耕 GPU 算力領域,研發為導向不斷提升產品競爭力算力領域,研發為導向不斷提升產品競爭力 采用主流采用主流 API,借助微軟推廣產品。,借助微軟推廣產品。從英偉達
56、創立時,公司就以市場需求為導向。通過匹配主流 API,不斷技術更新逐漸減低產品價格,達到消費者需求,以此來達到一家初創公司占領市場的目的。英偉達在設計NV2 后的產品時,都將微軟推出的 DirectX 作為匹配的 API。憑借著微軟 Windows 系列在操作系統市場占有大量份額,同時對 DirectX 和OpenGL 加速優化,使得英偉達的產品廣受歡迎。圖表圖表 38:1998年操作系統占比年操作系統占比 來源:IDC,中泰證券研究所 圖表圖表39:英偉達追隨:英偉達追隨DirectX升級開發產品升級開發產品 來源:各公司年報、中泰證券研究所 壓縮開發周期領先市場,為下游廠商提供更好的產品。
57、壓縮開發周期領先市場,為下游廠商提供更好的產品。英偉達把握住了從 2D 到 3D 過渡的風潮,通過成熟的研發體系,用速度甩開 2D 圖形廠商。英偉達圖形業務的快速產品周期得益于其運營模式。一般圖形市場產品有兩個開發周期:6-9 個月和 12-18 個月,英偉達執行了“三團隊-兩季度”的運營模式,具體方式包括三個并行開發團隊,專注于三個獨立的分階段產品開發。一個在第一年秋季,一個是在第二年春季以及第二年秋季。這樣的運行方式允許公司每 6 個月推出一次新產品,與圖形市場產品周期一致,并且領先市場 1-2 個研發周期。此外為解決芯片硬件開發比軟件開發慢的問題(軟件可以快速測試并經過調試,通常是每 -
58、24-天或每周一次;相比之下,芯片硬件就必須構建掩模并在進行電子測試之前完成初步制造),英偉達大力投資了仿真技術,從而提升效率。在產品布局多元化初期,用產品交叉服務市場。在產品布局多元化初期,用產品交叉服務市場。英偉達在經歷了手機端芯片市場開拓的失敗之后,并沒有停止 Tegra 處理器的研發,而是改變產品定位,將 Tegra 處理器運用在智能汽車、智慧城市和云端服務上。于是英偉達初步奠定了“兩產品條線-四市場”的商業模式。兩產品條線包括了英偉達傳統產品 GPU 和 Tegra 處理器,而四市場則包括了游戲、企業級、移動端、云端。圖表圖表40:英偉達商業布局:英偉達商業布局 GPU GeForc
59、e 游戲 Quadro 專業工作站 Tesla 超級計算機、工作站 GRID 圖像模塊 服務器工作站 GRID 系統 可視化計算 Tegra Tegra 平板、手機、游戲設備 Icera 基帶處理器 集成芯片解決方案 集成 Tegra 和 Icera Shield 項目 游戲、云端處理 Tegra VCM 智能汽車 嵌入計算平臺 數字消費設備 來源:英偉達、中泰證券研究所 英偉達的商業模式英偉達的商業模式戰略很好的戰略很好的應對了圖像處理器市場的發展趨勢。應對了圖像處理器市場的發展趨勢。當時的圖像處理器市場產品細化,主要分布在游戲玩家、企業級、平板電腦和移動端用戶,不同客戶的需求差異化明顯,針
60、對不同下游英偉達推出了對應的產品方案:(1)游戲市場:游戲市場:玩家希望能夠在不同的平臺無縫的進行游戲體驗,英偉達為此推出了端到端的服務:游戲能夠在云端運行,不需要玩家擁有足夠高性能的電腦。大大提高了玩家碎片時間的利用率和娛樂的靈活性。(2)企業級:企業級:產品則是為汽車、電影、天然氣等行業提供可視化解決方案,目的是提高行業生產力。英偉達面向企業市場的產品包括用于工作站的 Quadro,用于高性能計算服務器的 Tesla 和用于企業 VDI 應用程序的 GRID。(3)移動端:移動端:英偉達不再將移動端客戶拘泥于手機端用戶,而是將移動端擴展到移動智能設備市場,比如智能汽車、智能家居行業。英偉達
61、的移動戰略轉變為了將 Tegra 應用到需要視覺設計的設備中。(4)云端服務:云端服務:伴隨著計算機行業的發展也成為了可視化計算服務的重要一環。憑借云端技術,英偉達將 GPU 的應用從 PC 端拓展到服務器和數據中心,使得更多的用戶可以使用。英偉達開發的 GRID 使 Adobe Photoshop 遠程運行,并與應用程序交互。-25-圖表圖表41:2016-2025年自動駕駛規模(十億美元)年自動駕駛規模(十億美元)來源:Bain&Company,中泰證券研究所 英偉達英偉達 AMD 雙寡頭壟斷顯卡市場。雙寡頭壟斷顯卡市場。在 2009 年 Intel 取消 Larrabee 圖形顯卡項目之
62、后,獨立顯卡市場逐漸成為了雙寡頭市場。相較于行業的潛在新進入者,英偉達和 AMD 擁有更長的經營歷史、更大的客戶基礎、更全面的知識產權和專利保護,以及更多的融資、銷售、營銷和分銷資源,二者共同構筑了行業新進入者無法逾越的天塹。研發方面,2005年,AMD 的研發費用為 11 億美元,是英偉達的 3.2 倍左右,而到了 2022年,英偉達的研發費用達到了 73.4 億美元(對應 2023 財年),是 AMD的 1.47 倍。由于性能、構建、價格的不同,二者逐步產生差異化,形成了錯位競爭。至 2022 年第三季度,英偉達基本占據 88%市場份額,AMD則降低至 8%。圖表圖表 42:英偉達顯卡合作
63、伙伴多于:英偉達顯卡合作伙伴多于AMD 圖表圖表 43:AMD的研發費用被英偉達反超的研發費用被英偉達反超 來源:AMD,英偉達,中泰證券研究所 來源:AMD,英偉達,中泰證券研究所 -26-圖表圖表 44:英偉達在天梯圖覆蓋面廣,高端產品領先:英偉達在天梯圖覆蓋面廣,高端產品領先AMD 來源:各公司年報,中泰證券研究所 研發投入帶給英偉達高回報,在主流游戲和顯卡天梯測評上,研發投入帶給英偉達高回報,在主流游戲和顯卡天梯測評上,AMD 落落后于英偉達。后于英偉達。英偉達在 2018 年推出的 Titan RTX 和 RTX 2080 Ti 全面超過當時的 Radeon VII,其采取的策略是推
64、出比 AMD 稍高的性能和價格。即使技術比 AMD 領先,也會等到 AMD 推出更高性能的產品之后,才會推出,以此來獲得比 AMD 更高的收益。專利數量方面英偉達逐步反超專利數量方面英偉達逐步反超 AMD。AMD 此前在專利數量上一直多于英偉達,但申請的數量呈現下降趨勢。英偉達在 2011 年之后申請專利數量開始爆發,主要因其在 2007 年之后開始研發移動端 GPU 和深度學習領域,最終給 GPU 市場帶來了新的框架和更高性能的芯片。3.2 CUDA 自成體系:從單一產業到生態鏈自成體系:從單一產業到生態鏈,構建強護城河,構建強護城河 CUDA 助力英偉達成長為助力英偉達成長為 AI 產業龍
65、頭,構建強大生態產業龍頭,構建強大生態護城河壁壘。護城河壁壘。CUDA 是英偉達基于其生產的 GPUs 的一個并行計算平臺和編程模型,目的是便于更多的技術人員參與開發。開發人員可以通過 C/C+、Fortran 等高級語言來調用 CUDA 的 API,來進行并行編程,達到高性能計算目的。CUDA 平臺的出現使得利用 GPU 來訓練神經網絡等高算力模型的難度大大降低,將 GPU 的應用從 3D 游戲和圖像處理拓展到科學計算、大數據處理、機器學習等領域。這種生態系統的建立讓很多開發者依賴于 CUDA,進一步增加了英偉達的競爭優勢。-27-圖表圖表 45:CUDA加速計算解決方案加速計算解決方案 來
66、源:英偉達官網,中泰證券研究所 CUDA 的低成本和兼容性成為其最重要的吸引點之一。的低成本和兼容性成為其最重要的吸引點之一。英偉達的 CUDA是一個免費、強大的并行計算平臺和編程模型。安裝過程簡單且明確,讓開發者能夠輕松快速地啟動并行編程。CUDA 對新手極其友好,特別是對 C 語言、C+和 Fortran 的開發者。同時為支持其他編程語言,如Java、Python 等,CUDA 還提供第三方包裝器進行擴展。為廣大開發者提供了極大的便利和高效的編程體驗。操作系統方面,CUDA 在多種操作系統上也都有良好的兼容性,包括 Windows、Linux 和 macOS。圖表圖表46:CUDA 軟件層
67、軟件層 來源:The CUDA handbook,中泰證券研究所 -28-CUDA 有著豐富的社區資源和代碼庫,為編程提供良好的支持。有著豐富的社區資源和代碼庫,為編程提供良好的支持。英偉達的 CUDA 享有強大的社區資源,這個社區由專業的開發者和領域專家組成,他們通過分享經驗和解答疑難問題,為 CUDA 的學習和應用提供了豐富的支持。另外,CUDA 的代碼庫資源涵蓋各種計算應用,具有極高的參考價值,為開發者在并行計算領域的創新和實踐提供了寶貴的資源。這兩大特點共同推動了 CUDA 在并行計算領域的領先地位。圖表圖表47:CUDA 11.0 主要特點主要特點 來源:英偉達官網,中泰證券研究所
68、CUDA 借助燕尾服效應,搭配借助燕尾服效應,搭配 GeForce 覆蓋多元市場。覆蓋多元市場。CUDA 技術最初是為了配合 GeForce 系列芯片而推出的,利用 GeForce 在游戲市場的廣泛覆蓋率,作為一個技術杠桿,推動 CUDA 的普及和發展。作為一項可以幫助 GeForce 拓展新的市場的重要技術,CUDA 極大地提高了視頻和圖像應用(如 CyberLink、Motion DSP 和 Nero)的性能,實現了多倍的效率提升。創業公司的大量采用使得創業公司的大量采用使得 CUDA 應用場景進一步得到拓展,游戲不再是應用場景進一步得到拓展,游戲不再是唯一應用領域。唯一應用領域。隨著時間
69、的推移,超過一百家創業公司開始利用 CUDA的強大計算能力,使其應用領域得以擴展,不再局限于游戲方面。在視頻編碼領域,英偉達與 Elemental 公司合作,利用并行計算技術加速了高清視頻的壓縮、上傳和存儲速度。這一成功的合作不僅體現了 CUDA在各種場景下的適用性,也進一步推動了 CUDA 技術的發展。當Elemental 公司后被亞馬遜收購,其基于 CUDA 的視頻處理技術也成為AWS 的服務組成部分,這一過程也讓 CUDA 的使用場景得到了進一步的豐富和拓寬。CUDA 形成完整生態鏈,通過大學普及學習以推廣形成完整生態鏈,通過大學普及學習以推廣 CUDA。英偉達將CUDA 引入了大學的課
70、堂中,從源頭上擴大了 CUDA 的使用范圍和受眾群體。早在 2010 年,已經有關于 CUDA 數千篇論文,超過 350 所大學進行 CUDA 教學課程。在此基礎之上,英偉達建立了 CUDA 認證計劃、研究中心、教學中心,不斷完善 CUDA 的生態鏈。從結果看:2008 年僅有 100 所大學教學 CUDA 課程,在 2010 年英偉達全球建立了 20 個CUDA 研發中心后,2015 年已有 800 所大學開放 CUDA 課程。-29-圖表圖表48:大學教授:大學教授CUDA數量(所)數量(所)來源:英偉達,中泰證券研究所 對比對比 OpenCL,CUDA 是英偉達是英偉達 GPU 編程的更
71、優解。編程的更優解。OpenCL 雖然具有更廣的兼容性,但 CUDA 由于與英偉達的硬件緊密結合,能更有效地利用其 GPU 的性能。同時,CUDA 的編程模型相比 OpenCL 更加簡潔,易用,并提供完整的開發工具鏈。此外,CUDA 的社區資源豐富,代碼庫多樣,使得在科學計算、深度學習等領域的應用更為便捷。因此,對英偉達 GPU 的開發者來說,CUDA 往往是更優的選擇。圖表圖表49:CUDA成為英偉達生態基礎成為英偉達生態基礎 來源:英偉達,中泰證券研究所 對比對比 ADM 的的 CTM 編程模型編程模型,CUDA 擁有更廣泛的應用和更高的操作擁有更廣泛的應用和更高的操作性。性。從操作性來說
72、,由于 CTM 更接近硬件,因此開發者需要有更深入的硬件知識才能進行開發,但是這也意味著 CTM 能夠提供更精細的控制和優化。對比之下,CUDA 提供了一套完整的開發工具鏈,包括編譯器、調試器和性能分析工具,以及豐富的庫函數,為開發者提供了極大的便利。從應用來說,CUDA 已經在各種領域獲得了廣泛的應用,尤其是在科學計算和深度學習等領域,CUDA 擁有大量的優化庫和開發工具。而 CTM 的應用相對較少,但是由于它提供了對硬件的低級別控制,因此在一些特定的應用場景中會具有優勢。-30-圖表圖表50:GPU編程平臺發展歷史編程平臺發展歷史 來源:Semantic Scholar,中泰證券研究所 對
73、比微軟的對比微軟的 DirectCompute,CUDA 勝在配套設施的支持。勝在配套設施的支持。與DirectCompute 相比,CUDA 由于其豐富的功能庫,完善的開發工具和廣泛的應用支持,尤其在科學計算和深度學習領域,具有明顯優勢。CUDA 在英偉達 GPU 上的性能優化也更為出色。而 DirectCompute 作為跨平臺工具,其優勢在于與DirectX的兼容性以及對多種硬件的支持。但從英偉達 GPU 的應用廣泛度來看,使用 CUDA 才是開發者的首選??偟膩碚f,雖然 DirectCompute 的通用性更強,但英偉達的 CUDA 在功能、性能和應用范圍上提供了更強大的支持,對于使用
74、英偉達硬件的開發者來說是更優的選擇。CUDA 的開發提升了英偉達的品牌競爭力和影響力。的開發提升了英偉達的品牌競爭力和影響力。CUDA 的開發使英偉達的 GPU 超越了僅用于圖形處理的傳統角色,轉變為通用的并行計算設備,極大地提升了其在市場上的競爭力。英偉達因此能夠滿足廣泛的高性能計算和人工智能需求,使其產品得以進入新的市場領域。同時,隨著 CUDA 在各類高性能計算任務,特別是人工智能領域的廣泛應用,英偉達的品牌影響力得到了顯著增強。越來越多的人開始認知和使用英偉達的產品,這不僅加強了英偉達的市場地位,也為其未來的發展奠定了堅實的基礎。-31-圖表圖表51:英偉達人工智能生態系統:英偉達人工
75、智能生態系統 來源:英偉達,中泰證券研究所 CUDA 促進了英偉達的產品創新,激發更多可能性。促進了英偉達的產品創新,激發更多可能性。CUDA 的開發推動了英偉達在并行計算技術領域的創新,尤其在硬件架構方面。這不僅體現在優化了的 GPU 架構上,例如將流多處理器(SM)配臵為處理并行線程的方式,也在軟件架構上如 CUDA 自身的持續更新和優化。為了更有效地滿足用戶對于更高性能和更易用并行計算工具的需求,英偉達不斷創新,致力于提高 CUDA 的性能和用戶體驗。這一切不僅反映出英偉達對創新的重視,也為其在并行計算技術領域的領導地位提供了堅實的技術支撐。圖表圖表52:CUDA對應對應GPU架構發展架
76、構發展 Kepler Maxwell Pascal Volta Turing 推出時間 2013 2014 2016 2017 2018 制程 28nm 28nm TSMC 16nm/三星 14nm TSMC 12nm TSMC 12nm 芯片尺寸(平方毫米)118 148 471 815 754 晶體管(十億)1.3 1.87 11.8 21.1 18.6 CUDA 核心數量 1536 2048 3840 5120 4608 存儲容量 12GB 24GB 16GB 16GB 48GB 表現(浮點運算)5.04 6.8 10.6 15.7 16 來源:英偉達,中泰證券研究所 圖表圖表53:CU
77、DA通過并行架構的改進通過并行架構的改進 -32-來源:英偉達,中泰證券研究所 英偉達的英偉達的 CUDA 技術憑借其廣泛應用和強大合作伙伴網絡,技術憑借其廣泛應用和強大合作伙伴網絡,鞏固了英偉鞏固了英偉達的達的領導地位領導地位。CUDA 技術在眾多領域均有廣泛應用,包括但不限于深度學習、圖像和自然語言處理、天氣模擬、流體動力學、分子動力學、量子化學以及天體物理模擬。因此,適配 CUDA 的應用程序數量繁多,進而催生了對 CUDA 的廣闊需求空間。英偉達與諸如 Dell、HP、聯想等知名 OEM 廠商,以及 Netapp、Pure Storage 等渠道合作伙伴和如埃森哲等服務公司展開了深度合
78、作。CUDA 整合英偉達體系,培養了開發者和使用者的用戶粘性。整合英偉達體系,培養了開發者和使用者的用戶粘性。當開發者融入 CUDA 的生態系統,他們往往會被其卓越的計算性能、充裕的庫函數和出色的易用性所吸引,因此更傾向于持續利用此技術。另一方面,為 CUDA 優化的代碼移植至其他平臺通常需要消耗大量的精力和時間,這進一步增強了客戶的留存度。此外,英偉達不斷推陳出新,發布新的硬件產品及 CUDA 版本,從而維持用戶對其技術的關注并持續使用。這種深度使用使得用戶在選購硬件產品時傾向于選擇對 CUDA 有更好支持的英偉達產品,進而建立起穩固的客戶忠誠度。3.3 抓住人工智能發展浪潮,順利轉型切入算
79、力芯片領域抓住人工智能發展浪潮,順利轉型切入算力芯片領域 根據 IDC 的測算,全球數據總量將以每年 50%的增速不斷增長,在 2025年數據量會增加到 334ZB,在 2035年則將達到 19267ZB。隨著。隨著 5G落地,落地,應用方案更加具象化,未來隨之出現的數據總量和數據分析需求將會持應用方案更加具象化,未來隨之出現的數據總量和數據分析需求將會持續上升。續上升。增長的數據量主要來源于 IoT、移動互聯網、智慧城市、自動駕駛。大數據的應用將會從商業分析向工業、交通、政府管理、醫療、教育等等行業滲透,并且成為產業供應鏈中不可或缺的一部分。圖表圖表54:全球數據總量(:全球數據總量(ZB)
80、圖表圖表55:Intel測算的數據流測算的數據流 來源:IDC,中泰證券研究所 來源:Intel,中泰證券研究所 -33-圖表圖表56:全球:全球ADAS市場規模擴大市場規模擴大(億美元)(億美元)圖表圖表57:全球自動駕駛功能市場規模擴大:全球自動駕駛功能市場規模擴大(十億美元)(十億美元)來源:BIS Research,中泰證券研究所 來源:Bain&Company,中泰證券研究所 從目前的測算來看,智能駕駛將是算力要求最高的應用層面。從目前的測算來看,智能駕駛將是算力要求最高的應用層面。一方面汽車駕駛對于安全可靠性性要求最高,另一方面 L5 級別的汽車會攜帶的傳感器將達到 32 個,據麥
81、肯錫估算一輛自動駕駛汽車的數據量將達到4TB/h,Intel 測算出的一天數據量將達到 4000GB。而英偉達的 Xavier目前只有 1.3TFlops,還達不到處理 L5 的數據能力,自動駕駛和 ADAS市場在接下來的 10 年之間有望保持較高增長的態勢,因此智能駕駛以及 ADAS 存在著巨大的算力缺口。圖表圖表58:智能駕駛層級越高所需傳感器越多:智能駕駛層級越高所需傳感器越多 軟件應用軟件應用 L1 L2 L3 L4 L5 主動巡航控制 停車輔助 自動緊急制動 傳感器融合 隨時隨地無人駕駛輔助 車道偏離警告系統 車道保持輔助 駕駛員監控 高速無人駕駛輔助 交通堵塞輔助 硬件需求硬件需求
82、 超聲波傳感器 4 個 超聲波傳感器 4 個 超聲波傳感器 10 個 超聲波傳感器 10 個 長距雷達傳感器 1 個 長距雷達傳感器 1 個 長距雷達傳感器 2 個 長距雷達傳感器 2 個 環視攝像頭 1 個 短距雷達傳感器 4 個 短距雷達傳感器 6 個 短距雷達傳感器 6 個 環視攝像頭 1 個 環視攝像頭 5 個 環視攝像頭 5 個 長距離攝像頭 2 個 長距離攝像頭 4 個 立體攝像機 1 個 立體攝像機 2 個 Ubolo1 個 Ubolo1 個 激光雷達 1 個 激光雷達 1 個 航位推算 1 個 航位推算 1 個 來源:Deloitte,中泰證券研究所 人工智能產業將拉動人工智能
83、產業將拉動 GPU 行業發展。行業發展。根據 Tractica 的數據,2018 年全球 AI 硬件市場的收入為 196 億美元,其中 GPU 的收入占 36.2%為 71億美元。而在 2025 年將達到 2349 億美元,其中 GPU 的收入占 23.2%為 545 億美元。盡管 GPU 市場占比出現下滑,但是全球 AI 硬件市場在不斷上升,將會給 GPU 市場帶來更多的增長空間。-34-圖表圖表59:2018-2025年年AI硬件市場收入(十億美元)硬件市場收入(十億美元)來源:Tractica,中泰證券研究所 CPU 受到摩爾定律約束,應用性能增幅下降。受到摩爾定律約束,應用性能增幅下降
84、。人工智能的到來沒有因為摩爾定律的放緩而停止到來。登納德定律是通過縮小晶體管的尺寸和電壓讓設計師在保持功率密度時提高晶體管的密度和速度。但目前受到物理條件的限制,CPU 架構師需要大量增加電路和能量,獲得有限的ILP(指令級并行)。因此,在后摩爾定律時代,CPU 晶體管需要消耗更多的性能導致應用性能的小幅提高。最近幾年 CPU 的性能僅以每年 10%的速度增長,而過去是每年 50%。圖表圖表60:GPU打破摩爾定律打破摩爾定律 來源:英偉達,中泰證券研究所 GPU 憑借超高運算速度成為高性能計算憑借超高運算速度成為高性能計算的的寵兒寵兒,相比,相比 CPU 提高了數倍提高了數倍的計算效率的計算
85、效率。在人工智能領域,圖形處理器(GPU)憑借其卓越的并行計算能力和大規模處理單元,成為大數據運算的主力。這在深度學習模型的訓練和推斷等任務中表現得尤為明顯。盡管中央處理器(CPU)在順序化任務處理方面具有優勢,但其并行計算性能遠不如 GPU。自 2006年亞馬遜在卷積神經網絡(CNN)中首次使用 GPU,其效率就已顯著優于 CPU。如今,隨著技術不斷發展和更新,GPU 在運算效率上進一步超越 CPU,堅定地確立了其在 AI 時代的算力核心地位。-35-圖表圖表61:AI芯片產業鏈芯片產業鏈 來源:中泰證券研究所 盡管盡管 FPGA 具有編程靈活性,但具有編程靈活性,但 GPU 的處理效率卻更
86、勝一籌。的處理效率卻更勝一籌。FPGA是專用集成電路(ASIC)中的一種半定制電路,被稱為現場可編程門陣列,其性能介于定制電路和可編程器件之間??梢酝ㄟ^硬件描述語言(HDL)按照特定任務或者應用程序的需求來搭配相應的 HDL。相比較于 ASIC,FPGA 能夠使用 OpenCL 快速編程,更加具有成本效益。微軟預測基于 FPGA 的 BrainWave 推理平臺可以在達到每秒約傳輸 500 張圖像。但是對比這兩種硬件,GPU 從效率上更顯優勢,例如英偉達的Tesla P4 就能夠在 75w 的能耗上一秒傳輸 1676 張圖像。圖表圖表62:P4傳輸速度大于傳輸速度大于FPGA架構芯片架構芯片(
87、秒)(秒)來源:BIS Research,中泰證券研究所 -36-圖表圖表63:FPGA和和GPU對比對比 比較比較 優勢方優勢方 浮點計算 GPU 每秒的浮點運算總數要高于 FPGA GPU 延時性 FPGA 中實現的算法提供了確定性定時,延遲比 GPU 小一個數量級。FPGA 功耗 FPGA 的 GFPLOS/watt 比 GPU 高 3-4 倍 FPGA 接口 通過 PCI-E 接口,FPGA 可以通過幾乎任何接口連接到其他設備 FPGA 通用性 為舊的 GPU 設計的軟件在新的設備上還可以使用,而 FPGA 需要做出調整 GPU 大小 FPGA 較低的功耗對于散熱的需求低,因此尺寸較小
88、 GPU 開發 FPGA 開發昂貴并且困難 GPU 來源:Bain&Company,中泰證券研究所 英偉達以其創新力和高市場份額,在全球英偉達以其創新力和高市場份額,在全球 GPU 市場中居于領導地位。市場中居于領導地位。英偉達 GPU 領域享有顯著的市場份額,在 2022 年 Q3 英偉達市場占有率達到了歷史新高 88%。這一優勢體現了其在行業中的龍頭地位。其持續的技術創新和強大的研發實力,尤其是 CUDA 并行計算平臺的推出,進一步鞏固了其在市場中的優越地位。在人工智能和機器學習的加速應用下,英偉達的 GPU 已成為行業內的首選解決方案,廣泛應用于各個領域,從游戲和專業視覺應用到數據中心和
89、自動駕駛汽車?;仡櫽ミ_的發展歷程,回顧英偉達的發展歷程,其其成功的經驗在于以下幾點:成功的經驗在于以下幾點:(1)英偉達持續十幾年深耕 GPU 高性能計算潛力,產品矩陣豐富,抓住下游人工智能和 5G 浪潮,推動 GPU 市場從游戲顯卡轉變為 AI 計算加速處理器;(2)搭建 CUDA 生態,提高自身產品附加值,構建強大的軟件護城河壁壘。通過大學、研究院加快 CUDA 開發,吸引人工智能行業人員加入CUDA,將其打造成英偉達 GPU 核心競爭力;(3)加大研發投入,強大的研發能力使英偉達能夠實施創新技術,不斷更新 GPU 架構拓展業務范圍,擴大 GPU 市場,提高營收和利潤率,達成產業鏈的良性
90、循環。解析復盤英偉達,借鑒算力龍頭發展路徑。解析復盤英偉達,借鑒算力龍頭發展路徑。伴隨生成式 AI 火熱,大模型持續發展對算力提出更高要求,英偉達進入快速發展時期。我們認為復盤英偉達能夠學習海外龍頭的成長經驗,為國產廠商提供發展思路。此外,隨國內算力行業國產替代進程持續推進,看好國產供應鏈廠商發展機遇。4、算力是、算力是 AI 底層土壤,底層土壤,從英偉達看國產發展機遇從英偉達看國產發展機遇 4.1 ChatGPT 激起激起 AI 浪潮,大模型升級推動算力提升浪潮,大模型升級推動算力提升 AI 人工智能的發展主要依賴兩個領域的創新和演進:一是模仿人腦建立人工智能的發展主要依賴兩個領域的創新和演
91、進:一是模仿人腦建立起來的數學模型和算法,其次是半導體集成電路起來的數學模型和算法,其次是半導體集成電路 AI 芯片芯片。AI 的發展一直伴隨著半導體芯片的演進過程,20 世紀 90 年代,貝爾實驗室的楊立 -37-昆(Yann LeCun)等人一起開發了可以通過訓練來識別手寫郵政編碼的神 經 網絡,但在 那個 時 期,訓練 一 個深 度學習 卷 積神 經 網絡(Convolutional Neural Network,CNN)需要 3 天的時間,因此無法實際使用,而硬件計算能力的不足,也導致了當時 AI 科技泡沫的破滅。AI 芯片是芯片是 AI 發展的底層基石。發展的底層基石。英偉達早在 1
92、999 年就發明出 GPU,但直到2009年才由斯坦福大學發表論文介紹了如何利用現代GPU遠超過多核 CPU 的計算能力(超過 70 倍),把 AI 訓練時間從幾周縮短到了幾小時。算力、模型、數據一直是 AI 發展的三大要素,而 AI 芯片所代表的算力則是人工智能的底層基石。圖表圖表64:AI人工智能與半導體計算芯片發展歷程人工智能與半導體計算芯片發展歷程 來源:AI 芯片:前沿技術與創新未來,中泰證券研究所 ChatGPT 爆火的背后是人工智能爆火的背后是人工智能大模型大模型的迭代升級。的迭代升級。ChatGPT 是基于GPT-3.5 微調得到的新版本模型,能夠借助人類反饋的強化學習(RLH
93、F)技術來指導模型訓練,實現模型輸出與人類預期的需求,使對話內容更加人性化和富有邏輯性。從 2008 年第一代生成式預訓練模型 GPT-1 誕生以來,GPT 系列模型幾乎按照每年一代的速度進行迭代升級,未來隨著大語言模型(LLM)技術的不斷突破,AI 相關應用有望加速落地,AI產業或將迎來新一輪發展機遇。大模型發展將不斷降低大模型發展將不斷降低 AI 應用門檻,助力下游降本增效推動滲透率提應用門檻,助力下游降本增效推動滲透率提升。升。預訓練大模型在海量數據的學習訓練后具有良好的通用性和泛化性,用戶基于大模型通過零樣本、小樣本學習即可獲得領先的效果,能夠顯著降低 AI 應用的門檻,目前主流的大模
94、型包括 Transformer、GAN、CNN以及 RNN 等架構。-38-圖表圖表65:GPT模型迭代過程模型迭代過程 來源:OpenAI 官網,World of Engineering,中泰證券研究所 大語言模型(大語言模型(LLM)代表著)代表著 AI 領域的重大進步,并有望通過習得的知領域的重大進步,并有望通過習得的知識改變該領域。識改變該領域。根據英偉達,在過去幾年中,LLM 的規模每年增加 10倍,而且隨著這些模型的復雜程度和規模的增加,其性能也在不斷發展。大語言模型是一種基于深度學習的自然語言處理技術,其主要目的是通過學習大量文本數據從而自動生成符合語言規則的語句、段落甚至文章。
95、基于 Transformer 架構,大語言模型的核心思想是利用深度神經網絡來學習自然語言的語法、語義等特征,從而能夠預測下一個詞匯的出現概率,并根據這些概率生成新的語句。Transformer 架構在海量數據集上并行處理數據排序的計算能力是大語言模型背后的最大驅動力?;诨?Transformer 架構,架構,GPT 采用預訓練的方法來學采用預訓練的方法來學習語言的概率分習語言的概率分布模型,經過微調后可以解決各種自然語言處理任務、生成自然流暢的布模型,經過微調后可以解決各種自然語言處理任務、生成自然流暢的文本。文本。其工作原理如下:1)數據收集和監督訓練。模型用示例提示進行訓練,由人類向模
96、型演示所需的輸出。然后由人類對模型進行監督和微調,直到它能夠進行滿足所需性能水平的輸出。2)可比數據集手機和模型的獎勵訓練。對于相同的示例,向模型演示多個輸出并從最好到最差排序。已經通過監督訓練的模型將生成盡可能接近預期結果的輸出。用多組數據輸出來訓練模型以生成排名最高的輸出。3)使用強化學習來優化模型。當該模型產生一個排名最高的輸出時,它會得到獎勵以強化這種積極的結果。訓練過的模型生成輸出后,獎勵模型計算獎勵,如果新輸出排名較高則模型策略會自動更新。-39-圖表圖表 66:大語言模型(:大語言模型(LLM)舉例)舉例 類型類型 描述描述 備注備注 GPT-3/4(Generative Pre
97、trained Transformer 3/4)由 OpenAI 研發的 GPT-3/4,能夠進行自然語言生成、文本分類和問答等任務 GPT3 參數達 1750 億個,GPT4 參數達 3.5 萬億個。BERT(Bidirectional Encoder Representation from Transformers)由谷歌研發的雙向 Transformer 的 Encoder,因為Decoder 是不能獲要預測的信息的 擁有 1.1 億個參數 XLNet(eXtreme Language understanding NETwork)由 CMU 和 Google 共同開發的預訓練語言模型,能
98、夠進行自然語言處理任務,如文本分類、問答等 擁有 1.5 億個參數 RoBERTa(Robustly Optimized BERT Pretraining Approach)由 Facebook AI 研究院開發的預訓練語言模型,能夠進行自然語言處理任務如文本分類、問答等 擁有 1.25 億個參數 ERNIE Bot(文心一言)由百度開發的全新一代知識增強大語言模型 T5(Text-to-Text Transfer Transformer)由谷歌開發的預訓練語言模型,能夠進行多種自然語言處理任務,如文本生成、問答、摘要等 擁有 11 億個參數 來源:公開資料整理,中泰證券研究所 與傳統人工智能
99、不同,生成式與傳統人工智能不同,生成式 AI 具有創造性能力。具有創造性能力。傳統的人工智能模型建立在具有預測性的判別統計模型上,其側重于從現有數據中識別模式。而生成式模型則可以基于一組底層數據輸入來生成新的數據實例。生成式人工智能從底層數據集生成、創建新內容,以文本、圖像、音頻、視頻、代碼等形式生成原始想法,超越了傳統的模式檢測和扭曲數據分析。生成式 AI 能夠打破人與機器之間的通信障礙,使得人類用自然語言而不是編程語言與計算機進行通信。Transformer架構已經成為神經網絡學習中最重要的架構之一。架構已經成為神經網絡學習中最重要的架構之一。傳統上,自然語言處理領域中使用的大多數模型都基
100、于循環神經網絡(RNN),這些模型存在計算復雜度高、難以并行計算等眾多局限性。而Transformer 架構基于注意力機制,比傳統的 RNN 和 CNN 更快、更穩定,并且具有更高的準確率,更容易并行化。該技術大大減少了訓練模型的時間和對結構化數據集的依賴,提高了人工智能的自主學習能力。-40-圖表圖表67:Transformer架構示意圖架構示意圖 來源:壁仞科技研究院,中泰證券研究所 生成式生成式 AI 主要依賴于人工智能大模型,具有參數多、包含數據量大等主要依賴于人工智能大模型,具有參數多、包含數據量大等特點。特點。這些模型通常包含數十億至數萬億個參數,需要龐大的數據集進行訓練,根據AI
101、GC 發展報告 2023數據,國外主要 AIGC 預訓練模型參數規模在 6.4 億至 5400 億之間,平均參數量高達 1541 億。未來大模型的訓練數據不僅限于文字,還可以包括圖像、視頻等多種形式。與自然語言處理模型相比,多模態模型訓練數據為圖像、視頻等,規模遠大于語言類模型,因此需要更多的計算資源和算力來支持模型的訓練和推理。圖表圖表68:國外部分國外部分AIGC預訓練模型一覽預訓練模型一覽 來源:騰訊AIGC 發展報告 2023,中泰證券研究所 4.2 算力芯片快速增長,算力芯片快速增長,GPU 占據占據 AI 芯片主流地位芯片主流地位 算力需求激增,算力需求激增,AI應用發展仍需跨越當
102、前算力鴻溝。應用發展仍需跨越當前算力鴻溝。根據 OpenAI 數據,-41-2012-2018 年期間,人工智能訓練任務中使用的算力正呈指數級增長,速度為每3.5個月翻一倍,人們對于算力的需求增長了超過300,000倍。相比之下,摩爾定律是每 18 個月翻倍,如果是以摩爾定律的速度,這期間只會有 12 倍的增長。根據 IDC 數據,中國 AI 算力規模將保持高速增長,預計到 2026 年將達 1271.4EFLOPS,CAGRA(2022-2026 年)達 52.3%。算力需求的快速增長與芯片計算能力的增長形成剪刀差算力需求的快速增長與芯片計算能力的增長形成剪刀差,推動,推動 AI 芯片芯片市
103、場規模不斷發展市場規模不斷發展。當前模型計算量的增長遠超人工智能硬件算力的增長,二者性能增長之間的不匹配,剪刀差的擴大將帶來對算力基礎設施供給需求的不斷增長,以及算力硬件供給需求的快速增長。根據 Gartner數據,2025 年人工智能芯片市場規模將從 2020 年的 101 億美元增長至726 億美元,CAGR(2020-2025)為 48.4%。圖表圖表69:中國中國AI算力規模算力規模(百億億次浮點運算百億億次浮點運算/秒秒)圖表圖表70:全球全球AI芯片市場規模及預測芯片市場規模及預測 來源:2022-2023 中國人工智能計算力發展評估報告,中泰證券研究所 來源:IDC,Gartne
104、r,OpenAI,中泰證券研究所 AI 芯片是芯片是 AI 算力的核心,需求有望率先擴張。算力的核心,需求有望率先擴張。AI 芯片是用于加速人工芯片是用于加速人工智能訓練和推理任務的專用硬件,主要包括智能訓練和推理任務的專用硬件,主要包括 GPU、FPGA、ASIC 等,等,具有高度并行性和能夠實現低功耗高效計算的特點。具有高度并行性和能夠實現低功耗高效計算的特點。CPU 是 AI 計算的基礎,負責控制和協調所有的計算操作。在 AI 計算過程中,CPU 用于讀取和準備數據,并將數據來傳輸到 GPU 等協處理器進行計算,最后輸出計算結果,是整個計算過程的控制核心。根據 IDC 數據,CPU 在基
105、礎型、高性能型、推理型、訓練型服務器中成本占比分別為 32%、23.3%、25%、9.8%,是各類服務器處理計算任務的基礎硬件。GPU、FPGA、ASIC 是是 AI 計算的核心,作為加速芯片處理大規模并行計算的核心,作為加速芯片處理大規模并行計算。計算。具體來看,GPU 通用性較強,適合大規模并行計算,且設計及制造工藝較成熟,目前占據 AI 芯片市場的主要份額;FPGA 具有開發周期短、上市速度快、可配臵性等特點,目前被大量應用于線上數據處理中心和軍工單位;ASIC 根據特定需求進行設計,在性能、能效、成本均極大的超越了標準芯片,非常適合 AI 計算場景,是當前大部分 AI 初創公司開發的目
106、標產品。0%20%40%60%80%100%120%140%160%02004006008001000120014002019 2020 2021 2022 2023 2024 2025 2026 -42-圖表圖表 71:AI芯片特點及具體參數對比芯片特點及具體參數對比 來源:中泰證券研究所 相比于少核心串行結構的相比于少核心串行結構的 CPU,多核心的并行結構,多核心的并行結構 GPU 更適合處理圖更適合處理圖形圖像(矩陣結構)信息。形圖像(矩陣結構)信息。CPU 通常有 4 個、8 個或 16 個強力 ALU 核心(arithmetic logic unit,算術邏輯單元),適合做復雜的通
107、用串行任務。GPU 是圖形計算的重要元件,主要用來處理與圖形圖像相關的數據。與CPU 不同的是,GPU 有數百甚至數千個簡單 ALU 核心,單個 ALU 處理能力相比 CPU 的更弱,但能夠實現多個 ALU 并行計算,適合做簡單特定的并行任務。因此,對于復雜的單個計算任務來說,CPU 的執行效率更高,通用性更強;而對于圖形圖像這種矩陣式多像素點的簡單計算,更適合用 GPU 來處理,但通用性較弱。圖表圖表 72:CPU的基本結構的基本結構 圖表圖表 73:GPU的基本結構的基本結構 來源:Imagination,中泰證券研究所 來源:Imagination,中泰證券研究所 GPU 的并行計算能力
108、強于的并行計算能力強于 CPU。并行計算一般分為兩種類型:一是基于任務的并行處理,這種模式將計算任務拆分成若干個小的但不同的任務,不同任務相接組成一道流水線,由此完成整體的任務要求;二是基于數據的并行處理,這種模式將數據分解為多個部分,讓多個運算單元分別去計算小塊的數據,最后再將其匯總起來滿足任務要求。一般而言,-43-CPU 的多線程編程偏向于第一種并行模式,GPU 并行編程模式則偏向于第二種,其對于數據的計算能力更加強大。具有并行計算架構的具有并行計算架構的 GPU 是是 AI 算力的重要支撐,相較算力的重要支撐,相較 CPU 在在 AI 研究研究和開發中具有更高的效率。和開發中具有更高的
109、效率。21 世紀初期,研究人員意識到,由于機器學習算法通常具有與圖形處理算法相同類型的計算,因此 GPU 可以為機器學習提供基于 CPU 計算的更有效的替代方案。GPU 能夠提供卓越的并行性能,由此可以有效加速 AI 計算,滿足不斷發展的算力需求。GPU提供的計算效率不僅僅能夠簡化了分析過程,還能促進更廣泛的模型訓練以獲得更高的準確性,擴大了模型搜索過程的范圍以防止替代規范,使以前無法實現的某些模型變得可行,并允許對替代數據集增加額外的敏感性以確保其穩健性。圖表圖表 74:CPU與與GPU對比對比 CPU GPU 原因原因 設計目標 通用性高,需要處理不同數據類型 主要用于處理計算密集型的程序
110、和易于并行的程序并加快圖像處理速度 核數 個位數 眾核,個數可達三位數 控制器 復雜 簡單 CPU 面對分支程序時,通過預測分支結果來降低延時 ALU 較少 較多 CPU 需要在短時間內完成復雜計算,時鐘頻率高達達到 1.5323 千兆赫 Cache 較多,并分級 較少 CPU 利用大緩存來降低延遲 寄存器 較少 較多 GPU 依靠較多的寄存器來支持多線程 線程數 較少 較多 GPU 不依靠多級 Cache 來降低訪問內存的延遲,利用多線程來應對大吞吐量 功耗 一般 較高 來源:英偉達,公開資料整理,中泰證券研究所 GPU 在在 AI 研究和開發中的重要性不斷增加。研究和開發中的重要性不斷增加
111、。AI 芯片中,GPU 占據主要市場規模。根據 IDC 數據,2022 年國內人工智能芯片市場中,GPU芯片所占市場份額達 89.0%。GPU 作為市場上 Al 計算最成熟、應用最廣泛的通用型芯片,應用潛力較大,其并行計算架構相較于其他 AI 芯片更加適合于復雜數學計算場景,支持高度并行的工作負載。英偉達是全球領先的英偉達是全球領先的 GPU 和和 AI 芯片制造商之一。芯片制造商之一。在國內 GPU 市場,英偉達占據了主要份額。IDC 數據顯示,2020 年英偉達在國內 GPU 服務器市場幾乎占據 95%左右的市場份額。通過研究英偉達的發展路徑和戰略,能夠幫助國內企業更好地了解 GPU 的應
112、用和未來趨勢,為國內企業提供寶貴的借鑒和啟示。4.3 AI 芯片領域,國產芯片迅速崛起芯片領域,國產芯片迅速崛起 全球全球GPU芯片市場主要由海外廠商占據壟斷地位,國產廠商加速布局。芯片市場主要由海外廠商占據壟斷地位,國產廠商加速布局。全球 GPU 市場被英偉達、英特爾和 AMD 三強壟斷,英偉達憑借其自身CUDA 生態在 AI 及高性能計算占據絕對主導地位;國內市場中,景嘉微在圖形渲染 GPU 領域持續深耕,另外天數智芯、壁仞科技、登臨科技等一批主打 AI 及高性能計算的 GPGPU 初創企業正加速涌入。圖形渲染圖形渲染 GPU:目前國內廠商在圖形渲染:目前國內廠商在圖形渲染 GPU 方面與
113、國外龍頭廠商差方面與國外龍頭廠商差 -44-距不斷縮小。距不斷縮小。芯動科技的“風華 2 號”GPU 采用 5nm 工藝制程,與 Nvidia最新一代產品 RTX40 系列持平,實現國產圖形渲染 GPU 破局。景嘉微在工藝制程、核心頻率、浮點性能等方面雖落后于 Nvidia 同代產品,但差距正逐漸縮小。圖表圖表75:國內外國內外AI芯片產品對比(芯片產品對比(1)圖形渲染圖形渲染GPU 來源:各公司官網,中泰證券研究所 在在 GPGPU 方面,目前國內廠商與方面,目前國內廠商與 Nvidia 在在 GPGPU 上仍存在較大差上仍存在較大差距。距。制程方面,目前 Nvidia 已率先到達 4nm
114、,國內廠商多集中在 7nm;算力方面,國內廠商大多不支持雙精度(FP64)計算,在單精度(FP32)及定點計算(INT8)方面與國外中端產品持平,天數智芯、壁仞科技的AI 芯片產品在單精度性能上超過 NVIDIA A100;接口方面,壁仞科技與Nvidia 率先使用 PCle5.0,其余廠商多集中在 PCle4.0;生態方面,國內企業多采用 OpenCL 進行自主生態建設,與 Nvidia CUDA 的成熟生態相比,差距較為明顯。圖表圖表76:國內外:國內外AI芯片產品對比(芯片產品對比(2)GPGPU 來源:各公司官網,中泰證券研究所 FPGA 全球市場呈現“兩大兩小”格局,全球市場呈現“兩
115、大兩小”格局,Altera 與與 Xilinx 市占率共計超市占率共計超80%,Lattice 和和 Microsemi 市占率共計超市占率共計超 10%;整體來看,安路科技、紫光同創等廠商處于國際中端水平,仍需進一步突破。工藝制程方面,當前國產廠商先進制程集中在 28nm,落后于國際 16nm 水平;在等效LUT 數量上,國產廠商旗艦產品處于 200K 水平,僅為 XILINX 高端產 -45-品的 25%左右。ASIC 不同于不同于 CPU、GPU、FPGA,目前全球,目前全球 ASIC 市場并未形成明顯市場并未形成明顯的頭部廠商,國產廠商快速發展;的頭部廠商,國產廠商快速發展;通過產品對
116、比發現,目前國產廠商集中采用 7nm 工藝制程,與國外 ASIC 廠商相同;算力方面,海思的昇騰910 在 BF16 浮點算力和 INT8 定點算力方面超越 Googel 最新一代產品TPUv4,遂原科技和寒武紀的產品在整體性能上也與 Googel 比肩。未來國產廠商有望在 ASIC 領域繼續保持技術優勢,突破國外廠商在 AI 芯片的壟斷格局。圖表圖表77:國內外:國內外AI芯片產品對比(芯片產品對比(3)FPGA/ASIC 來源:各公司官網,中泰證券研究所 4.4 國產算力公司梳理國產算力公司梳理 龍芯中科:國產龍芯中科:國產 CPU 設計標桿,自主研發設計標桿,自主研發 GPGPU 公司主
117、要從事處理器(公司主要從事處理器(CPU)及配套芯片的研制、銷售及服務。)及配套芯片的研制、銷售及服務。主要產品包括龍芯 1 號、龍芯 2 號、龍芯 3 號三大系列處理器芯片及橋片等配套芯片,系列產品在電子政務、能源、交通、金融、電信、教育等行業領域已獲得廣泛運用。龍芯成功構建獨立信息技術體系的龍芯成功構建獨立信息技術體系的 CPU,不斷推出基于,不斷推出基于 LoongArch 架架構的芯片。構的芯片。龍芯基于自主指令系統,決心構建獨立于 Wintel 和 AA 體系的開放信息技術體系的 CPU。龍芯技術上的持續積累使其成功地建立了自己的指令系統架構 LoongArch。在 2021 年和
118、2022 年,公司相繼推出了多款基于 LA 架構的芯片產品,目前已經擁有 9 顆基于 LA 架構的芯片產品。-46-圖表圖表78:龍架構:龍架構LoongArch 來源:龍芯科技官網,中泰證券研究所 堅持自主研發指令系統、堅持自主研發指令系統、IP 核等核心技術。核等核心技術。龍芯中科掌握指令系統、處理器核微結構、GPU 以及各種接口 IP 等芯片核心技術,在關鍵技術上進行自主研發,擁有大量的自主知識產權,已取得專利 400 余項。GPU 產品進展順利,正研制新一代圖形及計算加速產品進展順利,正研制新一代圖形及計算加速 GPGPU 核。核。公司在 2022 年上半年完成了第一代龍芯圖形處理器架
119、構 LG100 系列,目前正在啟動第二代龍芯圖形處理器架構 LG200 系列圖形處理器核的研制。根據公司在2022年半年度業績交流會信息,第一代GPU核(LG100)已經集成在 7A2000 中,新一代 GPGPU 核(LG200)的研制也取得了積極進展。海光信息:國產高端處理器龍頭,海光信息:國產高端處理器龍頭,CPU+DCU 雙輪驅動雙輪驅動 公司主營產品包括海光通用處理器(公司主營產品包括海光通用處理器(CPU)和海光協處理器()和海光協處理器(DCU)。)。海光 CPU 主要面向復雜邏輯計算、多任務調度等通用處理器應用場景需求,兼容國際主流 x86 處理器架構和技術路線。從應用場景看,
120、海光 CPU 分為 7000、5000、3000 三個系列,分別定位于高端服務器、中低端服務器和邊緣計算服務器。海光 DCU 是公司基于 GPGPU 架構設計的一款協處理器,目前以 8000 系列為主,面向服務器集群或數據中心。海光 DCU 全面兼容 ROCm GPU 計算生態,能夠較好地適配國際主流商業計算軟件,解決了產品推廣過程中的軟件生態兼容性問題。CPU 與與 DPU 持續迭代,性能比肩國際主流廠商。持續迭代,性能比肩國際主流廠商。CPU 方面,目前海光一號和海光二號已經實現量產,海光三號已經正式發布,海光四號目前進入研發階段。海光 CPU 的性能在國內處于領先地位,但與國際廠商在高端
121、產品性能上有所差距,接近 Intel 中端產品水平;DCU 方面,深算一號已實現商業化應用,深算二號已于 2020 年 1 月啟動研發。在典型應用場景下,公司深算一號指標達到國際上同類型高端產品的水平。高研發力度成為海光產品快速迭代的基石高研發力度成為海光產品快速迭代的基石。從 2019 到 2021 年,海光信息的研發投入從 8.65 億元增至 15.85 億元,增長 83.3%。擁有千人級高端處理器研發團隊,且 90.2%的員工是研發人員。公司已取得多項處理 -47-器核心技術突破,并擁有 179 項專利、154 項軟件著作權和 81 項集成電路布圖設計專有權,構建了全面的知識產權布局。圖
122、表圖表79:海光海光CPU與與Intel產品性能對比產品性能對比 圖表圖表80:深算一號與國際同類型產品性能對比深算一號與國際同類型產品性能對比 來源:海光招股說明書,中泰證券研究所 來源:海光招股說明書,中泰證券研究所 寒武紀:國產寒武紀:國產 AI 芯片領先者芯片領先者 寒武紀是寒武紀是 AI 芯片領域的獨角獸。芯片領域的獨角獸。公司成立于 2016 年 3 月 15 日,專注于人工智能芯片產品的研發與技術創新,產品廣泛應用于消費電子、數據中心、云計算等諸多場景。公司是 AI 芯片領域的獨角獸:采用公司終端智能處理器 IP 的終端設備已出貨過億臺;云端智能芯片及加速卡也已應用到國內主流服務
123、器廠商的產品中,并已實現量產出貨;邊緣智能芯片及加速卡的發布標志著公司已形成全面覆蓋云端、邊緣端和終端場景的系列化智能芯片產品布局。人工智能的各類應用場景,從云端溢出到邊緣端,或下沉到終端,都離人工智能的各類應用場景,從云端溢出到邊緣端,或下沉到終端,都離不開智能芯片的高效支撐。不開智能芯片的高效支撐。公司面向云端、邊緣端、終端推出了三個系列不同品類的通用型智能芯片與處理器產品,分別為終端智能處理器 IP、云端智能芯片及加速卡、邊緣智能芯片及加速卡。寒武紀產品線豐富,應用場景廣泛寒武紀產品線豐富,應用場景廣泛。公司擁有一套全面的產品線,包括已經發布的面向云端和邊緣端的智能芯片、加速卡、訓練機、
124、處理器 IP以及軟件,能夠滿足在云、邊、端各個尺度的人工智能計算需求。在 2022年的 3 月份,公司推出了新的訓練加速卡 MLU370-X8。這款加速卡配備了雙芯片四核思元 370,并整合了寒武紀 MLU-Link 多核互聯技術,主要針對訓練任務。在廣泛應用于各個領域的 YOLOv3、Transformer等訓練任務中,8 卡計算系統的并行性能平均超過了 350WRTXGPU 的155%。-48-圖表圖表81:高性能通用圖形處理器芯片及系統研發項目情況及進程安排:高性能通用圖形處理器芯片及系統研發項目情況及進程安排 來源:龍芯中科股說明書,中泰證券研究所 復旦微電復旦微電:國內國內 FPGA
125、 領軍企業,多元化產品領軍企業,多元化產品打開增長空間打開增長空間 24 年潛心鉆研,高端芯片國產化年潛心鉆研,高端芯片國產化的開創性的開創性先鋒。先鋒。公司成立兩年后就成為國內首家上市的 IC 設計公司,二十余年發展過程中又陸續成為首家獲得IC 制造商的國際注冊代碼,推出國內首個非接觸卡等產品,打破國外廠商壟斷并在諸多領域取得突破。目前,復旦微的 RFID 芯片、智能卡芯片、EEPROM、智能電表 MCU 等多類產品市占率都位列前茅。此外,復旦微推出的億門級 FPGA 產品已實現供貨,填補了國產高端 FPGA 的空白,具有取代進口 FPGA 產品的巨大潛力。圖表圖表82:公司發展歷程時間表:
126、公司發展歷程時間表 來源:公司官網,公司招股書,中泰證券研究所整理 復旦微電復旦微電專注于專注于 FPGA 高端產品的開發,有望引領高端高端產品的開發,有望引領高端 FPGA 國產替國產替代。代。FPGA 在 5G 通信、人工智能以及特種集成電路等多個領域擁有巨大發展潛力。作為國內最早推出億門級 FPGA 產品的企業,復旦微電子在國內 FPGA 芯片設計行業占據了領先地位。至 2022 年半年報,公司已向超過 500 家客戶銷售相關 FPGA 產品,同時,10 億門級產品的研 -49-發正在進行中,預計在未來將引領高端 FPGA 的國產替代進程。復旦微電復旦微電產品應用廣泛,獲得業內認可產品應
127、用廣泛,獲得業內認可。作為國內頂尖的集成電路設計企業,公司以二十多年的深厚積淀構建了多元化的產品線。其 RFID 芯片、智能卡芯片、EEPROM 以及智能電表 MCU 等多種產品在市場上享有領先地位,獲得了三星、LG、VIVO 等海內外知名廠商的高度認可。FPGA 芯片國內技術領軍者芯片國內技術領軍者,國產替代種子選手國產替代種子選手。復旦微在國內 FPGA領域處于領先地位,目前可提供千萬門級、億門級 FPGA 芯片以及嵌入式可編程芯片等系列產品。研發方面,當前一方面基于 14/16nm 工藝制程開發 10 億門級產品,另一方面豐富 28nm 制程的 FPGA 及 PSoC 芯片種類,繼續保持
128、在國產 FPGA 技術的領先地位。圖表圖表83:FPGA芯片產品線芯片產品線 產品線產品線 產品介紹產品介紹 應用應用 產品或終端圖產品或終端圖 千萬門級 FPGA 采用 65nm CMOS 工藝,是一系列高性能、高性價比 SRAM 型 FPGA 產品 適用于網絡通信、信息安全、工業控制、高可靠等高性能、大規模應用 億門級 FPGA 芯片 采用 28nm CMOS 工藝,是一系列高性能、大規模的 SRAM 型 FPGA 產品 適用于 5G 通信、人工智能、數據中心、高可靠等高性能、大帶寬、超大規模應用 嵌入式可編程器件 PSoC 采用 28nm CMOS 工藝,是一系列嵌入式可編程片上系統產品
129、 適用于視頻、工控、安全、AI、高可靠等應用 來源:公司招股書、中泰證券研究所整理 安路科技安路科技:民用民用 FPGA 領先廠商,國產替代正當時領先廠商,國產替代正當時 安路科技是國內領先的安路科技是國內領先的 FPGA FPGA 芯片設計企業。芯片設計企業。安路科技成立于 2011 年,自成立至今,公司一直專注于 FPGA 芯片設計領域,通過多年的技術累積,公司在 FPGA 芯片設計技術、SoC 系統集成技術、FPGA 專用 EDA 軟件技術、FPGA芯片測試技術和FPGA應用解決方案等領域均有技術突破。公司主要專注于 FPGA 芯片和專用 EDA 軟件的研發、設計和銷售。產品的主要下游應
130、用領域主要包括工業控制、網絡通信、消費電子和數據中心等。-50-圖圖 84:公司發展歷程:公司發展歷程 來源:公司公告,中泰證券研究所整理 公司主要向客戶提供公司主要向客戶提供 FPGA FPGA 產品,包括產品,包括 FPGAFPGA 芯片和專用芯片和專用 EDAEDA 軟件兩部軟件兩部分。分?;谀壳暗暮诵募夹g體系,公司成功構建了由 ELF 系列、EAGLE 系列和 PHOENIX 系列 FPGA 芯片和 TangDynasty 系列專用 EDA 軟件組成的產品矩陣,2021 年,公司 FPSoC 產品新增了面向工業和視頻接口的低功耗 SWIFT 系列。公司產品覆蓋 28nm-55nm 的
131、工藝制程,形成了多種邏輯規模 FPGA 芯片和軟件的全產品線覆蓋,并持續致力于高容量、高性能的FPGA 和 FPSoC 芯片的研發與拓展。公司目前已成為國內領先的 FPGA 芯片供應商,產品已廣泛應用于工業控制、網絡通信、數據中心、消費電子等產業中。圖圖85:公司:公司FPGA芯片產品線芯片產品線 系列名稱系列名稱 細分系列細分系列 量產量產時間時間 制程制程 邏輯容量邏輯容量 產品介紹產品介紹 應用領應用領域域 產品圖片產品圖片 ELF 系列 ELF1 系列 2015年 130nm 336688 ELF1 系列 FPGA 定位低成本、低功耗可編程市場??焖偕想妴?、支持單電源供電、無需要外部
132、配置器件等特性使得 ELF1 器件非常適用于功能擴展、電源管理等應用場景。消費電子、工業控制 ELF2 系列 2018年 55nm 1.5K4.5K ELF2 系列 FPGA 是 ELF 的第二代產 品,定位低功耗可編程市場。無需外部配置器件、低密度邏輯容量、豐富的存儲器、高達 1Gbps 的 IO 速率等 特性,使得 ELF2器件非常適用于高速接口擴展與轉換、高速總線擴展、高速存儲器控制等應用場景。消費電子、網絡通信 ELF2 系列中包括一款嵌入 CPU 核的 FPSoC 芯片,已在多家客戶獲得應 用。ELF3 系列 2019年 55nm 1.5K9.2K ELF3 系列 FPGA 是 EL
133、F 的第三代產品,定位工業控制、網絡通信、數據中心等功能擴展應用市場,最多支持 336 個 IO,滿足客戶板級功能擴展多樣性應用需求。ELF3 器件經過功耗與性能優化,使系統設計師在降低成 本和功耗的同時又可滿足不斷增長 的帶寬要求。工業控制、網絡通信、數據中心 -51-EAGLE 系列 AL3 系列 2014年 65nm 5.8K11.1K AL3 系列 FPGA 定位高性價比的邏輯 控制市場。AL3 器件系列建立在一個 優化的工藝基礎之上,并通過較低的成本實現較高的功能性,具有合適的 邏輯規模,豐富的存儲資源。工業控制 EAGLE4系列 2016年 55nm 20K EAGLE4 系列是
134、AL3 的升級產品,定位在高性價比邏輯控制和圖像處理市場,數量適中的邏輯和乘法器,豐富多樣的片內存儲器,高達 1Gbps 的 IO 速率,使得 EAGLE4 器件非常適 合于圖像預處理,伺服控制和高速圖像接口轉換等領域。工業控制、網絡通信、數據中心 FPSoC EF2M45 EF2M45 是嵌入 ARM 處理器核的 FPSoC 芯片,單顆芯片實現靈活的硬件可編程系統控制功能,已在多家客戶獲得應用。工業控制、消費電子 SWIFT1 系列 SWIFT1 系列是全新低功耗 FPSoC 產品,芯片集成了邏輯單元、存儲單元、視頻處理單元、RISC-V 處理器核等資源,定位高帶寬的視頻數據處理和橋接可編程
135、系統芯片市場,在保持低功耗的前提下,提供高達 17.6Gbps 帶寬的 MIPI 數據收發能力。消費電子、工業控制 PHOENIX系列 PHOENIX系列 2020年 28nm 127K PHOENIX1 系列 FPGA 采用 28nm 工藝,產品架構支持 100K600K 等效邏輯單元、高速運算單元、豐富的存儲資源和高達 16Gbps 的 SerDes 接口資源,定位高性能可編程邏輯市場。針對高帶寬應用場景,PHOENIX1 能夠提供良好的信號處理和數據的傳輸功能。PHOENIX1 能夠滿足工業控制、網絡通信、數據中心等市場需求。工業控制、網絡通信、數據中心 TangDynasty Tang
136、Dynasty 2014年-TangDynasty 軟件為公司所有 FPGA 芯片產品系列提供簡潔高效的應用 設計開發環境。該軟件會根據 ELF 系 列、EAGLE 系列、PHOENIX 芯片系列需要進行算法升級和迭代。專用 EDA 軟件 來源:招股說明書,中泰證券研究所整理 布局卡位打造軟硬件生態體系行業壁壘較高,公司未來成長邏輯清晰。布局卡位打造軟硬件生態體系行業壁壘較高,公司未來成長邏輯清晰。公司立足于中低端 CPLD 產品起步,產品從幾十、幾百 K 的高性價比產品到目前 400K 的中高端產品全覆蓋,客戶積累深厚。公司采用軟硬件協同模式,軟件配套構建良好生態,其自主開發的 FPGA 專用 EDA 軟件擁有較高技術水平,是國內目前擁有最多客戶的國產 EDA 廠商,可以立足于廣大的客戶群體,不斷反饋完善自身軟件和配套的生態體系,打造自身軟硬件護城河。正是因為 FPGA 芯片行業需要廠商同時具備較高的硬件芯片設計能力以及軟件開發能力,行業進入壁壘較高。公司作為目前國產 FPGA 芯片行業的領先廠商,立足 FPGA 行業快速增長,擁有廣闊國產替代空間,提前布局卡位未來競爭優勢明顯,稀缺性成長性兼備,伴隨中高端產品放量,未來成長邏輯清晰。