《英偉達-美股公司研究報告-百川終將歸海AI奇點到來-240219(35頁).pdf》由會員分享,可在線閱讀,更多相關《英偉達-美股公司研究報告-百川終將歸海AI奇點到來-240219(35頁).pdf(35頁珍藏版)》請在三個皮匠報告上搜索。
1、請仔細閱讀本報告末頁聲明請仔細閱讀本報告末頁聲明 證券研究報告|首次覆蓋報告 2024 年 02 月 19 日 英偉達英偉達(NVDA.O)百川百川終將歸海終將歸海,AI 奇點到來奇點到來 全球全球人工智能算力中樞人工智能算力中樞,AI 需求推動強勁增長需求推動強勁增長。硬件端,英偉達目前形成了“GPU+CPU+DPU”的產品組合,成為縱橫數據中心、游戲顯卡、專業可視化、自動駕駛等多個賽道的算力之王。在數據中心賽道,2023 年的 AI 芯片市場中英偉達出貨量約占 60-70%。在游戲顯卡賽道,英偉達占據了消費級獨立顯卡的 80%以上出貨量。軟件端,我們認為 DGX Cloud長期有望成為英偉
2、達數據中心業務的第二增長曲線。AI 算力需求暴增帶來英偉達收入利潤表現強勁。FY2024Q3 英偉達收入為181.20 美元、yoy+206%,其中數據中心、游戲、專業可視化、自動駕駛分別為 145/29/4/3 億美元,yoy+279%/+81%/+108%/4%。2024Q3 財季公司 non-GAAP 凈利約 100 億美金、non-GAAP 凈利潤率達 55%。需求:需求:AI 算力需求算力需求可以延續多久?可以延續多久?英偉達數據中心業績的可持續性,來自于 AI 算力需求的可持續性。1)訓練端,更多國家、企業將入場 AI 軍備戰爭,模型的參數數據量也更大。2)推理端,端側 AI 的逐
3、步落地、AI應用向更多科技和制造領域破圈,均帶來更強的推理算力需求。我們粗略測算:1)訓練端:基于假設,至 2030 年全球累計需要相當于2000 萬張 H100 的等量算力需求。2)推理:基于假設,至 2030 年全球累計需要相當于超 1.16 億張 A30 的等量算力需求。供給:龍頭面對攪局者供給:龍頭面對攪局者。AI 芯片供給的競爭方還有:1)AMD 和 Intel 等數據中心 GPU 新手。2)谷歌 TPU、微軟 Athena 等云廠商自研芯片。英偉達對于來自競爭對手的挑戰,亦做了充分的準備:1)軟硬件產品上,公司在硬件產品上持續迭代新品,在軟件架構上持續延續優勢。英偉達望在 2024
4、 年發布 Hopper 架構 H200、還有望提前發布其下一代 GPU Blackwell B100。CUDA 架構開發者和下載量亦在持續提升。2)上下游生態上,英偉達一方面通過投資參股等方式綁定下游企業的算力需求,一方面通過上百億美金采購承諾額鎖定上游產能?;?CoWoS 的產能增長、對英偉達不同產品線的產能分配等假設,按英偉達財年維度,我們測算:2025/2026 財年,H100 的出貨量望達 209 萬張/155 萬張、H200 望達 35 萬張/62 萬張、B100 望達 23 萬張/143 萬張。投資建議:投資建議:首次覆蓋給予“買入”首次覆蓋給予“買入”評級評級。我們預計 202
5、4-2026 財年公司收入將達 594/986/1282 億美元,同比增長 120%/66%/30%。Non-GAAP 凈利潤 313/524/610 億美元,同比增長 274%/68%/16%??紤]到英偉達凈利潤高速增長,我們認為英偉達合理市值為 20964 億美元、對應股價為840.6 美金,對應 40 x FY2025e P/E(FY 2025 財年為 2024 年 1 月至 2025年 1 月),首次覆蓋給予“買入”評級。風險提示風險提示:下游 AI 應用不及預期、數據中心算力芯片競爭超預期、AI 行業政策監管超預期、假設和測算誤差風險。財務財務指標指標 FY2022A FY2023A
6、 FY2024E FY2025E FY2026E 營業收入(百萬美元)26,914 26,974 59,368 98,607 128,150 增長率 yoy(%)61 0 120 66 30 Non-GAAP 凈利(百萬美元)11,259 8,366 31,281 52,411 60,991 增長率 yoy(%)79.4-25.7273.9 67.5 16.4 EPS 最新攤?。涝?股)4.44 3.34 12.54 21.01 24.46 凈資產收益率(%)36.6 19.8 56.2 48.9 36.3 P/E(倍)162.4 216.1 57.5 34.3 29.5 P/S(倍)66.
7、8 66.7 30.3 18.2 14.0 資料來源:公司公告,國盛證券研究所 注:股價為 2 月 13 日收盤價 買入買入(首次首次)股票信息股票信息 行業 海外 2 月 13 日 收盤價(美元)721.28 總市值(百萬美元)1,780,119 總股本(百萬股)2,468 其中自由流通股(%)100%股價走勢股價走勢 作者作者分析師分析師 夏君夏君 執業證書編號:S0680519100004 郵箱: 分析師分析師 朱若菲朱若菲 執業證書編號:S0680522030003 郵箱: 相關研究相關研究-100%0%100%200%300%400%500%2023-012023-032023-05
8、2023-072023-092023-112024-01納斯達克指數英偉達 2024 年 02 月 19 日 P.2 請仔細閱讀本報告末頁聲明請仔細閱讀本報告末頁聲明 財務報表和主要財務比率財務報表和主要財務比率 資產負債表(資產負債表(百萬美元)利潤表利潤表(百萬美元)會計會計年度年度 FY2022A FY2023A FY2024E FY2025E FY2026E 會計年度會計年度 FY2022A FY2023A FY2024E FY2025E FY2026E 流動資產流動資產 28829 23073 53572 107223 170214 營業收入營業收入 26914 26974 5936
9、8 98607 128150 現金及現金等價物 1990 3389 26709 68732 119921 營業成本 9439 11618 16662 28495 43358 有價證券 19218 9907 9907 9907 9907 研發費用 5268 7339 8880 14223 19223 應收賬款 4650 3827 8423 13990 18182 銷售及行政費用 2166 2440 2725 3749 4873 存貨 2605 5159 7399 12653 19253 收購終止成本 0 1353 0 0 0 其他流動資產 366 791 1134 1940 2952 營業利潤營
10、業利潤 10041 4224 31101 52139 60697 非流動資產非流動資產 15358 18109 18283 18391 18458 其他損益-100 -43 389 136 136 固定資產 2778 3807 3981 4089 4156 利潤總額利潤總額 9941 4181 31490 52275 60833 商譽 4349 4372 4372 4372 4372 所得稅費用 189 -187 3123 3928 4571 無形資產 2339 1676 1676 1676 1676 凈利潤凈利潤 9752 4368 28367 48347 56262 其他非流動資產 589
11、2 8254 8254 8254 8254 EPS(美元/股)4 2 11 19 23 資產總計資產總計 44187 41182 71855 125613 188672 Non-GAAP 凈利潤 11259 8366 31281 52411 60991 流動負債流動負債 4335 6563 8870 14281 21078 Non-GAAP EPS(美元/股)4 3 13 21 24 短期債務 0 1250 1250 1250 1250 應付賬款 1783 1193 1711 2926 4452 其他流動負債 2552 4120 5909 10105 15376 非流動負債非流動負債 1324
12、0 12518 12518 12518 12518 長期債務 10946 9703 9703 9703 9703 其他非流動負債 2294 2815 2815 2815 2815 負債合計負債合計 17575 19081 21388 26799 33596 少數股東權益 0 0 0 0 0 普通股 3 2 2 2 2 資本公積 10385 11971 11971 11971 11971 留存收益 16235 10171 38538 86885 143146 主要主要財務比率財務比率 其他綜合損益-11 -43 -43 -43 -43 會計會計年度年度 FY2022A FY2023A FY202
13、4E FY2025E FY2026E 歸屬母公司股東權益 26612 22101 50468 98815 155076 成長能力成長能力 負債和股東權益負債和股東權益 44187 41182 71855 125613 188672 營業收入(%)61.4 0.2 120.1 66.1 30.0 營業利潤(%)37.3 15.7 52.4 52.9 47.4 歸屬母公司凈利潤(%)125.1 -55.2 549.4 70.4 16.4 獲利獲利能力能力 毛利率(%)64.9 56.9 71.9 71.1 66.2 現金現金流量流量表表(百萬美元)凈利率(%)36.2 16.2 47.8 49.0
14、 43.9 會計年度會計年度 FY2022A FY2023A FY2024E FY2025E FY2026E ROE(%)36.6 19.8 56.2 48.9 36.3 經營活動現金流經營活動現金流 9108 5641 25320 44023 53188 ROIC(%)37.0 18.9 54.2 48.2 35.9 凈利潤 9752 4368 28367 48347 56262 償債償債能力能力 折舊攤銷 1174 1544 1826 1892 1933 資產負債率(%)39.8 46.3 29.8 21.3 17.8 營運資金變動-3363 -2207 -4873 -6216 -5006
15、 凈負債比率(%)7.5 9.7 50.4 68.3 76.5 其他經營現金流 1545 1936 0 0 0 流動比率 6.7 3.5 6.0 7.5 8.1 投資活動現金流投資活動現金流-9830 7375 -2000 -2000 -2000 速動比率 5.6 2.9 5.1 6.5 7.2 資本支出-976 -1833 -2000 -2000 -2000 營運能力營運能力 其他投資現金流-8854 9208 0 0 0 總資產周轉率 0.7 0.6 1.1 1.0 0.8 籌資活動現金流籌資活動現金流 1865 -11617 0 0 0 應收賬款周轉率 7.6 6.4 9.7 8.8 8
16、.0 借款所得 0 0 0 0 0 應付賬款周轉率 18.0 18.1 40.9 42.5 34.7 股份回購-10039 0 0 0 每股指標(元)每股指標(元)分紅-399 -398 0 0 0 Non-GAAP EPS(最新攤?。?.44 3.34 12.54 21.01 24.46 其他籌資現金流 2264 -1180 0 0 0 每股經營現金流(最新攤?。?.65 2.26 10.15 17.65 21.33 現金凈增加額現金凈增加額 1143 1399 23320 42023 51188 每股凈資產(最新攤?。?0.67 8.86 20.24 39.62 62.18 估值估值比率比
17、率 P/E 162.4 216.1 57.5 34.3 29.5 P/B 67.6 81.4 35.6 18.2 11.6 P/S 66.8 66.7 30.3 18.2 14.0 資料來源:公司公告,國盛證券研究所 注:股價為 2 月 13 日 收盤價 VY2VZZBZSVEYUW8O8QaQtRnNmOsOkPrRnPlOsQmM6MnNzQxNtQqRMYpOsO 2024 年 02 月 19 日 P.3 請仔細閱讀本報告末頁聲明請仔細閱讀本報告末頁聲明 內容目錄內容目錄 1.全球領先的算力平臺.5 1.1 全球算力之源.5 1.1.1 業務一覽:全球算力之王.5 1.1.2 財務構成:
18、AI 需求推動數據中心業務強勁增長.7 1.2 硬件:“GPU+CPU+DPU”,縱橫多個行業賽道.8 1.3 軟件及平臺:云服務望成長為第二曲線.13 2.需求:AI 算力需求可以延續多久.14 2.1 AI 需求:對下一個時代的押注,誰也不能松懈.14 2.1.1 訓練端:誰在邊際增加 AI 算力投入?.14 2.1.2 推理端:哪些 AI 場景和應用在增加?.16 2.2 定量測算:模型訓練與推理,全球需要多少卡.19 3.供給:龍頭面對攪局者.22 3.1 AI 芯片江湖:扶持 AMD、發力自研芯片.22 3.2 英偉達的破局.24 3.2.1 軟硬件產品:加速迭代下一代硬件產品、CU
19、DA 持續保持優勢.24 3.2.2 上下游生態:綁定下游、鎖定上游.26 4.盈利預測、估值及投資建議.30 4.1 財務預測.30 4.2 估值及投資建議.33 風險提示.34 圖表目錄圖表目錄 圖表 1:NVIDIA 核心業務賽道構成.5 圖表 2:英偉達市場地位2023AI 芯片出貨量:英偉達占 60-70%.6 圖表 3:英偉達市場地位PC 獨立 GPU 出貨量:英偉達超過 80%.6 圖表 4:英偉達核心股東情況.6 圖表 5:NVIDIA 收入構成:年度.7 圖表 6:NVIDIA 收入構成:季度.7 圖表 7:NVIDIA 利潤情況:年度.8 圖表 8:NVIDIA 利潤情況:
20、季度.8 圖表 9:NVIDIA 數據中心業務:自下而上,從硬件產品到軟件平臺.9 圖表 10:NVIDIA 數據中心產品:GPU.9 圖表 11:英偉達數據中心產品:CPU.10 圖表 12:英偉達數據中心產品:DPU.10 圖表 13:產品梳理:英偉達消費級 GPU 主要產品.11 圖表 14:競品對比:AMD 消費級 GPU 主要產品.11 圖表 15:英偉達專業可視化主要產品.12 圖表 16:英偉達當前自動駕駛芯片.12 圖表 17:AI 訓練需求增加:更多國家開始加入 AI 軍備競賽.15 圖表 18:AI 訓練需求增加:更多企業開始加入 AI 軍備競賽.15 圖表 19:AI 訓
21、練需求增加:AI 模型加速迭代,參數量大幅提升.16 圖表 20:AI 推理需求增加:云到端.17 圖表 21:自動駕駛場景仿真:GAIA-1 模型框架.18 2024 年 02 月 19 日 P.4 請仔細閱讀本報告末頁聲明請仔細閱讀本報告末頁聲明 圖表 22:AI 推理需求增加:AI 應用向更多基礎研究領域擴展.19 圖表 23:訓練所需 GPU 需求按 H100 測算.20 圖表 24:推理所需 GPU 需求按 A30 測算.21 圖表 25:訓練性能對比:AMD MI300X vs 英偉達 H100.22 圖表 26:推理性能對比:AMD MI300X vs 英偉達 H100.22 圖
22、表 27:供給端競爭:AMD MI300X vs 英偉達相關 GPU 參數比較.23 圖表 28:國際巨頭 AI 芯片布局.23 圖表 29:云服務廠商發力自研芯片:以 Gooogle TPU 為例.24 圖表 30:硬件產品:NVIDIA 數據中心產品 pipeline.25 圖表 31:軟件生態對比:英偉達 vs.AMD.25 圖表 32:NVIDIA 軟件 CUDA 架構優勢.26 圖表 33:英偉達投資 AI 企業.27 圖表 34:絕對值:NVIDIA 收入 vs.采購承諾額(后續 12 個月).28 圖表 35:增速:NVIDIA 收入 vs.采購承諾額(后續 12 個月).28
23、圖表 36:CoWoS 產能及分配假設(萬片 12 英寸晶圓).28 圖表 37:英偉達 H100、H200、B100 供給量測算.29 圖表 38:英偉達財務預測:年度.31 圖表 39:英偉達財務預測:季度.32 圖表 40:美股重點科技公司估值.33 圖表 41:英偉達 P/E band.34 2024 年 02 月 19 日 P.5 請仔細閱讀本報告末頁聲明請仔細閱讀本報告末頁聲明 1.全球領先的算力平臺全球領先的算力平臺 1.1 全球算力之源全球算力之源 英偉達(NVIDIA)由黃仁勛、Chris Malachowsky 和 Curtis Priem 創立于 1993 年。1999
24、年,英偉達推出 Geforce 256,被稱為 GPU(Graphics Processing Unit)的定義者。起初的若干年,英偉達核心產品是游戲顯卡這一階段的戰役在經歷了與關鍵對手ATI 的纏斗、與重要客戶微軟和索尼的訴訟和合作、與兩大 CPU 巨頭 Intel 和 AMD 的合縱連橫之后,終于以在 2006 年以 AMD 收購 ATI、2009 年 Intel 暫時取消自研 GPU 計劃為標志而暫落下帷幕。此后的時間里,一方面,英偉達將芯片產品擴展至更多行業賽道如 2008 年蘋果的Macbook 搭載英偉達 GeForce 9400MG、2012 年特斯拉的 Model S 搭載英偉
25、達自動駕駛芯片、2019-2021 年加密貨幣浪潮中的 GTX1060 和 CMP 系列;另一方面英偉達也在積極向 DPU 和 CPU 環節延展2020 年英偉達收購 Mellanox Technologies 從而將芯片產品擴展至 DPU,2021 年英偉達在 GTC 2021 大會推出了基于 ARM 架構的首款 CPU 并命名為 Grace。至此,英偉達形成了“GPU+CPU+DPU”的產品組合,成為橫貫數據中心、游戲顯卡、專業可視化、自動駕駛等多個賽道的算力之王。1.1.1 業務業務一覽一覽:全球算力之王:全球算力之王 圖表 1:NVIDIA 核心業務賽道構成 資料來源:NVIDIA 財
26、報 PPT,國盛證券研究所 2024 年 02 月 19 日 P.6 請仔細閱讀本報告末頁聲明請仔細閱讀本報告末頁聲明 英偉達的算力芯片產品遍及數據中心、游戲顯卡、專業可視化、自動駕駛等多個行業賽道。公司作為業內的算力之王,其統治力從相應賽道市占率可見一斑:在數據中心賽道,Trendforce 數據顯示,2023 年的 AI 芯片市場中英偉達出貨量約占 60-70%,幾家互聯網巨頭的自研 ASIC 芯片約占 20%。當然,如果僅看數據中心 GPU 產品,則英偉達 A100、H100 等產品在模型訓練等方面幾乎沒有可替代的對手選項。在游戲顯卡賽道,JPR 數據顯示,英偉達占據了 PC 獨立顯卡的
27、 80%以上出貨量。收購了 ATI 的 AMD 當前則在 10%左右的市占率浮動。圖表 2:英偉達市場地位2023AI 芯片出貨量:英偉達占 60-70%圖表 3:英偉達市場地位PC 獨立 GPU 出貨量:英偉達超過 80%資料來源:TrendForce,國盛證券研究所 資料來源:JPR,國盛證券研究所 圖表 4:英偉達核心股東情況 股東名稱股東名稱 持股比例持股比例 Vanguard 集團 8.25%貝萊德 7.31%FMR 5.22%道富集團 3.59%黃仁勛 3.51%普徠仕 2.26%Geode Capital Management 1.96%摩根大通 1.41%摩根士丹利 1.32%
28、挪威中央銀行 1.08%北美信托 1.07%資料來源:Bloomberg,截止 2024/2/8,國盛證券研究所 英偉達自研AISC其他80%88%87%15%8%10%5%4%3%0%10%20%30%40%50%60%70%80%90%100%2022Q22023Q12023Q2IntelAMDNvdia 2024 年 02 月 19 日 P.7 請仔細閱讀本報告末頁聲明請仔細閱讀本報告末頁聲明 1.1.2 財務財務構成構成:AI 需求推動需求推動數據中心業務數據中心業務強勁增長強勁增長 英偉達的核心芯片產品線包括數據中心、游戲、專業可視化、自動駕駛等。截至 2023 財年(結束于 202
29、3 年 1 月),英偉達年度收入約 270 億美金,同比持平。其中,數據中心業務占比 56%,游戲業務占比 34%,專業可視化占比 6%,自動駕駛業務占比 3%,其他業務占比 2%。截至 2024Q3 財季(結束于 2023 年 10 月),英偉達季度收入約 180 億美金,同比增長 206%。其中,數據中心業務占比 80%,游戲業務占比 16%,專業可視化占比2%,自動駕駛業務占比 1%。2024Q3 財季,得益于 AI 算力需求強勁,英偉達數據中心業務同比增長 279%,單業務收入亦創新高。圖表 5:NVIDIA 收入構成:年度 資料來源:公司公告,國盛證券研究所 圖表 6:NVIDIA
30、收入構成:季度 資料來源:公司公告,國盛證券研究所 -50%0%50%100%150%-10,000 20,000 30,000FY2019FY2020FY2021FY2022FY2023NVIDIA年度收入構成:百萬美元數據中心游戲專業可視化自動駕駛其他yoy-數據中心yoy-游戲yoy-專業可視化yoy-自動駕駛-100%0%100%200%300%-5,000 10,000 15,000 20,0001Q232Q233Q234Q231Q242Q243Q24NVIDIA季度收入構成:百萬美元收入-數據中心收入-游戲收入-專業可視化收入-汽車收入-其他yoy-數據中心yoy-游戲yoy-專業
31、可視化yoy-自動駕駛 2024 年 02 月 19 日 P.8 請仔細閱讀本報告末頁聲明請仔細閱讀本報告末頁聲明 同樣,得益于 AI 算力需求暴增帶來的數據中心 GPU 供不應求,英偉達利潤表現也非常強勁:截至 2023 財年(結束于 2023 年 1 月),英偉達年度 GAAP 口徑利潤約 43.7 億美金,non-GAAP 口徑利潤約 83.7 億美金。公司 non-GAAP 凈利潤率達 31%。截至 2024Q3 財季(結束于 2023 年 10 月),英偉達季度 GAAP 口徑利潤約 92.4 億美金,non-GAAP 口徑利潤約 100.2 億美金。公司 non-GAAP 凈利潤率
32、達 55%。圖表 7:NVIDIA 利潤情況:年度 圖表 8:NVIDIA 利潤情況:季度 資料來源:公司公告,國盛證券研究所 資料來源:公司公告,國盛證券研究所 1.2 硬件:“硬件:“GPU+CPU+DPU”,”,縱橫縱橫多個行業賽道多個行業賽道 1)數據中心)數據中心 英偉達的數據中心業務涵蓋自下而上、從硬件產品到軟件平臺的全棧產品。其中硬件部分包含 GPU、CPU、DPU 三大類別芯片;軟件方面包括 CUDA 并行編程模型、CUDA-x應用程序加速庫、應用程序編程接口、或 API、SDK 和工具、以及特定領域的應用程序框架等;平臺端則包含 NVDIA HPC、NVDIA AI、NVDI
33、A Omniverse 等平臺。英偉達計算平臺專注于在超大規模、云、企業、公共部門和邊緣數據中心加速最計算密集型的工作負載,如人工智能、數據分析、圖形和科學計算。0%10%20%30%40%50%-2,000 4,000 6,000 8,000 10,000 12,0002020202120222023NVIDIA non-GAAP利潤情況:年度non-GAAP凈利:百萬美元non-GAAP凈利潤率:%0%10%20%30%40%50%60%-2,000 4,000 6,000 8,000 10,000 12,0001Q232Q233Q234Q231Q242Q243Q24NVIDIA non-
34、GAAP利潤情況:季度non-GAAP凈利:百萬美元non-GAAP凈利潤率:%2024 年 02 月 19 日 P.9 請仔細閱讀本報告末頁聲明請仔細閱讀本報告末頁聲明 圖表 9:NVIDIA 數據中心業務:自下而上,從硬件產品到軟件平臺 資料來源:NVIDIA 財報 PPT,國盛證券研究所 數據中心 GPU 是英偉達的王牌產品,公司主要產品包括訓練/推理芯片 A100、H100、L40、L40S 等,以及推理芯片 A10、A30 等。2024 年公司將推出性能更強的 H200、B100等。圖表 10:NVIDIA 數據中心產品:GPU GPU A100 SXM H100 SXM L40 L
35、40S A10 A30 架構 Ampere Hopper Ada Lovelace Ada Lovelace Ampere Ampere 市場定位 訓練/推理 訓練/推理 訓練/推理 訓練/推理 推理 推理 Tensor FP16 峰值算力:TFLOPS 624 1979 181.05 362.05 125 165 Tensor TF32 峰值算力:TFLOPS 312 989 90.5 183 62.5 82 GPU 顯存 HBM2e HBM3 支持 ECC 的48GB GDDR6 支持 ECC 的48GB GDDR6 GDDR6 HBM2 顯存容量 80GB 80GB 48GB 48GB
36、24GB 24GB 顯存帶寬 2039 GB/s 3.35 TB/s 864 GB/s 864 GB/s 600 GB/s 933 GB/s 互連技術 NVLink:600 GB/s PCIe 4.0:64 GB/s NVLink:900GB/s PCIe 5.0:128GB/s PCIe 4.0:64 GB/s PCIe 4.0:64 GB/s PCIe 4.0:65 GB/s NVLink:200 GB/s PCIe 4.0:64 GB/s 資料來源:公司官網,國盛證券研究所 2024 年 02 月 19 日 P.10 請仔細閱讀本報告末頁聲明請仔細閱讀本報告末頁聲明 除了 GPU 之外,
37、英偉達也擴大其他數據中心處理器產品組合:數據中心 CPU 方面,英偉達也在加速布局,比如推出數據中心 CPU 產品 NVIDIA Grace CPU 超級芯片。此外,英偉達也推出適用于大規模 AI 和 HPC 應用的突破性加速 CPUNVIDIA Grace Hopper 超級芯片。圖表 11:英偉達數據中心產品:CPU Grace CPU Grace Hopper GPU HBM capacity(GB)96GB HBM3 144GB HBM3e Grace CPU cores(number)Up to 72 cores GPU HBM bandwidth(GB/s)4TB/s HBM3 4
38、.9TB/s HBM3e 浮點算力 FP64:peak 7.1 TFLOPS FP64:34 teraFLOPS。FP32:67 teraFLOPS 顯存帶寬 Up to 1TB/s Up to 512GB/s(grace)900 GB/s bidirectional(hopper)互連技術 NVLink-C2C bandwidth:900GB/s PCIe links:Up to 8x PCIe Gen5 x16 option to bifurcate NVLink-C2C bandwidth:900 GB/s bidirectional PCIe links:Up to 4x PCIe x
39、16(Gen5)核心控制 Core count 144 Arm Neoverse V2 Cores with 4x128b SVE2 72 Arm Neoverse V2 cores 低功耗內存 LPDDR5X size 240GB,480GB and 960GB Up to 480GB 資料來源:公司官網,國盛證券研究所 DPU 方面,NVIDIA BlueField 網絡平臺為全球數據中心提供動力,憑借強大的計算能力以及用于網絡、存儲和安全加速的內置軟件定義硬件加速器,BlueField 可為各種環境中的多種工作負載提供安全的加速基礎設施。DPU 產品包含 NVIDIA BlueField
40、-3、BlueField-2、BlueField-3 SuperNIC 等。圖表 12:英偉達數據中心產品:DPU BlueField-2 BlueFhield-3 NVIDIA BlueField-3 SuperNIC 網絡接口 以太網-10/25/50/100Gb/s 的雙端口,或 200Gb/s 的單端口 InfiniBand-EDR/HDR100(100Gb/s)雙端口或 HDR(200Gb/s)的單端口 1 或 2 端口高達 400Gb/s 以太網或NDR InfiniBand 網絡連接 1 或 2 端口高達 400Gb/s 以太網或NDR InfiniBand 網絡連接 PCI E
41、xpress 接口 8 或 16 通道的 PCIe Gen 4.0 PCIe 交換機(含多達 8 個下行端口)32 通道第五代 PCIe 多達 16 個下行端口的 PCIe 交換拆分 32 通道第五代 PCIe 多達 16 個下行端口的 PCIe 交換拆分 ARM 核心 多達 8 個 Armv8A72 核心(64位)流水線 多達 16 個 ARMv8.2+A78 Hercules核心(64 位)多達 16 個 ARMv8.2+A78 Hercules核心(64 位)DDR4 DIMM 支持 單個 DDR4DRAM 控制器 8GB/16GB 板載 DDR4 雙 DDR5 5600MT/s DRA
42、M 控制器 32GB 板載 DDR5 內存 雙 DDR5 5600MT/s DRAM 控制器 32GB 板載 DDR5 內存 資料來源:公司官網,國盛證券研究所 2)游戲顯卡游戲顯卡 英偉達針對游戲市場的產品包括用于游戲臺式機和筆記本電腦的 GeForce RTX 和 2024 年 02 月 19 日 P.11 請仔細閱讀本報告末頁聲明請仔細閱讀本報告末頁聲明 GeForce GTX GPU,以及用于玩 PC 游戲的 GeForce NOW 云游戲平臺,用于電視高質量流媒體的 SHIELD、以及用于游戲機的系統芯片(SoC)和開發服務。在 2023 財年,英偉達推出了基于 Ada Lovela
43、ce 架構的 GeForce RTX 40 系列游戲 GPU。圖表 13:產品梳理:英偉達消費級 GPU 主要產品 GeForce 型號型號 NVIDIA CUDA 核心數量核心數量(個)(個)加速頻率加速頻率(GHz)基礎頻率基礎頻率(GHz)標準顯存配置標準顯存配置 顯存位寬顯存位寬 RTX 4090 D 14592 2.52 2.28 24 GB GDDR6X 384 位 RTX 4080 SUPER 10240 2.55 2.29 16 GB GDDR6X 256 位 RTX 4080 9728 2.51 2.21 16 GB GDDR6X 256 位 RTX 4070 Ti SUPE
44、R 8448 2.61 2.34 16 GB GDDR6X 256 位 RTX 4070 Ti 7680 2.61 2.31 12 GB GDDR6X 192 位 RTX 4060 Ti 4352 2.54 2.31 16 GB GDDR6 或 8 GB GDDR6 128 位 RTX 3090 Ti 10752 0.86 1.56 24 GB GDDR6X 384 位 RTX 2080 Ti 4352 1.64 1.35 11 GB GDDR6 352 位 GTX 1660 Ti 1536 1770 1500 6GB GDDR6 192 位 資料來源:公司官網,國盛證券研究所 圖表 14:競
45、品對比:AMD 消費級 GPU 主要產品 Radeon型號型號 計 算計 算單元單元 基 準基 準頻率頻率 加速頻率加速頻率 游 戲游 戲頻率頻率 峰 值 半 精 度峰 值 半 精 度(FP16)性能性能 峰 值 單 精 度峰 值 單 精 度(FP32)性能性能 最 大最 大顯存顯存 顯存類型顯存類型 顯 存 位顯 存 位寬寬 最大顯存帶最大顯存帶寬寬 RX 7900 XTX 96-最高可達2500 MHz 2300 MHz 123 TFLOPS 61 TFLOPS 24GB GDDR6-最高可達960 GB/s RX 7900M 72-1825 MHz 77.05 TFLOPS 38.52
46、TFLOPS 16GB GDDR6-最高可達576 GB/s RX 7700S 32-2200 MHz 41 TFLOPS 20.5 TFLOPS 8GB GDDR6 128-bit 最高可達288 GB/s RX 6950 XT 80 1890 MHz 最高可達2310 MHz 2100 MHz 47.31 TFLOPS 23.65 TFLOPS 16GB GDDR6 256-bit 最高可達576 GB/s RX 6850M XT 40-2463 MHz 26.6 TFLOPS 13.3 TFLOPS 12GB GDDR6 192-bit 最高可達432 GB/s RX 6750 XT 4
47、0 2150 MHz 最高可達2600 MHz 2495 MHz 26.62 TFLOPS 13.31 TFLOPS 12GB GDDR6 192-bit 最高可達432 GB/s RX 6750 GRE 12GB 40 2321 MHz 最高可達2581 MHz 2439 MHz 26.43 TFLOPS 13.21 TFLOPS 12GB GDDR6 192-bit 最高可達384 GB/s RX 6650 XT 32 2055 MHz 最高可達2635 MHz 2410 MHz 21.59 TFLOPS 10.79 TFLOPS 8GB GDDR6 128-bit 最高可達280 GB/
48、s RX 6550M 16-2560 MHz 11.6 TFLOPS 5.8 TFLOPS 4GB GDDR6 64-bit 最高可達144 GB/s RX 6550S 16-2170 MHz 9.9 TFLOPS 4.9 TFLOPS 4GB GDDR6 64-bit 最高可達128 GB/s 資料來源:AMD 官網,國盛證券研究所 2024 年 02 月 19 日 P.12 請仔細閱讀本報告末頁聲明請仔細閱讀本報告末頁聲明 3)專業可視化專業可視化 英偉達專業可視化產品的適用范圍包括設計和制造以及數字內容創建。例如設計和制造包括計算機輔助設計、建筑設計、消費產品制造、醫療儀器和航空航天。數
49、字內容創作包括專業視頻編輯和后期制作、電影特效和廣播電視圖形。主要硬件產品包括 Ada Lovelace 架構的專業卡 RTX 6000 等、Ampere 架構的 RTX A6000 系列、Turing 架構的T1000 等。圖表 15:英偉達專業可視化主要產品 產品產品 GPU Memory Display Ports Max Power Consumption Form Factor Thermal NVIDIA Ada Lovelace Architecture RTX 6000 48GB GDDR6 with ECC 4x DisplayPort 1.4a*300W 4.4”(H)x
50、10.5”(L)dual slot Active RTX 5000 32GB GDDR6 with ECC 4x DisplayPort 1.4a*250W 4.4”(H)x 10.5”(L)dual slot Active RTX 4500 24GB GDDR6 with ECC 4x DisplayPort 1.4a 210W 4.4”(H)x 10.5”(L)dual slot Active NVIDIA Ampere Architecture A800 40GB Active 40GB HBM2 Not equipped 240W 4.4”(H)x 10.5”(L)dual slot
51、Active RTX A6000 48GB GDDR6 with ECC 4x DisplayPort 1.4a*300W 4.4”(H)x 10.5”(L)dual slot Active RTX A5500 24GB GDDR6 with ECC 4x DisplayPort 1.4a*230W 4.4(H)x 10.5(L)dual slot Active NVIDIA Turing Architecture T1000 4GB|8GB GDDR6 4x Mini DisplayPort 1.4 50W 2.713(H)x 6.137(L)single slot Active T600
52、4GB GDDR6 4x Mini DisplayPort 1.4 40W 2.713(H)x 6.137(L)single slot Active T400 2GB|4GB GDDR6 3x Mini DisplayPort 1.4 30W 2.713(H)x 6.137(L)single slot Active 資料來源:公司官網,國盛證券研究所 4)自動駕駛自動駕駛 NVIDIA 的汽車業務由自動駕駛、智能座艙、電動汽車計算平臺和信息娛樂平臺解決方案組成,將以 DRIVE Hyperion 品牌為自動駕駛市場提供完整的端到端解決方案。硬件方面,英偉達自動駕駛芯片主要包含 Xavier、O
53、rin、Thor 等。圖表 16:英偉達當前自動駕駛芯片 產品產品 Xavier Orin Thor 發布時間 2018 2019 2022 量產時間 2020 2022 2025E 制程 12nm 7nm/功耗 30W 45W/算力 30 TOPS 254 TOPS 2000 TOPS 資料來源:公司公告、維科網、玩車教授、IT 之家、電子工程世界,國盛證券研究所 2024 年 02 月 19 日 P.13 請仔細閱讀本報告末頁聲明請仔細閱讀本報告末頁聲明 1.3 軟件軟件及及平臺平臺:云服務望成長為第二曲線云服務望成長為第二曲線 當然,英偉達作為全球領先的算力平臺,在硬件產品之外,亦為客戶
54、提供了多維度的軟件平臺服務,包括但不限于:DGX Cloud:云服務平臺,可提供 NVIDIA DGX AI 超級計算專用集群,并配以 NVIDIA AI 軟件。DGX Cloud 不僅包括算力,還包括一整套“AI 訓練即服務”解決方案。Omniverse:元宇宙應用平臺,使用 OpenUSD 開發工業元宇宙應用,適用于汽車、建筑、工程、施工和運營、媒體和娛樂,以及制造行業等。GeForce Now:云游戲平臺,支持玩家綁定 Steam、Epic Games 賬號,通過 NVIDIA GeForce Now 云游戲來體驗已有游戲庫中的游戲。Automobile Drive:自動駕駛平臺,其中開
55、放式 NVIDIA DRIVE SDK 為開發者提供了自動駕駛所需的所有構建塊和算法堆棧,該軟件有助于開發者更高效地構建和部署各種先進的自動駕駛應用程序。其中,DGX Cloud 作為英偉達數據中心業務在算力芯片產品之外的重要業務方向,將數據中心業務擴展到了算力和模型訓練等相關的云服務方面。NVIDIA AI 則包括加速計算、基礎 AI 軟件、預訓練模型和“AI 代工廠”。預訓練模型和“AI 代工廠”包括語言模型NEMO、視覺模型 PICASSO、生物學模型 BIONEMO、游戲模型 NVIDIA ACE、生成式 AI模型(包括 GPT、T5 和 Llama 等)等等。我們認為,DGX Clo
56、ud 有望將算力和模型訓練相關業務以更易得的方式提供給企業客戶,長期有望成為英偉達數據中心業務的第二增長曲線。2024 年 02 月 19 日 P.14 請仔細閱讀本報告末頁聲明請仔細閱讀本報告末頁聲明 2.需求需求:AI 算力需求算力需求可以延續多久可以延續多久 2.1 AI 需求:需求:對下一個時代的押注,誰也不能松懈對下一個時代的押注,誰也不能松懈 2022 年,OpenAI 推出 ChatGPT,帶來了人工智能浪潮。此后,全球互聯網及云服務大廠陸續加入大模型的軍備戰爭,AI 算力需求快速提升。英偉達數據中心業績的可持續性,來自于算力需求的可持續性。2.1.1 訓練訓練端端:誰在誰在邊際
57、增加邊際增加 AI 算力算力投入?投入?人工智能實力的提升,是一個互聯網及云服務企業甚至于一個國家都不能錯過的戰斗。當前我們看到,AI 軍備戰爭已經從 2023 年的少數幾家互聯網及云服務大廠,向更多地區的更多企業和部門擴展。接下來,更多國家和企業將入場 AI 軍備戰爭:更多國家入場:法國、英國、德國、瑞典、越南、新加坡、印度、日本等國家和地區開始加大 AI 投入。更多企業增加投入:Meta、OpenAI、以及微軟、谷歌等均在加大 AI 投入。模型更大:隨著多模態的發展、各家模型廠商之間的競爭加劇,模型的參數數據量也更大。2024 年 02 月 19 日 P.15 請仔細閱讀本報告末頁聲明請仔
58、細閱讀本報告末頁聲明 圖表 17:AI 訓練需求增加:更多國家開始加入 AI 軍備競賽 國家國家 時間時間 事件事件 越南 2024 年 1 月 越南通信傳媒部近日發布了一項計劃,到 2025 年,越南至少擁有一個越南語大語言模型。越南企業 Vingroup 旗下子公司 VinBigData 開發,第一個向公眾開放的越南生成式人工智能大模型 ViGPT。新加坡 2024 年 1 月 新加坡上個月宣布了一項計劃,將針對印尼語、馬來語和泰語研發大語言模型。日本 2024 年 1 月 日本政府聯合日本電氣公司、富士通、軟銀等大型科技公司投入數億美元,開發日語大型語言模型。英國 2023 年 11 月
59、 英國政府宣布將投資 2.25 億英鎊研發人工智能(AI)超級計算機“Isambard-AI”,助推英國成為 AI 領域的全球領導者。德國 2023 年 10 月 德國的 Julich 超級計算中心也宣布了其建設下一代人工智能超級計算機的計劃,使用接近24000 個 Grace Hopper Superchips 和 Quantum-2 InfiniBand,將其提升為全球最強大的人工智能超級計算機,擁有超過 90 exaflops 的人工智能性能。印度 2023 年 10 月 印度電子和信息技術部于 2023 年 10 月 14 日發布了印度人工智能 2023 計劃。重點關注了包括計算機基礎
60、設施建設、人工智能研究和創新能力提升、國家機器人戰略草案草擬、人工智能芯片開發、印度數據集建設等問題。2024 年 1 月 印度數據中心運營商Yotta計劃向美國智能芯片制造商英偉達追加購買價值5億美元的AI芯片,用以強化其人工智能云服務能力。2023 年 12 月,印度數據中心運營商 Yotta 訂購約 16000 顆英偉達 H100 芯片,預計到 2024 年 1 月,將有 4096 個 GPU 投入 Yotta 的人工智能云服務。法國 2023 年 6 月 巴黎初創公司 Mistral AI 宣布獲得一輪超過 1 億美元的種子資金,以構建類似 ChatGPT 的大型語言模型和生成式 AI
61、。該公司預計將于明年推出首個 AI 產品,目前的估值已經超過了 2 億歐元。瑞典 2023 年 12 月 AI Sweden 與 RISE 和 WASP WARA Media&Language 一起,為北歐語言(主要是瑞典語)開發了一個大規模的生成語言模型。資料來源:英偉達業績會、環球網、澎湃新聞、第一財經、AIse 官網、印度政府電子與信息技術部、騰訊網,國盛證券研究所 圖表 18:AI 訓練需求增加:更多企業開始加入 AI 軍備競賽 公司公司 時間時間 事件事件 Meta 2024年1 月 Meta 首席執行官扎克伯格宣布,到 2024 年底前 Meta 將購買約 35 萬張英偉達 H10
62、0,包括其他 GPU 將有大約 60 萬 H100 的等效算力。Amazon 2024年2 月 為了加強其云業務,亞馬遜正在向聊天機器人制造商 Anthropic 投資高達 40 億美元。亞馬遜首席財務官布萊恩奧爾薩夫斯基(Brian Olsavsky)在電話會議上表示,亞馬遜預計今年的資本支出將增加,以支持 AWS 的增長,包括對生成式 AI 和大型語言模型的額外投資。谷歌 2024年2 月 2024 年資本支出將繼續增加,以支持 AI 的持續投資。微軟 2024年2 月 1)微軟首席財務官艾米胡德(Amy Hood)預計,微軟的資本開支將在 2024 年一季度顯著環比擴大。2)微軟管理層判
63、斷,隨著未來推理需求增長,云資源的消耗速度還將進一步提升。OpenAI 2024年1 月 OpenAI 計劃投資千億美元自建芯片工廠,以應對全球 AI 芯片需求激增。蘋果 2024年2 月 庫克在財報會上指出,蘋果正全力以赴地投入大量時間和精力于 AI 的研發,并計劃在今年晚些時候公布更多細節。資料來源:澎湃新聞、財聯社、億邦動力、財經十一人、搜狐網、中國經濟周刊,國盛證券研究所 2024 年 02 月 19 日 P.16 請仔細閱讀本報告末頁聲明請仔細閱讀本報告末頁聲明 圖表 19:AI 訓練需求增加:AI 模型加速迭代,參數量大幅提升 資料來源:公司公告,國盛證券研究所 2.1.2 推理推
64、理端端:哪些哪些 AI 場景和應用在增加?場景和應用在增加?我們看到,AI 推理相關的算力需求正在海量襲來,而背后的驅動力則包括端側 AI 的逐步落地、AI 應用從文娛內容領域向更多科技和制造領域擴展等方面。端側 AI 落地 近期 AI 大模型功能在硬件端落地的浪潮開啟:AI PC、AI 手機、AI+可穿戴新型便攜產品等迭起,AI 賦能硬件產品更智能、交互更順暢、提升用戶體驗。2023 年 11 月,Humane 發布無屏幕可穿戴設備 AI Pin,背后是 OpenAI 的 GPT-4 為其提供 AI 能力,可實現語音通話、寫文稿、聽音樂、處理電子郵件、實時翻譯等任務,未來計劃增加導航和購物功
65、能。2024 年 1 月,聯想攜 40 多款產品亮相 CES 2024,其中包括十余款 AI PC。聯想宣布個人 AI 助理Lenovo AI Now 將在今年上半年部署到產品上市。2024 年 1 月,三星發布首款 AI 手機 Galaxy S24,全面集成了三星自研的前沿生成式 AI 模型 Gauss,同時,谷歌 AI 大模型 Gemini nano 在其中得到全面應用,為搜索、通話、短信、相機等都配置了 AI 功能。我們預期,端側 AI 產品的快速普及將為 AI 推理帶來大量需求。2024 年 02 月 19 日 P.17 請仔細閱讀本報告末頁聲明請仔細閱讀本報告末頁聲明 圖表 20:A
66、I 推理需求增加:云到端 終端應用終端應用 案例公司案例公司 相關產品相關產品 功能功能 AI+可穿戴:Pin Humane AI Pin AI Pin 重不足 40 克,可吸附在衣服等物體表面,無需實體屏幕,可語交互音/投影在手掌交互。AI 模型加持下,AI Pin 可實現寫文稿、聽音樂、實時翻譯等任務,未來計劃增加導航和購物功能。AI+可穿戴:吊墜 Rewind Pendant 產品形態類似項鏈吊墜,可以捕捉所說和所聽的內容,轉錄、加密并完全存儲在手機上,提供個性化 AI 能力。AI+可穿戴:眼鏡 Meta Ray-Ban 拍攝照片、60 秒視頻以及聽音樂、接電話等,且支持 Meta AI
67、。AI+可穿戴:AR/VR Meta Meta Quest 3 或接入 Meta AI,可以實現對話,提供做飯、旅游、寫作的建議等。AI+可穿戴:MR 蘋果 Vision Pro 可以接入多模態 AI 助手 Otter,以視頻為輸入,能完成多模態感知、推理、和上下文學習。AI+可穿戴:耳機 訊飛 iFLYBUDS Nano 現場錄、通話錄、音視頻錄。搭載生成式 AI 會議助理 VIAIM,智能提煉、總結關鍵信息,快速生成會議摘要、提取待辦事項、并對待辦事項進行跟進。AI+手機 谷歌 Pixel 8 系列 更好的拍照和視頻功能,翻譯、實時轉錄消息,檢測并過濾垃圾電話,檢測用戶是否遭遇嚴重車禍并呼
68、叫緊急服務,Fitbit 將使用生成式 AI 為用戶帶來個性化指導、動態鍛煉建議。引入 Bard 后,Google Assistant 將個性化功能與大模型的推理和生成能力相結合,實現聽、說、影響處理能力的全面升級。AI+手機 三星 Galaxy S24 自研生成式 AI 產品 Gauss 將面向 AI 聊天、AI 代碼、AI 圖片等領域,同時,谷歌 AI大模型 Gemini nano 在其中得到全面應用。AI+手機 蘋果 尚未推出 探索 AI 嵌入應用程序。AI+手機 華為 mate 60 華為手機智慧助手小藝具備 AI 大模型能力,在交互、生產力提升和個性化服務三個方向上增強。AI+手機
69、小米 小米 14 系列 搭載驍龍 8gen3 芯片,基于小米自研的 AI 大模型,澎湃 OS 將實現小愛輸入助手、WPS 隨手拍、AI 妙畫、AI 搜圖、AI 寫真、AI 擴圖、實時字幕等功能。AI+手機 Vivo X100 系列 Vivo OriginOS 4 正式亮相、將大模型能力與系統結合,X100 系列手機將全球首發搭載天璣 9300 旗艦芯片。AI+手機 OPPO Find X6 系列 OPPO 正式推出 AndesGPT 并接入新操作系統 ColorOS 14,Find X6 系列等 6 款機型將首發升級正式版。小布助手支持了內容創作、用機助手、智能摘要、智能消除等各類 AIGC
70、能力。AI+手機 榮耀 Magic6 系列 榮耀 Magic6 系列將支持自研 70 億端側 AI 大模型。AI+PC 聯想 聯想 AIPC 可以創建本地知識庫和運行個人基礎大模型,還支持 AI 計算和自然交互。除此之外,聯想還通過大模型壓縮技術,保證了個人隱私和數據安全,使得 AIPC 能夠在本地運行個人大模型,不需要依賴云端操作。AI+PC 三星 Galaxy Book 4 發布首款人工智能(AI)筆記本 Galaxy Book 4 系列筆記本電腦,預計該系列將于2024 年 1 月在韓國上市,之后推向其他地區。AI+智能音箱 亞馬遜 Alexa 接入為語音交互定制的大模型,可提供更自然的
71、對話功能和智能家居控制。AI+智能音箱 小米 小愛同學 小米團隊結合大模型的對話特點升級了小愛的交互模型。小愛擁有優秀的上下文理解能力;全新沉浸式的對話形態,生成式的結果。具體而言,小愛同學可以寫周報、做旅游攻略、制定健身計劃,甚至寫代碼等。AI+智能車 特斯拉 FSD V12 FSD V12 打造基于神經網絡的端到端大模型。AI+智能車 蔚來 智駕 基于 BEV+Tansformer 開展無圖拓城計劃。AI+智能車 小鵬 智駕 基于 BEV+Tansformer 開展無圖拓城計劃。AI+智能車 理想 座艙+智駕 理想發布自研認知大模型“Mind GPT”,包括對話生成、語言理解、知識問答、邏
72、輯推理等在內的各項能力變得更安全,更準確,也更有邏輯。AI+智能車 華為 問界 M9 問界 M9 在智能座艙和智能駕駛雙“天花板”基礎上,搭載的黑科技包括:鴻蒙智能座艙、華為智能駕駛、HUAWEI xPixel、HUAWEI AR-HUD、AI 大模型、傳感聯邦、HUAWEI SOUND 等。AI+機器人 特斯拉 Optimus 特斯拉的全自動駕駛系統 FSD 直接被應用在 Optimus 身上,機器人采用了與汽車一樣的視覺感知,使用攝像頭輸入數據,以神經網絡進行計算。AI+機器人 英偉達 Eureka(機器人訓練工具)Eureka 可以教會機器人復雜的運動控制技能,比如轉筆、打開抽屜和柜子、
73、拋球和接球、操作剪刀。AI+機器人 Meta Habitat3.0(機器 人 訓 練 工具)Habitat 3.0 是第一個支持在多樣化、逼真的室內環境中,就人機交互任務進行大規模訓練的模擬器。資料來源:各公司官網、官方微博、澎湃新聞、財聯社、IT 之家、華爾街見聞、量子位、金融界、鈦媒體、新浪、中國證券網、經濟觀察網、36 氪、快科技、每日經濟新聞、科創版日報,國盛證券研究所 2024 年 02 月 19 日 P.18 請仔細閱讀本報告末頁聲明請仔細閱讀本報告末頁聲明 領域破圈 我們認為,接下來生成式 AI 的應用,除了可以在內容領域以外,會在更多的領域和圈層落地。首先,以自動駕駛領域為例,
74、各類 AI 工具被廣泛地應用在數據合成、4D 標注、感知模型、決策規劃模型、以及當前的端到端模型探索中。其中,由于 1)數據采集成本日益提高、2)真實場景的數據采集涉及隱私安全信息,3)有效 corner case 的收集密度太低等原因,自動駕駛的訓練往往面臨數據不足的問題?;诖?,自動駕駛領域一些企業,如 Wayve,已經開始通過生成式 AI 模型來創建駕駛場景視頻,用以更好地輔助自動駕駛端側模型的開發。英國創業公司 Wayve 在 2023 年 6 月首次推出了 GAIA-1(Generative Artifitial Intelligengce for Autonomy)、并在 2023
75、 年 9 月更新了最新進展。GAIA-1 模型核心是一個基于自回歸 Transformer 的世界模型(world model):在輸入視頻、文本、動作指引后,能預測序列中下一組圖像 token;這些預測的圖像 token 不僅在視覺上連貫、而且和此前的文字和動作指引保持一致。隨后,視頻解碼器(video diffusion model)將這些圖像 token 轉換回像素空間。除了 Wayve 以外,Tesla 也在嘗試通過建立仿真場景來輔助自動駕駛模型的訓練。Tesla 在 CVPR 2023 workshop 展示了其“General World Model”,市場普遍認為其除了可以為自動
76、駕駛決策規劃模型的訓練提供“模擬器”環境外、后續作用還可能體現在自動駕駛算法本身。我們認為,生成式 AI 模型有望大大降低自動駕駛模型訓練的門檻、以及提升決策規劃的能力天花板。圖表 21:自動駕駛場景仿真:GAIA-1 模型框架 資料來源:Scaling GAIA-1:9-billion parameter generative world model for autonomous driving,作者為 Anthony Hu、Lloyd Russell 等,國盛證券研究所 其次,在生物及材料科學領域,我們也看到了生成式 AI 在蛋白質預測、新型材料生成等“AI For Science(AI4
77、S)”方面的巨大潛力。谷歌 Deepmind 旗下的 Alphafold 是生物醫學領域比較早出圈的 AI 工具,此前就可以進行單鏈蛋白質的預測、以及后續擴展至具有多條蛋白質鏈的復合物。2023 年 10 2024 年 02 月 19 日 P.19 請仔細閱讀本報告末頁聲明請仔細閱讀本報告末頁聲明 月底,新一代 Alphafold 進一步加強,不僅可以預測蛋白質結構,還可以進行對核酸、小分子配體等生物分子結構的預測。該工具有助于加速生物醫學的進展。谷歌 Deepmind 旗下的另一個工具 GNoMe,則是將類似能力應用在了新材料的發現上。GNoMe 基于圖神經網絡對晶體材料進行預測和篩選。當前
78、 GNoMe 發現了 220萬種新晶體材料,而且將預測材料穩定性的準確率從 50%拉高到 80%。微軟MatterGen的突破則在于,可以針對所需要的特性,直接生成相應的新型材料。MatterGen 基于類似 Diffusion Model 的方法,為晶體材料選取了定制的擴散過程、得出基礎模型。然后引入適配器模塊,在帶有屬性標簽的附加數據集上對基礎模型進行微調,最終引導生成的結果符合目標屬性約束。這一技術有望大大加快設計所需特性材料的速度。圖表 22:AI 推理需求增加:AI 應用向更多基礎研究領域擴展 模型及工具名模型及工具名稱稱 所屬公司所屬公司 時間時間 技術技術 成果成果 新一代Alp
79、hafold 谷歌Deepmind 2023 年 10 月 原有 Alphafold 是單鏈蛋白預測的突破,Alphafold-Multitimer 擴展到具有多條蛋白質鏈的復合物。新一代 Alphafold 在此基礎上進一步拓展。新一代 Alphafold 不僅可以預測蛋白質結構,還可以進行對核酸、小分子配體等生物分子結構的預測。該工具有助于加速生物醫學的進展。GNoMe 谷歌Deepmind 2023 年 11 月 GNoMe 基于圖神經網絡(GNN),將已知的穩定材料生成候選結構,然后對這些候選結構進行篩選。篩選得出的結果進行結構穩定性的驗證,隨后作為新的訓練數據再給到 Gnome、用以
80、改進預測能力。谷歌使用 GNoMe 工具,發現了 220 萬種新晶體材料,而且將預測材料穩定性的準確率從 50%拉高到 80%。MatterGen 微軟 2023 年 12 月 基于類似 Diffusion Model 的方法,為晶體材料選取了定制的擴散過程、得出基礎模型。然后引入適配器模塊,在帶有屬性標簽的附加數據集上對基礎模型進行微調,最終引導生成的結果符合目標屬性約束。MatterGen 可以針對所需要的特性,直接生成相應的新型材料。這些生成的材料具有結構的獨特性和新穎性。資料來源:新智元、量子位、澎湃新聞,國盛證券研究所 從內容生成,到自動駕駛場景仿真、到材料定制,我們認為后續生成式
81、AI 在科技、制造等研究及生產領域可以帶來更多推理需求、也創造更多產業價值。2.2 定量測算定量測算:模型訓練與推理,全球需要多少卡:模型訓練與推理,全球需要多少卡 我們用粗略的測算,來估計當前全球企業在 AI 模型的訓練和推理過程中所需要的算力芯片的量級:首先從訓練的角度,我們以 GPT-4(根據 SemiAnalysis,約 1.8 萬億參數、13 萬億訓練數據)作為基礎,假設后續幾年全球各國大模型數量持續增加、模型參數繼續攀升,則按我們的測算,至 2030 年,全球累計需要相當于 2000 萬張 H100 的等量算力需求。2024 年 02 月 19 日 P.20 請仔細閱讀本報告末頁聲
82、明請仔細閱讀本報告末頁聲明 圖表 23:訓練所需 GPU 需求按 H100 測算 2023e 2024e 2025e 2026e 2027e 2028e 2029e 2030e 國家數 3 5 5 6 7 8 9 10 科技巨頭數/國家 3 5 5 5 5 5 5 5 模型數/科技巨頭企業 3 4 5 5 5 5 5 5 模型參數擴容速度:10%10%10%10%10%10%10%Token 數:十億 13000 14300 15730 17303 19033 20937 23030 25333 模型參數量:十億 1800 1980 2178 2396 2635 2899 3189 3508
83、Flops/token/模型參數量-訓練 6 6 6 6 6 6 6 6 峰值算力 TFLOPS-H100 SXM 989 989 989 989 989 989 989 989 算力利用率假設 21.3%21.3%21.3%21.3%21.3%21.3%21.3%21.3%總計卡數需求:百萬張 0.6 2.6 3.9 5.6 7.9 11.0 14.9 20.1 每年新增卡數需求:百萬張 2.0 1.3 1.7 2.3 3.0 4.0 5.1 資料來源:The economics of large language models、作者為 SUNYAN,semianalysis,國盛證券研究所
84、測算 其次從推理的角度,我們同樣以 GPT-4(根據 SemiAnalysis,約 1.8 萬億參數、13 萬億訓練數據)作為基礎,假設后續幾年全球各國大模型數量持續增加、模型參數繼續攀升、應用迭代帶來的用戶訪問用量持續提升,則按我們的測算,至 2030 年,全球累計需要超過 1.16 億張相當于 A30 的等量算力需求。2024 年 02 月 19 日 P.21 請仔細閱讀本報告末頁聲明請仔細閱讀本報告末頁聲明 圖表 24:推理所需 GPU 需求-按 A30 測算 2023e 2024e 2025e 2026e 2027e 2028e 2029e 2030e 每次查詢次數/訪問 8 10 1
85、1 13 14 16 17 19 每次查詢輸入字數 50 50 50 50 50 50 50 50 每次查詢輸出字數 200 200 200 200 200 200 200 200 字數/token 0.75 0.75 0.75 0.75 0.75 0.75 0.75 0.75 token 數/訪問 2667 3167 3667 4167 4667 5167 5667 6167 國家數 3 5 5 6 7 8 9 10 科技巨頭數/國家 3 5 5 5 5 5 5 5 模型數/科技巨頭企業 3 4 5 5 5 5 5 5 單個模型每月訪問:億次 5 6 6 7 8 9 9 10 單模型訪問次數
86、/年:百萬 6000 6840 7680 8520 9360 10200 11040 11880 模型參數擴容速度 10%10%10%10%10%10%10%模型參數量:十億 1800 1980 2178 2396 2635 2899 3189 3508 Flops/token/模型參數量-推理 2 2 2 2 2 2 2 2 峰值算力 TFLOPS A30 165 165 165 165 165 165 165 165 算力利用率假設 21.3%21.3%21.3%21.3%21.3%21.3%21.3%21.3%總計卡數需求:百萬張 1.4 7.7 13.8 23.0 36.4 55.1
87、81.0 115.9 資料來源:The economics of large language models、作者為 SUNYAN,semianalysis,國盛證券研究所測算 2024 年 02 月 19 日 P.22 請仔細閱讀本報告末頁聲明請仔細閱讀本報告末頁聲明 3.供給供給:龍頭龍頭面對面對攪局者攪局者 3.1 AI 芯片芯片江湖江湖:扶持:扶持 AMD、發力自研芯片、發力自研芯片 在算力芯片如此緊缺的當下,眾多互聯網及云服務廠商當然也不能把雞蛋放在一個籃子里既不夠安全、又太貴。當前的 AI 芯片賽道,除了種子選手英偉達之外,還有兩類重要的陣營:以 AMD 和 Intel 為代表的
88、GPU 專業級新選手,以谷歌 TPU、微軟 Athena 等為代表的云廠商自研芯片。以 AMD 為例,AMD 于 2023 年 6 月發布 AMD Instinct MI300X GPU 和 AMD Instinct MI300A APU。在硬件性能角度,MI300X 堪與 H100 一戰:內存:內存容量較 H100 的 80GB 提高 2.4 倍至 192GB,內存帶寬從 3.4TB/s 提升1.6 倍至 5.3TB/s。HPC 表現:算力性能高達 H100 的 2.4 倍。AI 表現:算力性能高達 H100 的 1.3 倍。圖表 25:訓練性能對比:AMD MI300X vs 英偉達 H1
89、00 圖表 26:推理性能對比:AMD MI300X vs 英偉達 H100 資料來源:36 氪,國盛證券研究所 資料來源:36 氪,國盛證券研究所 根據 AMD 的表述,就 AMD Instinct MI300X platform 與英偉達 H100 HGX 的比較而言,在訓練方面二者性能相當,在推理方面則 MI300X platform 的推理速度是 H100 HGX 的1.4 倍(Llama2)到 1.6 倍(Bloom)。2024 年 02 月 19 日 P.23 請仔細閱讀本報告末頁聲明請仔細閱讀本報告末頁聲明 圖表 27:供給端競爭:AMD MI300X vs 英偉達相關 GPU
90、參數比較 對比對比 MI300X A100 SXM H100 SXM H200 SXM B100 GPU 架構 AMD CDNA3 NVIDIA Ampere NVIDIA Hopper NVIDIA Hopper Blackwell 技術制程 TSMC 5nm|6nm FinFET TSMC 7nm TSMC 4nm TSMC 4nm TSMC 3nm FP64 81.7 TFLOPS 9.7 TFLOPS 34 TFLOPS 34 TFLOPS-FP32 163.4 TFLOPS 19.5 TFLOPS 67 TFLOPS 67 TFLOPS-TF32 1307.4 TFLOPS 312
91、TFLOPS 989 TFLOPS 989 TFLOPS-FP16 2614.9 TFLOPS 624 TFLOPS 1979 TFLOPS 1979 TFLOPS-BF16 2614.9 TFLOPS 624 TFLOPS 1979 TFLOPS 1979 TFLOPS-FP8 5229.8 TFLOPS-3958 TFLOPS 3958 TFLOPS-INT8 5229.9 TFLOPS 1248 TFLOPS 3958 TOPS 3958 TOPS-GPU Memory 192 GB 80GB 80 GB 141 GB 192GB GPU Memory Type HBM3 HBM2e H
92、BM3 HBM3e HBM3e GPU Memory Bandwidth 5.3 TB/s 2039 GB/s 3.3 TB/s 4.8 TB/s-Interconnect Infinity Fabric:896 GB/s NVLink:600 GB/s NVLink:900 GB/s NVLink:900 GB/s-TDP 750 W 400 W 700 W 700 W-晶體管數量 1530 億 540 億 800 億 800 億 1780 億 資料來源:英偉達官網、AMD 官網、量子位、快科技、機器之心 Pro、澎湃新聞、芯智訊、IT 之家、科創板日報、tweaktown、每日經濟新聞,國
93、盛證券研究所 同樣,很多對AI芯片需求較高的大廠亦早早開始布局自研芯片,如谷歌TPU、微軟Athena、亞馬遜 Tranium 等。圖表 28:國際巨頭 AI 芯片布局 公司公司 芯片芯片 發布時間發布時間 代際代際 制程制程 設計設計 用途用途 亞馬遜亞馬遜 Trainium 2020 1 5nm 自研 訓練 亞馬遜亞馬遜 Inferentia2 2022 2 5nm 自研 推理 谷歌谷歌 TPU v5 2023 5 5nm/7nm 自研 訓練 谷歌谷歌 Maple 2025(E)1 5nm marvell technology 谷歌谷歌 Cypress 2025(E)1 5nm 自研 微軟
94、微軟 Azure Maia 100 2023 1 5nm 自研 訓練和推理 微軟微軟 Azure Cobalt 100 2023 1 5nm 自研 微軟微軟 Athena 2024(E)1 5nm 自研 訓練和推理 微軟微軟 Cascade 2024(E)1 5nm 自研 特斯拉特斯拉 D1 2021 1 7nm 自研 訓練 Meta MTIA v1 2023 1 7nm 自研 推理 資料來源:The Information reporting、亞馬遜官網、熱點科技、新智元、鈦媒體、半導體行業觀察、芯東西、The Information、機器之心、快科技、澎湃新聞,國盛證券研究所 2024 年
95、 02 月 19 日 P.24 請仔細閱讀本報告末頁聲明請仔細閱讀本報告末頁聲明 其中以谷歌為例,谷歌自 2015 年發布 TPU v1 以來,不斷迭代升級,在 TPU v2 時已經可以支持訓練。其在2021年Q2發布的TPU v4通過光互連實現可重配置和高可拓展性,采用 7nm 工藝,峰值算力達 275TFLOPS,性能大幅提升。根據谷歌發布的論文 TPU v4:An Optically Reconfigurable Supercomputer for Machine Learning with Hardware Support for Embeddings,使用 TPU v4 芯片進行嵌入
96、訓練時,相比于使用 TPU v3 芯片,可以獲得 2.7 倍的性能提升。圖表 29:云服務廠商發力自研芯片:以 Gooogle TPU 為例 TPU v1 TPU v2 TPU v3 TPU v4i TPU v4 發布時間 2015Q2 2017Q3 2018Q4 2020Q1 2021Q2 DNN target 推理 訓練和推理 訓練和推理 推理 訓練和推理 Peak TFLOPS/Chip 92(8b int)46(bf16)123(bf16)138(bf16/8b int)275(bf16/8b int)TDP(Watts)Chip/System 散熱設計功耗(W)75/220 280/
97、460 450/660 175/275-Chip Technology 28nm 16nm 16nm 7nm 7nm 資料來源:Ten Lessons From Three Generations Shaped Googles TPUv4i、作者為 Norman P.Jouppi、Doe Hyun Yoon 等,TPU v4:An Optically Reconfigurable Supercomputer for Machine Learning with Hardware Support for Embeddings、作者為 Norman P.Jouppi、George Kurian等,芯
98、智訊,國盛證券研究所 3.2 英偉達的破局英偉達的破局 我們認為,英偉達對于來自競爭對手的挑戰,亦具備充分的信心、以及做了其充分的準備:軟硬件產品上,公司在硬件產品上持續迭代新品,在軟件架構上持續延續優勢。英偉達望在 2024 年發布 Hopper 架構 H200、還有望提前發布其下一代 GPU Blackwell B100。CUDA 架構開發者和下載量亦在持續提升。上下游生態上,英偉達一方面通過投資參股等方式綁定下游企業的算力需求,一方面通過上百億美金采購承諾協議鎖定上游產能。3.2.1 軟軟硬件硬件產品產品:加速迭代下一代加速迭代下一代硬件硬件產品、產品、CUDA 持續保持優勢持續保持優勢
99、 在硬件方面,英偉達或于 2024 年推出 Hopper 架構 H200、Blackwell 架構 B100。面對AMD Instinct MI300 系列的洶洶來勢,英偉達或提前其 B100 產品的推出和交付以做應對。據英偉達,2024 年推出的 Blackwell 架構 B100 GPU,在 GPT-3 175B 推理性能標竿方面擊敗 A100、H100 及 H200,其 AI 表現性能將是 Hopper 架構 H200 GPU 兩倍以上。2024 年 02 月 19 日 P.25 請仔細閱讀本報告末頁聲明請仔細閱讀本報告末頁聲明 圖表 30:硬件產品:NVIDIA 數據中心產品 pipe
100、line 資料來源:NVIDIA 財報 PPT,國盛證券研究所 在軟件架構方面,AMD 為了更好地兼容 CUDA 平臺,ROCm 復制了 CUDA 的技術棧,支持 HIP(類 CUDA)和 OpenCL 兩種 GPU 編程模型,開發者可以用類似 CUDA 的方式為AMD 的 GPU 產品編程,從而在源代碼層面兼容 CUDA。圖表 31:軟件生態對比:英偉達 vs.AMD Nvidia CUDA AMD ROCm 廠商 英偉達 AMD 推出時間 2006 年 2016 年 編程 CUDA 使英偉達的 GPU 能夠執行使用 C、C+、Fortran、OpenCL、DirectCompute和其他語
101、言編寫的程序。支持 HIP(類 CUDA)和 OpenCL 兩種 GPU 編程模型。其中HIP 的編程語法與 CUDA 相似,開發者可以用類似 CUDA 的方式為 AMD 的 GPU 產品編程,從而在源代碼層面上兼容CUDA。排他性 僅適用于英偉達硬件。ROCm 支持多種加速器廠商和架構,提供了開放的可移植性和互操作性。資料來源:芯世相、快科技、AMD 官網、IT 之家,國盛證券研究所 但在實操角度,英偉達 CUDA 架構具有較明顯的先發優勢。CUDA 架構當前擁有 450 萬開發者,2023 年軟件下載量達 4800 萬次,15000 家創業企業使用 CUDA 架構。網絡效應驅動 CUDA
102、架構受眾持續增加。2024 年 02 月 19 日 P.26 請仔細閱讀本報告末頁聲明請仔細閱讀本報告末頁聲明 圖表 32:NVIDIA 軟件 CUDA 架構優勢 資料來源:NVIDIA 財報 PPT,國盛證券研究所 3.2.2 上下游上下游生態生態:綁定綁定下游下游、鎖定上游、鎖定上游 除了產品端過硬之外,英偉達在需求端對下游企業的生態綁定、在供給端對上游供應商的產能鎖定,也使得英偉達有著更加穩定的上下游關系。下游:大舉下游:大舉投資投資 AI 模型企業模型企業 從 2023 年到 2024 年,英偉達投資了大量大模型及 AI 相關企業。通過投資這些企業,英偉達進一步擴張了 AI 版圖、我們
103、認為有助于其綁定下游潛在需求。2024 年 02 月 19 日 P.27 請仔細閱讀本報告末頁聲明請仔細閱讀本報告末頁聲明 圖表 33:英偉達投資 AI 企業 投資公司投資公司 時間時間 投資方投資方 融資金額融資金額 AI 業務業務 Adept AI 2023 年 3 月 英偉達、微軟等 3.5 億美元 Adept 的旗艦基礎模型 ACT-1 與現有的生成式人工智能工具不同,因為它能夠解釋用戶對軟件工具的高級自然語言請求,并直接為它們執行任務。CoreWeave 2023 年 4 月 英偉達、Friedman、Gross 2.2 億美元 CoreWeave 提供了對云端 Nvidia GPU
104、 的十幾個 SKU的訪問權限,包括H100s、A100s、A40s和RTXA6000s,用于人工智能和機器學習、視覺效果和渲染、批處理和像素流等用例。Cohere 2023 年 5 月 英偉達、甲骨文等 2.7 億美元 Cohere 的生成式 AI 模型主要面向的是企業級客戶,包括全球流媒體平臺、服裝公司以及使用該平臺簡化客戶服務或提高內容審核能力的公司。Runway 2023 年 6 月 谷歌、英偉達 1.41 億美元 Runway 利用計算機圖形學和機器學習方面的最新進展發布了 Gen1 和 Gen2 兩代視頻生成模型,其中Gene1 還需要提供原源頻,而 Gen2 僅需要幾個單詞就能生成
105、短視頻。Inflection AI 2023 年 7 月 英偉達、微軟和谷歌前首席執行官埃里克施密特 13 億美元 Inflection AI 大部分資金將用于增強計算能力,以開發更強大的基礎模型,其最新的 AI 基礎模型名為Inflection-2。新模型的訓練速度更快、成本更低,但仍然可以處理大量運算(1025 FLOP)。AI21 Labs 2023 年 8 月 英偉達、三星、谷歌 1.55 億美元 AI21 Labs為企業提供基于文本的生成人工智能服務,技術包括領先的大型語言模型和神經符號技術。Hugging Face 2023 年 8 月 英偉達、谷歌、亞馬遜、Salesforce,
106、、AMD、英特爾、IBM和高通等 2.35 億美元 Hugging Face 打造了一個平臺,人工智能開發人員可以在其中共享代碼、模型、數據集,并使用該公司的開發工具讓開源人工智能模型更輕松地運行。Imbue 2023 年 9 月 英偉達 2 億美元 與 ChatGPT 這樣的大規模人工智能基礎模型不同,Imbue 瞄準的是 AI 代理:一種可以模擬人類決策來完成復雜任務的計算系統,Imbue 專注與創建專為推理而定制的基礎模型。Twelve Labs 2023 年 10 月 英偉達 970 萬美元 Twelve Labs 開發了能夠理解視頻內容的超大規模人工智能模型 Mistral AI 2
107、023 年 12 月 英偉達、Salesforce等 4.5 億歐元 Mistral AI 專注于聊天機器人和生成人工智能工具的開源軟件。幾個月前在開源 Apache 2.0 許可下發布了 Mistral 7B,這是其第一個大型語言模型(LLM)。Kore.ai 2024 年 1 月 英偉達 1.5 億美元 Kore.ai 集成了英偉達的 GPU 加速卡 Riva,目前提供了一個企業無代碼平臺,幫助各種規模的公司以安全和負責任的方式與人工智能進行業務交互。資料來源:半導體行業觀察、Tech 商業,國盛證券研究所 上游:上游:加強加強對供應商的產能鎖定對供應商的產能鎖定 在 CoWoS 和 HB
108、M 產能稀缺的當前,“得產能者得天下”。英偉達除了此前與供應商建立的良好合作關系之外,亦在持續提升給供應商的采購協議金額。2024 年 02 月 19 日 P.28 請仔細閱讀本報告末頁聲明請仔細閱讀本報告末頁聲明 截至 2024Q3 財季(2023 年 10 月),英偉達給供應商的采購承諾額已達 210 億美金以上。根據我們的測算,其中后續 12 個月以內的采購承諾額在 150 億美金以上。巨額采購協議的簽訂一定程度上幫助英偉達鎖定了相應比例產能。而事實上,英偉達的收入兌現也和其上游采購承諾額呈現正相關采購協議金額越高、說明其需求和產能保證度越高、收入也越高。圖表 34:絕對值:NVIDIA
109、 收入 vs.采購承諾額(后續 12 個月)圖表 35:增速:NVIDIA 收入 vs.采購承諾額(后續 12 個月)資料來源:公司公告,國盛證券研究所 資料來源:公司公告,國盛證券研究所 基于 CoWoS 的產能增長、對英偉達不同產品線的產能分配等假設,按英偉達財年維度(例:FY 2025 財年為 2024 年 1 月至 2025 年 1 月),我們測算:H100 在 2025/2026 財年的出貨量望達 209 萬張/155 萬張。H200 在 2025/2026 財年的出貨量望達 35 萬張/62 萬張。B100 在 2025/2026 財年的出貨量望達 23 萬張/143 萬張。圖表
110、36:CoWoS 產能及分配假設(萬片 12 英寸晶圓)資料來源:臺灣電子時報、中關村在線,國盛證券研究所測算,注:此處為自然季度 -5,000 10,000 15,000 20,0001Q202Q203Q204Q201Q212Q213Q214Q211Q222Q223Q224Q221Q232Q233Q234Q231Q242Q243Q24絕對值比較:公司收入 vs.公司采購承諾額收入:百萬美元采購承諾額:百萬美元-100%0%100%200%300%1Q212Q213Q214Q211Q222Q223Q224Q221Q232Q233Q234Q231Q242Q243Q24增速比較:公司收入 vs.公
111、司采購承諾額增速收入:增速采購承諾額:增速024624Q1e24Q2e24Q3e24Q4e25Q1e25Q2e25Q3e25Q4e其他AMD英偉達 2024 年 02 月 19 日 P.29 請仔細閱讀本報告末頁聲明請仔細閱讀本報告末頁聲明 圖表 37:英偉達 H100、H200、B100 供給量測算 24Q1e 24Q2e 24Q3e 24Q4e 25Q1e 25Q2e 25Q3e 25Q4e 26Q1e 26Q2e 26Q3e 26Q4e 英偉達 CoWoS(萬片 12 英寸晶圓)0.7 0.9 1.3 1.7 1.7 1.7 1.8 1.8 1.8 1.8 1.8 1.8 1)H100
112、H100 CoWoS 占比 50%50%50%50%40%35%30%25%20%20%20%20%每片晶圓可切片數 30 30 30 30 30 30 30 30 30 30 30 30 H100 月供應量(萬張)11 14 20 27 20 18 16 13 11 11 11 11 H100 季供應量(萬張)32 42 59 81 59 54 47 40 32 32 32 32 2)H200 H200 CoWoS 占比 0%10%10%10%10%10%10%10%10%10%10%10%每片晶圓可切片數 30 30 30 30 30 30 30 30 30 30 30 30 H200 月
113、供應量(萬張)0 3 4 5 5 5 5 5 5 5 5 5 H200 季供應量(萬張)0 8 11 15 15 15 16 16 16 16 16 16 3)B100 B100 CoWoS 占比 0%0%7%27%45%47%50%55%55%55%55%55%每片晶圓可切片數 14 14 14 14 14 14 14 14 14 14 14 14 B100 月供應量(萬張)0 0 1 6 10 11 12 14 14 14 14 14 B100 季供應量(萬張)0 0 3.8 19 31 34 37 41 41 41 41 41 資料來源:臺灣電子時報、中關村在線,國盛證券研究所測算,注:
114、此處為自然季度 2024 年 02 月 19 日 P.30 請仔細閱讀本報告末頁聲明請仔細閱讀本報告末頁聲明 4.盈利預測、估值及盈利預測、估值及投資建議投資建議 4.1 財務預測財務預測 1)數據中心業務 根據我們前述對英偉達數據中心 GPU 的需求和供給的假設和測算,我們估算:2025 財年,公司 H100、H200、B100 出貨量或達 209 萬/35 萬/23 萬張。2026 財年,公司 H100、H200、B100 出貨量或達 155 萬/62 萬/143 萬張?;诖?,我們估算英偉達的數據中心業務:2025 財年,數據中心業務收入或達 819 億美金,2026 財年,數據中心業務
115、收入或達 1087 億美金。2)游戲等其他業務 我們預計隨著游戲 GPU 市場復蘇以及英偉達產品的更新迭代,英偉達游戲業務在 2025財年有望實現加速增長。專業可視化、智能駕駛等也有望保持穩健增長。我們估算,公司整體業務的財務表現可達:2025 財年,公司總收入或達 986 億美金,GAAP 口徑凈利可達 483 億美金,non-GAAP 口徑凈利可達 524 億美金。2026 財年,公司總收入或達 1282 億美金,GAAP 口徑凈利可達 563 億美金,non-GAAP 口徑凈利可達 610 億美金。綜上,我們預計 2024-2026 財年公司 GAAP 凈利潤 284/483/563 億
116、美元,同比增長549%/70%/16%。Non-GAAP 凈利潤313/524/610 億美元,同比增長 274%/68%/16%。2024 年 02 月 19 日 P.31 請仔細閱讀本報告末頁聲明請仔細閱讀本報告末頁聲明 圖表 38:英偉達財務預測:年度 百萬美元百萬美元 FY2020 FY2021 FY2022 FY2023 FY2024e FY2025e FY2026e 收入收入 10,918 16,675 26,914 26,974 59,368 98,607 128,150 數據中心 2,983 6,696 10,613 15,005 45,871 81,851 108,747 游
117、戲 5,518 7,759 12,462 9,067 10,601 13,336 15,503 專業可視化 1,212 1,053 2,111 1,544 1,521 1,874 2,114 智能駕駛 700 536 566 903 1,081 1,184 1,344 其他 505 631 1,162 455 294 362 442 成本成本-4,150-6,279-9,439-11,618-16,662-28,495-43,358 毛利毛利 6,768 10,396 17,475 15,356 42,706 70,112 84,792 毛利率毛利率 62%62%65%57%72%71%66%
118、R&D rate 26%24%20%27%15%14%15%S&G rate 10%12%8%9%5%4%4%經營利潤經營利潤 2,846 4,532 10,041 4,224 31,101 52,139 60,697 經營利潤率經營利潤率 26%27%37%16%52%53%47%GAAP 凈利凈利 2,796 4,332 9,752 4,368 28,367 48,347 56,262 GAAP 凈利潤率 26%26%36%16%48%49%44%Non-GAAP 凈利凈利 3,580 6,277 11,259 8,366 31,281 52,411 60,991 Non-GAAP 凈利潤
119、率 33%38%42%31%53%53%48%資料來源:公司公告,國盛證券研究所 2024 年 02 月 19 日 P.32 請仔細閱讀本報告末頁聲明請仔細閱讀本報告末頁聲明 圖表 39:英偉達財務預測:季度 百萬美元百萬美元 FY1Q23 FY2Q23 FY3Q23 FY4Q23 FY1Q24 FY2Q24 FY3Q24 FY4Q24e 收入收入 8,288 6,704 5,931 6,051 7,192 13,507 18,120 20,549 數據中心 3,750 3,806 3,833 3,616 4,284 10,323 14,514 16,750 游戲 3,620 2,042 1,
120、574 1,831 2,240 2,486 2,856 3,019 專業可視化 622 496 200 226 295 379 416 431 智能駕駛 138 220 251 294 296 253 261 271 其他 158 140 73 84 77 66 73 78 成本成本-2,857-3,789-2,754-2,218-2,544-4,045-4,720-5,353 毛利毛利 5,431 2,915 3,177 3,833 4,648 9,462 13,400 15,196 毛利率毛利率 66%43%54%63%65%70%74%74%R&D rate 20%27%33%32%26
121、%15%13%13%S&G rate 7%9%11%10%9%5%4%4%經營利潤經營利潤 1,868 499 601 1,256 2,140 6,800 10,417 11,744 經營利潤率經營利潤率 23%7%10%21%30%50%57%57%GAAP 凈利凈利 1,618 656 680 1,414 2,043 6,188 9,243 10,893 GAAP 凈利潤率 20%10%11%23%28%46%51%53%Non-GAAP 凈利凈利 3,443 1,292 1,456 2,174 2,713 6,740 10,020 11,808 Non-GAAP 凈利潤率 42%19%2
122、5%36%38%50%55%57%資料來源:公司公告,國盛證券研究所 2024 年 02 月 19 日 P.33 請仔細閱讀本報告末頁聲明請仔細閱讀本報告末頁聲明 4.2 估值估值及投資建議及投資建議 英偉達作為全球算力之源,英偉達作為全球算力之源,我們看好我們看好其其數據中心業績的可持續性:數據中心業績的可持續性:需求端:需求端:英偉達數據中心業績的可持續性,來自于 AI 算力需求的可持續性。1)訓練端,更多國家和企業將入場 AI 軍備戰爭,模型的參數數據量也更大。2)推理端,端側 AI 的逐步落地、AI 應用向更多科技和制造領域破圈,均帶來更強的推理算力需求。我們粗略測算:1)訓練端:基于
123、假設,至 2030 年全球累計需要相當于 2000 萬張H100 的等量算力需求。2)推理:基于假設,至 2030 年全球累計需要 1.16 億張相當于 A30 的等量算力需求。英偉達作為全球算力之源,將充分受益。供給端,供給端,英偉達面對競爭亦做了充分的準備:1)軟硬件產品上,公司在硬件產品上持續迭代新品,在軟件架構 CUDA 上持續延續優勢。2)上下游生態上,英偉達一方面通過投資參股等方式綁定下游企業的算力需求,一方面通過上百億美金采購承諾額鎖定上游產能?;?CoWoS 的產能增長、對英偉達不同產品線的產能分配等假設,我們測算:2025/2026 財年,H100 的出貨量望達 209 萬
124、張/155 萬張、H200 望達 35 萬張/62萬張、B100 望達 23 萬張/143 萬張。估值方面,縱向對比,英偉達當前估值處于歷史均值以下。橫向對比,我們選取微軟、Meta、AMD、超威電腦作為可比公司。其中微軟和 Meta 既是英偉達 AI GPU 的重要客戶,同時也在發力自研訓練/推理芯片。AMD、超微電腦分別為 AI 算力芯片、AI 服務器重要標的。橫向對比可比公司,我們認為英偉達作為高增長的全球算力龍頭,有望享受估值溢價。我們預計 2024-2026 財年公司 GAAP 凈利潤 284/483/563 億美元,同比增長549%/70%/16%。Non-GAAP 凈利潤313/
125、524/610 億美元,同比增長 274%/68%/16%??紤]到英偉達凈利潤高速增長,我們認為英偉達合理市值為 20964 億美元、對應股價為840.6 美金,對應 40 x FY2025e P/E(FY 2025 財年為 2024 年 1 月至 2025 年 1 月),首次覆蓋給予“買入”評級。圖表 40:美股重點科技公司估值 股票簡稱股票簡稱 股票代碼股票代碼 收盤價收盤價(美美元)元)市值市值(億美元)(億美元)EPS(美元)(美元)P/E FY2024E FY2025E FY2026E FY2024E FY2025E FY2026E 微軟 MSFT.O 406.3 30191.3 1
126、1.6 13.3 15.6 35.1 30.6 26.0 Meta META.O 460.1 11730.3 19.1 21.9 26.1 24.1 21.0 17.6 AMD AMD.O 171.5 2771.7 3.6 5.4 7.3 47.9 31.8 23.4 超微電腦 SMCI.O 791.5 442.7 21.6 28.2 32.9 36.6 28.0 24.1 資料來源:Bloomberg,國盛證券研究所。注:截止 2024 年 2 月 13 日收盤,EPS 來自 Bloomberg 一致預期 2024 年 02 月 19 日 P.34 請仔細閱讀本報告末頁聲明請仔細閱讀本報告末
127、頁聲明 圖表 41:英偉達 P/E band 資料來源:Wind,國盛證券研究所,注:截止 2024 年 2 月 13 日收盤,P/E 為 Wind 盈利預測 風險提示風險提示 下游下游 AI 應用不及預期應用不及預期。1)AI 硬件需求不及預期。AI 硬件相關行業涉及手機、PC、可穿戴設備、智能音箱、智能車、機器人等,若本身硬件行業如手機、PC 需求復蘇不及預期,或 AI 功能對需求的提振不及預期,或將影響銷售。2)AI 軟件應用落地不及預期。如果大模型最終 B 端、C 端應用落地慢于預期,可能會帶來相關公司基于 AI 的業務優化不及預期。數據中心算力芯片競爭超預期數據中心算力芯片競爭超預期
128、。AI 芯片賽道中,除了種子選手英偉達之外,還有兩類重要的陣營:1)以 AMD 和 Intel 為代表的 GPU 專業級新選手。2)以谷歌 TPU、微軟 Athena等為代表的云廠商自研芯片。若競爭超預期,或將影響英偉達的龍頭地位。AI 行業政策監管超預期行業政策監管超預期。人工智能將對社會和經濟產生深遠影響,國內外均在審議出臺AI 相關監管法規制度。此外地緣政策也會影響 AI 算力的提供。若政策監管超預期,或將一定程度影響公司業務。假設和測算誤差風險假設和測算誤差風險。本文對全球企業在 AI 模型的訓練和推理過程中所需要的算力芯片、CoWos 產能及分配、英偉達 GPU 供給量等測算均基于一
129、系列假設,可能會與現實情況有所偏差,從而使得測算存在誤差。2024 年 02 月 19 日 P.35 請仔細閱讀本報告末頁聲明請仔細閱讀本報告末頁聲明 免責聲明免責聲明 國盛證券有限責任公司(以下簡稱“本公司”)具有中國證監會許可的證券投資咨詢業務資格。本報告僅供本公司的客戶使用。本公司不會因接收人收到本報告而視其為客戶。在任何情況下,本公司不對任何人因使用本報告中的任何內容所引致的任何損失負任何責任。本報告的信息均來源于本公司認為可信的公開資料,但本公司及其研究人員對該等信息的準確性及完整性不作任何保證。本報告中的資料、意見及預測僅反映本公司于發布本報告當日的判斷,可能會隨時調整。在不同時期
130、,本公司可發出與本報告所載資料、意見及推測不一致的報告。本公司不保證本報告所含信息及資料保持在最新狀態,對本報告所含信息可在不發出通知的情形下做出修改,投資者應當自行關注相應的更新或修改。本公司力求報告內容客觀、公正,但本報告所載的資料、工具、意見、信息及推測只提供給客戶作參考之用,不構成任何投資、法律、會計或稅務的最終操作建議,本公司不就報告中的內容對最終操作建議做出任何擔保。本報告中所指的投資及服務可能不適合個別客戶,不構成客戶私人咨詢建議。投資者應當充分考慮自身特定狀況,并完整理解和使用本報告內容,不應視本報告為做出投資決策的唯一因素。投資者應注意,在法律許可的情況下,本公司及其本公司的
131、關聯機構可能會持有本報告中涉及的公司所發行的證券并進行交易,也可能為這些公司正在提供或爭取提供投資銀行、財務顧問和金融產品等各種金融服務。本報告版權歸“國盛證券有限責任公司”所有。未經事先本公司書面授權,任何機構或個人不得對本報告進行任何形式的發布、復制。任何機構或個人如引用、刊發本報告,需注明出處為“國盛證券研究所”,且不得對本報告進行有悖原意的刪節或修改。分析師聲明分析師聲明 本報告署名分析師在此聲明:我們具有中國證券業協會授予的證券投資咨詢執業資格或相當的專業勝任能力,本報告所表述的任何觀點均精準地反映了我們對標的證券和發行人的個人看法,結論不受任何第三方的授意或影響。我們所得報酬的任何
132、部分無論是在過去、現在及將來均不會與本報告中的具體投資建議或觀點有直接或間接聯系。投資評級說明投資評級說明 投資建議的評級標準投資建議的評級標準 評級評級 說明說明 評級標準為報告發布日后的 6 個月內公司股價(或行業指數)相對同期基準指數的相對市場表現。其中 A 股市場以滬深 300 指數為基準;新三板市場以三板成指(針對協議轉讓標的)或三板做市指數(針對做市轉讓標的)為基準;香港市場以摩根士丹利中國指數為基準,美股市場以標普 500 指數或納斯達克綜合指數為基準。股票評級 買入 相對同期基準指數漲幅在 15%以上 增持 相對同期基準指數漲幅在 5%15%之間 持有 相對同期基準指數漲幅在-
133、5%+5%之間 減持 相對同期基準指數跌幅在 5%以上 行業評級 增持 相對同期基準指數漲幅在 10%以上 中性 相對同期基準指數漲幅在-10%+10%之間 減持 相對同期基準指數跌幅在 10%以上 國盛證券研究所國盛證券研究所 北京北京 上海上海 地址:北京市東城區永定門西濱河路 8 號院 7 樓中海地產廣場東塔 7 層 郵編:100077 郵箱: 地址:上海市浦明路 868 號保利 One56 1 號樓 10 層 郵編:200120 電話:021-38124100 郵箱: 南昌南昌 深圳深圳 地址:南昌市紅谷灘新區鳳凰中大道 1115 號北京銀行大廈 郵編:330038 傳真:0791-86281485 郵箱: 地址:深圳市福田區福華三路 100 號鼎和大廈 24 樓 郵編:518033 郵箱: