《英偉達-美股公司研究報告-AI芯片龍頭迎來發展大時代-230409(36頁).pdf》由會員分享,可在線閱讀,更多相關《英偉達-美股公司研究報告-AI芯片龍頭迎來發展大時代-230409(36頁).pdf(36頁珍藏版)》請在三個皮匠報告上搜索。
1、 敬請參閱最后一頁特別聲明 1 公司成立以來經歷數次業務升級,實現由傳統 GPU 供應商到平臺化公司的轉型升級,成就人工智能時代最璀璨的軟硬件一體化 AI解決方案領導者。2023 財年公司實現營收 269.74 億美元,同比+0.2%,實現凈利潤 43.68 億美元,同比-55.2%。與 AI 息息相關的數據中心業務占比達到 56%,成為公司最大營收來源。公司主導公司主導數據中心數據中心訓練與推理訓練與推理市場市場,軟硬件結合軟硬件結合強化平臺化布局。強化平臺化布局。公司的 CUDA 是當下最適合深度學習和 AI 訓練的 GPU 架構,已積累 300 個加速庫和 400 個 AI 模型。硬件形
2、成 CPU+GPU+DPU的協同布局,訓練和推理芯片性能大幅領先競爭對手,AI 服務器GPU 份額達 80%,我們得測算數據中心業務潛在業績彈性最高達36.38 億美元。同時自研數據中心服務器 CPU 搭配公司 GPU,性能較傳統 x86 CPU 提高數倍,在公司 GPU 高份額情況下強化平臺優勢。我們預計 23-25 年數據中心營收同增 15%/25%/25%。受益于高玩家基數和受益于高玩家基數和產品升級周期,游戲業務有望成為現金奶牛。產品升級周期,游戲業務有望成為現金奶牛。22 年公司游戲業務營收大幅下滑主要是虛擬貨幣市場萎靡導致上一代顯卡庫存過高。但游戲業務基本面優異,過高庫存逐漸去化,
3、獨立 GPU 份額超 80%,新一代 40 系列顯卡供不應求,全球用戶超 2 億,我們預計 23-25 年游戲業務營收同增 5%/10%/15%。專業可視化專業可視化打造元宇宙入口,打造元宇宙入口,面向工業領域落地面向工業領域落地 Omniverse。作為元宇宙和數字工業化的入口,Omniverse 成為 AI 生態構建的關鍵環節,其本身豐富的工具、領先的技術疊加沒有競爭對手的先發優勢將持續鞏固公司平臺化優勢。產品導入初期對營收改善有限,我們預計 23-25 年專業可視化業務營收同增-25%/20%/20%。公司前瞻布局公司前瞻布局自動駕駛自動駕駛,業務即將步入收獲期。業務即將步入收獲期。公司
4、自動駕駛業務已導入前 30 大乘用車廠商中的 20 家,前 10 大貨車廠商中的 7家,前 10 大無人駕駛出租車中的 8 家,在手積壓訂單超 110 億美元,我們預計 23-25 年自動駕駛業務營收同增 50%/40%/30%。我們預計公司 2023-2025 年實現營收 296.98 億美元、358.19 億美元、436.79 億美元,凈利潤為 75.79 億美元、101.97 億美元和131.42 億美元,對應 EPS 為 3.07 美元、4.13 美元和 5.32 美元,對應 PE 為 88x、65x 和 53x。我們給予 2023 年 120 倍估值,市值 9095 億美元,目標價
5、368.21 美元,給予公司買入評級。終端需求不如預期;AI 發展不如預期;美國加大對華制裁力度。05,00010,00015,00020,00025,00030,000112.00143.00174.00205.00236.00267.00298.00220411美元(元)成交金額(百萬元)成交金額英偉達 公司深度研究 敬請參閱最后一頁特別聲明 2 內容目錄內容目錄 一、人工智能時代軟硬件一體化的 AI 解決方案領導者.5 1.1 公司持續推動業務轉型升級,擁抱影響未來世界的人工智能.5 1.2 游戲與數據中心雙輪驅動,公司業績持續成長.7 1.3 公司面向萬億美元的可觸達市場,平臺化布局強
6、化公司競爭優勢.11 二、AI 大模型時代,AI 芯片、GPU、DPU、CPU 硬件全面布局.14 2.1 AI 的 iPhone 時刻到來,算力需求大幅拉升.14 2.2 AI 芯片:訓練、推理全面布局,公司產品定義行業發展.17 2.3 GPU:獨立顯卡市場強者恒強,公司龍頭地位穩固.19 2.4 DPU:數據中心第三顆主力芯片,助力數據中心邁入 AI 時代.21 2.5 CPU:面向數據中心定制,自研 CPU+GPU 組合強化平臺化優勢.23 三、完整的軟件生態助力英偉達與客戶合作共贏.24 3.1 CUDA 架構幫助公司率先開拓加速計算&深度學習.25 3.2 Omniverse 疊加
7、其他 AI 平臺,覆蓋多行業助力公司構建完整生態.28 四、盈利預測與投資建議.32 4.1 盈利預測.32 4.2 投資建議及估值.33 五、風險提示.33 圖表目錄圖表目錄 圖表 1:公司提供軟硬件結合一體化解決方案.5 圖表 2:公司從 GPU 芯片供應商逐漸轉型成為軟硬件一體的 AI 龍頭.6 圖表 3:2013-2022 年公司各業務營業收入.7 圖表 4:2013-2022 年公司終端市場業務占比.7 圖表 5:2013-2022 年公司及可比公司營業收入.7 圖表 6:2013-2022 年公司及可比公司營收增速.7 圖表 7:2013-2022 年公司及可比公司毛利率.8 圖表
8、 8:2022 年公司營收結構.8 圖表 9:14Q1-22Q4 公司數據中心業務營收.9 圖表 10:公司 CPU+GPU+DPU 三芯路線圖.9 圖表 11:14Q1-22Q4 公司游戲業務營收.10 圖表 12:公司光線追蹤技術示意圖.10 圖表 13:公司 DLSS 技術示意圖.10 圖表 14:14Q1-22Q4 公司自動駕駛業務營收.11 AUdYkZlXeYlWsXsXqZ6McMbRnPmMmOpMeRoOtPlOqRpO6MmNoOMYtPrPwMqMmR公司深度研究 敬請參閱最后一頁特別聲明 3 圖表 15:歷年公司自動駕駛業務積壓訂單金額.11 圖表 16:14Q1-22
9、Q4 公司專業可視化業務營收.11 圖表 17:英偉達平臺化解決方案.12 圖表 18:公司測算遠期可觸達市場規模達到 1 萬億美元.13 圖表 19:測算 2026 年數據中心 GPU 市場有望達 224 億美元.13 圖表 20:公司數據中心業務潛在業績彈性(億美元).14 圖表 21:ChatGPT 成為歷史上最快突破 1 億活躍用戶的應用程序.14 圖表 22:AI 人工智能不同落地場景.15 圖表 23:公司量子計算平臺.15 圖表 24:公司量子加速平臺.15 圖表 25:計算光刻示意圖.16 圖表 26:ASML 光刻機結構示意圖.16 圖表 27:公司 Omniverse 示意
10、圖.16 圖表 28:訓練與推理 AI 芯片對比.17 圖表 29:CPU、GPU、FPGA、ASIC 特點對比.18 圖表 30:2022 年全球企業級 GPU 市占率.18 圖表 31:2022 年中國 AI 芯片市占率.18 圖表 32:主流 AI 訓練芯片性能對比.19 圖表 33:主流 AI 推理芯片性能對比.19 圖表 34:獨立 GPU 與集成 GPU 對比.20 圖表 35:全球獨立顯卡市占率變化情況.20 圖表 36:第四代 Tensor Core 結構示意圖.21 圖表 37:主流電子游戲開啟 DLSS 帶來巨大性能提升.21 圖表 38:2023 年 3 月市場高端顯卡性
11、能對比圖.21 圖表 39:DPU 功能集示意圖.22 圖表 40:全球 DPU 市場規模預測.22 圖表 41:DPU 不同路線對比.22 圖表 42:主流 DPU 性能對比.23 圖表 43:公司 Grace Hopper 超級芯片結構示意圖.23 圖表 44:采用 NVLink Switch 技術的 Grace Hopper 與傳統 x86 CPU+Hopper GPU 對比.24 圖表 45:采用 NVLink Switch 技術的公司 Grace Hopper 與傳統 x86 CPU+Hopper 架構 GPU 運算速度對比.24 圖表 46:全球獨立 GPU 季度出貨量(百萬).2
12、5 圖表 47:全球獨立服務器 GPU 季度出貨量(百萬).25 圖表 48:CPU 與 GPU 架構.25 公司深度研究 敬請參閱最后一頁特別聲明 4 圖表 49:公司 CUDA-X AI 結構.26 圖表 50:除 Omniverse 外英偉達軟硬件生態結構.27 圖表 51:Omniverse 軟硬件框架.29 圖表 52:Omniverse 架構.30 圖表 53:公司分業務營收及毛利率預測.33 圖表 54:可比公司估值比較(市盈率法).33 公司深度研究 敬請參閱最后一頁特別聲明 5 AI 1.1 公司持續推動業務轉型升級,擁抱影響未來世界的人工智能公司持續推動業務轉型升級,擁抱影
13、響未來世界的人工智能 近四十年來,摩爾定律一直是推動芯片行業發展的核心驅動力。隨著摩爾定律接近極限,在成本和功耗的雙重制約下,指數級的性能增長逐漸放緩。而 AI 和加速計算則成為算力需求激增、數據中心功耗暴漲背景下延續摩爾定律,實現可持續發展、數字化以及卓越性能的最佳工具。近日崛起的 ChatGPT 和 AIGC 正在推動企業重塑產品以及商業模型,重構企業核心競爭力。公司開創了加速計算的先河,首先提出 AI+云計算概念,用以幫助解決傳統計算機無法解決的重大挑戰,并逐漸成長為全球人工智能的領導者。公司的平臺已安裝在數億臺計算機中,也用于各類云服務以及服務器廠商,為 TOP500 超級計算機中的
14、361 臺提供支持,在整個生態中擁有超過 350 萬開發者。以終端應用場景區分,目前公司的主營業務包括數據中心、游戲、專業可視化、自動駕駛、OEM/其他。近年來,公司持續以 CUDA 為核心構建生態與技術的護城河,將硬件、軟件、系統、算法、庫以及終端應用進行一體化整合。通過整合底層 GPU+DPU+CPU 三大硬件,建立統一的底層硬件架構,使得從云端到終端不同的硬件平臺,都支持統一的 CUDA 軟件平臺。而基于CUDA軟件平臺的可編程特性,使內部或第三方開發者可以不斷開發并完善CUDA的軟件堆棧,使得 CUDA 生態不斷形成正向循環,同時公司在各細分垂直領域落地全套解決方案,建立起獨特的生態與
15、技術壁壘。圖表圖表1:公司提供軟硬件結合一體化解決方案公司提供軟硬件結合一體化解決方案 來源:英偉達,國金證券研究所 公司深度研究 敬請參閱最后一頁特別聲明 6 起步探索階段(起步探索階段(1993-1998):):1993 年公司在硅谷成立并進軍圖形芯片業務,公司成立初期市場已有 20 多家圖形芯片公司,外部競爭環境十分激烈。1995 年公司推出其首款產品 NV1,但由于性能和通用性缺乏競爭力,投入市場后銷量不佳,公司一度處于破產邊緣。1997 年公司推出全球首款 128 位 3D 處理器 NV3(即 RIVA 128),它迅速獲得了原始設備制造商的認可,并在前四個月內出貨量突破100萬臺。
16、公司依靠該系列中的Riva 128zx、Riva TNT、Riva TNT2 三大產品逐漸走向顯卡芯片市場的主流地位。1998 年公司與臺積電簽約建立合作伙伴關系,將其顯卡交由臺積電代工生產,開啟強強聯合之路后公司與臺積電連續幾年保持 70%年復合增長率,創造了業界奇跡??焖俪砷L階段(快速成長階段(1999-2005):):1999 年 1 月,公司在納斯達克上升,首日交易后價值 5900萬美元。同年 8 月,公司推出了全新架構的顯示芯片,也是全球第一個真正意義上的 GPU芯片 GeForce 256,GPU 由此獨立于 CPU 成為獨立的計算單元。公司還推出用于專業圖形的 Quadro 25
17、6,很快成為專業人士從事各種領域設計時遵循的標準。當年公司實現出貨量 1000 萬臺,并由此步入快速成長階段。2000 年,公司收購圖像技術先驅 3dfx,此后公司始終保持視覺計算領域霸主地位。到 2002 年公司宣布實現 GPU 出貨量累計高達 1 億顆,成為硅谷成長最快的半導體公司,收入達到 10 億美元。轉型升級階段(轉型升級階段(2006-2015):):2006 年公司推出通用 GPU 計算的革命性架構 CUDA,運用 GPU 并行處理能力來應對最復雜的計算挑戰。2007 年公司在圖形市場取得了突飛猛進的增長,Tesla GPU 的問世標志著公司正式步入超級計算領域。隨后一年,公司緊
18、接著推出了 Tegra 移動處理器,其功耗比普通 PC 筆記本電腦低 30 倍。經過 20 多年的發展,公司逐漸形成 GeForce、Quadro、Tesla、Tegra 幾大產品線,其中 GeForce 用于 PC 和筆記本,Quadro 主要用于工作站,Tesla 主要用于大型計算,Tegra 則用于移動產品。2015年其推出的 Tegra X1、DRIVE 高級駕駛輔助系統、GeForce GTX TITAN X 等使公司擴展至人工智能、自動駕駛等新興領域,應用領域持續轉型升級。飛速發展階段(飛速發展階段(2016-至今):至今):從 2016 年開始,隨著人工智能技術興起,公司 GPU
19、 開始在深度學習領域被廣泛應用。得益于深度學習的技術開發,將人工智能推到了一個新的高潮。2018 年,公司發布了加入光線追蹤技術的圖靈(Turing)架構,再一次重新定義了計算圖形,成為全球第一個支持實時光線追蹤的 GPU。近年來隨著 AI 算力持續革新,公司在 GTC 2019 大會上推出多項創新應用領域,廣泛覆蓋人工智能、高性能計算、機器人、自動駕駛、醫療健康、專業化視覺等眾多領域。圖表圖表2:公司從公司從GPU芯片供應商逐漸轉型成為軟硬件一體的芯片供應商逐漸轉型成為軟硬件一體的AI龍頭龍頭 來源:公司官網,國金證券研究所 公司深度研究 敬請參閱最后一頁特別聲明 7 1.2 游戲與數據中心
20、雙輪驅動,游戲與數據中心雙輪驅動,公司業績持續成長公司業績持續成長 公司營收結構持續改善,更具成長潛力的數據中心業務成為最大營收來源。公司營收從2013 年的 41 億美元成長到 2022 年的 269.74 億美元,年復合增速為 23.2%。凈利潤從2013 年的 4.4 億美元成長到 2022 年的 43.68 億美元。其中數據中心、游戲、專業可視化、自動駕駛、OED 及其他在 2022 年分別實現營收 150.05(56%)、90.67(34%)、15.44(6%)、9.03(3%)、4.55(2%)億美元,分別同比+41%、-27%、-27%、60%、-61%。圖表圖表3:2013-2
21、022年年公司公司各業務營業收入各業務營業收入 圖表圖表4:2013-2022年年公司公司終端市場業務占比終端市場業務占比 來源:Capital IQ,國金證券研究所 來源:Capital IQ,國金證券研究所 2022 年公司游戲業務的下滑拖累整體營收增速,但 2013-2022 年營收的復合增速優于可比公司。英特爾憑借著一直以來在 CPU 領域的領先地位,營收早早超過了 500 億美元,但近年來伴隨著 CPU 的市場份額被 AMD 不斷蠶食,英特爾營收增長出現乏力。而 2022年更是受到終端消費萎靡的影響,營業收入同比減少 20%。公司憑借持續地研發創新投入,開創性的將 GPU 的應用場景
22、從游戲和圖像渲染拓展到人工智能、自動駕駛以及其他領域,隨著數以千計的企業和用戶使用 GPU 驅動的深度學習,營業收入也是呈現高速增長的態勢,2013-2022 年大部分時間的營收增速都要優于可比公司。圖表圖表5:2013-2022年年公司及可比公司公司及可比公司營業收入營業收入 圖表圖表6:2013-2022年公司及可比公司營收增速年公司及可比公司營收增速 來源:Capital IQ,國金證券研究所 來源:Capital IQ,國金證券研究所 公司毛利率領先可比公司,2023 財年見底后有望逐季改善。從毛利率來看,公司近年來毛利率穩定小幅成長,從 2013 年的 54.9%一路成長到 2021
23、 年的階段高點 64.9%,2022年受到 PC 需求衰退以及全球經濟下滑的影響,全年毛利率下滑到 56.9%,四個季度的毛利率分別為 65.5%、43.5%、53.6%、63.3%,最低點出現在 2023 財年第二季度。但隨著 H100 與 RTX40 系列等高端產品的推出,也帶動公司毛利率逐季改善,公司展望 2024財年第一季度公司毛利率將落在 63.6%-64.6%。由于個人電腦市場的持續萎縮,英特爾的毛利率逐年下滑,從 2013 年 59.8%下滑到 2022 年 42.6%,而英特爾預計 2023 年第一季度將繼續虧損。而近年來 AMD 的處理器在性能上也不斷追趕甚至超越英特爾的產品
24、,使得 AMD 在處理器市場的份額逐年提升,也帶動 AMD 公司毛利率自 2016 年以來逐年改善,2022 年全年毛利率為 51.1%。0501001502002503002013 2014 2015 2016 2017 2018 2019 2020 2021 2022數據中心(億美元)游戲專業可視化OEM&IP自動駕駛-100%-50%0%50%100%150%200%2013 2014 2015 2016 2017 2018 2019 2020 2021 2022數據中心YoY游戲YoY專業可視化YoYOEM&IP YoY自動駕駛YoY01002003004005006007008009
25、002013 2014 2015 2016 2017 2018 2019 2020 2021 2022英偉達(億美元)AMD英特爾-40%-20%0%20%40%60%80%2013 2014 2015 2016 2017 2018 2019 2020 2021 2022英偉達AMD英特爾公司深度研究 敬請參閱最后一頁特別聲明 8 圖表圖表7:2013-2022年公司及可比公司毛利率年公司及可比公司毛利率 來源:Capital IQ,國金證券研究所 公司目前四大主營業務分別為數據中心、游戲、專業可視化以及自動駕駛。2023 財年公司實現營收 269.74 億美元,其中數據中心業務占比 56%,
26、包括 DGX/HGX/EGX/IGX 系統以及 GPU/CPU/DPU/Networking 硬件等。游戲業務占比 33%,包括用于游戲的 GPU顯卡以及用于云游戲的 GeForce NOW 產品。專業可視化業務占比 6%,包括 Quadro 和Omniverse 產品。自動駕駛占比 3%,包括 DRIVE Hyperion、DRIVE AGX 以及 DRIVE AV&IX產品。圖表圖表8:2022年公司年公司營收結構營收結構 來源:英偉達、國金證券研究所 主營業務一:主營業務一:數據中心業務有望成為增長核心驅動力,過去 5 年營收 CAGR 達 51%。公司數據中心業務專注于加速超大規模、云
27、服務、企業、公共部門和邊緣數據中心的計算密集型工作負載,例如人工智能、數據分析、圖形和科學計算等,并基于 GPU、DPU 和CPU 三種新一代架構構建的加速計算平臺,圍繞 CUDA 提供各類庫和軟件開發工具,公司正在不斷重塑 AI 時代的數據中心。0%10%20%30%40%50%60%70%2013201420152016201720182019202020212022英偉達AMD英特爾公司深度研究 敬請參閱最后一頁特別聲明 9 圖表圖表9:14Q1-22Q4公司數據中心業務營收公司數據中心業務營收 來源:Bloomberg,國金證券研究所 公司在數據中心市場逐漸完成 CPU+GPU+DPU
28、 三芯的硬件布局。2021 年 GTC 大會上,公司公布了數據中心芯片的路線圖,包括 CPU、GPU 和 DPU 這三類硬件,每種芯片都將以兩年為周期進行迭代。同時公司發布專為數據中心設計,基于 ARM 架構的 Grace CPU,采用臺積電 4N 工藝制造,72 核 ARM v9 指令集架構,并自研 CPU 核心。2022年 GTC 大會上,公司推出全新一代 Hopper 架構的 H100 GPU,采用臺積電 4N 工藝,擁有 800 億個晶體管,各類算力指標都是上一代產品 A100 的 3-6 倍。2023 年 GTC 大會上,公司公布了 Grace CPU 的部分測試數據,相較于現有數據
29、中心使用的 x86 CPU,運行微服務的速度快 2.3 倍,內存密集型數據處理性能快 2 倍,在多個技術計算應用上運行流體力學計算工作時速度快 1.9 倍,Grace CPU 有望在 2023 年下半年量產。而基于 CPU和 GPU 的硬件布局,公司更推出了將兩顆 Grace CPU 在同一款 PCB 上互聯的 Grace Superchip,以及將Grace CPU和 Hopper CPU封裝在一起的Grace Hopper Superchip。圖表圖表10:公司公司CPU+GPU+DPU三芯路線圖三芯路線圖 來源:Forbes,國金證券研究所 主營業務二:主營業務二:游戲業務成長性有限,但
30、有望成為長期現金牛業務,過去五年營收 CAGR僅 10%。過去十幾年間,游戲是最大的娛樂產業,PC 端成為最主要的游戲平臺,3A 游戲、電子競技、社交連接以及游戲流媒體的興起都在不斷推動游戲業務的增長。公司在游戲業務上提供面向 PC 和筆記本電腦的 GeForce RTX 和 GeForce GTX 顯卡、用于在硬件性能不足的設備上玩 PC 游戲的 GeForce NOW 云游戲、用于在電視上播放高質量流媒-50%0%50%100%150%200%250%0510152025303540451Q143Q141Q153Q151Q163Q161Q173Q171Q183Q181Q193Q191Q20
31、3Q201Q213Q211Q223Q22數據中心(億美元)YoYQoQ公司深度研究 敬請參閱最后一頁特別聲明 10 體的 SHIELD,以及用于游戲機的平臺和開發服務。目前公司在 GPU 領域的市占率超過80%,全球超過 2 億游戲玩家使用公司的 GeForce 系列顯卡。圖表圖表11:14Q1-22Q4公司游戲業務營收公司游戲業務營收 來源:Bloomberg,國金證券研究所 公司的光追、DLSS 等技術引領游戲行業發展,同步發力云游戲業務。光線追蹤長期以來一直用于電影行業的特效,是一種計算密集型技術,該技術通過模擬光線的物理行為,甚至可以將電影級實時渲染應用于對圖像要求極為嚴格的游戲中。公
32、司的 RTX產品采用光線追蹤技術,在游戲中實現電影級質量的實時渲染,以此提高用戶的游戲體驗。而人工智能也正在引發一場游戲革命,DLSS 技術將人工智能引入到游戲內的物理/動畫模擬、實時渲染和 AI 增強的直播功能。借助 DLSS 技術,公司基于 AI 的超高分辨率重新定義實時渲染,即渲染更少的像素,然后使用 AI 構建更清晰、更高分辨率的圖像。圖表圖表12:公司公司光線追蹤技術示意圖光線追蹤技術示意圖 圖表圖表13:公司公司DLSS技術示意圖技術示意圖 來源:英偉達,國金證券研究所 來源:英偉達,國金證券研究所 主營業務三:前瞻布局自動駕駛業務,即將迎來收獲期,過去五年營收 CAGR 達 10
33、%。公司正在以 DRIVE 品牌為自動駕駛市場提供完整的端到端解決方案,使得客戶可以基于公司平臺快速高效地開發自動駕駛產品。解決方案包括軟件和硬件部分,硬件端提供 Drive Orin SoC 和預計 2025 年量產的 Drive Thor SoC 兩種高算力自動駕駛芯片。軟件端,包括基于DRIVE AV完整軟件棧來實現自動駕駛、地圖繪制和停車服務的DRIVE Chauffeur;基于智能車載體驗 DRIVE IX 軟件的 Drive Concierge 和用于實時對話 AI 功能的Omniverse Avatar。目前公司自動駕駛業務未來 5 年在手訂單超 110 億美元,公司產品已覆蓋前
34、 30 大乘用車廠商中的 20 家,前 10 大貨車廠商中的 7 家,前 10 大無人駕駛出租車中的 8 家。我們看好公司自動駕駛業務即將步入收獲期,有望成為下一個十億美元的營收板塊。-60%-40%-20%0%20%40%60%80%100%120%05101520253035401Q143Q141Q153Q151Q163Q161Q173Q171Q183Q181Q193Q191Q203Q201Q213Q211Q223Q22游戲(億美元)YoYQoQ公司深度研究 敬請參閱最后一頁特別聲明 11 圖表圖表14:14Q1-22Q4公司自動駕駛業務營收公司自動駕駛業務營收 圖表圖表15:歷年公司自動
35、駕駛業務積壓訂單金額歷年公司自動駕駛業務積壓訂單金額 時間 自動駕駛業務積壓訂單金額 2020 年 數十億美元 2021 年 超過 80 億美元 2022 年 超過 110 億美元 來源:Bloomberg,國金證券研究所 來源:英偉達,國金證券研究所 主營業務四:專業可視化領域領導者,持續推動全行業的創新發展,過去五年營收 CAGR達 11%。從桌面到數據中心再到云端,公司始終與獨立軟件供應商(ISV)密切合作來為專業可視化市場服務,優化 ISV 為公司 GPU 配套的產品,并為計算機輔助設計、建筑設計、消費品制造、醫療儀器和航空航天等設計與制造環節,以及專業視頻編輯、后期制作、電影特效和廣
36、播電視等數字內容創作環節提供更具生產力的 GPU 解決方案。公司目前占據了 90%以上的圖形工作站市場份額,4500 萬藝術家、建筑師和產品設計師正在利用公司的產品來處理具有挑戰性的工作流,并突破創造力的極限。圖表圖表16:14Q1-22Q4公司專業可視化業務營收公司專業可視化業務營收 來源:Bloomberg,國金證券研究所 1.3 公司面向公司面向萬億美元的可觸達市場萬億美元的可觸達市場,平臺化布局強化公司競爭優勢平臺化布局強化公司競爭優勢 人工智能正在成為這個時代最具影響力的技術力量,我們認為人工智能(包括芯片,模組,系統,算法,終端應用)未來將成為整合電子,通信,軟件及云/邊緣運算/設
37、備電子端后成為各種提升應用效能的人工智能工具平臺,各類 AI+應用即將落地,像 ChatGPT 對話機器人,以及特斯拉即將自動駕駛中引入AI學習框架,傳統應用在引入AI后將迎來巨變。公司在完成由 GPU 顯卡供應商向軟硬件一體 AI 解決方案供應商的轉變后,形成了競爭對手難以企及的平臺化優勢。公司公司相對于競爭對手的相對于競爭對手的優勢在于:優勢在于:1)硬件端產品布局齊全且性能突出,公司在數據中心業務中完成 CPU+DPU+GPU的組合布局。數據中心 GPU 市占率遙遙領先,H100、A100 等高端訓練卡供不應求,且性能大幅度領先競爭對手 AMD 的同代產品,而英特爾仍處于起步階段。CPU
38、 端則是針對數據中心自研 Grace CPU,侵蝕競爭對手英特爾最大的主營業務。公司在 GPU 高市占率的背景下,Grace CPU 搭配公司 GPU 使用相較傳統 x86 CPU 搭配公司 GPU 有數倍的性能提升,使得公司 CPU 在數據中心的滲透率有望迅速提升。2)軟件端前瞻布局,競爭對手稀少。CUDA 平臺是目前最適合深度學習、AI 訓練的GPU 架構。在 2007 年推出后不斷改善更新,衍生出各種工具包、軟件環境,構筑了完整的生態,并與眾多客戶合作構建細分領域加速庫與 AI 訓練模型,已經積累 300 個加速庫和 400 個 AI 模型。而競爭對手 AMD 的 ROCm 平臺在用戶生
39、態和性能優化上還存在差-100%-50%0%50%100%150%0.00.51.01.52.02.53.03.51Q143Q141Q153Q151Q163Q161Q173Q171Q183Q181Q193Q191Q203Q201Q213Q211Q223Q22自動駕駛(億美元)YoYQoQ-100%-50%0%50%100%150%200%012345671Q143Q141Q153Q151Q163Q161Q173Q171Q183Q181Q193Q191Q203Q201Q213Q211Q223Q22專業可視化(億美元)YoYQoQ公司深度研究 敬請參閱最后一頁特別聲明 12 距。面向元宇宙的 Om
40、niverse 則是一個不斷完善自身、不斷擴充用戶群體的 AI 平臺,其本身豐富的工具、領先的技術疊加沒有競爭對手的先發優勢將持續鞏固公司在元宇宙以及數字工業領域的優勢。公司公司未來的發展機會未來的發展機會在于:在于:軟硬件結合的平臺化布局,以及不同領域快速落地垂直解決方案的能力。公司以 CPU、GPU、DPU 等芯片硬件為基礎,構建 DGX、HGX、EGX等硬件系統。從云端到終端不同的硬件平臺,都支持統一的 CUDA、CUDA-X 等軟件架構。然后基于硬件系統和軟件架構形成 HPC、AI、Ominiverse 等應用平臺,最終落地到設計、金融、游戲、倉儲、醫療、高等教育、數據中心、交通運輸、
41、公共領域等行業,隨著未來AI 應用范圍的深入和拓展,公司將成為平臺化布局的最大受益者。圖表圖表17:英偉達平臺化解決方案英偉達平臺化解決方案 來源:英特爾,國金證券研究所 公司正瞄準萬億美元的市場加緊布局全棧解決方案。根據公司的測算,公司遠期可觸達市場(TAM)高達 1 萬億美元,其中全球范圍內擁有 30 億游戲玩家和創作者,其中 25%的人每年會花費超過 100 美金在購買 PC、筆記本、云游戲以及游戲機中的 GPU,從而給公司游戲業務帶來 1000 億美元的可觸達市場。全球范圍內每年 5000 萬臺企業服務器的軟件訂閱,帶動公司人工智能企業軟件 1500 億美元的可觸達市場。全球范圍內超過
42、4500萬的設計師與創作者,以及衍生的訂閱服務,帶來 Omniverse 企業軟件 1500 億美元的可觸達市場。未來每年 2000 萬臺服務器的增量,會帶來 GPU、CPU、DPU、NIC、交換機等硬件與系統 3000 億美元的可觸達市場。全球范圍內每年為 1 億輛汽車提供各類硬件以及為數百萬輛汽車提供軟件方案,將為公司自動駕駛業務帶來3000 億美元的可觸達市場。公司深度研究 敬請參閱最后一頁特別聲明 13 圖表圖表18:公司測算遠期可觸達市場規模達到公司測算遠期可觸達市場規模達到1萬億美元萬億美元 來源:英偉達,國金證券研究所 我們測算 2026 年數據中心 GPU 市場規模將達到 22
43、4 億美元,公司作為數據中心 GPU的龍頭有望持續受益。隨著 ChatGPT 引爆新一輪人工智能應用的熱情,我們看好人工智能將成為未來無所不在的工具,海內外數據中心、云業務廠商紛紛開始推動 AI 基礎設施建設,AI 服務器出貨量在全部服務器中的占比逐漸提高。根據 TrendForce 的數據,2022年搭載GPGPU的AI服務器年出貨量占全部服務器的比重接近1%,2023年在ChatGPT等人工智能應用加持下,AI 服務器出貨量有望同比增長 8%,20222026 年出貨量 CAGR有望達 10.8%,以 AI 服務器用 GPU,主要以公司 H100、A100、A800(主要出貨中國)以及 A
44、MD MI250、MI250X 系列為主,而公司與 AMD 的占比約 8:2。我們測算 2026年全球數據中心 GPU 市場規模有望達 224 億美元,22-26 年 CAGR 達 54%,基于以下假設:1)IDC 預測 2026 年全球服務器出貨量 1877 萬臺;2)AI 服務器的占比逐年提升1%;3)AI 服務器中 GPU 的搭載數量逐年提升 0.5 個;4)隨著 GPU 產品迭代,GPU單價逐年提升 2000 美元。圖表圖表19:測算測算2026年數據中心年數據中心GPU市場有望達市場有望達224億美元億美元 2022 2023E 2024E 2025E 2026E 全球服務器出貨量(
45、千)14,945 14,934 16,255 17,626 18,768 YoY 10.4%-0.1%8.8%8.4%6.5%全球 AI服務器占比 0.9%1.0%1.1%1.2%1.3%全球 AI服務器出貨量(千)135 149 179 212 244 AI服務器中 GPU 數量 2 2.5 3 3.5 4 GPU 單價(美元)15000 17000 19000 21000 23000 數據中心 GPU 市場規模(億美元)40 63 102 155 224 來源:IDC,TrendForce,國金證券研究所 我們認為公司數據中心未來的業績彈性取決于全球大模型競賽激烈程度(大模型保有量)以及
46、AI 公司可接受的訓練時長。根據公司和其他機構的聯合研究Efficient Large-Scale Language Model Training on GPU Clusters Using Megatron-LM中提到,單個大模型的訓練速度可以由以下公式大致推得:8 其中 T 為模型 tokens(超參數),P 為模型參數,X為單 GPU 算力,n 為 GPU 數量。因此基于以上函數,我們可以依照全球大模型保有量以及模型訓練天數這兩個變量,推斷出不同參數下所需要的 GPU 數量,由此推斷出給公司帶來的業績彈性。在測算中,我們使用基于 GPT-3 大模型的一些參數,P=175bn,T=300b
47、n,X為 140 teraFLOP/s,GPU 單價為 15000 美元,其余參數和測算結果請見下表。公司深度研究 敬請參閱最后一頁特別聲明 14 圖表圖表20:公司公司數據中心業務潛在業績彈性數據中心業務潛在業績彈性(億美元)(億美元)訓練天數訓練天數 20 30 40 50 60 70 180 0.58 0.87 1.15 1.44 1.73 2.02 150 0.69 1.04 1.39 1.73 2.08 2.43 120 0.87 1.30 1.73 2.17 2.60 3.03 90 1.15 1.73 2.31 2.89 3.46 4.04 60 1.73 2.60 3.46 4
48、.33 5.20 6.06 30 3.46 5.20 6.93 8.66 10.39 12.13 20 5.20 7.79 10.39 12.99 15.59 18.19 10 10.39 15.59 20.79 25.98 31.18 36.38 來源:英偉達、OpenAI、國金證券研究所 AIAIGPUDPUCPU 2.1 AI 的的 iPhone 時刻到來,算力需求大幅拉升時刻到來,算力需求大幅拉升 ChatGPT 是由 OpenAI 于 2022 年 11 月推出的人工智能聊天機器人,該程序使用基于GPT-3.5 架構的大型語言模型,并通過人類反饋的監督學習和強化學習進行訓練。Chat
49、GPT 通過問答形式與用戶完成交互,可以完成自動生成文本、自動問答、自動摘要等多種任務。ChatGPT 因其能提供類似人類的響應,迅速成為近期發展最快和關注度最高的應用之一,上線 5 天用戶突破百萬,上線兩個月活躍用戶突破 1 億,使其成為歷史上用戶增長最快的應用程序,它的爆火出圈使得人工智能賽道迅速升溫。圖表圖表21:ChatGPT成為歷史上最快突破成為歷史上最快突破1億活躍用戶的應用程序億活躍用戶的應用程序 來源:CNBC,國金證券研究所 人工智能正在由云端走向終端應用場景。2023 年 3 月 21 日,在公司的 2023 年 GTC 大會上,公司宣布“AI 的 iPhone 即將到來”
50、,并發布了與多個行業重要客戶的合作成果,包括量子計算、計算光刻、數字孿生等,并且推出了新一代的超級計算機 NVIDIA DGX AI,集成 8 個 H100 GPU 模組,大幅提升了單機算力;同時推出 DGX Cloud 云服務,使得各行業企業都可以通過簡單的網絡瀏覽器訪問 AI 超算集群,大幅降低了部署本地算力基礎大模型數量大模型數量 公司深度研究 敬請參閱最后一頁特別聲明 15 設施的復雜性。圖表圖表22:AI人工智能不同落地場景人工智能不同落地場景 來源:英偉達,國金證券研究所 NIDIA DGX Quantum 是全球首個 GPU 加速量子系統,將全球最強大的加速計算平臺(NVIDIA
51、 Grace Hopper 超級芯片與 CUDA Quantum 開源模型實現)疊加全球最先進的量子控制平臺 OPX(由以色列公司 Quantum Machines 開發)相結合,可為高性能和低延遲量子經典計算的研究人員提供革命性的新架構,實現了GPU和量子處理單元(QPU)之間亞微秒級延遲。CUDA Quantum 是全球首個使用經典計算機編辦語言 C+和 Python所構建的量子算法平臺,有助于在量子計算機和經典計算機上運行算法。在 2023GTC 大會上,公司認為短期內量子計算仍然處于研究階段,而非量產階段,但是借助公司 DGX Quantum,研究人員有望為量子計算的未來開發混合應用程
52、序和關鍵算法。圖表圖表23:公司公司量子計算平臺量子計算平臺 圖表圖表24:公司公司量子加速平臺量子加速平臺 來源:英偉達,國金證券研究所 來源:英偉達,國金證券研究所 在計算光刻領域,公司推出了突破性的光刻計算庫 cuLitho,將計算光刻加速 40 倍以上。計算光刻是提高光刻分辨率、推動芯片制造達到尖端工藝的關鍵手段。作為芯片制造過程中最復雜、昂貴、關鍵的環節之一,光刻成本約占硅片加工成本的 1/3 以上。配合光刻計算 EDA 工具使用,其可以幫助晶圓廠縮短原型周期時間、提高產量,為 2nm 及以上先進工藝奠定基礎,并使得曲線掩模、High NA EUV、亞原子級光刻膠模型等新技術節點所需
53、公司深度研究 敬請參閱最后一頁特別聲明 16 的新型解決方案和創新技術成為可能。目前計算光刻仍然使用 CPU 進行,每年需要消耗數百億 CPU 小時,而晶圓廠的大型數據中心因此需要 24*7 全天候運行,以便創建用于光刻系統的掩膜板。這些數據中心是芯片制造商每年投資近2000億美元資本支出的一部分。公司H100 GPU需要89塊掩膜板,在 CPU 上運行時處理單個掩膜板需要兩周時間,而在 GPU 上運行 cuLitho 只需 8 小時。通過這項應用,臺積電可以把 4 萬個用來驅動計算光刻的 CPU 服務器,換成 500 套 DGX H100,能耗將從 35 兆瓦降至 5 兆瓦。此外,使用 cu
54、Litho 的晶圓廠,每天可以生產 3-5倍多的光掩膜,僅使用當前配置電力的 1/9。圖表圖表25:計算光刻示意圖計算光刻示意圖 圖表圖表26:ASML光刻機結構示意圖光刻機結構示意圖 來源:英偉達,國金證券研究所 來源:英偉達,國金證券研究所 公司推出了第三代 OVX計算系統和新一代工作站,為基于 NVIDIA Omniverse Enterprise的大規模數字孿生提供動力。第三代 OVX服務器通過組合雙 CPU 平臺、BlueField-3 DPU、L40 GPU、兩個 ConnectX-7 SmartNIC 和 NVIDIA Spectrum 以太網平臺,提供了突破性的圖形和 AI 性
55、能,可加速大規模數字孿生模擬等應用,進而提高運營效率和預測性規劃功能。公司還宣布了用于構建和操作元宇宙應用的平臺 NVIDIA Omniverse 的相關更新,增加了一系列生成式 AI、模擬仿真相關功能,讓開發者能夠更輕松地部署工業元宇宙應用。圖表圖表27:公司公司Omniverse示意圖示意圖 來源:英偉達,國金證券研究所 AI 大模型時代,算力需求提升明顯,并保持指數級增長。2015 至 2016 年左右,AI 大模型問世,大模型趨勢始于 2015 年底 AlphaGo 的出現并一直延續至今。期間,這些大規模模型由科技巨擘訓練,他們擁有的更多訓練預算打破了以往的趨勢,大模型由于參數數量大幅
56、增加,所需要的算力也相較常規模型大幅增長。目前 ChatGPT 的總算力消耗約為3640PF-days(即假如每秒計算一千萬億次,需要計算 3640 天),需要 78 個投資規模 30億、算力 500P 的數據中心才能支撐運行。大模型算力增加呈指數級變化,每 9 至 10 個月翻一番。2015 年推出的 Alpha Go Lee 大模型所需要的訓練量算力超過 1021 FLOPs,而 2021 年推出的大模型 Megatron-Turing 公司深度研究 敬請參閱最后一頁特別聲明 17 NLG 530B 的訓練算力需求已經超過了 1024 FLOPs,算力提升了 1000 倍左右。圖表圖表28
57、:主流主流 AIAI 模型所需訓練量變化情況(紅色為模型所需訓練量變化情況(紅色為 AIAI 大模型,藍色為大模型,藍色為 AIAI 常規模型)常規模型)來源:Compute Trends Across Three Eras of Machine Learning,國金證券研究所 2.2 AI 芯片:訓練、推理全面布局,芯片:訓練、推理全面布局,公司產品定義行業發展公司產品定義行業發展 類比成在學校中學習,AI 模型和大多數人一樣為了完成一項工作,需要接受教育。具體來說,經過訓練(training)的 AI 模型可以將其所學應用于數字世界的任務例如:識別圖像、口語詞、血液疾病,或者向某人推薦她
58、/他接下來可能要購買的鞋子等各種各樣的應用。這種更快更高效的版本的 AI 模型可以基于其訓練成果對其所獲得的新數據進行“推導”,在人工智能領域,這個過程被成為“推理(inference)”。訓練所需要精度更高,算力也更高,并且需要有一定的通用性,以便完成各種學習任務。因此目前 AI 訓練芯片的算力一般都采用 16 位浮點數進行標志,另外支持 32 位浮點數計算,甚至 64 位雙精度數據的計算。推理是借助已經訓練好的 AI 模型進行運算,利用輸入數據獲得所需要輸出的結果,對精度和算力要求較低。因此一般推理都是采用 8 位整型對算力進行標志,計算時也都是進行整型運算。圖表圖表29:訓練與推理訓練與
59、推理AI芯片對比芯片對比 場場景景 算力需求算力需求 精度要求精度要求 主要產品主要產品 應用場景應用場景 訓練 高,英偉達H100 fp16算力達到2000TOPS 高,一般使用16位、32 位浮點甚至 64位雙精度數據 英偉達 V100、A100、H100;AMD MI200;寒武紀思元290;壁仞BR100 等 對特定的預研模型、神經網絡的大量參數進行運算訓練,使模型能夠完成各種任務 推理 較低,英偉達 T4 int8 算力130TOPS 較低,一般使用8位或16位整型數據 英偉達 L40、T4、A10、A30;AMD Alveo V70;寒武紀思元100、思元 370;燧原邃思1.0等
60、 在已經完成訓練的模型基礎上,利用輸入數據獲得所需要輸出的結果 來源:產業鏈調研,國金證券研究所 人工智能芯片多用傳統型芯片,或用昂貴的圖形處理器(GPU),或用現場可編程門陣列芯片配合中央處理器(FPGA+CPU)為主,用以在云端數據中心的深度學習訓練和推理,公司深度研究 敬請參閱最后一頁特別聲明 18 通用專用型 AI 芯片(ASIC),也就是張量處理器或特定用途集成電路(ASIC),主要是針對具體應用場景,三類芯片短期內將共存并在不同應用場景形成互補。圖表圖表30:CPU、GPU、FPGA、ASIC特點對比特點對比 類別 GPU FPGA ASIC 特點 性能高、計算能力強 功耗高 通用
61、性好 可編程性、靈活功耗和通用性介于 GPU與 ASIC之間 定制化設計 性能穩定 優秀的功耗控制 代表公司 英偉達、AMD 賽靈思 寒武紀、地平線、比特大陸、谷歌(TPU)來源:ADLINK,國金證券研究所 公司于 1999 年發明了全球第一款 GPU(圖形處理器),GPU 具有大量運算單元,非常適合并行運算,能夠大幅提高計算效率。借助 GPU 行業的深厚積累,公司在 2006 年推出CUDA 架構,使科學家和研究人員能夠利用 GPU 的并行處理能力來應對最復雜的計算挑戰。憑借 GPU 行業的深厚積累,公司通過去掉傳統 GPU 的圖像渲染單元,優化計算能力,先后推出了多款訓練、推理 AI 芯
62、片,并且借助 CUDA 構建的豐富生態,在 AI 芯片行業成為了全球龍頭企業。根據 IDC 數據,2022 年公司在全球企業級 GPU 市占率達到91.4%,同時根據產業鏈調研,公司在國內 AI 芯片的市占率超過 90%。圖表圖表31:2022年年全球全球企業級企業級GPU市占率市占率 圖表圖表32:2022年年中國中國AI芯片市占率芯片市占率 來源:IDC,國金證券研究所 來源:產業鏈調研,國金證券研究所 AI 芯片重要指標是算力和帶寬。算力是一秒鐘所能完成的處理的數量,決定了 AI 芯片的數據計算速度。而帶寬決定了AI芯片每秒鐘可以訪問的數據量。如果AI芯片的算力不足,對于大量算力需求的模
63、型訓練需要耗費更長時間,同時考慮到 AI 芯片板卡之間的互聯損耗,AI 芯片板卡增大到一定數量時,會有類似邊際效應的情況發生,算力的增長大幅減小,因此無法通過無限增加 AI 芯片數量來實現算力提升。而帶寬決定了 AI 芯片獲得數據的能力,如果算力非常高的 AI 芯片其帶寬極小,訪問數據能力不足,則無法讓算力完全發揮,也會限制性能。因此大算力、高帶寬是 AI 芯片的發展方向。訓練端公司先后推出了 V100、A100、H100 三款芯片,以及為了滿足美國標準,向大陸銷售的 A100 和 H100 的帶寬縮減版產品 A800 和 H800。(1)V100 能加快 AI、高性能計算(HPC)和圖形技術
64、的發展。其采用 NVIDIA Volta 架構,并帶有 16 GB 和 32GB 兩種配置,在單個 GPU 中即可提供高 10 個 CPU 的性能。(2)A100 采用 NVIDIA Ampere 架構,是 NVIDIA 數據中心平臺的引擎。A100 的性能比上一代產品提升高達 20 倍,并可劃分為七個 GPU 實例,以根據變化的需求進行動態調整。A100 提供 40GB/80GB 顯存兩種版本,A100 80GB 將 GPU 顯存增加了一倍,并提供超快速的顯存帶寬(每秒超過2 萬億字節 TB/s),可處理超大型模型和數據集。(3)H100 使用 NVIDIA NVLink Switch系統,
65、可連接多達 256 個 H100 來加速百億億級(Exascale)工作負載,另外可通過專用的 Transformer 引擎來處理萬億參數語言模型。與上一代產品相比,H100 的綜合技術創新可以將大型語言模型的速度提高 30 倍,從而提供業界領先的對話式 AI。公司最新的 H100 算力接近 2000T,采用臺積電 5nm 制程,是目前算力最大的 AI 訓練芯片,隨著模型參數數量增大,訓練所需要算力不斷增長,H100 有望進一步鞏固公司龍頭地位。英偉達AMD其他英偉達其他公司深度研究 敬請參閱最后一頁特別聲明 19 圖表圖表33:主流主流AI訓練芯片性能對比訓練芯片性能對比 性能性能指標指標
66、英偉達英偉達V100 英偉達英偉達A100 英偉達英偉達A800 英偉達英偉達H100 英偉達英偉達H800 AMD MI 250 壁仞壁仞BR100 昆侖芯昆侖芯 2 寒武紀寒武紀290 燧原燧原 2.0 FP16算力 112T 125T 130T 624T 624T 1513T 1979T 1513T 1979T 362T 960T 128T 256T 128T 互聯帶寬 32GB/s PCIE 或300GB/s NVLink 64GB/s PCIe 或600GB/s NVLink 64GB/s PCIe 或400GB/s NVLink 128GB/s PCIe 或600GB/s NVLi
67、nk或900GB/s NVLink 128GB/s PCIe 或450GB/s NVLink 100GB/s 448 GB/s 512 GB/s 600GB/s 300GB/s 內存 16G、32G 40G、80G 40G、80G 80G 80G 128G 64G 32G 32G 32G 制程 12nm 7nm 7nm 5nm 5nm 6nm 7nm 7nm 7nm 12nm 來源:各公司網站,國金證券研究所 推理端公司先后推出了 A10、A30、T4、L40 四款芯片。(1)A10 可在易于管理、安全且有彈性,能依照各種需求進行調整的基礎架構中,加速多個數據中心工作負載,范圍涵蓋繪圖豐富的虛
68、擬桌面基礎架構(VDI)以及人工智能。(2)A30 借助 NVIDIA Ampere 架構 Tensor Core 和多實例 GPU(MIG),它可以安全加速各種工作負載,其中包括大規模 AI推理和高性能計算(HPC)應用程序。具有 PCIe 外形規格(非常適合主流服務器)的 A30 集快速顯存帶寬與低功耗于一體,不僅能實現彈性數據中心,還能為企業帶來更大價值。(3)T4 基于新型 NVIDIA Turing 架構,采用節能高效(70 瓦)的小尺寸 PCIe 封裝,它已針對主流計算環境進行優化,并配備多精度 Turing Tensor Core 和新的 RT Core。與來自 NGC 的加速容
69、器化軟件堆棧相結合,T4 可提供大規模的革命性性能。(4)L40 由 Ada Lovelace 架構提供支持,為 GPU 加速數據中心工作負載提供革命性神經圖形、可視化、計算和 AI 功能。目前主流的推理芯片當中,公司的 L40 算力為 362T,采用稀疏矩陣時算力超過 700T,優勢較其他推理芯片明顯。圖表圖表34:主流主流AI推理芯片性能對比推理芯片性能對比 性能指標性能指標 英偉達英偉達 A10 英偉達英偉達 A30 英偉達英偉達 T4 英偉達英偉達 L40 寒武紀寒武紀 思元思元370 int8 算力 250T,采用稀疏技術 500T 330T,采用稀疏矩陣 661T 130T 362
70、T,采用稀疏矩陣 724T 256T 互聯帶寬 64G 64G PCIe 或 200G NVLink 32G 64G 200G 內存 24G 24G 16G 48G 48G 來源:各公司官網,國金證券研究所 2.3 GPU:獨立顯卡市場強者恒強,公司龍頭地位穩固:獨立顯卡市場強者恒強,公司龍頭地位穩固 GPU(Graphics Processing Unit,圖形處理器)又被稱為顯示芯片,多用于個人電腦、工作站、游戲主機以及移動設備(智能手機、平板電腦、VR 設備)上專門運行繪圖運算的微處理器。圖形處理器是公司在 1999 年 8 月發表 GeForce 256 繪圖處理芯片時首先提出的概念,
71、在此之前電腦中處理影像輸出的顯示芯片,通常很少被視為是一個獨立的運算單元。獨立 GPU 一般焊接在顯卡的電路板上,位置在顯卡的風扇下面。獨立 GPU 使用的是專用的顯示存儲器,顯存帶寬決定了 GPU的連接速度。集成 GPU一般與 CPU集成在一起。集成 GPU 一般只支持電腦日常辦公,性能較低,但功耗和成本也低。而獨立 GPU 具有更強大的性能,可以支持大型游戲或圖像處理軟件運行,但具有更高的功耗和成本。公司深度研究 敬請參閱最后一頁特別聲明 20 圖表圖表35:獨立獨立GPU與集成與集成GPU對比對比 獨立獨立 GPU 集成集成 GPU 與 CPU 關系 獨立于 CPU,是單獨的電腦組件,有
72、自身內存 集成在 CPU 當中,與 CPU 共享系統內存 價格 高 低 功耗 高 低 性能 高 低 主要生產廠商和產品 NVIDIA(GeForce 系列),AMD(Radeon 系列)Intel(HD 系列),AMD(APU 系列)應用場景 高性能游戲電腦、個人工作站、VR/AR、人工智能等 辦公用電腦、手機 來源:英特爾,國金證券研究所 根據 JPR 數據,2022 年全年桌面獨立顯卡的出貨量為 3786 萬塊,相比 2021 年的 4915萬大幅下降。在 2021 年,桌面獨立顯卡市場規模為 518 億美元,顯卡平均售價為 1056美元。由于 2022 年桌面獨立顯卡的出貨量下降明顯,整
73、個市場的規模也減少了 241.4 億美元,而顯卡平均售價為 637 美元。我們預計 2023 年下半年開始,2020 年疫情初期所購買的電腦將開始陸續進入換機周期,疊加消費電子復蘇,有望使得獨立顯卡出貨量及平均售價重新提升。雖然市場處于下行周期,公司獨立顯卡市占率穩步提高。公司獨立顯卡市占率常年超過70%。而去年隨著公司 GeForce RTX 40 系列顯卡推出,憑借優異性能,公司市占率更進一步。根據 JPR 數據,2022 年 Q3 全球獨立顯卡市場當中,公司占據 88%,AMD 占 8%,英特爾為 4%。而根據 JPR 數據,公司 2022 年 Q1 在全球獨立顯卡的市占率為 78%。公
74、司在市場下行期間擴大份額,有望在市場復蘇時更鞏固自身龍頭地位。圖表圖表36:全球獨立顯卡市占率變化情況全球獨立顯卡市占率變化情況 來源:JPR,國金證券研究所 公司 GeForce RTX 40 系列顯卡采用自研 Ada Lovelace 架構,打造出色的游戲與創作、專業圖形、AI 和計算性能。Ada Lovelace 架構使用第四代 Tensor Core,憑借公司在 Hopper H100 數據中心 GPU 上首次推出的全新 FP8 Transformer 引擎,Ada 的全新第四代 Tensor Core 擁有快速計算能力,可將吞吐量提升 4 倍,達到 1.4 TensorpetaFLO
75、PS。同時為了滿足圖形渲染時的密集光線追蹤工作負載,Ada 架構使用了第三代 RT Core,在視頻游戲中實現了實時光線追蹤。第 3 代 RT Core 不僅將光線與三角形求交性能提高了一倍,還將 RT-TFLOP 峰值性能提高了一倍之多。Ada 架構同時支持 NVIDIA DLSS 3 算法,DLSS 3 算法利用 AI 技術生成更多幀,以此提升性能。DLSS 會借助 GeForce RTX 40 系列 GPU 所搭載的全新光流加速器分析連續幀和運動數據,進而創建其他高質量幀,同時不會影響圖像質量和響應速度。根據公司測試,當開啟 DLSS 3 算法時,主流游戲的性能實現了 200%560%的
76、增長。0%10%20%30%40%50%60%70%80%90%100%19Q420Q120Q220Q320Q421Q121Q221Q321Q422Q122Q222Q3英偉達AMD英特爾公司深度研究 敬請參閱最后一頁特別聲明 21 圖表圖表37:第四代第四代Tensor Core結構示意圖結構示意圖 圖表圖表38:主流電子游戲開啟主流電子游戲開啟DLSS帶來巨大性能提升帶來巨大性能提升 來源:英偉達,國金證券研究所 來源:英偉達,國金證券研究所 公司目前在售產品包括 GeForce RTX 16203040 系列產品,全面覆蓋低中高市場。在高端獨立顯卡市場中,GeForce RTX 4090
77、是目前性能最高的獨立顯卡,較競爭對手更具優勢。同時公司憑借 DLSS 算法,可以通過 AI 技術實現游戲性能的大幅突破,使消費者體驗更為良好。而公司的顯卡驅動以及針對各種游戲及應用場景的優化也是市場中最為領先的,很多游戲廠商或專業圖像渲染廠商,因為公司獨立顯卡的極高市占率,在開發游戲或圖像渲染軟件時,會專門針對公司獨立顯卡進行優化,進一步鞏固了公司市場地位。因此我們認為,獨立顯卡行業強者恒強,公司未來將繼續保持并穩固行業龍頭地位。圖表圖表39:2023年年3月市場高端顯卡性能對比圖月市場高端顯卡性能對比圖 來源:mydrivers,國金證券研究所 2.4 DPU:數據中心第三顆主力芯片數據中心
78、第三顆主力芯片,助力數據中心邁入,助力數據中心邁入 AI 時代時代 DPU(數據處理器,Data Processing Unit),是數據中心第三顆主力芯片。2016 年,DPU首次由美國公司 Fungible 提出,其主要目標是優化和提升數據中心效能。DPU 是由基礎網卡進化而來,是智能網卡發展的下一形態。DPU 下游主要對應數據中心/云計算、智能駕駛、數據通信、網絡安全等領域需求。公司深度研究 敬請參閱最后一頁特別聲明 22 圖表圖表40:DPU功能集示意圖功能集示意圖 來源:DPU 技術白皮書,國金證券研究所 作為算力網絡創新技術之一,算力卸載統籌虛擬化、數據安全、運維管理等領域,是構建
79、高性能、高可靠云化平臺的關鍵技術。DPU 一方面是實現算力卸載的重要載體,另一方面也是算網一體的初級形態,定位于數據中心繼 CPU、GPU 之后的“第三顆主力芯片”,業界需要重點打造和推動 DPU 技術的發展與成熟。根據華經產業研究院數據,2021 年全球 DPU 市場已達到 50.7 億美元規模,并隨著 AI、HPC 等大算力高性能應用場景不斷落地,未來市場增速明顯,在 2025 年將達到 245 億美元的規模。圖表圖表41:全球全球DPU市場規模預測市場規模預測 來源:華經產業研究院,國金證券研究所 公司 2020 年推出 BlueField-2 DPU 以來,已經陸續迭代了多款產品,目前
80、已經量產的產品包括 Bluefield-2 以及 BlueField-3,面向數據安全、網路安全、存儲卸載等應用場景。公司 DPU 芯片采用 Arm 內核,以 SoC 的形態出貨。對于更復雜、更廣泛的現實用例,基于 SoC 的 DPU 技術路線提供了更優實施選項,SoC 技術路線具備可編程、高靈活性等特征,是未來 DPU 發展的一個主流方向。圖表圖表42:DPU不同路線對比不同路線對比 技術路線技術路線 性價比性價比 易編程度易編程度 靈活性靈活性 功耗功耗 ASIC 高 中 低 低 FPGA 低 高 高 高 SoC 中 高 高 中 來源:華經產業研究院,國金證券研究所 0%10%20%30%
81、40%50%60%70%80%050100150200250300202020212022E2023E2024E2025EDPU全球市場(億美元,左軸)YoY(右軸)公司深度研究 敬請參閱最后一頁特別聲明 23 公司 DPU 產品業界性能領先,BlueField-3 是首款為 AI 和加速計算而設計的 DPU,助力各企業在任何規模的應用上都能實現業內領先的性能和數據中心的安全性。這款 DPU 針對多租戶、云原生環境進行了優化,提供數據中心級的軟件定義和硬件加速的網絡、存儲、安全和管理等服務。一個 BlueField-3 DPU 所提供的數據中心服務可相當于多達 300 個CPU 核才能實現的服
82、務,從而釋放寶貴的 CPU 資源來運行關鍵業務應用。作為業內首款 400G 以太網和 NDR InfiniBand DPU,BlueField-3 具有出色的網絡性能。相比上一代產品,它具有 10 倍加速計算能力、16 個 Arm A78 CPU 核,和 4 倍的加密速度。BlueField-3 也是首款支持第五代 PCIe 總線并提供數據中心時間同步加速的 DPU。圖表圖表43:主流主流DPU性能對比性能對比 英偉達英偉達 BlueField-3 英偉達英偉達 BlueField-2 賽靈思賽靈思 Alveo U25 Marvell OCTEON 10 傳輸速率 400Gb/s 以太網或 N
83、DR InfiniBand 200Gb/s 以太網或InfiniBand 25Gb/s 以太網 50400Gb/s 以太網 PCIe 32*PCIe 5.0 8*PCIe 4.0 或16*PCIe 4.0 16*PCIe 3.0 最高 8*PCIe 5.0 DDR 32GB DDR5 16GB DDR4 或32GB DDR5 2GB DDR4 與4GB DDR4 最多支持 12*DDR5 5200MTS 來源:各公司官網,國金證券研究所 2.5 CPU:面向面向數據中心數據中心定制定制,自研自研 CPU+GPU 組合強化平臺化優勢組合強化平臺化優勢 公司于 2023 年 GTC 當中宣布推出首
84、款面向 AI 基礎設施和高性能計算的基于 Arm Neoverse 的數據中心專屬 CPU,其可提供最高的性能,是當今領先服務器芯片內存帶寬和能效的兩倍。NVIDIA Grace CPU 超級芯片由兩個 CPU 芯片組成,它們之間通過 NVLink-C2C 互連在一起。NVLink-C2C 是一種新型的高速、低延遲、芯片到芯片的互連技術。Grace CPU超級芯片是去年 NVIDIA 發布的首款由 CPU-GPU 集成的“Grace Hopper 超級芯片”的一部分,它將與基于 NVIDIA Hopper 架構的 GPU 一同應用于大型 HPC 和 AI 應用。這兩款超級芯片采用相同的底層 C
85、PU 架構及 NVLink-C2C 互連。圖表圖表44:公司公司Grace Hopper超級芯片結構示意圖超級芯片結構示意圖 來源:英偉達,國金證券研究所 Grace CPU 與公司 Hopper 架構 GPU 使用,并采用公司 NVLink Switch 連接技術時,相比傳統 x86 架構 CPU 與公司 Hopper 架構 GPU 時,CPU 帶寬有了 2 倍左右增長,GPU-CPU 雙向帶寬有了近 6 倍增長,而 GPU-GPU 雙向帶寬增長了 8 倍,性能有顯著提高。公司深度研究 敬請參閱最后一頁特別聲明 24 圖表圖表45:采用采用NVLink Switch技術的技術的Grace H
86、opper與傳統與傳統x86 CPU+Hopper GPU對比對比 HGX H100 4-GPU(x86)英偉達英偉達 HGX Grace Hopper NVLink Switch CPU 內存帶寬(GB/s/GPU)最高 150 最高 546 GPU 內存帶寬(GB/s/GPU)3000 3000 GPU-CPU 雙向連接帶寬(GB/s/GPU)128(*16 PCIe Gen5)900(NVLink C2C)GPU-GPU 雙向連接帶寬(GB/s/GPU)100(InfiniBand NDR400)900(NVLink 4)來源:英偉達,國金證券研究所 憑借最高的性能、內存帶寬、能效及可配
87、置性,Grace CPU 超級芯片在要求最為嚴苛的高性能計算、AI、數據分析、科學計算和超大規模計算應用方面將會脫穎而出。根據公司測試,使用 Grace Hopper 相比傳統 x86+Hopper,在 NLP 自然語言模型的訓練中,運算速度提高了 4 倍,而在高性能計算應用如 ABINIT 中,性能提高了 3.6 倍。圖表圖表46:采用采用NVLink Switch技術的技術的公司公司Grace Hopper與傳統與傳統x86 CPU+Hopper架架構構GPU運算速度對比運算速度對比 來源:英偉達,國金證券研究所 公司目前在 GPU 領域擁有絕對的統治力:受到疫情及產能影響,全球獨立 GP
88、U 在 22 年出貨量受到了比較大的影響,22Q2、22Q3GPU 出貨量分別為 1800 萬、1200 萬臺,同比下滑約 20%、50%,但是服務器中的獨立 GPU 銷量所受到的影響相對小很多,22Q2、22Q3 服務器獨立 GPU 出貨量約為 81 萬、79 萬臺,同比增長 83%、50%,僅 22Q3 環比略有下滑。從份額上看,所有獨立 GPU 中,公司最低的份額為 18Q1 的 66.4%,在這之后公司的份額至 22Q2 一路上升到 83%左右,而 22Q3,全球 GPU 份額公司占據了88.4%。在服務器獨立 GPU 份額上,公司的優勢更加明顯,自 17Q3 之后,公司份額一直在 9
89、0%之上,22Q3,公司服務器獨立 GPU 份額甚至達到了 96%。公司深度研究 敬請參閱最后一頁特別聲明 25 圖表圖表47:全球獨立全球獨立GPU季度出貨量(百萬)季度出貨量(百萬)圖表圖表48:全球獨立服務器全球獨立服務器GPU季度出貨量(百萬)季度出貨量(百萬)來源:IDC,國金證券研究所 來源:IDC,國金證券研究所 為什么是英偉達?為什么是英偉達?1)之前介紹過的多適用于不同應用領域的高性能 GPU 及服務器、新推出的適配Grace-Hopper 體系的 Grace CPU 等。2)公司 CUDA 架構是目前最適合深度學習、AI訓練的 GPU 架構。在 2007 年推出后經歷了 1
90、6 年的不斷改善更新,衍生出各種工具包、軟件環境,構筑了完整的生態。3)公司已經與眾多客戶合作,一同構建細分領域加速庫與 AI 訓練模型,目前已經積累 300 個加速庫和 400 個 AI 模型。Omniverse 平臺與各AI 平臺、GTC 上宣布構建 Nvidia AI Foundations(云 LLM&生成式 AI 平臺)與 DGX Cloud(云算力平臺)與用戶共同成長,合作共贏。4)NVSwitch 與 NVLink 大幅提升了 GPU顯存的物理限制,使得 GPU 之間的數據傳輸更加迅速,系統內大幅提升 GPU 傳輸效率,完美配合公司高性能 GPU。3.1 CUDA 架構幫助公司率
91、先開拓加速計算架構幫助公司率先開拓加速計算&深度學習深度學習 GPU 在加速計算及深度學習上性能遠遠高于 CPU:CPU 作為傳統的計算處理核心,往往運用于通用計算中,核心數較少。GPU 則是作為圖形計算的核心,通常用于處理圖像信息,核心數較多。如果需要進行大量的并行計算,由于 CPU 的線性流程特點,CPU 只能根據核心數一次進行對應的并行計算。而 GPU 由于具有多核心的特點,因此在處理并行計算時,可以多核心同時進行,大幅提高計算效率。舉例來說,目前 AMD 第四代 EPYC服務器 CPU“Genoa”的核心數最高達 96 個,而 Nvidia H100 則有 16896 個 CUDA核心
92、。目前來看,GPU 是目前最適合深度學習&AI 訓練的硬件。圖表圖表49:CPU與與GPU架構架構 來源:英偉達,國金證券研究所 CUDA架構幫助公司從所有 GPU 廠商中脫穎而出:過去 GPU 完成并行計算需要先將計算任務渲染成圖形再借助 GPU 圖形處理的能力進行計算,而公司在 2006 年推出了 CUDA架構,通過定義的一套通用計算指令集(PTX)和一小部分 C 語言擴展集,讓開發者直接0510152025301Q163Q161Q173Q171Q183Q181Q193Q191Q203Q201Q213Q211Q223Q22NVIDIA(百萬)AMDIntelOthers00.10.20.3
93、0.40.50.60.70.80.91Q163Q161Q173Q171Q183Q181Q193Q191Q203Q201Q213Q211Q223Q22NVIDIA(百萬)AMDIntelOthers公司深度研究 敬請參閱最后一頁特別聲明 26 運用編程語言與指令對計算任務進行處理,充分利用 GPU 中強大的并行計算能力,大幅縮短計算時間。隨著 CUDA 的不斷發展,公司使 CUDA 可以直接支持 OpenCL、Fortran、Python、.NET 等語言及標準 API,建立起了一套目前最完善的軟件體系。AMD 的 ROCm系統相比 CUDA 在編程語言和 API 支持上有所不如,且支持的 GP
94、U 類型也相對較少。公司也在不斷更新 CUDA,對加速計算、深度學習提供支持。2022 年 11 月 28 日,公司推出最新的 CUDA 12.0 大版本,為 Hopper 和 Ada Lovelace 架構提供可編程功能。CUDA 12 提供了更多的張量操作選項,這些選項很多都支持公共 PTX中間表示法,更方便大模型通過張量計算訓練。在成熟的 CUDA底層架構之上,公司還專門為 AI進行了優化,推出了 CUDA-X A加速庫。CUDA-X AI 是軟件加速庫的集合,這些庫建立在 CUDA 之上,提供對于深度學習、機器學習和高性能計算必不可少的優化功能。CUDA-X AI 讓開發人員能夠提高工
95、作效率,同時從不斷提升的應用程序性能中獲益。CUDA-X AI 主要組件包括數學庫、并行算法庫、圖像和視屏庫、通信庫、深度學習庫、合作伙伴庫,用戶通過使用這些庫,實現不斷擴展的算法集的過程將得到大幅優化。CUDA-X AI 庫可以部署到多種設備內的 NVIDIA GPU上,其中包括臺式機、工作站、服務器、云計算和物聯網設備。通過與行業合作得到的數據再經由公司自己的大模型的訓練,這些加速庫已經充分完成了預訓練。未來想要發展行業端 AI 應用的公司只需調整自身的數據再通過已有加速庫進行訓練、優化,即可得到高質量模型。其他涉及服務器 GPU 的公司例如 AMD、公司都沒有類似 CUDA 架構及CUD
96、A-X AI 加速庫的生態,公司在軟件層面全面領先競爭對手。圖表圖表50:公司公司CUDA-X AI結構結構 來源:英偉達,國金證券研究所 公司深度計算公司深度計算&AI 訓練生態完整:訓練生態完整:目前公司生態下 AI 訓練的流程為:1)加快完成數據準備:相較于類似的純 CPU 配置,企業憑借 Nvidia Rapids 最高可將性能加快 70 倍并將成本效益提高 20 倍。2)大規模訓練:借助 Nvidia Tao 工具套件,無需 AI 專業知識或大型訓練數據集,僅需微調 NVIDIA 預訓練模型,即可在數小時內創建自定義的生產就緒型 AI 模型。3)針對推理進行優化:在推理過程中,使用
97、NVIDIA TensorRT 的應用的執行速度比純 CPU 平臺的速度快高達 40 倍。TensorRT 可以優化在所有主要框架中訓練的神經網絡模型。4)大規模部署:借助 NVIDIA Triton 推理服務器,可簡化并優化在生產環境中大規模部署 AI 模型的流程。公司深度研究 敬請參閱最后一頁特別聲明 27 圖表圖表51:除除Omniverse外英偉達軟硬件生態結構外英偉達軟硬件生態結構 來源:英偉達,國金證券研究所 公司深度研究 敬請參閱最后一頁特別聲明 28 RAPIDS 由一系列開源軟件庫和 API 組成,用于完全在 GPU 上執行數據科學流程,以 NVIDIA CUDA-X AI
98、為基礎,融合了顯卡、機器學習、深度學習、高性能計算等領域多年來的發展成果。RAPIDS 使用 10TB 大小的常見 API(如 Pandas 和 Dask),相較于最高的 CPU 基準,其在 GPU 上的運行速度要快 20 倍。RAPIDS 依靠 CUDA 基元進行低級別計算優化,但通過用戶友好型 Python 接口實現了 GPU 并行化和高顯存帶寬。RAPIDS支持從數據加載和預處理到機器學習、圖形分析和可視化的端到端數據科學工作流程。NVIDIA TAO 工具套件基于 TensorFlow 和 PyTorch 構建,是 NVIDIA TAO 框架的低代碼版本,通過抽象出 AI/深度學習框架
99、的復雜性來加速模型訓練過程。無需具備 AI 專業知識或大型訓練數據集,TAO 工具套件可以通過遷移學習的強大功能和對預訓練 NVIDIA模型進行微調,針對推理進行優化。公司通過已有的數據已經訓練了超過 100 個模型,同時與 Nvidia Riva、Nvidia Metropolis 等 AI 平臺連接,構筑了完整且簡化的 AI 訓練流程,極大程度降低了 AI 訓練的門檻。TensorRT 以 NVIDIA 的并行編程模型 CUDA 為基礎構建而成,利用 CUDA-X 中的庫、開發工具和技術,針對人工智能、自主機器、高性能計算和圖形優化所有深度學習框架中的推理。NVIDIA TensorRT
100、是用于高性能深度學習推理的 SDK。此 SDK 包含深度學習推理優化器和運行時環境,可為深度學習推理應用提供低延遲和高吞吐量。軟件端的 Tensor SDK 配合早在 2017 年就推出的 Tensor Core 硬件使得公司在保持準確性的同時,大幅縮短從訓練到收斂的時間,從而在 AI 學習上遙遙領先 AMD。Triton 推理服務器可在任意基于 GPU 或 CPU 的基礎設施上部署、運行和擴展任意框架中經過訓練的 AI 模型,進而精簡 AI 推理。它還幫助開發者跨云、本地、邊緣和嵌入式設備提供高性能推理。Triton 還可在嚴格的延遲限制條件下優化實時推理服務,通過支持批量推理來更大限度地提
101、高 GPU 和 CPU 利用率,并內置對音頻和視頻流輸入的支持。對于需要使用多個模型來執行端到端推理的用例,Triton 支持模型集成。2023GTC 上公司推出了新軟件 NVIDIA Triton Management Service,可在整個數據中心自動擴展和編排Triton 推理實例,可提高部署模型的吞吐量和成本效率。3.2 Omniverse 疊加其他疊加其他 AI 平臺,覆蓋多行業助力公司構建完整生態平臺,覆蓋多行業助力公司構建完整生態 為什么為什么 Omniverse 重要?重要?不僅僅在于公司向我們展示的已實現的各種應用、正在實現或者未來即將實現的應用,Omniverse 可以發
102、揮其元宇宙的特性,使成千上萬的人進入同一片空間解決同一個問題,從而大幅提升效率。Omniverse 是一個不斷完善自身、不斷擴充用戶群體的 AI 平臺,從技術到生態來看是目前最好的平臺。平臺本身豐富的工具、領先的技術疊加看不見競爭對手的先發優勢將持續鞏固公司在元宇宙以及數字工業領域的優勢。建立起 Omniverse 平臺及其他 AI 平臺后,公司 AI 服務已經覆蓋了設計、金融、游戲、倉儲、醫療、高等教育、數據中心、交通運輸、公共領域等行業。公司幾乎實現了這些在這些行業上 AI 應用的壟斷,隨著未來 AI 應用行業拓展、市場規模的不斷擴張,公司將成為軟件生態領域的最大受益者。公司深度研究 敬請
103、參閱最后一頁特別聲明 29 圖表圖表52:Omniverse軟硬件框架軟硬件框架 來源:英偉達,國金證券研究所 公司深度研究 敬請參閱最后一頁特別聲明 30 工業數字化已經成為元宇宙中可實現的實際應用:在公司的 AI 平臺中,Omniverse 作為元宇宙和工業數字化的入口,是構建 AI 生態的關鍵一環。元宇宙方面,Omniverse 可以使藝術家垮多個 3D 工具創作內容、開發者在虛擬世界中訓練 AI、企業構建工業流程的數字孿生。對藝術家&工程師來說,Omniverse 帶來的實時 3D 場景建模、全面模擬&可視化、方便的團隊合作都為藝術創作或者規劃藍圖帶來了極大的便利。目前已有近 30 萬
104、名創作者和設計師下載了 Omniverse。GTC2023 上,公司向我們分享了工業數字化目前的實際應用。公司展示了 BMW 建設新工廠與 Amazon 倉儲規劃的 Omniverse 運用。精細的建??梢杂行У膸推髽I解決工廠建設時可能遇到的問題,在動工前節約大量糾錯成本。大量車企已經開始了運用 Omniverse 的數字化,將汽車零部件在虛擬環境中組裝成數字孿生汽車、將空氣動力學可視化、測試主動安全系統等。Omniverse 是基于 USD(Universal Scene Description)的可擴展平臺,可使個人和團隊更快地構建自定義 3D 工作流并模擬大型虛擬世界。USD 不僅僅是一
105、種文件格式,更是一個開放、可擴展的框架和生態系統,具有可用于在 3D 虛擬世界中合成、編輯、查詢、渲染、協作和仿真的 API。Omniverse 主要包含五個組件:1)Omniverse Nucleus:最重要的提供共享數據庫和協作引擎。2)Omniverse Connect:在客戶端應用和 Omniverse 應用之間實現工作流雙向的實時同步。3)Omniverse Simulation:采用 NVIDIA 核心物理模擬技術的可擴展、物理精準的世界仿真。4)Omniverse Kit:用于開發基于簡潔且強大工作流程的應用框架。5)多 GPU 可擴展渲染器,實現高性能光線追蹤。圖表圖表53:O
106、mniverse架構架構 來源:英偉達,國金證券研究所 Omniverse 的核心技術包括的核心技術包括 MDL、PhysX與與 RTX:MDL(材料定制語言)可在支持的應用程序之間自由地共享基于物理性質的材質和光線。不同于為特定渲染器生成程序的著色語言,MDL 材質定義光線的高級特性。不管是基于 OpenGL 的應用程序還是像 Iray 一樣基于物理的渲染器,MDL 都可以通過多種渲染器和工具解釋光線特性并創建極佳的圖像。PhysX是一種可擴展的多平臺物理仿真解決方案,可為智能手機、高端多核 CPU 和 GPU等各類設備提供支持。RTX 是 NVIDIA 在計算機圖形領域的重要先進技術之一,
107、RTX 技術利用優化的光線追蹤API(如 NVIDIA OptiX、Microsoft DXR 和 Vulkan),將實時電影級渲染效果變為現實。逼真的視覺效果不僅包括物體呈現的外觀,還包括其行為方式。借助強大的 CUDA Core公司深度研究 敬請參閱最后一頁特別聲明 31 和 API,RTX技術能夠在游戲、虛擬環境以及特效環境中,對真實物體的行為精確建模。NVIDIA RTX 技術為可視化計算帶來了 AI 功能,使開發人員能夠創建 AI 增強型應用,為終端用戶帶來出色的工作流程加速效果。目前的目前的 Omniverse 生態中已有的部分應用:這些應用可以幫助用戶實現逼真的建模以及生態中已有
108、的部分應用:這些應用可以幫助用戶實現逼真的建模以及更為深遠的數字工業化,并且已經對客戶業務產生了深遠影響。更為深遠的數字工業化,并且已經對客戶業務產生了深遠影響。1)Omniverse Audio2Face:使用生成式 AI 可以即時從一個音頻來源創建面部表情動畫。根據任何配音音軌制作游戲角色、電影角色或實時數字助理 3D 動畫。Audio2Face對 AR/VR、數字人的應用起到了積極作用。在 AR/VR 設備的面部動作捕捉仍未普及的當下,使用該音頻轉面部表情(包含情緒,生動的面部動作)的技術,能增強 AR/VR社交軟件和數字人的體驗的真實性。2)Omniverse ACE:實時的 AI 端
109、到端解決方案,用于大規模開發和部署交互式人物模型和數字人。Omniverse ACE 也包含了公司其他 AI 平臺中的 NVIDIA Maxine,提供了一套 GPU 加速的 AI 軟件開發套件和云原生微服務,用于部署 AI 功能,以增強實時視頻通信。Omniverse 也與 NVIDIA Tokkio 嵌入在一起,Nvidia Tokkio 可以賦能交互式虛擬形象以智能方式查看、感知、交談并提供推薦,以加強在線和現場(餐館和商店等)的客戶服務。3)Nvidia Drive Sim:構建了一個物理精準的仿真平臺,能夠快速、高效地進行大規模的自動駕駛汽車測試和驗證。Nvidia Drive Si
110、m 中包含了神經重建引擎(NRE),這是一套 AI 工具,可以將真實世界的數據直接帶入仿真中,大大增加真實感并加快生產速度。NRE 可將駕駛過程中收集的視頻數據轉換為交互式 3D 測試環境,開發者可在此環境中修改場景、添加合成對象,并應用隨機化技術,使初始場景更具挑戰性。目前大陸集團和 AEye 的長距激光雷達已經和公司合作接入 Drive Sim 平臺。4)Nvidia Isaac Sim:由 Omniverse 提供動力支持,是一款可擴展的機器人模擬應用和合成數據生成工具,可提供逼真、物理屬性準確的虛擬環境,以便開發、測試和管理基于 AI 的機器人。利用 Isaac Sim 的 Omniv
111、erse Replicator,可以生成用于訓練感知模型的合成數據。同時支持機器人在虛擬環境中模擬操作和模擬導航。在GTC2023 中,公司展示了目前通過 Isaac Sim 實現的工業數字化成果,也宣布了與BMW、Amazon Robotics、西門子等企業合作,打造智能工廠和自動化倉儲物流。不止 Omniverse,公司在涉及 AI 的各行各業都積極建設生態:除了 Omniverse 之外,公司在生物醫療、光刻、量子計算、物流等眾多領域與客戶展開合作、建立獨立加速庫,與客戶合作共贏。不僅僅是元宇宙及數字工業化,公司早已經深入行業,用加速計算幫助客戶解決眾多問題。雖然 AMD 的加速計算生態
112、也與行業有所合作,但是公司這些年間已經建立了約 400 個加速庫,在寬度上領先其競爭對手。在與客戶合作的過程中,憑借優異的硬件與軟件生態配套,客戶逐漸依賴公司生態,需要公司的加速計算去解決行業問題。不知不覺間,公司為競爭對手們構建了難以翻越的競爭壁壘。這些 AI 平臺與加速計算應用包括但不限于:1)cuLitho:cuLitho 計算光刻模擬了光通過光學元件并與光刻膠相互作用時的行為,應用逆物理算法來預測掩膜版上的圖案,以便在晶圓上生成最終圖案。使用 cuLitho GPU加速,500 套 DGX H100(包含 4000 顆 Hopper GPU)完成與 4 萬顆 CPU 運算服務器相同的工
113、作量,但速度快 40 倍,功耗降低 90%,生產光掩膜的計算光刻工作用時可以從兩周減少到 8 個小時。公司將繼續與臺積電、ASML 和 Synopsys 合作,將先進制程推進到 2 納米及更高精度制程,幫助客戶解決目前摩爾定律遇到的物理極限問題。2)cuQuantum:Nvidia Quantum 平臺由庫和系統組成,可供研究人員推進量子編程模型。是用于量子電路仿真的加速庫。仿真框架中 Open Quantum CUDA 是混合GPU-Quantum 編程模型。與 Quantum Machines 合作開發的量子控制鏈路可將 NVIDIA GPU 連接到量子計算機以極快的速度進行糾錯。IBM
114、Qiskit、Google Cirq、百度量易伏、QMWare、QuEra、Xanadu Pennylane、Agnostiq 和 AWS Bracket 已將 cuQuantum 集成到他們的仿真框架中。3)cuOpt:NVIDIA cuOpt 使用進化算法和加速計算每秒分析 300 億次動作,可以解決具有挑戰性的揀取和配送問題。AT&T 定期派遣 3 萬名技術人員為 700 個地理區域的 1300萬客戶提供服務,如果在 CPU上運行,AT&T 的調度優化 需要一整夜的時間,借助 cuOpt,AT&T 可以將查找解決方案的速度加快 100 倍并實時更新其調度方案。cuOpt 還可以優化物流服
115、務,德勤、Capgemini、Softserve、埃森哲和 Quantiphi 正在使用 NVIDIA cuOpt 來幫助客戶優化運營。4)Nvidia Clara:NVIDIA Clara 平臺可用于醫學影像、基因組學、患者監控和藥物研發,公司深度研究 敬請參閱最后一頁特別聲明 32 并可部署在嵌入式系統、邊緣、每個云等任何地方。四種主要組件包括 Clara Holoscan、Clara Parabricks、Clara Discovery、Clara Guardian。Nvidia Clara 平臺同樣運用了公司加速庫,適用于實時傳感器處理系統與云端或儀器設備內的端到端基因組分析等。5)N
116、vidia Aerial:Nvidia Aerial 平臺是一個應用框架,用于構建高性能、軟件定義、云原生的 5G 應用,以滿足消費者日益增長的需求。在 GPU 上并行處理基帶信號和數據流,優化結果。NVIDIA cuBB SDK 提供 GPU 加速的 5G 信號處理流程,包括適用于第 1 層5G PHY 的 cuPHY。通過在高性能 GPU 顯存中保留所有物理層處理來提供出色的吞吐量和效率。NVIDIA cuVNF SDK 提供經過優化的輸入/輸出和數據包處理,可在 GPU 顯存和支持 GPUDirect 的 NVIDIA ConnectX-6 DX網絡接口卡之間直接交換數據包。4.1 盈利
117、預測盈利預測 我們預測 2023-2025 年公司營收達到 296.98 億美元、358.19 億美元、436.79 億美元,凈利潤分別為 0.38 億美元、0.72 億美元、1.13 億美元,GAAP 毛利率為 64.5%、65.0%和 65.5%,不同業務的營收變動邏輯如下:數據中心:數據中心:預測 2023-2025 年營業收入達到 172.56 億美元、215.70 億美元、269.62 億美元,同比+15%、+25%、+25%。營業收入方面,公司為全球數據中心 GPU 龍頭廠商,2022 年實現營收 150.05 億美元,同增 41%。根據 TrendForce 數據,AI 訓練所用
118、的服務器 GPU 主要被公司和 AMD 壟斷,其中公司市占率約 80%,且產品性能領先 AMD。同時根據產業鏈調研,公司在國內 AI 芯片的市占率超過 90%。隨著全球人工智能發展超預期,海內外廠商紛紛投入大模型和 AI 競賽中,我們測算得大模型訓練有望給公司數據中心業務帶來 36.38 億美元的額外業績彈性,因此我們給予23-25 年數據中心業務15%、25%、25%的營收增速預測。游戲:游戲:預測 2023-2025 年營業收入達到 95.20 億美元、104.72 億美元、120.43 億美元,同比+5%、+10%、+15%。營業收入方面,2022 年公司游戲業務營收大幅下滑主要是礦難導
119、致上一代 GPU 顯卡庫存過高,隨著庫存逐漸去化,新產品 RTX40 系列的供不應求,以及公司游戲業務長期基本面優異,我們認為游戲業務營收增速將逐季改善。目前公司獨立 GPU 份額超 80%,根據 JPR 的數據,公司在全球獨立顯卡市場的市占率從 19Q4 的73%提高到 22Q3 的 88%,同期最大競爭對手 AMD 的市占率從 27%下降到 8%。公司全球范圍內用戶超 2 億,RTX40 系列產品在性能與競爭對手之間進一步拉開差距。在軟件方面,公司與微軟簽署了一份為期 10 年的協議,將 Xbox PC 游戲系列引入 GeForce NOW云游戲平臺,進一步多元化游戲業務營收,以彌補硬件部
120、分受制于個人電腦出貨量增速的放緩。受益于高玩家基數和產品固定升級周期,我們看好游戲業務有望成為現金奶牛。因此我們給予 23-25 年游戲業務 5%、10%、15%的營收增速預測。專業可視化:專業可視化:預測 2023-2025 年營業收入達到 11.58 億美元、13.90 億美元、16.68 億美元,同比-25%、+20%、+20%。Omniverse 作為元宇宙和數字工業化的入口,成為 AI生態構建的關鍵環節,其本身豐富的工具、領先的技術疊加看不見競爭對手的先發優勢將持續鞏固公司的平臺化優勢。但目前 Omniverse 仍處于初步導入客戶階段,短期內對于庫存調整而導致的營收下滑改善有限。公
121、司預計庫存調整有望在 2023 年上半年結束,短期內營收會受到庫存調整的擾動,但 Omniverse 在各垂直領域的落地有望成為營收成長核心驅動力。因此我們給予 23-25 年專業可視化業務-25%、20%、20%的營收增速預測。自動駕駛:自動駕駛:預測 2023-2025 年營業收入達到 13.55 億美元、18.96 億美元、24.65 億美元,同比+50%、+40%、+30%。營業收入方面,我們認為自動駕駛和新能源應是未來 15 年最大的科技變革。從人駕到類似智能服務器裝四輪驅動的自駕的轉變將對硬件產業鏈形成巨 大 的提 升,大 幅提 高激 光雷 達 攝像 頭毫 米波 雷 達,CV2X
122、等 感 知 層芯 片,GPU/CPU/FPGA/AI 芯片等決策層芯片,以及高速以太網接口等執行層芯片的需求。所以我們之前在 2022 年度策略報告中估計 2035 年全球超過 30%的汽車銷量將具備 L3-L5 的自動駕駛功能,未來 15 年的復合增長率達到 30-35%。公司在自動駕駛業務上進行了軟硬件一體的產品布局,未來 5 年在手訂單超 110 億美元,產品已覆蓋前 30 大乘用車廠商中的 20 家,前 10 大貨車廠商中的 7 家,前 10 大無人駕駛出租車中的 8 家。我們看好公司自動駕駛業務即將步入收獲期,因此我們給予 23-25 年自動駕駛業務 50%、40%、30%的營收增速
123、預測。毛利率方面:預測毛利率方面:預測 2023-2025 年公司年公司 GAAP 毛利率為毛利率為 64.5%、65.0%和和 65.5%。毛利率方面,2022 年四個季度公司 GAAP 毛利率分別為 65.5%、43.5%、53.6%、63.6%。由于挖礦熱潮的消退以及美國限制公司數據中心用高性能 GPU 向中國大陸市場出貨,導致公司在 2022 年第二季度和第三季度增加部分庫存準備以及庫存減計費用影響公司毛利率。公司深度研究 敬請參閱最后一頁特別聲明 33 隨著公司面向游戲市場推出新產品 RTX40 系列,超越競爭對手的卓越性能使得新品持續處于供不應求的狀態,以及公司面向中國大陸客戶推出
124、定制化 GPU產品以解決美國禁令,過高的庫存問題正在逐漸消失。結合公司對2023 年第一季度 GAAP毛利率 63.6%-64.6%的展望,我們看好公司毛利正在逐季改善。因此我們給予 23-25 年公司 GAAP 毛利率64.5%、65.0%和 65.5%的預測。圖表圖表54:公司分業務營收及毛利率預測公司分業務營收及毛利率預測 單位:億美元 2019A 2020A 2021A 2022E 2023E 2024E 1.數據中心數據中心 66.96 106.13 150.05 172.56 215.70 269.62 YoY 124.47%58.50%41.38%15.00%25.00%25.0
125、0%2.游戲游戲 77.59 124.62 90.67 95.20 104.72 120.43 YoY 40.61%60.61%-27.24%5.00%10.00%15.00%3.專業可視化專業可視化 10.53 21.11 15.44 11.58 13.90 16.68 YoY-13%100%-27%-25%20%20%4.OEM&IP 6.31 11.62 4.55 4.10 4.91 5.41 YoY 24.95%84.15%-60.84%-10.00%20.00%10.00%5.自動駕駛自動駕駛 5.36 5.66 9.03 13.55 18.96 24.65 YoY-23.43%5.
126、60%59.54%50.00%40.00%30.00%公司總營收公司總營收 166.75 269.14 269.74 296.98 358.19 436.79 YoY 52.73%61.40%0.22%10.10%20.61%21.94%GAAP 毛利率 63.3%64.9%56.9%64.5%65.0%65.5%來源:Bloomberg,國金證券研究所 4.2 投資建議及估值投資建議及估值 預計公司 2023-2025 年凈利潤為 75.79 億美元、101.97 億美元和 131.42 億美元,對應EPS 為 3.07 美元、4.13 美元和 5.32 美元,對應 PE 為 88x、65x
127、 和 51x。我們選取英特爾、AMD 這兩家可比公司對公司進行估值。我們看好人工智能的發展正在迎來“iPhone時刻”。如果說英特爾是 PC 時代的皇冠,高通是移動時代的皇冠,我們看好公司很可能成為人工智能時代的皇冠。公司完成了從一家 GPU 供應商到軟硬一體的 AI 解決方案領導者轉變?;?CUDA 形成了高度粘性的開發者生態,并在 GPU 等各類硬件上不斷定義行業發展方向。因此我們給予 2023 年 120 倍估值,市值 9095 億美元,目標價 368.21美元,給予公司買入評級。圖表圖表55:可比公司估值比較(市盈率法)可比公司估值比較(市盈率法)名稱 股價(美元)EPS PE 20
128、21A 2022A 2023E 2024E 2025E 2021A 2022A 2023E 2024E 2025E INTC 英特爾*32.81 5.47 1.84 0.50 1.79 2.317 11.34 5.77 66.02 18.30 14.16 AMD AMD*92.47 2.79 3.50 3.09 4.35 5.03 56.25 59.34 29.97 21.27 18.39 平均值平均值 33.80 32.56 48.00 19.79 16.27 NVDA 英偉達 270.37 3.81 1.77 3.07 4.13 5.32 59.96 114.97 88.11 65.49
129、50.81 來源:Bloomberg,國金證券研究所(2023 年 4 月 9日股價,標*股票采用 Bloomberg 一致預期)消費類、泛工業、數據中心、超算等領域需求不如預期。2022 年部分下游領域景氣度下滑,如果未來市場空間持續發生不利的變化,導致下游客戶的需求持續下降,存在需求不及預期以及營收繼續下滑的風險。人工智能發展不如預期。人工智能的發展基于國內外政府政策推動、技術持續迭代以及新產品的供給驅動等邏輯,若國內外政策波動、技術升級放緩,必然導致 AI 發展不如預期。美國加大對中國半導體相關領域制裁力度的風險。到目前為止,拜登政府對中國科技行業的技術競爭及封鎖似乎沒有明顯改善,若是中
130、美關系持續惡化,可能會影響公司產品向大陸客戶的銷售。公司深度研究 敬請參閱最后一頁特別聲明 34 附錄:附錄:損益表損益表預測摘要預測摘要 利潤表利潤表 單位:美元單位:美元(百萬百萬)項目項目/報告期報告期 2020A 2021A 2022A 2023E 2024E 2025E 營業收入營業收入 16,675 26,914 26,974 29,698 35,819 43,679 營業成本 6,279 9,439 11,618 10,543 12,537 15,069 毛利 10,396 17,475 15,356 19,155 23,283 28,609 一般費用 1,940 2,166 2
131、,440 2,554 2,973 3,625 研發費用 3,924 5,268 7,339 8,018 8,955 10,483 營業利潤 4,532 10,041 5,577 8,583 11,355 14,501 利息收入 57 29 267 68 179 314 利息支出 184 236 262 322 328 373 權益性投資損益 0 0 0 0 0 0 其他非經營性損益 4 107 -48 0 0 0 其他損益 0 0 -1,353 0 0 0 除稅前利潤除稅前利潤 4,409 9,941 4,181 8,329 11,206 14,442 所得稅 77 189 -187 750
132、1,009 1,300 凈利潤凈利潤 4,332 9,752 4,368 7,579 10,197 13,142 少數股東損益 0 0 0 0 0 0 凈利潤(不含少數股東權益)凈利潤(不含少數股東權益)4,332 9,752 4,368 7,579 10,197 13,142 來源:公司年報、國金證券研究所 公司深度研究 敬請參閱最后一頁特別聲明 35 市場中相關報告評級比率分析市場中相關報告評級比率分析 日期日期 一周內一周內 一月內一月內 二月內二月內 三月內三月內 六月內六月內 來源:聚源數據 市場中相關報告評級比率分析說明:市場中相關報告投資建議為“買入”得 1 分,為“增持”得 2
133、 分,為“中性”得 3 分,為“減持”得 4 分,之后平均計算得出最終評分,作為市場平均投資建議的參考。最終評分與平均投資建議對照:1.00 =買入;1.012.0=增持;2.013.0=中性 3.014.0=減持 投資評級的說明:投資評級的說明:買入:預期未來 612 個月內上漲幅度在 15%以上;增持:預期未來 612 個月內上漲幅度在 5%15%;中性:預期未來 612 個月內變動幅度在-5%5%;減持:預期未來 612 個月內下跌幅度在 5%以上。公司深度研究 敬請參閱最后一頁特別聲明 36 特別聲明:特別聲明:國金證券股份有限公司經中國證券監督管理委員會批準,已具備證券投資咨詢業務資
134、格。本報告版權歸“國金證券股份有限公司”(以下簡稱“國金證券”)所有,未經事先書面授權,任何機構和個人均不得以任何方式對本報告的任何部分制作任何形式的復制、轉發、轉載、引用、修改、仿制、刊發,或以任何侵犯本公司版權的其他方式使用。經過書面授權的引用、刊發,需注明出處為“國金證券股份有限公司”,且不得對本報告進行任何有悖原意的刪節和修改。本報告的產生基于國金證券及其研究人員認為可信的公開資料或實地調研資料,但國金證券及其研究人員對這些信息的準確性和完整性不作任何保證。本報告反映撰寫研究人員的不同設想、見解及分析方法,故本報告所載觀點可能與其他類似研究報告的觀點及市場實際情況不一致,國金證券不對使
135、用本報告所包含的材料產生的任何直接或間接損失或與此有關的其他任何損失承擔任何責任。且本報告中的資料、意見、預測均反映報告初次公開發布時的判斷,在不作事先通知的情況下,可能會隨時調整,亦可因使用不同假設和標準、采用不同觀點和分析方法而與國金證券其它業務部門、單位或附屬機構在制作類似的其他材料時所給出的意見不同或者相反。本報告僅為參考之用,在任何地區均不應被視為買賣任何證券、金融工具的要約或要約邀請。本報告提及的任何證券或金融工具均可能含有重大的風險,可能不易變賣以及不適合所有投資者。本報告所提及的證券或金融工具的價格、價值及收益可能會受匯率影響而波動。過往的業績并不能代表未來的表現??蛻魬斂紤]
136、到國金證券存在可能影響本報告客觀性的利益沖突,而不應視本報告為作出投資決策的唯一因素。證券研究報告是用于服務具備專業知識的投資者和投資顧問的專業產品,使用時必須經專業人士進行解讀。國金證券建議獲取報告人員應考慮本報告的任何意見或建議是否符合其特定狀況,以及(若有必要)咨詢獨立投資顧問。報告本身、報告中的信息或所表達意見也不構成投資、法律、會計或稅務的最終操作建議,國金證券不就報告中的內容對最終操作建議做出任何擔保,在任何時候均不構成對任何人的個人推薦。在法律允許的情況下,國金證券的關聯機構可能會持有報告中涉及的公司所發行的證券并進行交易,并可能為這些公司正在提供或爭取提供多種金融服務。本報告并
137、非意圖發送、發布給在當地法律或監管規則下不允許向其發送、發布該研究報告的人員。國金證券并不因收件人收到本報告而視其為國金證券的客戶。本報告對于收件人而言屬高度機密,只有符合條件的收件人才能使用。根據證券期貨投資者適當性管理辦法,本報告僅供國金證券股份有限公司客戶中風險評級高于 C3 級(含 C3 級)的投資者使用;本報告所包含的觀點及建議并未考慮個別客戶的特殊狀況、目標或需要,不應被視為對特定客戶關于特定證券或金融工具的建議或策略。對于本報告中提及的任何證券或金融工具,本報告的收件人須保持自身的獨立判斷。使用國金證券研究報告進行投資,遭受任何損失,國金證券不承擔相關法律責任。若國金證券以外的任
138、何機構或個人發送本報告,則由該機構或個人為此發送行為承擔全部責任。本報告不構成國金證券向發送本報告機構或個人的收件人提供投資建議,國金證券不為此承擔任何責任。此報告僅限于中國境內使用。國金證券版權所有,保留一切權利。上海上海 北京北京 深圳深圳 電話:021-60753903 傳真:021-61038200 郵箱: 郵編:201204 地址:上海浦東新區芳甸路 1088 號 紫竹國際大廈 7 樓 電話:010-85950438 郵箱: 郵編:100005 地址:北京市東城區建內大街 26 號 新聞大廈 8 層南側 電話:0755-83831378 傳真:0755-83830558 郵箱: 郵編:518000 地址:中國深圳市福田區中心四路 1-1 號 嘉里建設廣場 T3-2402