1、 敬請閱讀末頁的重要說明 證券研究報告|行業簡評報告 2023 年 03 月 23 日 英偉達英偉達 GTC 2023 跟蹤報告跟蹤報告 TMT 及中小盤/電子 事件:事件:英偉達 GTC 開發者大會于 3 月 20-23 日舉辦,英偉達 CEO 黃仁勛于 3 月 21日發表主題演講,介紹 AI 的最新進展,以及 AI 技術如何影響每個行業和日常生活。綜合演講及材料信息,總結要點如下:評論:評論:1、Grace 打造超打造超低功耗計算利器,低功耗計算利器,H100 助力助力 DGX 創造創造 AI 的的 iPhone 時刻時刻。Grace CPU:擅長單線程執行和內存處理,包含 72 個 Ar
2、m 核心,可提供 3.2TB/s的帶寬,Grace Superchip 通過 900GB/s 的接口連接兩個 CPU,可提供 1TB/s的帶寬,是目前系統的 2.5 倍,功耗僅是其 1/8,采用風冷即可,適合云計算和科學計算應用。DGX(AI 超級計算機):超級計算機):LLM 實現突破的引擎,創造 AI 的 iPhone時刻,配備 8 個 H100 GPU 模組,通過 NVLINK Switch 相連,H100 配備Transformer 引擎,旨在處理 ChatGPT 模型。四大推理四大推理芯片芯片平臺平臺:1)L4:針對 AI 視頻工作負載,優化視頻編解碼、內容審核和通話功能;2)L40
3、:針對Omniverse、圖形渲染以及文本轉圖像和文本轉視頻等生成式 AI;3)Hopper GPU:配備雙 GPU NVLINK 的 PCIE H100,目前云上唯一可以處理 ChatGPT的 GPU 是 A100,一臺搭載 4 對 H100 及雙 NVLINK 的標準服務器速度要快 10倍,H100 可將 LLM 的處理成本降低一個數量級;4)Grace Hopper:新的超級芯片,通過 900GB/s 的芯片接口連接 Grace CPU 和 Hopper GPU,適合處理大型數據集,例如推薦系統和 LLM 的 AI 數據庫。2、完善多應用領域加速庫建設,臺積電預計完善多應用領域加速庫建設
4、,臺積電預計 23M6 將對將對 cuLitho 進行生產認證進行生產認證。加速庫:加速庫:加速計算的核心加速計算的核心。cuQuantum 對量子計算機進行加速;Spark-RAPIDS可加速云數據處理平臺;cuOpt 用于運籌學領域解決組合優化問題;CV-CUDA和 VPF 是用于計算機視覺和視頻處理的云規模加速庫;Parabricks 可用于基因組分析;cuLitho 計算光刻庫,與臺積電、ASML 和 Synopsys 合作將計算光刻加速了 40 倍以上,臺積電在 500 個 DGX H100 系統上將功率從 35MW 降至5MW,替代用于計算光刻的 4 萬臺 CPU 服務器,為 2n
5、m 等生產做準備,臺積電將于 6 月對 cuLitho 進行生產資格認證。軟件軟件 SDK 構成的構成的推理平臺:推理平臺:NVIDIA TensorRT 用于推理運行時針對指定 GPU 進行性能優化。NVIDIA Triton 用于數據中心的推理服務,支持多種深度學習框架,支持 GPU 和 CPU。NVIDIA BlueField:高效管理數據中心操作系統和軟件。3、云服務云服務為全球各類公司普及生成式為全球各類公司普及生成式 AI 機會,推出語言機會,推出語言/視覺視覺/藥物研發模型藥物研發模型。NVIDIA DGX Cloud:為客戶提供出色的 NVIDIA AI 服務,通過與 Micr
6、osoft Azure、Google GCP 和 Oracle OCI 合作,通過瀏覽器即可將 NVIDIA DGX AI 超級計算機即時地接入每家公司,為迫切需要使用生成式 AI 的客戶提供了在全球云端即時訪問 NVIDIA AI 的機會。NVIDIA AI Foundations:面向需要構建、優化和運營定制 LLM 和生成式 AI 的云服務,包括語言、視覺和生物學模型制作服務。NVIDIA Nemo 用于構建定制的語言文本轉文本生成式模型,可便捷地采用預訓練模型借助 NeMo 進行快速模型設計。Picasso 是一項視覺語言模型制作服務,面向希望使用許可內容或專有內容來訓練自定義模型的客
7、戶。NVIDIA 行業規模行業規模 占比%股票家數(只)454 9.2 總市值(億元)74412 8.9 流通市值(億元)56028 7.9 行業指數行業指數%1m 6m 12m 絕對表現 5.9 2.4 相對表現 3.8 8.9 資料來源:公司數據、招商證券 相關相關報告報告 1、英偉達 FY23Q4 跟蹤報告本季業績符合預期,數據中心和游戲業務增長展望樂觀2023-02-24 2、海外電子跟蹤報告英偉達FY2023Q1季報總結及業績說明會紀要2022-05-27 3、海外電子跟蹤報告英偉達FY2022 Q3 季報總結及法說會紀要2021-11-19 鄢凡鄢凡 S1090511060002
8、曹輝曹輝 S1090521060001 王恬王恬 S1090522090002 程鑫程鑫 研究助理 -30-20-1001020Mar/22Jul/22Nov/22Feb/23(%)電子滬深300AI 的的 iPhone 時刻到來時刻到來,英偉達全力加速生成式英偉達全力加速生成式 AI 發展發展 敬請閱讀末頁的重要說明 2 行業簡評報告 BioNeMo 服務提供先進的用于藥物研發的生成式 AI 模型。4、Omniverse 數字化平臺構建虛擬化場景,提升工廠建造效率并節約資金數字化平臺構建虛擬化場景,提升工廠建造效率并節約資金。工業化數字平臺,旨在搭建數字化和物理實體之間的橋梁,讓各個行業先以
9、數字方式設計、構建、運營和優化實體產品和工廠,然后再投入實際生產,以提高效率和速度,最終節省資金。一個用途是以虛擬方式構建工廠,在真正的實體工廠建成之前,以數字方式整合工廠的所有機械設備,減少在最后時刻出現意外、變更訂單和工廠延遲開工等情況,虛擬工廠整合可以為全球工廠節省數十億美元,可用于半導體晶圓廠、汽車制造商、電池制造商和物流倉庫等。投資建議:投資建議:英偉達是全球領先的 GPU 廠商,逐步完成服務器核心 CPU 布局,在 AI 技術領域為客戶提供完善的軟硬件支持,與全球領軍云服務廠商合作助力云計算應用普及,用 AI 的方式為各行業賦能增效??紤]到英偉達作為全球領先的 AI 技術風向標之一
10、,我們認為此次 GTC 大會再次展現了生成式 AI 應用的巨大潛力,建議關注英偉達以及直接參與其 GPU 產業鏈的全球優質公司以及國內同類對標公司,包括全球具備高端芯片制造、封測和軟件支持的半導體生產廠商,同時關注核心主芯片成品到終端應用涉及到的芯片原廠、PCB、云服務硬件、AI 模型應用和各類終端廠商。風險提示:風險提示:競爭加劇風險;貿易摩擦風險;行業景氣度變化風險;宏觀經濟及競爭加劇風險;貿易摩擦風險;行業景氣度變化風險;宏觀經濟及政策風險。政策風險。表表 1:大算力:大算力相關電子相關電子產業鏈公司產業鏈公司 板塊板塊 領域領域 公司公司 芯片制造 晶圓廠 臺積電、中芯國際等 封測 通
11、富微電、長電科技、偉測科技、甬矽電子等 EDA/IP 華大九天、概倫電子、廣立微、芯原股份等 芯片相關 云端算力芯片 寒武紀、海光信息、龍芯中科、景嘉微等 邊緣端算力芯片 瑞芯微、晶晨股份、全志科技、樂鑫科技、中科藍訊、炬芯科技、恒玄科技、富瀚微等 主芯片外圍芯片 杰華特、瀾起科技、聚辰股份、晶豐明源、裕太微、龍迅股份等 存儲 江波龍、佰維存儲、兆易創新、北京君正、聚辰股份等 PCB 高多層板 深南電路、滬電股份、生益電子、勝宏科技、東山精密、鵬鼎控股等 IC 載板 深南電路、興森科技等 載板材料 生益科技、華正新材、南亞新材等 云服務硬件 服務器整機 工業富聯、浪潮信息、中科曙光、廣達、英業
12、達、仁寶、緯穎等 高速連接、熱管理等 立訊精密等 模型應用端 AI 大模型應用端 ??低?、大華股份、螢石網絡等 終端 XR 立訊精密、高偉電子、兆威機電、長盈精密等 智能音箱 漫步者、國光電器、百度、阿里、小米等 可穿戴 立訊精密、漫步者、歌爾股份、佳禾智能等 資料來源:招商證券整理 (后附(后附英偉達英偉達GTC 2023黃仁勛黃仁勛主題演講主題演講紀要全文)紀要全文)pPpOXX8ZdXbZqUeXwV9PdNbRpNoOsQoNeRrRoNlOtRtQ7NoPsNvPqNwPNZpNmM 敬請閱讀末頁的重要說明 3 行業簡評報告 附錄:附錄:英偉達英偉達 GTC 2023 開發者開發者
13、大會大會主題演講主題演講紀要紀要 時間:時間:2023 年 3 月 21 日 主講人:主講人:英偉達創始人黃仁勛 背景介紹背景介紹:近四十年來,摩爾定律一直是引領計算機行業動態發展的重要規律,而計算機行業又影響著各行各業的發展。在成本和功耗不變的情況下性能的指數級增長已經放緩,然而,計算技術的發展日新月異,曲速引擎是加速計算,動力來源就是 AI。各行各業正在應對,可持續發展、生成式 AI,和數字化等強大的動態挑戰,因此加速計算和 AI 的到來,恰逢其時。如果沒有摩爾定律,隨著計算量的激增數據中心的能耗飆升,企業將難以實現凈零排放,生成式AI 的非凡能力,使得企業產生了緊迫感,他們需要重新構思他
14、們的產品和商業模式,產業內各企業正在競相實現數字化轉型,成為軟件驅動的科技公司,要成為顛覆者,而不是被顛覆者。今天,將討論加速計算和 AI 如何成為強大的工具,幫人們應對這些挑戰,和把握未來的巨大機遇,我們將分享 NVIDIA的數據中心級全棧加速計算平臺的新進展,我們將展示新的芯片和系統、加速庫、云服務、AI 服務,以及助力我們拓展新市場的合作伙伴關系,1、加速庫:包括、加速庫:包括 cuQuantum、cuOpt、culitho 等等平臺,用于量子計算、運籌規劃、平臺,用于量子計算、運籌規劃、視頻處理、醫療、光刻等各個視頻處理、醫療、光刻等各個領域領域 背景介紹:背景介紹:從圖形、成像、粒子
15、或流體動力學、量子物理學,到數據處理和機器學習,每個經過優化的堆棧都會加速對應應用領域。加速后,應用可以獲得令人難以置信的速度,還可以擴展到許多臺計算機,在過去十年中,加速和縱向擴展的結合,使我們能夠為許多應用,實現百萬倍的性能提升,進而有助于解決以前無法解決的問題。例如,2012 年,Alex Kerchevsky、Ilya Suskever 和 Geoff Hinton 需要一臺速度超快的計算機,來訓練 AlexNet 計算機視覺模型,研究人員在 GeForce GTX580 上使用 1400 萬張圖像訓練了 AlexNet,可處理 262 千萬億次浮點運算,經過訓練的模型以壓倒性優勢贏得
16、了 ImageNet 挑戰賽,并觸發了 AI 的大爆炸。十年后,Transformer 模型面世了,現在任職于 OpenAI 的 Ilya 訓練了 GPT-3 大型語言模型來預測下一個單詞,訓練GPT-3 需要進行 323x10e21 次浮點運算,浮點運算量比訓練 AlexNet 多一百萬倍,結果創造出了 ChatGPT,這個震驚全世界的 AI。嶄新的計算平臺已經誕生嶄新的計算平臺已經誕生,AI 的“的“iPhone 時刻”已經到來時刻”已經到來,加速計算和加速計算和 AI 技術已技術已經走進現實。經走進現實。加速庫是加速計算的核心,這些加速庫連接到了各種應用中,進而再連接到遍布世界的各行各業
17、,形成了網絡中的網加速庫是加速計算的核心,這些加速庫連接到了各種應用中,進而再連接到遍布世界的各行各業,形成了網絡中的網絡。絡。經過 30 年的開發,已經有數千款應用被 NVIDIA 的庫加速,幾乎涉及科學和工業的每個領域。所有 NVIDIA GPU都兼容 CUDA,為開發者提供了龐大的安裝基礎和廣泛的覆蓋范圍,大量加速應用吸引了終端用戶,為云服務提供商和計算機制造商創造了一個龐大的市場,這個市場大到足以投入數十億的研發費用來推動其增長。汽車和航空航天行業使用 CFD 進行湍流和空氣動力學仿真,電子行業使用 CFD 進行熱管理設計。由 CUDA 加速的新CFD 求解器,在同等系統成本下,NVI
18、DIAA100 的吞吐量是 CPU 服務器的 9 倍,或者,在同等仿真吞吐量下,NVIDIA的成本降低了 9 倍能耗降低了 17 倍。Ansys、Siemens、Cadence 和其他先進的 CFD 求解器現已采用 CUDA 加速,在全球范圍內,工業 CAE 每年使用近1000 億 CPU 核心小時,加速計算是減少功耗、實現可持續發展和凈零排放的最好方式。敬請閱讀末頁的重要說明 4 行業簡評報告 圖圖 1:由由 CUDA 加速的新加速的新 CFD 求解求解 資料來源:英偉達,招商證券【cuQuantum 量子加速】量子加速】英偉達宣布推出量子控制鏈路英偉達宣布推出量子控制鏈路 cuQuantu
19、m,對量子計算機進行加速。,對量子計算機進行加速。NVIDIA 正在與全球量子計算研究社區合作,NVIDIA Quantum 平臺由庫和系統組成,可供研究人員推進量子編程模型,系統架構和算法。cuQuantum 是用于量子電路仿真的加速庫 IBMQiskit、GoogleCirq、百度量易伏、QMWare、QuEra、Xanadu Pennylane、Agnostiq 和 AWS Bracket 已將 cuQuantum 集成到他們的仿真框架中,OpenQuantumCUDA 是我們的混合GPU-Quantum 編程模型。IonQ、ORCA Computing、Atom、QuEra、Oxfor
20、d Quantum Circuits、IQM、Pasqal、Quantum Brilliance、Quantinuum、Rigetti,Xanadu 和 Anyon 已經集成 OpenQuantum CUDA,要從量子噪聲和退相干中恢復數據,需要對大量量子比特進行糾錯。cuQuantum這是與這是與Quantum Machines合作開發的,它可將合作開發的,它可將NVIDIA GPU連接到量子計算機以極快的速度進行糾錯連接到量子計算機以極快的速度進行糾錯。雖然商用量子計算機還有十到二十年的時間才能實現,但我們很高興能通過 NVIDIA Quantum,為這個充滿活力的大型研究社區提供支持,全
21、球企業使用 Apache Spark 處理數據湖和存儲,SQL 查詢、圖分析和推薦系統。圖圖 2:用于量子電路仿真的加速庫用于量子電路仿真的加速庫 cuQuantum 資料來源:英偉達,招商證券 敬請閱讀末頁的重要說明 5 行業簡評報告 Spark-RAPIDS 是是 NVIDIA 加速的加速的 Apache Spark 數據處理引擎數據處理引擎,可加速主要云數據處理平臺,可加速主要云數據處理平臺。數據處理是全球 5000億美元云計算支出的主要工作負載,現在 Spark-RAPIDS 可加速主要云數據處理平臺,包括 GCP Dataproc,Amazon EMR、Databricks 和 Cl
22、oudera,推薦系統使用向量數據庫來存儲、索引、搜索和檢索非結構化數據的大型數據集,向量數據庫的一個新型重要用例是大型語言模型,在文本生成過程中,可用于檢索領域特定事實或專有事實,我們將推出一個新的庫,即 RAFT,用于加速索引、數據加載和近鄰檢索,我們正在將 RAFT 的加速引入到 Meta 的開源 FAISS AI 相似性搜索,超過 1000 家組織使用的,Milvus 開源向量數據庫以及 Docker 鏡像下載次數超過 40 億次的 Redis,對于構建專有大型語言模型的組織而言,向量數據庫至關重要。圖圖 3:Spark-RAPIDS 數據處理引擎數據處理引擎 資料來源:英偉達,招商證
23、券 【cuOpt 運籌規劃加速】運籌規劃加速】英偉達英偉達 cuOpt 加速庫用于運籌學領域,解決組合優化問題。加速庫用于運籌學領域,解決組合優化問題。22 年前,運籌學研究科學家 Li 和 Lim 發布了一系列具有挑戰性的揀取和配送問題(PDP),PDP 出現在制造、運輸零售和物流,甚至救災領域,PDP 是旅行商問題的泛化同時也是 NP-hard 問題,這意味著不存在有效算法來找到精確解,隨著問題規模的增加,求解時間會呈階乘增長。NVIDIA cuOpt 使用進化算法和加速計算每秒分析 300 億次動作,打破了世界紀錄,并為 Li 和 Lim 的挑戰找到了合適的解決方案。AT&T 定期派遣
24、3 萬名技術人員為 700 個地理區域的 1300 萬客戶提供服務,如今,如果在 CPU 上運行,AT&T 的調度優化需要一整夜的時間,AT&T 希望找到一個實時調度解決方案,能不斷優化緊急客戶需求,和整體客戶滿意度,同時能針對延誤和出現的新事件進行調整,借助 cuOpt,AT&T 可以將查找解決方案的速度加快 100 倍并實時更新其調度方案,AT&T 已采用全套 NVIDIA AI 庫。除了 Spark-RAPIDS 和 cuOPT 之外,他們還將 Riva 用于對話式 AI,并將 Omniverse 用于數字人,AT&T 正在利用NVIDIA 加速計算和 AI 來實現高可持續性、成本節約和
25、新的服務,cuOpt 還可以優化物流服務,每年有 4000 億個包裹被投遞到 3770 億個站點。德勤、Capgemini、Softserve、埃森哲和 Quantiphi 正在使用 NVIDIA cuOpt 來幫助客戶優化運營。敬請閱讀末頁的重要說明 6 行業簡評報告 圖圖 4:英偉達英偉達 cuOpt 及客戶及客戶 資料來源:英偉達,招商證券 NVIDIA 的推理平臺由三個軟件的推理平臺由三個軟件 SDK 組成組成:NVIDIA TensorRT 用于推理運行時針對指定用于推理運行時針對指定 GPU 進行性能優化,進行性能優化,NVIDIA Triton 用于數據中心的推理服務,支持多種深
26、度學習框架,支持用于數據中心的推理服務,支持多種深度學習框架,支持 GPU 和和 CPU。TensorRT 和 Triton 已有 4 萬余客戶其中包括 Microsoft Office 和 Teams,Amazon、美國運通和美國郵政署,Uber使用Triton每秒為數十萬車輛預測到達時間,Roblox擁有超6000萬的日活用戶,它使用Triton來部署包括游戲推薦,構建虛擬形象、審核內容和市場廣告的模型。我們將發布一些強大的新功能:支持集成模型的模型分析器、并發多模型服務,以及適用于 GPT-3 大語言模型的多GPU、多節點推理。NVIDIA Triton Management Servi
27、ce 是我們的新軟件,可在整個數據中心,自動擴展和編排 Triton推理實例;50%-80%的云視頻管線運行在 CPU 上,這增加了功耗和成本,并增加了延遲。Triton Management Service將幫助您提高部署模型的吞吐量和成本效率。圖圖 5:TensorRT 和和 Triton 推理平臺推理平臺 資料來源:英偉達,招商證券 【CV-CUDA 視頻處理加速】視頻處理加速】用于計算機視覺的用于計算機視覺的 CV-CUDA 和用于視頻處理的和用于視頻處理的 VPF 是新的云規模加速庫是新的云規模加速庫。CV-CUDA 包括 30 個計算機視覺算子,可用于檢測、分割和分類,VPF 是一
28、個 Python 視頻編解碼加速庫,騰訊使用 CV-CUDA 和 VPF 每天處理 30 萬個視 敬請閱讀末頁的重要說明 7 行業簡評報告 頻,Microsoft 使用 CV-CUDA 和 VPF 來處理視覺搜索,Runway 公司使用 CV-CUDA 和 VPF,為其云生成式 AI 視頻編輯服務處理視頻。視頻已經占據了 80%的互聯網流量,用戶生成的視頻內容正在顯著增長,并消耗大量能源,我們應該加速所有視頻處理服務并減少能源消耗,CV-CUDA 和 VPF 處于搶先體驗階段。圖圖 6:CV-CUDA 平臺平臺 資料來源:英偉達,招商證券【Parabricks 醫療加速】醫療加速】NVIDIA
29、 加速計算幫助基因組學實現了里程碑式發展,現在醫生可以在同一次就診中抽取患者的血液并對其 DNA 進行測序;另一個里程碑是,使用另一個里程碑是,使用 NVIDIA 助力的儀器設備,將整個基因組測序的成本降低至僅需助力的儀器設備,將整個基因組測序的成本降低至僅需 100 美元美元,基因組學是合成生物學的重要工具從藥物研發、農業到能源生產,其應用范圍非常廣泛。NVIDIA Parabricks 是一套 AI 加速庫,可用于云端或儀器設備內的端到端基因組分析,NVIDIA Parabricks 適用于各種公有云和基因組學平臺(例如Terra、DNAnexus和FormBio)。今天,我們宣布推出Pa
30、rabricks4.1,并將會在PacBio、OxfordNanopore、Ultima,Singular、BioNano 和 Nanostring 的第四代 NVIDIA 加速基因組學設備上運行,全球價值2500 億美元的醫療設備市場正在發生變革,醫療設備將由軟件定義,并且由 AI 進行賦能。NVIDIA Holoscan 是一個適用于實時傳感器處理系統的軟件庫,超過 75 家公司正在通過 Holoscan 開發醫療設備,今天我們宣布,全球醫療設備行業領導者 Medtronic 將與 NVIDIA 攜手,為軟件定義的醫療設備構建其 AI 平臺,此次合作將為 Medtronic 系統打造一個通
31、用平臺,從手術導航到機器人輔助手術,皆包含在內。今天,Medtronic 宣布基于 NVIDIA Holoscan 構建新一代 GIGenius 系統,將 AI 用于早期檢測結腸癌并將于今年年底推出。敬請閱讀末頁的重要說明 8 行業簡評報告 圖圖 7:Parabricks 加速庫加速庫 資料來源:英偉達,招商證券 【cuLitho 光刻加速】光刻加速】背景介紹:背景介紹:芯片行業幾乎是各行各業的基礎,芯片制造要求極高的精確度,生產出的特征比細菌小 1000 倍,大小約為一個金原子或一條人類 DNA 鏈的尺寸。光刻,即在晶圓上創建圖案的過程,是芯片制造過程的起始階段,包括兩個階段-光掩模制作和圖
32、案投影。從根本上來說,這是一個物理極限下的成像問題,光掩模如同芯片中的模板光線被阻擋或穿過掩模,到達晶片以形成圖案。光線由 ASML EUV 極紫外線光刻系統產生,每個系統的價值超過 2.5 億美元,ASML EUV 采用一種顛覆性的方式來制造光線,激光脈沖每秒向一滴錫發射 5 萬次,使其汽化,產生一種能發射 13.5 納米 EUV 光的等離子體,幾乎是 X射線,隨后,多層鏡面引導光線至光掩膜。光掩膜板中的多層反射器利用 13.5 納米光的干涉圖案,實現更精細特征,精細度可達到 3 納米,晶圓的定位精度達到四分之一納米,并且每秒對準 2 萬次以消除任何振動的影響,光刻之前的步驟,計算光刻應用逆
33、物理算法來預測掩膜板上的圖案,以便在晶圓上生成最終圖案,事實上,掩膜上的圖案與最終特征完全不相似,計算光刻模擬了光通過光學元件并與光刻膠相互作用時的行為,這些行為是根據麥克斯韋方程描述的。計算光刻是芯片設計和制造領域中最大的計算工作負載,每年消耗數百億 CPU 小時,大型數據中心 24x7 全天候運行以便創建用于光刻系統的掩膜板,這些數據中心是芯片制造商每年投資近 2000 億美元的資本支出的一部分,隨著算法越來越復雜計算光刻技術也在快速發展,使整個行業能夠達到 2 納米及以上。敬請閱讀末頁的重要說明 9 行業簡評報告 圖圖 8:cuLitho 加速庫合作客戶加速庫合作客戶 資料來源:英偉達,
34、招商證券 NVIDIA 今天宣布推出 cuLitho一個計算光刻庫一個計算光刻庫,cuLitho 是一項歷時近四年的龐大任務,我們與臺積電、是一項歷時近四年的龐大任務,我們與臺積電、ASML和和 Synopsys 密切合作,將計算光刻加速了密切合作,將計算光刻加速了 40 倍以上。倍以上。NVIDIA H100 需要 89 塊掩膜板,在 CPU 上運行時,處理單個掩膜板當前需要兩周時間,如果在 GPU 上運行 cuLitho只需 8 小時即可處理完一個掩膜板。臺積電可以通過在臺積電可以通過在 500 個個 DGX H100 系統上使用系統上使用 cuLitho 加速,將功率從加速,將功率從 3
35、5MW 降至降至 5MW,從而替代用于計算光,從而替代用于計算光刻的刻的 4 萬臺萬臺 CPU 服務器。借助服務器。借助 cuLitho,臺積電可以縮短原型周期時間提高產量,減少制造過程中的碳足跡并為,臺積電可以縮短原型周期時間提高產量,減少制造過程中的碳足跡并為 2納米及以上的生產做好準備,臺積電將于納米及以上的生產做好準備,臺積電將于 6 月開始對月開始對 cuLitho 進行生產資格認證。進行生產資格認證。2、加速芯片:推出全新、加速芯片:推出全新 Grace CPU、Superchip 模組及模組及 BlueField 技術,面向技術,面向 AI、云、云服務、數據中心等服務、數據中心等
36、 背景介紹:背景介紹:所有行業都需要加速各種工作負載,以便我們能減少功耗,達到事半功倍的效果,在過去十年中,云計算每年增長 20%,成為了價值 1 萬億美元的巨大行業,大約 3000 萬臺 CPU 服務器完成大部分處理工作,而挑戰即將到來,隨著摩爾定律的終結,CPU 性能的提高也會伴隨著功耗的增加,另外,減少碳排放這一任務從根本上與增加數據中心的需求相悖,云計算的發展受功耗限制,首先,數據中心必須加速各種工作負載,加速將會減少功耗,節省的能源可以促進新的增長,未經過加速的工作負載都將會在 CPU 上進行處理,加速云數據中心的 CPU 側重點與過去有著根本性的不同,在 AI 和云服務中,加速計算
37、卸載可并行的工作負載,而 CPU 可處理其他工作負載,比如 WebRPC 和數據庫查詢。英偉達推出面向英偉達推出面向 AI 和云的和云的 Grace CPU。其中 AI 工作負載由 GPU 加速,單線程執行和內存處理則是 Grace 的擅長之處,但這不僅僅是 CPU 芯片的問題,數據中心管理員負責對整個數據中心的吞吐量和 TCO 進行優化,為了在云數據中心規模下實現高能效我們設計了 Grace,Grace 包含 72 個 Arm 核心,由超高速片內可擴展的、緩存一致的網絡連接,可提供 3.2TB/s 的截面帶寬。敬請閱讀末頁的重要說明 10 行業簡評報告 圖圖 9:Grace CPU 資料來源
38、:英偉達,招商證券 Grace Superchip 模組模組是云數據中心的基礎。是云數據中心的基礎。通過 900GB/s 的低功耗芯片到芯片緩存一致接口,連接兩個 CPU 芯片之間的 144 個核,內存系統由 LPDDR 低功耗內存構成(與手機上使用的相似),我們專門對此進行了增強,以便在數據中心中使用它提供 1TB/s 的帶寬,是目前系統的 2.5 倍而功耗只是其 1/8,整個 144 核 Grace Superchip 模組的大小僅為 5x8 英寸,而內存高達 1TB,該模組的功耗超低,風冷即可。帶有被動冷卻功能的計算模組,兩臺 Grace Superchip 計算機可以安裝進一臺 1U
39、風冷服務器即可正常運行,Grace 的性能和能效非常適合云計算應用和科學計算應用。我們使用熱門的 Google 基準測試(測試云微服務的通信速度),和 Hi-Bench 套件(測試 Apache Spark 內存密集型數據處理)測試了 Grace,此類工作負載是云數據中心的基礎。圖圖 10:Grace Superchip 資料來源:英偉達,招商證券 敬請閱讀末頁的重要說明 11 行業簡評報告 Grace 處理速度大大提升,目前正在進行樣品調測。處理速度大大提升,目前正在進行樣品調測。在微服務方面,Grace 的速度比最新一代 x86CPU 的平均速度快 1.3 倍,而在數據處理中則快 1.2
40、倍,而達到如此高性能,整機功耗僅為原來服務器的 60%。云服務提供商可以為功率受限的數據中心配備超過 1.7 倍的 Grace 服務器,每臺服務器的吞吐量提高 25%,在功耗相同的情況下,Grace使云服務提供商獲得了兩倍的增長機會。Grace 正在進行樣品調測,華碩、Atos、GB、HPE、QCT Supermicro、Wistron 和 ZT 目前正在構建系統。圖圖 11:Grace CPU 和和 NEXT-GEN x86 性能對比性能對比 資料來源:英偉達,招商證券 英偉達英偉達 BlueField 能高效管理數據中心操作系統和軟件。能高效管理數據中心操作系統和軟件。在現代軟件定義的數據
41、中心中,操作系統在執行虛擬化、網絡、存儲和安全任務時,會消耗近一半的數據中心 CPU 核心和相關功耗,數據中心必須加速每個工作負載,從而降低功耗并釋放 CPU 給可創造收入的工作負載,NVIDIA Blue Field 卸載并加速數據中心操作系統和基礎設施軟件。Check Point、思科、DDN、DellEMC、Juniper、Palo Alto Networks,RedHat 和 VMWare 等超過二十個生態系統合作伙伴,使用 BlueField 的數據中心加速技術來更高效地運行其軟件平臺。BlueField-3 已投入生產,并被領先的云服務提供商所采用以加速其云計算平臺,比如百度、Co
42、re Weave,京東、Microsoft Azure、Oracle OCI 和騰訊游戲。圖圖 12:BlueField-3 資料來源:英偉達,招商證券 敬請閱讀末頁的重要說明 12 行業簡評報告 3、AI 超級計算機及云計算平臺:基于超級計算機及云計算平臺:基于 DGX Cloud,為全球主要云服務商提供為全球主要云服務商提供 AI 技術技術 背景介紹:背景介紹:NVIDIA 加速計算始于 DGX(AI 超級計算機),這是大語言模型實現突破背后的引擎,我親手將全球首款 DGX 交給了 OpenAI,自此之后,財富100 強企業中有一半 安裝了 DGX AI 超級計算機,DGX 已成為 AI
43、領域的必備工具。英偉達英偉達 DGX H100 AI 超級計算機全面投入生產,不斷擴展應用版圖。超級計算機全面投入生產,不斷擴展應用版圖。DGX 配有 8 個 H100GPU 模組,H100 配有Transformer 引擎,旨在處理類似令人驚嘆的 ChatGPT 模型,。ChatGPT 是生成式預訓練 Transformer 模型的代表,這 8 個 H100 模組通過 NVLINK Switch 彼此相連,以實現全面無阻塞通信,8 個 H100 協同工作,就像一個巨型 GPU,計算網絡是 AI 超級計算機的重要系統之一。400Gbps 超低延遲的 NVIDIA QuantumInfini B
44、and,具有網絡內計算功能,可將成千上萬個 DGX 節點連接成一臺 AI 超級計算機。NVIDIA DGX H100 是全球客戶構建 AI 基礎設施的藍圖,現在已全面投入生產。微軟宣布 Azure 將向其 H100AI 超級計算機開放私人預覽版,Atos、AWS、Cirrascale、CoreWeave、戴爾、Gigabyte、谷歌、HPE、Lambda Labs、聯想、Oracle、Quanta,和 SuperMicro 也將很快開放系統和云服務。DGX AI 超級計算機的市場獲得了顯著增長,從最初被用作 AI 研究工具,DGXAI 超級計算機正在不斷擴展其應用范圍能夠全天候運行以優化數據和
45、處理 AI,DGX 超級計算機是現代 AI 工廠。圖圖 13:DGX 超級計算機組裝全流程超級計算機組裝全流程 資料來源:英偉達,招商證券 我們正處于我們正處于 AI 的“的“iPhone 時刻”,時刻”,DGX Cloud 為全球主要云服務商提供為全球主要云服務商提供 AI 技術。技術。生成式 AI 引發了全球企業制定AI戰略的緊迫感,客戶需要更簡單快捷地訪問NVIDIAAI,我們宣布推出NVIDIA DGX Cloud,通過與Microsoft Azure、Google GCP 和 Oracle OCI 合作,通過一個瀏覽器就可以將 NVIDIADGXAI 超級計算機即時地接入每家公司,D
46、GX Cloud 經過優化,可運行 NVIDIA AI Enterprise,這是一款全球領先的加速庫套件,用于 AI 端到端開發和部署。DGX Cloud 為客戶提供出色的 NVIDIA AI 以及全球主要的云服務提供商,這一合作將 NVIDIA 的生態系統引入到了云服務提供商 NVIDIA 觸及的范圍得以擴展,這種雙贏的合作伙伴關系為迫切需要使用生成式 AI 的客戶提供了在全球云端即時訪問 NVIDIA AI 的機會,我們很高興我們的業務模式以這種速度、規模和覆蓋范圍在云上擴展。敬請閱讀末頁的重要說明 13 行業簡評報告 圖圖 14:NVIDIA DGX Cloud 資料來源:英偉達,招商
47、證券 Oracle Cloud Infrastructure(OCI)將成為首個將成為首個 NVIDIA DGX Cloud。OCI 具有出色的性能它擁有兩層計算網絡和管理網絡,具有業界最佳 RDMA 功能的 NVIDIA CX-7 提供了計算網絡,而 Blue Field-3 將成為管理網絡的基礎設施處理器,這種組合是一款先進的 DGXAI 超級計算機,可提供多租戶云服務。我們擁有 50 家 EA 企業客戶,涵蓋消費互聯網和軟件、醫療健康,媒體和娛樂以及金融服務。圖圖 15:Oracle Cloud Infrastructure DGX Cloud 資料來源:英偉達,招商證券 4、云代工廠:
48、面向生成式、云代工廠:面向生成式 AI 技術,用于文本轉換、圖像視頻生成、藥物模型創建等技術,用于文本轉換、圖像視頻生成、藥物模型創建等 背景介紹:背景介紹:ChatGPT、Stable Diffusion、DALL-E 和 Mid journey 喚醒了世界對生成式 AI 的認知,這些應用的易用性和令人印象深刻的功能,短短幾個月內就吸引了超過一億的用戶,ChatGPT 是迄今歷史上用戶數量增長最快的應用,無需訓練只需給這些模型下指令即可,您可以使用精確提示,也可以使用模糊提示如果提示不夠清晰,ChatGPT 會根據對話了解您的意圖,生成的文本令人贊嘆,ChatGPT 可以撰寫備忘錄和詩歌,改
49、寫研究論文,解決數學問題,突出合同 敬請閱讀末頁的重要說明 14 行業簡評報告 的關鍵點,甚至編寫軟件程序,ChatGPT 是一臺計算機,它不僅可以運行軟件,還能編寫軟件,眾多突破性成果造就了生成式 AI,Transformers 能以大規模并行的方式,從數據的關系和依賴性中學習上下文和含義,這使得大型語言模型能夠利用海量數據進行學習,他們可以在沒有明確訓練的情況下執行下游任務,受物理學啟發的擴散模型通過無監督學習來生成圖像,在短短十幾年的時間里,我們經歷了從試圖識別貓到生成穿著太空服,在月球上行走的,的逼真貓圖像的過程。生成式 AI 是一種新型計算機,一種我們可以用人類語言進行編程的計算機,
50、這種能力影響深遠每個人都可以命令計算機來解決問題,而之前這是只有計算機程序員才能接觸的領域,現在每個人都可以是程序員。生成式 AI 是一種新型計算平臺,與 PC、互聯網、移動設備和云類似,與之前的計算時代類似先行者正在打造新的應用,并成立新公司,以利用生成式 AI 的自動化和協同創作能力。英偉達宣布推出英偉達宣布推出 NVIDIA AI Foundations,這是一項云服務,面向需要構建、優化和運營,定制,這是一項云服務,面向需要構建、優化和運營,定制 LLM(大型語言模(大型語言模型)和生成式型)和生成式 AI,使用其專有數據進行訓練,用于處理特定領域的任務。,使用其專有數據進行訓練,用于
51、處理特定領域的任務。NVIDIA AI Foundations 包括語言,視覺和生物學模型制作服務。圖圖 16:NVIDIA AI Foundations 資料來源:英偉達,招商證券 NVIDIA NeMo 用于構建定制的語言文本轉文本生成式模型。用于構建定制的語言文本轉文本生成式模型??蛻艨梢砸胱约旱哪P?,或從 NeMo 涵蓋了 GPT-8、GPT-43 到 GPT-530 等數十億參數的預訓練模型入手。生成式模型,比如 NVIDIA 的 43B 基礎模型,通過基于數十億個句子和數萬億個單詞進行訓練來學習。隨著模型的收斂,它開始理解單詞與其基本概念之間的關系,這些關系通過模型嵌入空間中的權
52、重進行捕獲。Transformer 模型使用一種名為自注意力的技術:一種旨在學習一系列單詞中的依賴性和關系的機制,其結果是得到一種模型,該模型可為類似 ChatGPT 的體驗奠定基礎,這些生成式模型需要大量數據,數據處理和分布式訓練方面深厚的 AI 專業知識,以及大規模計算,以跟上創新的步伐進行訓練、部署和維護。企業可以通過在企業可以通過在 NVIDIA DGX Cloud 上的上的 NVIDIA NeMo 服務,快速采用生成式服務,快速采用生成式 AI。最快捷的方法是從 NVIDIA 的某項先進預訓練基礎模型開始入手,借助 NeMo 服務,人們可以輕松自定義一個模型,并進行參數調優,以教授其
53、專業技能,比如匯總財務文檔,創建特定品牌的內容,以及以個性化的寫作風格撰寫電子郵件。將模型連接到專有知識庫,可確保響應是準確的、最新的,并為其業務所引用。接下來可以通過添加邏輯,以及監控輸入、輸出、毒性和偏差閾值來提供防護欄,以便模型在指定的領域內運行,并防止出現意外響應。模型投入使用后,可以根據,用戶交互通過強化學習不斷改進,在遷移到云 API 進行更大規模的評估和應用集成之前,可以使用 NeMo 進行快速原型設計。敬請閱讀末頁的重要說明 15 行業簡評報告 圖圖 17:Nemo 語言模型語言模型 資料來源:NVIDIA GTC,招商證券 Picasso 是一項視覺語言模型制作服務,面向希望
54、使用許可內容或專有內容來訓練自定義模型的客戶。是一項視覺語言模型制作服務,面向希望使用許可內容或專有內容來訓練自定義模型的客戶。要充分發揮其潛力,企業需要大量版權許可的數據、AI 專家和 AI 超級計算機,NVIDIA Picasso 是一項云服務,用于構建和部署生成式 AI 賦能的圖像、視頻和 3D 應用。借助此服務,企業、ISV 和服務提供商,可以部署自己的模型。公司正在與主要合作伙伴合作,力求為各行各業提供生成式 AI 功能,另外,人們還可以從 NVIDIA Edify 模型入手,使用自己的數據訓練這些模型,以創建產品或服務。這些模型可生成圖像、視頻和 3D 素材。要訪問生成式 AI 模
55、型,應用需向 Picasso發送帶有文本提示和元數據的 API 調用,Picasso 使用在 NVIDIA DGX Cloud 上運行的適當模型,將生成的素材發送回應用,這些素材可以是逼真的圖像、高分辨率視頻或詳細的 3D 幾何圖形,可將生成的素材導入編輯工具或 NVIDIA Omniverse,以構建逼真的虛擬世界,元宇宙應用和數字孿生仿真。NVIDIA Picasso 服務可以簡化構建自定義生成式服務可以簡化構建自定義生成式 AI 應用所需的訓練、優化和推理。應用所需的訓練、優化和推理。Getty Images 將使用 Picasso服務構建 Edify 圖片和 Edify 視頻生成式模型
56、,這些模型以其豐富的內容庫為基礎進行訓練,其中包含大量以負責任授權的方式獲得許可的專業圖像和視頻素材,企業將能夠使用簡單的文本或圖像提示創建自定義的圖像和視頻。Shutterstock 正在開發一款以其專業的圖像、3D 和視頻素材庫進行訓練的 Edify-3D 生成式模型,Shutterstock 將幫助簡化用于創意制作、數字孿生和虛擬協作的 3D 素材的創建過程,使企業能夠更快更輕松地實現這些工作流。公司與 Adobe 之間的長期合作將迎來重要擴展,公司將共同構建一系列新一代 AI 功能,打造創意領域的未來,將生成式AI 融入營銷人員和創意專業人士的日常工作流,新的生成式 AI 模型將針對圖
57、像、視頻、3D 和動畫制作進行優化,為了保護藝術家的權利,Adobe 正在開發以商業可行性和正確內容歸屬為重點的方案,該方案由 Adobe 的“內容真實性倡議”提供支持。敬請閱讀末頁的重要說明 16 行業簡評報告 圖圖 18:Picasso視覺語言模型視覺語言模型 資料來源:NVIDIA GTC,招商證券 NVIDIA AI Foundations 的第三個領域應用是生物學。的第三個領域應用是生物學。藥物研發是一個價值近 2 萬億美元的行業,研發投入高達 2500億美元。NVIDIA Clara 是一款醫療健康應用框架,用于影像,儀器、基因組學分析和藥物研發。目前,該行業正在轉向利用生成式 A
58、I 來發現疾病靶因,設計新型分子或蛋白質類藥物,以及預測藥物對機體的作用。數百家新型 AI 藥物研發初創公司相繼涌現,Insilico Medicine、Exscientia、Absci 和 Evozyme 就位列其中,有些公司已經發現了新型靶標或候選藥物,并開始了人體臨床試驗。BioNeMo 可幫助研究人員使用專有數據創建、微調和提供自定義模型??蓭椭芯咳藛T使用專有數據創建、微調和提供自定義模型。藥物研發包括 3 個關鍵階段,發現引發疾病的機理,設計新分子無論是小分子、蛋白質還是抗體,以及最后就這些分子之間相互作用的方式進行篩選。如今,生成式 AI 正在改變藥物研發過程的每一步,NVIDI
59、A BioNeMo 服務提供先進的、用于藥物研發的生成式 AI 模型,它可作為云服務提供,讓用戶即時輕松地訪問加速的藥物研發工作流。BioNeMo 包括 AlphaFold、ESMFold 和 OpenFold等,用于三維蛋白質結構預測的模型,ProtGPT用于蛋白質生成,ESM1和ESM2用于蛋白質特性預測,MegaMolBART和 MoFlow 用于分子生成,DiffDock 則用于分子對接。藥物研發團隊可以通過 BioNeMo 的 Web 界面或云 API 使用這些模型。BioNeMo 在藥物研發領域的應用:在藥物研發領域的應用:以下是一個使用 NVIDIA BioNeMo 進行藥物研發
60、虛擬篩選的示例,生成式模型可以讀取蛋白質氨基酸序列,并在幾秒鐘內準確預測目標蛋白質的結構,它們還可生成具有理想 ADME 特性的分子,從而優化藥物在體內的作用方式。生成式模型甚至可以預測蛋白質和分子的三維相互作用,加速最佳候選藥物的研發。借助 NVIDIA DGX Cloud,BioNeMo 還可提供按需超級計算基礎設施,以進一步優化和訓練模型,進而為團隊節省寶貴的時間和資金,使其專注于研發挽救生命的藥物。敬請閱讀末頁的重要說明 17 行業簡評報告 圖圖 19:BioNeMo 模型模型 資料來源:NVIDIA GTC,招商證券 NVIDIA AI Foundations 是一個云服務代工廠,用
61、于構建自定義語言模型和生成式是一個云服務代工廠,用于構建自定義語言模型和生成式 AI。自十年前 AlexNet 面市以來,深度學習就開辟了巨大的新市場,包括自動駕駛、機器人、智能音箱,并重塑了購物、了解新聞和享受音樂的方式。這只是冰山一角,隨著生成式 AI 掀起新一波機遇浪潮,AI 正處于轉折點,使得推理工作負載呈階梯函數式增長。AI現在可以生成多種數據,從語音、文本、圖像、視頻和 3D 圖形,到蛋白質和化學物質,不一而足。設計一個云數據中心來處理生成式 AI 是一項巨大挑戰,一方面,理想情況下最好使用一種加速器,因為這可以使得數據中心具有彈性,能夠應對不可預測的流量峰值和低谷;但另一方面,沒
62、有一個加速器能以最優的方式處理在算法、模型、數據類型和數據大小方面的多樣性,NVIDIA 的 One Architecture 平臺兼具加速功能和彈性。5、推理芯片、推理芯片平臺:平臺:面向面向 AI 視頻、視頻、Omniverse 和圖形渲染、和圖形渲染、ChatGPT 等大型語言模型等大型語言模型等應用等應用 公司公司宣布推出全新的推理平臺:四種配置,一個體系架構,一個軟件棧,每種配置都針對某一類工作負載進行了優化。宣布推出全新的推理平臺:四種配置,一個體系架構,一個軟件棧,每種配置都針對某一類工作負載進行了優化。圖圖 20:NVIDIA全新推理平臺全新推理平臺 資料來源:NVIDIA G
63、TC,招商證券 敬請閱讀末頁的重要說明 18 行業簡評報告 1)針對針對 AI 視頻工作負載,視頻工作負載,公司公司推出了推出了 L4。它針對以下方面進行了優化:視頻解碼和轉碼、視頻內容審核,以及視頻通話功能,例如背景替換、重新打光、眼神交流,轉錄和實時翻譯。如今大多數云端視頻都在 CPU 上處理,一臺8-GPU L4 服務器將取代一百多臺用于處理 AI 視頻的雙插槽 CPU 服務器。Snap 是 NVIDIA AI 在計算機視覺和推薦系統領域領先的用戶。NVIDIA 和 Google Cloud 正在努力加速在 L4 上部署主要工作負載。首先,公司正在加速針對Wombo和Descript等云
64、服務的生成式AI模型的推理;其次,公司會將Triton推理服務器與Google Kubernetes Engine和 VertexAI 集成;第三,公司將使用 NVIDIA Spark-RAPIDS 加速 Google Dataproc;第四,公司將加速 AlphaFold UL2 和 T5 大型語言模型;第五,公司將加速 Google Cloud 的沉浸式流,以渲染 3D 和 AR 體驗。2)針對針對 Omniverse、圖形渲染以及文本轉圖像和文本轉視頻等生成式、圖形渲染以及文本轉圖像和文本轉視頻等生成式 AI,公司公司推出推出 L40。L40 的性能是 NVIDIA最受歡迎的云推理 GP
65、U T4 的 10 倍。Runway 是生成式 AI 領域的先驅,他們正在發明用于創作和編輯內容的生成式AI 模型,借助 30 多種來自云端的 AI Magic Tools,他們的服務將徹底改變創作過程。在本地或云端運行的最新一代NVIDIA GPU 的助力下,Runway 讓用戶只需簡單幾筆即可從視頻中移除一個對象,或僅使用一個輸入圖像就可以對視頻應用不同的樣式,或更改視頻的背景或前景。過去使用傳統工具需要數小時才能完成的工作,現在只需短短幾分鐘就可以獲得專業廣播級質量的結果。在實現這一點的過程中,Runway 采用了 CV-CUDA,它是一個開源項目,使開發者能夠構建 GPU 加速的高效計
66、算機視覺工作負載預處理和后處理流程,并將其擴展到云。借助 NVIDIA 技術,Runway 得以行不可能之事,讓內容創作者獲得最佳體驗。以前受限的專業工作現在可以由您來完成,事實上 Runway在奧斯卡提名的好萊塢電影中得到了應用,而公司正在致力將這項技術提供給全世界的創作者。3)針對針對 ChatGPT 等大型語言模型的推理,等大型語言模型的推理,公司公司推出一款新的推出一款新的 Hopper GPU。配備雙 GPU NVLINK 的 PCIE H100,這一款 H100 配備 94GB HBM3 顯存,H100 可以處理擁有 1750 億參數的 GPT-3,同時還可支持商用 PCIE 服務
67、器輕松擴展。目前在云上唯一可以實際處理 ChatGPT 的 GPU 是 HGX A100,與適用于 GPT-3 處理的 HGX A100 相比,一臺搭載四對 H100 及雙 GPU NVLINK 的標準服務器的速度要快 10 倍。H100 可將大型語言模型的處理成本降低一個數量級。4)Grace Hopper是新的超級芯片。是新的超級芯片。通過900 GB/秒的高速一致性芯片到芯片接口連接Grace CPU和Hopper GPU。Grace Hopper 非常適合處理大型數據集,例如適用于推薦系統和大型語言模型的 AI 數據庫。如今,利用大容量內存,CPU 會存儲和查詢巨型嵌入表,然后將結果傳
68、輸到 GPU 進行推理,借助 Grace-Hopper,Grace 可以查詢嵌入表,并將結果直接傳輸到 Hopper,速度比 PCIE 快 7 倍,客戶希望構建規模大幾個數量級的 AI 數據庫,Grace-Hopper是理想的引擎,以上就是 NVIDIA 的推理平臺,一個為適用于多種 AI 負載,最大化的數據中心加速和彈性而設計的架構。6、Omniverse 虛擬工廠:溝通數字和實體,幫助工業倉儲、汽車等領域快速搭建工廠虛擬工廠:溝通數字和實體,幫助工業倉儲、汽車等領域快速搭建工廠 Omniverse 是一個工業數字化平臺,旨在搭建數字化和物理實體之間的橋梁。是一個工業數字化平臺,旨在搭建數字
69、化和物理實體之間的橋梁。該平臺讓各個行業先以數字方式設計、構建、運營和優化實體產品和工廠,然后再投入實際生產,數字化提高了效率和速度,并節省了資金。Omniverse 其中一個用途是以虛擬方式構建工廠,在真正的實體工廠建成之前,以數字方式整合工廠的所有機械設備,這樣可以減少在最后時刻出現意外、變更訂單和工廠延遲開工等情況,虛擬工廠整合可以為全球工廠節省數十億美元。半導體行業正在投資 5000 億美元來建造 84 個新晶圓廠,到 2030 年,汽車制造商將建造 300 家工廠生產 2 億輛電動汽車,電池制造商正在建造 100 多家特大型工廠,數字化也在改變物流行業,在全球數十億平方英尺的倉庫之間
70、輾轉運輸貨物。Omniverse 在倉儲領域的應用:在倉儲領域的應用:我們來看看 Amazon 如何使用 Omniverse 自動化、優化和規劃其自動倉庫。Amazon Robotics 制造并部署了非常龐大的移動工業機器人機群,此機器人機群的最新成員是 Proteus,這是 Amazon 首個完全自主的倉庫機器人。Proteus 可利用先進的安全、感知和導航技術在公司的設施中移動。Proteus 具有多個傳感器,其中包括攝像頭激光雷達和超聲傳感器,用于為其自主軟件系統提供支持,Proteus 團隊需要提高神經網絡的性能,該神經網絡能夠讀取基準標記并幫助機器人,確定其在地圖上的位置。訓練由機器
71、人傳感器輸入驅動的 ML 模型需要大量正確的數據,通過 Isaac Sim 中的 Omniverse Replicator,Amazon Robotics 成功生成了大型逼真合成數據集,將標記檢測成功率從 88.6%提高到了 98%。此外,使用 Omniverse Replicator 生成的合成數據還加快了開發速度,將所需時間從幾個月縮短到了幾天,因為與僅使用真實數據相比,公司能夠以更快的速度迭代測試和訓練模型。為了 敬請閱讀末頁的重要說明 19 行業簡評報告 給不斷壯大的 Proteus 機器機群提供新的自主功能,Amazon Robotics 正在努力縮小仿真與現實之間的差距,構建大規模
72、的多傳感器、多機器人仿真。借助 Omniverse,Amazon Robotics 將通過全保真倉庫數字孿生優化運營,無論是生成合成數據還是開發更高水平的自主功能,基于 Omniverse 的 Isaac Sim,都可幫助 Amazon Robotics 團隊在設施中部署 Proteus 之時節省時間和資金。圖圖 21:Proteus 機器人機器人 圖圖 22:倉儲應用示例:倉儲應用示例 資料來源:NVIDIA GTC,招商證券 資料來源:NVIDIA GTC,招商證券 Omniverse 具備獨特的數字化技術,是具備獨特的數字化技術,是 USD 的首要開發平臺,幫助團隊協作,創建虛擬世界和數
73、字孿生。的首要開發平臺,幫助團隊協作,創建虛擬世界和數字孿生。Omniverse基于物理性質,反映物理定律,它可以連接到機器人系統,并使用環路中的硬件進行操作,它采用生成式 AI 來加速創建虛擬世界,Omniverse 可以管理大型數據集,公司在每個領域都對 Omniverse 進行了重大更新。已有近 30 萬名創作者和設計師下載了 Omniverse,Omniverse 不是一種工具,而是一個 USD 網絡和共享數據庫,也是一種與各行各業使用的設計工具相連接的基礎結構。它可以連接、合成和模擬使用行業領先工具創建的 3D 資產,公司很高興看到 Omniverse 生態連接的發展壯大,每個連接都
74、會將一個平臺的生態系統與所有其他平臺的生態系統連接到一起。Omniverse網絡中的網絡正在呈指數級增長,現已連接Bentley Systems LumenRT,還連接了Siemens Teamcenter、NX 和 Process Simulate、Rockwell Automation Emulate 3D、Cesium、Unity 等許多應用。圖圖 23:Omniverse 連接的應用連接的應用 資料來源:NVIDIA GTC,招商證券 Omniverse 在汽車領域的應用:在汽車領域的應用:我們來看看價值 3 萬億美元的汽車行業的數字化,了解汽車公司如何在其工作流中評估 Omniver
75、se。沃爾沃汽車公司和通用汽車使用 Omniverse USD Composer 連接和統一其資產工作流,通用汽車使用 Alias、Siemens NX、Unreal、Maya 和 3ds Max 將設計師、雕塑家和藝術家連接到一起,并將汽車零部件在虛擬環境中組裝成數字孿生汽車,在工程和仿真中,他們在 Omniverse 中將 Powerflow 空氣動力學可視化,對于新一代梅賽德斯奔馳和捷豹路虎汽車,工程師在 Omniverse 中使用 Drive Sim 生成,合成數據來訓練 AI 模型,通過虛擬NCAP 駕駛測試驗證主動安全系統,并模擬真實駕駛場景。Omniverse 的生成式 AI 將
76、以前駕駛的路線重構為 3D,以 敬請閱讀末頁的重要說明 20 行業簡評報告 便重現或修改過去的體驗。借助 Idealworks,寶馬在 Omniverse 中使用 Isaac Sim 生成合成數據和場景,用來訓練工廠機器人,Lotus 正在使用 Omniverse 以虛擬方式組裝焊接站,豐田公司正在使用 Omniverse 構建自己工廠的數字孿生,梅賽德斯-奔馳使用 Omniverse 為新車型構建、優化和規劃組裝流水線,Rimac 和 Lucid Motors 使用Omniverse 根據真實的設計數據構建數字商店,這些數據準確地反映他們的汽車的狀況。寶馬正在使用 Omniverse 規劃全
77、球近三十家工廠的運營,在實際工廠開業兩年之前,他們會在 Omniverse 中完整建造一間新的電動汽車工廠。全球各行各業都在加速數字化發展,未來三年,該領域的投資金額將超過 3.4 萬億美元,寶馬努力在汽車數字化領域處于領先地位。圖圖 24:汽車工廠應用示例:汽車工廠應用示例 資料來源:NVIDIA GTC,招商證券 借助借助 NVIDIA Omniverse 和和 AI,公司公司能夠更快地建立新工廠,并更高效地進行生產,節省大量成本。能夠更快地建立新工廠,并更高效地進行生產,節省大量成本。這一切都要從規劃開始。這是一個復雜的過程,在此過程中,公司需要將許多工具,數據集和遍布全球的專家串聯起來
78、。傳統上,公司受到限制,因為數據在各種系統和工具中單獨管理,如今,這種局面已經實現了全方位的改變。公司正在開發自定義 Omniverse 應用,以將現有的工具、專門知識和團隊聯系在一起,使其處在統一視圖中。Omniverse 是云原生同時不限平臺,可讓團隊隨時隨地在虛擬工廠中開展協作。Omniverse 是實現工業數字化的數字到物理操作系統,今天是實現工業數字化的數字到物理操作系統,今天公司公司要宣布推出三款專為運行要宣布推出三款專為運行 Omniverse 而設計的系統。而設計的系統。首先,公司將推出由 NVIDIA Ada RTX GPU 和英特爾的最新款 CPU 提供動力支持的新一代工作
79、站,這款新工作站非常適合用于光線追蹤、物理仿真、神經圖形和生成式 AI。從 3 月開始,Boxx、戴爾、惠普和聯想將提供這款工作站;其次,針對 Omniverse 優化的新型 NVIDIA OVX 服務器,OVX 由服務器 GPU Ada RTX L40 和公司的新款 BlueField-3組成,OVX 服務器將由戴爾、HPE、Quanta、技嘉、聯想和 Supermicro 提供,每一層 Omniverse 的堆棧包括芯片、系統、網絡和軟件在內都是新發明。構建和操作 Omniverse 計算機需要一個成熟的 IT 團隊,公司將快速輕松地擴展和運用 Omniverse。敬請閱讀末頁的重要說明
80、21 行業簡評報告 圖圖 25:NVIDIA 和英特爾支持的和英特爾支持的新一代工作站新一代工作站 圖圖 26:NVIDIA OVX 服務器服務器 資料來源:NVIDIA GTC,招商證券 資料來源:NVIDIA GTC,招商證券 Omniverse Cloud 應用示例:應用示例:全球大型行業競相實現其物理流程的數字化,目前,這是一項復雜的任務。NVIDIA Omniverse Cloud 是一種平臺即服務,支持即時安全地訪問托管的 Omniverse Cloud API 工作流,以及在 NVIDIA OVX上運行的可定制應用,企業團隊通過 Web 瀏覽器 Omniverse Launche
81、r 或通過自定義集成,訪問托管服務套件,進入 Omniverse Cloud 后,企業團隊可以立即訪問、擴展和發布基礎應用和工作流,以組裝和構建虛擬世界,生成用于訓練感知 AI 的數據,測試和驗證自動駕駛汽車,或模擬自主機器人,從而訪問共享數據,并將其發布到 Omniverse Nucleus,設計師和工程師在 RTX 工作站上使用他們慣用的第三方設計工具,并行發布對 Nucleus 的編輯,然后,當準備好在 Omniverse 中迭代或查看其集成模型時,只需打開 Web 瀏覽器并登錄即可。隨著項目和團隊規模的擴大,Omniverse Cloud 可根據需要調配計算資源和許可證,從而優化成本,
82、新的服務和升級會自動獲得實時更新。圖圖 27:Omniverse 模型模型 資料來源:NVIDIA GTC,招商證券 公司公司宣布推出宣布推出 NVIDIA Omniverse Cloud,這是一種完全托管的云服務。,這是一種完全托管的云服務。公司正在與 Microsoft 合作,將 Omniverse Cloud 引入全球各個行業,將在 Azure 中托管它,并通過 Microsoft 豐富的存儲、安全性、應用和服務組合受益。公司正在將 Omniverse Cloud 連接到 Microsoft 365 生產力套件,其中包括 Teams、OneDrive、SharePoint,和 Azure
83、 IoT Digital Twins 服務。Microsoft 和 NVIDIA 正在將 Omniverse 帶給數以億計的 Microsoft 365 和 Azure 用戶,加速計算和 AI 技術已經走進現實,開發者使用 NVIDIA 來提速和擴大規模,從而解決之前無法解決的問題。敬請閱讀末頁的重要說明 22 行業簡評報告 圖圖 28:Omnicerse Cloud 支持功能支持功能 資料來源:NVIDIA GTC,招商證券 凈零排放是一項艱巨的挑戰,每家公司都必須加速所有工作負載以減少功耗,加速計算是一項全棧的數據中心級計算挑戰,Grace、Grace-Hopper 和 BlueField
84、-3 是適用于超級節能加速數據中心的新芯片,加速庫可解決新挑戰,開辟新市場,公司更新了 100 個加速庫,包括用于量子計算的 cuQuantum、用于組合優化的 cuOpt,以及用于計算光刻的 cuLitho,公司很高興能與臺積電、ASML 和 Synopsys 合作達到 2 納米及更高精度制程。NVIDIA DGX AI 超級計算機是生成式大型語言模型取得突破的引擎,DGX H100 AI 超級計算機正在生產中,并即將通過全球不斷擴大的 OEM 和云服務合作伙伴網絡面世。DGX 超級計算機沒有止步于研究,正在成為現代化的 AI 工廠,每家公司都將會制造智能,公司通過與 Microsoft A
85、zure、Google GCP 和 Oracle OCI 合作,借此擴展 NVIDIA DGX Cloud 的業務模式,通過一個瀏覽器就可以將 NVIDIA DGX AI 超級計算機即時地接入每家公司,DGX Cloud 為客戶提供在 NVIDIA 和全球范圍內都出類拔萃的 CSP。7、結語:、結語:AI 的的“iPhone 時刻”時刻”已來已來 我們我們正處于正處于 AI 的“的“iPhone 時刻”,生成式時刻”,生成式 AI 推理工作負載已進入超速運行狀態。推理工作負載已進入超速運行狀態。公司推出了新的推理平臺:四種配置,一個體系架構,適用于AI視頻的L4,適用于Omniverse和圖形
86、渲染的L40,適用于擴展LLM推理的H100 PCIE,適用于推薦系統和向量數據庫的 Grace-Hopper。NVIDIA 推理平臺可最大化提高數據中心加速和彈性。NVIDIA 和 Google Cloud 正在合作部署廣泛的推理工作負載,通過此次合作,Google GCP 成為了首款 NVIDIA AI云。NVIDIA AI Foundations 是一個云服務和代工廠,用于構建自定義語言模型和生成式 AI,NVIDIA AI Foundations包括語言、視覺和生物學模型制作服務。Getty Images 和 Shutterstock 正在構建自定義視覺語言模型,公司正與 Adobe合
87、作,為創造性的未來構建一系列新一代 AI 功能。Omniverse 是實現工業數字化的數字到物理操作系統,Omniverse可以統一端到端工作流,并將價值 3 萬億美元,擁有 1400 萬員工的汽車行業數字化,Omniverse 正在躍上云端,公司在 Azure 上進行托管,與 Microsoft 合作,Omniverse Cloud 引入全球各個行業。敬請閱讀末頁的重要說明 23 行業簡評報告 圖圖 29:NVIDIA 硬件與支持功能更新情況硬件與支持功能更新情況 資料來源:NVIDIA GTC,招商證券 敬請閱讀末頁的重要說明 24 行業簡評報告 分析師分析師承諾承諾 負責本研究報告的每一
88、位證券分析師,在此申明,本報告清晰、準確地反映了分析師本人的研究觀點。本人薪酬的任何部分過去不曾與、現在不與,未來也將不會與本報告中的具體推薦或觀點直接或間接相關。鄢凡:鄢凡:北京大學信息管理、經濟學雙學士,光華管理學院碩士,14 年證券從業經驗,08-11 年中信證券,11 年加入招商證券,現任研發中心董事總經理、電子行業首席分析師、TMT 及中小盤大組主管。11/12/14/15/16/17/19/20/21/22年新財富電子行業最佳分析師第 2/5/2/2/4/3/3/4/3/5 名,11/12/14/15/16/17/18/19/20 年水晶球電子2/4/1/2/3/3/2/3/3 名
89、,10/14/15/16/17/18/19/20 年金牛獎TMT/電子第 1/2/3/3/3/3/2/2/1 名,2018/2019 年最具價值金牛分析師。曹輝:曹輝:上海交通大學工學碩士,2019/2020 年就職于西南證券/浙商證券,2021 年加入招商電子團隊,任電子行業分析師,主要覆蓋半導體領域。王恬:王恬:電子科技大學金融學、工學雙學士,北京大學金融學碩士,2020 年在浙商證券,2021 年加入招商電子團隊,任電子行業分析師。程鑫:程鑫:武漢大學工學、金融學雙學士,中國科學技術大學碩士,2021 年加入招商電子團隊,任電子行業研究助理。諶薇:諶薇:華中科技大學工學學士,北京大學微電
90、子碩士,2022 年加入招商電子團隊,任電子行業研究助理。評級評級說明說明 報告中所涉及的投資評級采用相對評級體系,基于報告發布日后 6-12 個月內公司股價(或行業指數)相對同期當地市場基準指數的市場表現預期。其中,A 股市場以滬深 300 指數為基準;香港市場以恒生指數為基準;美國市場以標普 500 指數為基準。具體標準如下:股票股票評級評級 強烈推薦:預期公司股價漲幅超越基準指數 20%以上 增持:預期公司股價漲幅超越基準指數 5-20%之間 中性:預期公司股價變動幅度相對基準指數介于 5%之間 減持:預期公司股價表現弱于基準指數 5%以上 行業評級行業評級 推薦:行業基本面向好,預期行
91、業指數超越基準指數 中性:行業基本面穩定,預期行業指數跟隨基準指數 回避:行業基本面轉弱,預期行業指數弱于基準指數 重要重要聲明聲明 本報告由招商證券股份有限公司(以下簡稱“本公司”)編制。本公司具有中國證監會許可的證券投資咨詢業務資格。本報告基于合法取得的信息,但本公司對這些信息的準確性和完整性不作任何保證。本報告所包含的分析基于各種假設,不同假設可能導致分析結果出現重大不同。報告中的內容和意見僅供參考,并不構成對所述證券買賣的出價,在任何情況下,本報告中的信息或所表述的意見并不構成對任何人的投資建議。除法律或規則規定必須承擔的責任外,本公司及其雇員不對使用本報告及其內容所引發的任何直接或間接損失負任何責任。本公司或關聯機構可能會持有報告中所提到的公司所發行的證券頭寸并進行交易,還可能為這些公司提供或爭取提供投資銀行業務服務??蛻魬斂紤]到本公司可能存在可能影響本報告客觀性的利益沖突。本報告版權歸本公司所有。本公司保留所有權利。未經本公司事先書面許可,任何機構和個人均不得以任何形式翻版、復制、引用或轉載,否則,本公司將保留隨時追究其法律責任的權利。