《電子行業COMPUTEX 2024跟蹤報告:NV領銜大廠展示算力前景AI PC等端側應用加速落地-240607(37頁).pdf》由會員分享,可在線閱讀,更多相關《電子行業COMPUTEX 2024跟蹤報告:NV領銜大廠展示算力前景AI PC等端側應用加速落地-240607(37頁).pdf(37頁珍藏版)》請在三個皮匠報告上搜索。
1、 敬請閱讀末頁的重要說明 證券研究報告|行業簡評報告 2024 年 06 月 07 日 推薦推薦(維持)(維持)COMPUTEX 2024跟蹤報告跟蹤報告 TMT 及中小盤/電子 事件:事件:COMPUTEX 為全球最大的電腦和技術貿易展之一,吸引全球上千家廠商參會,近年來亦成為全球科技生態鏈聚集之處。COMPUTEX 2024 于 6 月 4 日至 7 日在中國臺灣如期舉辦,以“AI 串聯、共創未來”為主題。綜合主題演講和展會信息,我們整理了各大廠商對于前沿科技的最新動態和展望,我們認為本屆大會 AI 賦能成主旋律,AI 算力、AI PC 等端側應用為主要關注點。評論:評論:1、算力:各家大
2、廠均展出算力:各家大廠均展出GPU升級迭代圖,數據中心液冷方案滲透率提升。升級迭代圖,數據中心液冷方案滲透率提升。1)英偉達:)英偉達:Blackwell Ultra:B 系列下一代產品(2025 年推出,8 顆 HBM3e),配合 Spectrum Ultra X800 以太網交換機新品。下一代平臺:Rubin 平臺(2026年推出),包括 Rubin GPU(8 顆 HBM4)、Vera CPU、NVLink6 交換機芯片(3600GB/s)、CX9 SuperNIC(1.6Gb/s)、X1600 IB/以太網芯片,對應下一代 GPU 為 Rubin Ultra(12 顆 HBM4,202
3、7 年推出)。2)AMD:CPU,第四代EPYC比此前可減少80%的rack空間,降低65%的能源消耗。第五代EPYC Turin(3 納米與 6 納米)將于 24H2 推出;GPU,MI 325X 比 H200 具備更高存儲與運算能力,與 MI 300X 使用相同架構,方便客戶進行替換。單個帶有 8顆 MI 325X 芯片的服務器可同時運行高達 1 萬億個參數,是 H200 的兩倍。同時公司加入 UA Link 與 UEC,致力推動 AI 互連發展。3)英特爾英特爾:CPU,Xeon 6(144 核)比 Xeon 2(28 核)快 4.2 倍,3:1 的 rack consolidation
4、 ratio,同時今年公司將推出第二代Xeon 6(288 核),形成6:1 的rack consolidation ratio;GPU,Gaudi3 比 H100 性能更高,TCO 更低,time-to-train 比 H100 快 40%,Inference Throughout 快 15%,Inferencing 快 2.3 倍。4)Supermicro:DLC液冷解決方案可節省 OPEX 達 40%,5 年內節省 6000 萬美金。公司目標將 DLC市場份額一年內提高到 15%,2 年內提高至 30%。目前每天的液冷機架出貨量已經超過 50 個,總體機架出貨每月 1000 多個,產能每
5、月 5000 個,同時馬來西亞工廠將于 24Q4 上線。2、AI端:端:AI PC加速落地,關注加速落地,關注ARM架構或帶來架構或帶來PC處理器市場格局變化處理器市場格局變化。1)高通:)高通:搭載驍龍 X Elite/Plus 的設備支持 Copilot+PC 體驗,采用 ARM 架構,相較于 X86 架構能效比更優,NPU 算力達 45 TOPS,NPU 每瓦特性能與酷睿Ultra 7 相比高 5.4 倍;首批超過 20 款搭載驍龍 X Elite/Plus 的 Copilot+PC 現已開啟預售,6 月 18 日起可購買。2)ARM:分享了憑借 Kleidi AI 和 Arm CSS等
6、創新,預計到 2025 年 Arm 設備將超過 1000 億臺,公司目標是在五年內獲得Windows PC 市場超過 50%的份額。3)聯發科:)聯發科:宣布加入 Arm 全面設計,新一代 Chromebook、智能電視和顯示設備芯片亮相。4)AMD:搭載 Ryzen AI 300系列的 AI PC 將于 7 月上市,NPU 性能業內領先,達 50 TOPs。5)英特爾:)英特爾:公布 Lunar Lake 處理器架構細節,將于 24Q3 為 80 多種新型 AI PC 設計提供支持。6)英偉達:)英偉達:認為 AI 下一波浪潮是 Physical AI,重點闡述了機器人等相關應用。3、投資建
7、議:投資建議:關注關注AI算力算力、AI端側端側持續持續創新創新帶來的投資機遇。帶來的投資機遇。1)AI算力:算力:NV 超級算力產品不斷賦力各領域應用,硬件領域建議關注英偉達英偉達及其產業鏈標的,關注服務器硬件層面所涉及到的 GPU、CPU、存儲、高速連 行業規模行業規模 占比%股票家數(只)494 9.7 總市值(十億元)6790.5 8.9 流通市值(十億元)5621.7 8.2 行業指數行業指數%1m 6m 12m 絕對表現-2.9-21.1-22.7 相對表現-2.6-27.0-16.2 資料來源:公司數據、招商證券 相關相關報告報告 1、消費電子行業深度跟蹤報告:一季報業績邊際改善
8、,關注 GPT-4o與蘋果 AI 終端創新2024-05-20 2、半導體行業月度深度跟蹤:一季報景氣邊際改善,關注復蘇持續性和結構性機會2024-05-14 鄢凡鄢凡 S1090511060002 王恬王恬 S1090522090002 諶薇諶薇 研究助理 涂錕山涂錕山 研究助理 -40-30-20-10010Jun/23Sep/23Jan/24May/24(%)電子滬深300NV領銜大廠展示算力領銜大廠展示算力前景前景,AI PC等端側等端側應用應用加速落地加速落地 敬請閱讀末頁的重要說明 2 行業簡評報告 接器和電光連接、PCB/IC 載板、散熱、電源、各類輔助芯片等零部件和先進封裝/H
9、BM 等的投資機會,建議關注 GB200 新平臺以及未來 Rubin 系列下的高速電連接等新技術應用,關注在高速電連接領域深度布局的安費諾安費諾和立訊精密立訊精密等巨頭及對應的產業鏈供應商。2)AI端:端:我們認為隨著終端品牌、芯片、軟件應用等產業鏈龍頭在 AI 技術上的共同投入,PC/手機/機器人/XR/可穿戴/智能汽車/智能家居等終端有望迎來 AI創新浪潮,近期 AI 端側創新加速落地,把握 AI 端側持續創新帶來的投資機遇。我們建議關注:1)蘋果 AI 端側硬件 AI 化升級提速,WWDC 24 或將展示蘋果AI 相關布局,積極把握蘋果鏈優質公司低位布局機會,繼續首推立訊精密立訊精密,看
10、好高偉電子、比亞迪電子、水晶光電、鵬鼎高偉電子、比亞迪電子、水晶光電、鵬鼎控股、控股、東山東山精密精密、長盈精密、環旭、長盈精密、環旭電子電子等,并關注瑞聲科技、瑞聲科技、兆威機電兆威機電等;2)其他品牌端的 AI 大模型及應用布局,如小米集團、傳音控股、小米集團、傳音控股、聯想集團聯想集團(計算機組聯合)、螢石網絡、螢石網絡、??低?低?、視、大華大華股份股份、漫步者、漫步者等;3)AI 驅動零部件創新,GPT-4o 視頻交互能力有望驅動終端攝像頭升級,關注光學鏈高偉電子、舜宇光學、韋爾高偉電子、舜宇光學、韋爾/格科格科/思特威思特威等,以及 SoC/晶圓代工/存儲/聲學/PCB/被動元件
11、/散熱/電池/電磁屏蔽等環節。風險提示:風險提示:宏觀經濟波動加劇宏觀經濟波動加劇、行業景氣度變化行業景氣度變化、電子產業競爭加劇電子產業競爭加劇、地緣政地緣政治及匯率風險。治及匯率風險。(后附(后附COMPUTEX 2024主題演講要點主題演講要點)敬請閱讀末頁的重要說明 3 行業簡評報告 正文正文目錄目錄 附錄:COMPUTEX 2024 主題演講要點.6 1、AI 算力:各家大廠均展出 GPU 升級迭代圖,數據中心液冷方案滲透率提升.6(1)英偉達:展示 Blackwell 系列全套解決方案,展示未來 3 年數據中心 GPU 發展規劃.6(2)AMD:24H2 將推出 CPU Turin
12、 與 GPU MI325X.14(3)英特爾:推出新處理器 Xeon 6,展示 Gaudi3 兼具價格與性能優勢.19(4)Supermicro:服務器可搭載各家最新芯片產品,將推動服務器液冷系統市占迅速提升.21 2、AI 端:AI PC 加速落地,關注 ARM 架構或帶來 PC 處理器市場格局變化.28(1)高通:展示驍龍 X 系列和 Copilot+PC 如何助力重塑 PC,6 月中可購買.28(2)ARM:25 年 Arm 設備將達 1000 多億臺,5 年內獲得 Windows PC 市場超過 50%份額.30(3)聯發科:加入 Arm 全面設計,新一代 Chromebook、智能電
13、視和顯示設備芯片亮相.31(4)AMD:搭載 Ryzen AI 300 系列的 AI PC 將于 7 月上市,NPU 性能業內領先.33(5)英特爾:公布 Lunar Lake 處理器架構細節,將于 24Q3 為 80 多種新型 AI PC 設計提供支持.34(6)英偉達:AI 下一波浪潮是 Physical AI,關注機器人等熱門應用領域.35 圖表圖表目錄目錄 圖 1:Blackwell 平臺.6 圖 2:Grace CPU.7 圖 3:Blackwell 能耗節省.8 圖 4:DGX Blackwell 與 DGX Hopper.8 圖 5:DGX Blackwell 實圖.9 圖 6:
14、MGX 系統實圖.9 圖 7:NVLink Switch 芯片.9 圖 8:GPU 機柜實圖.10 圖 9:DGX GPU 實圖.10 圖 10:Spectrum X800.11 圖 11:從 Blackwell 到數據中心的發展.11 圖 12:從 Blackwell 到數據中心的發展.12 圖 13:從 Blackwell 到數據中心的發展.12 圖 14:從 Blackwell 到數據中心的發展.13 圖 15:從 Blackwell 到數據中心的發展.13 圖 16:Rubin 平臺.14 圖 17:公司產品發展.14 圖 18:數據中心 EPYC 發展歷程.15 圖 19:最新 EP
15、YC 運行速度比較.15 敬請閱讀末頁的重要說明 4 行業簡評報告 圖 20:EPYC 數據中心數據比較.16 圖 21:EPYC 端到端 AI 性能比較.16 圖 22:第五代 EPYC 產品數據.16 圖 23:第五代 EPYC 產品數據將于下半年推出.16 圖 24:AMD GPU 產品 Roadmap.17 圖 25:MI 325X 產品數據.17 圖 26:MI 325X 與 H200 比較.17 圖 27:MI 350 系列產品數據.18 圖 28:MI 350 與 B200 比較.18 圖 29:UA Link 合作伙伴.18 圖 30:UEC 合作伙伴.18 圖 31:AMD
16、產品組合.19 圖 32:Xeon6(右)與 Xeon2(20 個,左)比較.19 圖 33:Xeon6 服務器優勢.19 圖 34:Xeon+RAG.20 圖 35:Gaudi2.20 圖 36:AI for Enterprise.20 圖 37:Gaudi3 與 H100 比較.21 圖 38:Gaudi3 合作生態.21 圖 39:Gaudi3 合作伙伴產品.21 圖 40:DLC 與 Air-Cooled 比較.22 圖 41:DLC 與 Air-Cooled 比較.22 圖 42:過去 DLC 的缺陷.23 圖 43:公司現今 DLC 優點.23 圖 44:Supermicro 機架
17、展示.23 圖 45:Supermicro 機架展示.23 圖 46:Supermicro 產品展示.24 圖 47:Supermicro 產品展示.24 圖 48:Supermicro 產品展示.24 圖 49:Supermicro 產品展示.25 圖 50:Supermicro 256 GPUs 集群 9 Rack SU.25 圖 51:Supermicro 256 GPUs 集群 5 Rack SU.25 圖 52:SuperCloud Composer 軟件.26 圖 53:馬來西亞工廠 24Q4 上線.26 圖 54:Supermicro 邊緣 AI 推理產品組合.27 圖 55:S
18、upermicro DLC 份額規劃.27 圖 56:高通 X Elite 擁有出色的每瓦特性能.28 敬請閱讀末頁的重要說明 5 行業簡評報告 圖 57:高通 X Elite CPU 性能領先.28 圖 58:高通驍龍 X 系列平臺賦能的 Copilot+設備.29 圖 59:高通合作伙伴引言.29 圖 60:高通 AI Hub.30 圖 61:高通 X Elite 可運行超過 1200 款游戲.30 圖 62:ARM Kleidi AI 介紹.31 圖 63:ARM CSS 介紹.31 圖 64:Arm 預計到 25 年 Arm 設備將達 1000 多億臺.31 圖 65:聯發科加入 Ar
19、m 全面設計.32 圖 66:聯發科 AI 具備領先的加速器能力.32 圖 67:聯發科 838 Kompanio 838 產品展示.32 圖 68:ARM 下一代“Zen 5”CPU.33 圖 69:ARM 新的 NPU 性能領先.33 圖 70:AMD AI PC 合作伙伴.34 圖 71:英特爾 Lunar Lake 處理器亮點.35 敬請閱讀末頁的重要說明 6 行業簡評報告 附錄:附錄:COMPUTEX 2024主題演講主題演講要點要點 1、AI算力:算力:各家大廠均展出各家大廠均展出GPU升級迭代圖,數據中心升級迭代圖,數據中心液冷方案滲透率提升液冷方案滲透率提升(1)英偉達)英偉達
20、:展示展示Blackwell系列全套解決方案,展示未來系列全套解決方案,展示未來3年數年數據中心據中心GPU發展規劃發展規劃 Blackwell平臺:平臺:Blackwell芯片每秒傳輸芯片每秒傳輸10TB,第五代第五代NV Link允許將多個允許將多個GPU連在一起連在一起且且具有高可靠性。具有高可靠性。Blackwell 擁有幾項非常重要的技術,其中之一就是芯片的尺寸,公司采用了兩個臺積電能夠生產出的最大的芯片,用世界上最先進的連接,每秒傳輸 10 TB,將兩個芯片連接在一起,將這兩個芯片連接在一起后,公司將其中兩個芯片放在一個計算機節點上,該節點與 Grace CPU 相連。在訓練中,G
21、race CPU 可用于多種用途,在推理和生成的情況下,它可以用來存儲上下文記憶,這樣人工智能就有了記憶,并能理解用戶想進行的對話的上下文。公司的第二代transformer 引擎,允許公司根據計算層所需的精度和范圍,動態適應較低的精度。公司擁有安全人工智能的第二代 GPU,這樣就可以要求服務提供商保護用戶的人工智能不被竊取、盜竊或篡改。公司的第五代 NV Link,允許將多個 GPU連接在一起,這也是公司第一代具有可靠性和可用性引擎的產品,這套“RAS system”允許測試每一個晶體管觸發器、芯片上的內存、芯片外的內存,這樣公司就能在現場確定某個芯片的平均無故障時間(MTBF)是否失效。在
22、一個系統中,擁有 10000 個 GPU 的超級計算機的故障間隔時間是可以測量的,而擁有10 萬個 GPU 的超級計算機的故障間隔時間則以分鐘為單位,因此,如果不提高超級計算機的可靠性,那么超級計算機要想長期運行并訓練出一個可以持續數月的模型,實際上是不可能的。當然,可靠性會提高正常運行時間,而正常運行時間會直接影響成本。最后,解壓縮引擎數據處理是公司必須做的最重要的事情之一,公司增加了數據壓縮引擎和解壓縮引擎,這樣從存儲中提取數據的速度就能比現在快 20 倍。圖圖1:Blackwell平臺平臺 資料來源:英偉達,招商證券 敬請閱讀末頁的重要說明 7 行業簡評報告 這是世界上最復雜、最高性能的
23、計算機,這是 Grace CPU,是世界上最大的芯片,然后用每秒 10 TB 的鏈路把這兩個連接在一起。圖圖2:Grace CPU 資料來源:英偉達,招商證券 Blackwell提高計算量同時降低成本。提高計算量同時降低成本。計算能力、運算能力、人工智能運算能力,每一代都在八年內增長了 1000 倍,摩爾定律在八年內的速度大概是 60 倍,而在過去的八年里,摩爾定律的發展速度要慢得多,即使摩爾定律在最好的時候也比不上 Blackwell 的能力,它的計算量是驚人的。只要公司提高計算量,成本就會降低,公司通過其計算能力訓練一個 GPT4(2 萬億個參數、8 萬億個 tokens)的能耗下降了 3
24、50 倍,而 Pascal 則需要 1000 GWh,1000 GWh 意味著需要一個千兆瓦的數據中心,世界上還沒有千兆瓦級的數據中心,但如果有一個千兆瓦級的數據中心,就需要一個月的時間,如果有 100 兆瓦的數據中心,則需要一年時間,這就是為什么這些大型語言模型 ChatGPT 在 8 年前無法實現的原因,公司在提高性能和能效的同時,不斷降低能耗,提高效率。Blackwell算力平臺:算力平臺:現在,公司利用 Blackwell 節省能耗將過去 1000GWh 減到 3GWh,如果是 10000個 GPU,只需要 10 天左右,短短八年時間,進步之大令人難以置信,這是用于 inference
25、、token generation,公司的 token generation 性能有可能使每個令牌的能耗降低 45000 倍。Pascal 生成一個 token 需要 17000 焦耳,這有點像兩個燈泡運行兩天(200 瓦特的能量),運行兩天才能產生一個 GPT4 token,生成一個單詞大約需要三個 token,因此,Pascal 生成 GPT 4 并進行 ChatGPT 體驗實際上是不可能的。但現在,生成每個 token 只需 0.4 焦耳,Blackwell 是一個巨大的飛躍,即便如此,它還不夠大,公司必須建造更大的機器,制造它的方法叫做 DGX。敬請閱讀末頁的重要說明 8 行業簡評報告
26、 圖圖3:Blackwell能耗節省能耗節省 資料來源:英偉達,招商證券 DGX Blackwell與與MGX:公司的 Blackwell 芯片被用于 DGX 系統,這是 DGX Blackwell,它是風冷的,內部有 8 個這樣的 GPU,這個版本支持 X86,它將進入公司一直在出貨的 Hoppers設備。不過,如果想使用液體冷卻,公司有一個新系統,這個新系統基于這塊電路板,公司稱之為 MGX 模塊化系統。MGX 系統,有兩塊黑色板,這個節點有四個 Blackwell 芯片,都是液冷的,其中72 個 GPU 通過新的 NVLink 連接在一起。這是 NVLink 交換機(第五代),這是世界上
27、最先進的交換機,它的數據傳輸率非常高,這些交換機將每一個Blackwells 都相互連接起來,這樣就擁有了一個巨大的 72 GPU Blackwell。這一整個 GPU 有 72 個芯片,而上一代只有 8 個,因此,公司增加了九倍的帶寬,增加了 45 倍的 AI flops,而功耗卻只有 10 倍。圖圖4:DGX Blackwell與與DGX Hopper 資料來源:英偉達,招商證券 敬請閱讀末頁的重要說明 9 行業簡評報告 圖圖5:DGX Blackwell實圖實圖 圖圖6:MGX系統實圖系統實圖 資料來源:英偉達,招商證券 資料來源:英偉達,招商證券 NVLink Chip:最神奇的是 N
28、VLink 芯片,它將所有這些不同的 GPU 連接在一起,因為大型語言模型非常龐大,一個 GPU 和一個節點都裝不下,它需要整個機架的 GPU,就像這個新 DGX,它的大型語言模型有幾十萬億個參數,大型 NVLink 交換機有500 億個晶體管,72 個端口,每個端口 400GB,四個 Links,橫截面帶寬為每秒7.2TB,但其中重要的一點是,它在交換機內部集成了數學,這樣就可以在芯片上進行還原,這在深度學習中非常重要。圖圖7:NVLink Switch芯片芯片 資料來源:英偉達,招商證券 這是一個 GPU,這是世界上最先進的 GPU 之一,但這是一個 gamer GPU。這是一個 DGX
29、GPU,GPU 的背面是 NVLink Spine,Spine 有 5000 根線,2 英里,它將兩個 GPU 連接在一起,收發器讓公司可以用銅線驅動整個長度。因此,NVLink交換機用銅線驅動Spine,可以在一個機架上節省20千瓦,這就是NVLink spine。敬請閱讀末頁的重要說明 10 行業簡評報告 圖圖8:GPU機柜實圖機柜實圖 圖圖9:DGX GPU實圖實圖 資料來源:英偉達,招商證券 資料來源:英偉達,招商證券 IB與以太網:與以太網:即使是這個,對人工智能工廠來說也不夠大。因此,公司必須用高速網絡將其連接起來,有兩種聯網方式,1)Infinite Band,它已被用于世界各地
30、的超級計算和人工智能工廠,而且對公司來說,它的發展速度快得令人難以置信。但是,并不是每個數據中心都能處理 Infinite Band,因為他們已經在以太網上投資了太長時間,管理 Infinite Band 交換機和 Infinite Band 網絡確實需要一些專業技能和專業知識。2)以太網,因此,公司所做的就是將 Infinite Band 的功能引入以太網架構,而這非常困難,其原因在于,以太網是為高平均吞吐量而設計的,因為每個節點、每臺計算機都與互聯網中的不同用戶相連,而大部分通信都是數據中心與互聯網另一端的某個人之間的通信。然而,深度學習和人工智能工廠、GPU 并不與互聯網上的人通信,大部
31、分情況下,它們是在相互通信,之所以相互通信,是因為它們都在收集部分產品,它們必須將其還原,然后重新分配,大塊的部分產品縮減再分配,重要的不是平均吞吐量,重要的是最后到達的時間。Spectrum X800:四種技術實現交換機通信。四種技術實現交換機通信。公司創建了一個端到端的架構,這樣頸部和交換機就能進行通信,采用了四種不同的技術來實現這一點:1)Nvidia 擁有世界上最先進的 RDMA,因此,公司現在有能力為以太網提供網絡級 RDMA;2)congestion control,交換機在任何時候都能以令人難以置信的速度進行遙測,每當 GPU 或下一個設備發送過多信息時,可以讓它們停止發送,這樣
32、就不會產生 hotspots;3)adaptive routing,以太網需要按順序發送和接收信息,公司會看到擁堵或當前未使用的端口,無論排序如何,都會將其發送到可用的端口,而另一端的Bluefield 會重新排序,使其按順序返回,這種 adaptive routing 功能非常強大;4)noise isolation,數據中心隨時都有一個以上的模型在訓練或發生一些事情,它們的噪音和流量可能會相互影響,從而導致抖動。因此,當一個訓練模型出現噪音時,一個模型的訓練會導致最后一個模型的到達時間過晚,從而拖慢整體訓 敬請閱讀末頁的重要說明 11 行業簡評報告 練進度。如果建立了一個價值 50 億或
33、30 億美元的數據中心并將其用于訓練,如果利用率降低了 40%,結果培訓時間就延長了 20%,50 億美元的數據中心實際上就相當于 60 億美元的數據中心,成本非常高,影響很大,使用 Spectral Max的以太網基本上可以大大提高性能,網絡基本上是免費的,這是一項相當大的成就。公司有一整套以太網產品,這是 Spectrum X800,它的速度是每秒 51.2TB、256 radix,下一個產品是一年后的 512radix,Spectrum X800 Ultra,之后是 X 1600,但 X800 是為數以萬計的 GPU 設計的,X800 Ultra 是為數十萬 GPU 設計,而 X 160
34、0 則是為數百萬 GPU 設計,數百萬 GPU 數據中心的時代即將到來。圖圖10:Spectrum X800 資料來源:英偉達,招商證券 從從Blackwell到數據中心:到數據中心:圖圖11:從:從Blackwell到數據中心的發展到數據中心的發展 資料來源:英偉達,招商證券 敬請閱讀末頁的重要說明 12 行業簡評報告 圖圖12:從:從Blackwell到數據中心的發展到數據中心的發展 資料來源:英偉達,招商證券 圖圖13:從:從Blackwell到數據中心的發展到數據中心的發展 資料來源:英偉達,招商證券 敬請閱讀末頁的重要說明 13 行業簡評報告 圖圖14:從:從Blackwell到數據
35、中心的發展到數據中心的發展 資料來源:英偉達,招商證券 圖圖15:從:從Blackwell到數據中心的發展到數據中心的發展 資料來源:英偉達,招商證券 Rubin平臺:平臺:計算機中最重要的東西是當一臺計算機能夠向后兼容,并在架構上與所有已創建的軟件兼容時,其進入市場的速度就會大大加快。明年是 Blackwell Ultra,就像H100 和 H200 一樣,會看到 Blackwell Ultra 的一些令人興奮的新一代產品,再次挑戰極限,以及所提到的下一代 spectrum switches。公司的下一代平臺叫 Rubin 平臺,所有這些芯片 100%都在全面開發中,它們的節奏是一年內達到技
36、術極限,在架構上 100%兼容,這基本上就是 Nvidia 正在打造的產品,以及在其之上的所有豐富軟件。敬請閱讀末頁的重要說明 14 行業簡評報告 圖圖16:Rubin平臺平臺 資料來源:英偉達,招商證券 因此,從很多方面來看,從圖像網絡的那一刻起,從 2012 年之前的 G-Force 到今天的 NVIDIA,公司確實發生了巨大的轉變。圖圖17:公司產品發展:公司產品發展 資料來源:英偉達,招商證券 (2)AMD:24H2將推出將推出CPU Turin與與GPU MI325X 數據中心數據中心EPYC產品高性能、低能耗,第五代產品高性能、低能耗,第五代EPYC產品產品Turin將于下半年推將
37、于下半年推出。出。公司 EPYC 產品擁有 900 多種云服務提供商案例,每天都有數以百萬計的人們使用由EPYC驅動的云服務,包括Facebook、Instagram、Linkedln、Microsoft、Zoom、Netflix、Wechat、Whatsapp 等。2017 年推出 EPYC 產品,每一代產品都有越來越多的客戶采用 EPYC,因為其具有領先的性能、效率,目前 EPYC 產品占據 33%的市場份額且還在增長。敬請閱讀末頁的重要說明 15 行業簡評報告 圖圖18:數據中心:數據中心EPYC發展歷程發展歷程 資料來源:AMD,招商證券 第第四代四代EPYC CPU比同行快比同行快5
38、倍倍。公司最新一代服務器 CPU EPYC 比其他處理器運行速度快5倍,即便是與來自目前競爭者最先進的產品相比也要快1.5倍。圖圖19:最新:最新EPYC運行速度比較運行速度比較 資料來源:AMD,招商證券 更換更換第第四代四代EPYC可減少可減少80%的的rack空間,降低空間,降低65%的能源的能源消耗。消耗?,F在越來越多的企業開始建造數據中心,增加新的 AI 能力,使用第四代 EPYC 產品更新數據中心可以做到一個服務器替換先前五個服務器,減少 80%的 rack 空間,減少 65%的能源消耗?,F在很多企業想要將通用計算與 AI 結合而不增加 GPU 的數量,EPYC 依舊是最好的選擇,
39、EPYC 運行 TPX AI Benchmark,通過使用不同的案例及算法測量端到端 AI pipeline 時快 1.7 倍。敬請閱讀末頁的重要說明 16 行業簡評報告 圖圖20:EPYC數據中心數據比較數據中心數據比較 圖圖21:EPYC端到端端到端AI性能比較性能比較 資料來源:AMD,招商證券 資料來源:AMD,招商證券 第第五代五代EPYC處理器處理器Turin采用采用3納米與納米與6納米制程,將于納米制程,將于24H2推出。推出。第四代 EPYC 是最好的服務器 CPU,但公司不斷追求最先進的性能,即將推出第五代 EPYC 處理器,叫做圖靈(Turin),圖靈有 192cores,
40、384threads,13chiplets(3 納米與 6 納米制程),支持所有最新的存儲與 IO 標準。當模擬2千萬個原子模型時,一個128核的Turin比競爭者最好的產品快3.1倍。當運行大語言模型時,Turin 也具有優秀的 AI 推理性能,將在今年下半年推出。圖圖22:第五代:第五代EPYC產品數據產品數據 圖圖23:第五代:第五代EPYC產品數據將于下半年推出產品數據將于下半年推出 資料來源:AMD,招商證券 資料來源:AMD,招商證券 2023-2026每年一代產品,每年一代產品,MI 325X與與MI 300X采用相同架構以便客戶更快換采用相同架構以便客戶更快換代。代。去年公司推
41、出 MI 300X,現在拓展 roadmap,每年一代產品,今年晚些時候公司計劃推出 MI 325X,它具有更快的速度,更高的存儲,2025 年將會推出 MI 350 系列產品,使用 CDNA 4 架構,但他們都會采用相同的行業 OCP 服務器設計標準,客戶也會更快適用公司的新產品,到 2026 年,公司將會推出新的 CDNA架構去適配 MI 400 系列產品。敬請閱讀末頁的重要說明 17 行業簡評報告 圖圖24:AMD GPU產品產品Roadmap 資料來源:AMD,招商證券 MI 325X:MI 325X比比H200具備更高存儲與運算能力。具備更高存儲與運算能力。MI 325X 達到 28
42、8GB 超快 HBM3E存儲,6TB/S 帶寬,與 MI 300X 使用相同架構,客戶能夠非常方便進行替換。與競爭者產品相比,MI 325X 提供高兩倍的存儲,1.3 倍更快存儲帶寬,1.3 倍更快運算性能。單個帶有 8 顆 MI 325X 芯片的服務器可同時運行高達 1 萬億個參數,這是 H200 的兩倍。到 2025 年,公司將介紹 CDNA 4 架構,將實現 AI性能大幅增加。圖圖25:MI 325X產品數據產品數據 資料來源:AMD,招商證券 圖圖26:MI 325X與與H200比較比較 資料來源:AMD,招商證券 敬請閱讀末頁的重要說明 18 行業簡評報告 MI 350:MI 350
43、采用采用3納米制程,納米制程,比比B200性能高性能高1.2倍倍。MI 350 系列產品使用 3 納米先進制程,支持 FP4 與 FP6 數據類型,同樣與 MI 300、MI 325 具有相同架構。將 MI 350 與 B200 進行比較,MI 350 支持更高 1.5 倍的存儲以及更快 1.2 倍的運算性能。圖圖27:MI 350系列產品數據系列產品數據 圖圖28:MI 350與與B200比較比較 資料來源:AMD,招商證券 資料來源:AMD,招商證券 Ultra Accelerator Link聯盟包括聯盟包括AMD、BROADCOM、CISCO、Google、HPE、Intel、Meta
44、、Microsoft。AI 網絡架構需要支持高速交換率且低延遲,必須拓展連接大量加速器節點,上周許多大型芯片云與系統集成商共同宣布發展高性能架構開源標準計劃,以連接大量加速器,該計劃叫做 UA Link,UA Link 是擴大加速器規模最好的解決方案,UA Link 1.0 標準將會在今年晚些時候 on track。同時UEC(ultra ethernet Consortium)的建立能夠更好的促進企業間數據交換,技術交流,創造更先進的 AI 與 HPC。圖圖29:UA Link合作伙伴合作伙伴 圖圖30:UEC合作伙伴合作伙伴 資料來源:AMD,招商證券 資料來源:AMD,招商證券 公司產品
45、組合:公司產品組合:公司展示了許多產品,從最新的 Ryzen 9000 電腦與第三代 Gen Ryzen AI 處理器,具有領先的 AI 計算能力,到單一路徑 Versal Gen 2 系列,具有更多邊緣 AI能力,到 EPYC 產品組合,這些都是革命性的創新。敬請閱讀末頁的重要說明 19 行業簡評報告 圖圖31:AMD產品組合產品組合 資料來源:AMD,招商證券 (3)英特爾英特爾:推出新處理器推出新處理器Xeon 6,展示,展示Gaudi3兼具價格與性能兼具價格與性能優勢優勢 基于基于Xeon廣泛的用戶群,廣泛的用戶群,Xeon 6將大幅降低數據中心能耗、提高算力密度。將大幅降低數據中心能
46、耗、提高算力密度。公司推出新處理器 Xeon 6(144 核),是現代數據中心的重大升級,具有高核數量、每瓦高密度性能,使公司有更多選擇去拓展服務器負載量,總體而言,它具有更高的性能、更低的能耗、更小的尺寸。在視頻解碼上,Xeon 6 比 Xeon 2(28 核)快 4.2 倍,每瓦性能比 Xeon 2 快 2.6 倍。相同算力情況下,3:1 的 rack consolidation 意味著一個 200racks(Xeon 2)的數據中心只需要 66racks(Xeon 6),能夠節省 80k MWh 的能源,因為目前 Xeon產品使用遍布全球,如果有 500 個數據中心更新使用 Xeon 6
47、,那么將會節省 140萬中國臺灣家庭一年的用電量、370 萬輛汽車一年的能耗量或中國臺灣臺北 101 500 年的能耗量。同時,一個 Xeon 6 有 144 核,兩個就有 288 核,今年晚些時候公司將推出第二代 Xeon 6 帶有 288 核,這會形成 6:1 的 rack consolidation ratio。圖圖32:Xeon6(右)與(右)與Xeon2(20個,左)比較個,左)比較 圖圖33:Xeon6服務器優勢服務器優勢 資料來源:Intel,招商證券 資料來源:Intel,招商證券 Xeon+RAG實時傳輸數據,高性價比實時傳輸數據,高性價比Gaudi2構建開源企業構建開源企業
48、AI平臺。平臺。如今超過 60%的負載在云上運行,而超過 80%的數據仍然在端側,有很多數據是未受監測的,現在 Xeon+RAG 技術改變了這一局面,RAG 成為了一種重要的企業工作流程,它將數據和數據庫結合在一起,一些大語言模型的訓練可能基于一個月、敬請閱讀末頁的重要說明 20 行業簡評報告 一年甚至幾年前的數據,但是,將這些數據與實時時間序列嵌入相結合,就能形成一個非凡的組合,它不僅功能強大,比如 Xeon 第 6 代處理器,而且還通過公司的 AI 加速器,比如 Gaudi,得到了進一步的增強??蛻粢苍趯ふ腋咝阅?、高性價比的 AI 訓練推理解決方案,他們開始轉向另一種選擇例如 Gaudi,
49、他們想要開源的軟硬件解決方案,低的 TCOs,這就是為什么轉向 Gaudi2 的原因,公司把這些整合到一起,通過開源社區以及 Linux 創造開放的企業級 AI 平臺。圖圖34:Xeon+RAG 圖圖35:Gaudi2 資料來源:Intel,招商證券 資料來源:Intel,招商證券 圖圖36:AI for Enterprise 資料來源:Intel,招商證券 Gaudi3具有比具有比H100更高的性能,更高的性能,TCO也更低。也更低。Gaudi3 擁有強大性能,比 H100 time-to-train 快 40%,Inference Throughout 比 H100 快 15%,Infer
50、encing 比H100 快 2.3 倍,客戶能夠花更少的價格獲得更好的性能。它是可拓展的,使用公開行業標準,例如以太網,支持所有開源架構,例如 pytorch,適用成百上千種模型。Gaudi3 給客戶帶來巨大的市場機會,因為他們想要 TCO、想要更多選擇、想要性能,Gaudi3 都能滿足。敬請閱讀末頁的重要說明 21 行業簡評報告 圖圖37:Gaudi3與與H100比較比較 圖圖38:Gaudi3合作生態合作生態 資料來源:Intel,招商證券 資料來源:Intel,招商證券 圖圖39:Gaudi3合作合作伙伴產品伙伴產品 資料來源:Intel,招商證券 (4)Supermicro:服務器可
51、搭載各家最新芯片產品,將推動服務器服務器可搭載各家最新芯片產品,將推動服務器液冷系統市占迅速提升液冷系統市占迅速提升 DLC液冷相比風冷具有更低成本。液冷相比風冷具有更低成本。公司液冷(DLC)已有 30 多年的歷史,與需要大量電力運行的風冷不同,TLC 液冷能以更低的成本和更小的環境影響為服務器提供最佳冷卻效果。公司的目標是讓 DLC 迅速成為所有數據中心和人工智能工廠的主流解決方案,從而提高效率,降低運營成本。以下是 Supermicro DLC液冷解決方案,假設一個中等規模 LLM 的數據中心 GPT4,大約需要 8000 個 GPUs 或 1000 個 HGX 系統,DLC 集群可以節
52、省高達 3%的初始資本成本,由于減少了數據中心空間,節省了總成本,最終 DLC 可以做到免費。敬請閱讀末頁的重要說明 22 行業簡評報告 圖圖40:DLC與與Air-Cooled比較比較 資料來源:Supermicro,招商證券 DLC優勢凸顯,近兩年市場份額有望提升至優勢凸顯,近兩年市場份額有望提升至30%。DLC 可節省 OPEX 達 40%,5 年內節省 6000 萬美金,同樣也能減少二氧化碳的排放,實現綠色計算。DLC減少能源需求,對于一個中等規模LLM的數據中心,Air-Cooled需要能源15MW,而 DLC 只需要 10MW。過去大家對 DLC 不敢興趣,因為 1)DLC 有很長
53、的前置時間,可能需要 1 年的準備周期,2)DLC 也更貴,3)DLC 不支持數據中心,4)在過去 30 年 DLC市場份額小于 1%?,F在公司 DLC 解決方案得到全面提升,1)公司能夠把 DLC 前置時間縮短至 2-4周,2)公司 DLC 成本更低,3)公司 DLC 具有高性能、高可靠性,4)在接下來的一年內,公司目標將 DLC 在數據中心的市場份額提高到 15%,且在接下來的 1-2 年內提高至 30%。DLC 將會與 Air-Cooled 的成本相同甚至更低,降低二氧化碳的排放,保護數以百萬計的樹木。圖圖41:DLC與與Air-Cooled比較比較 資料來源:Supermicro,招商
54、證券 敬請閱讀末頁的重要說明 23 行業簡評報告 圖圖42:過去過去DLC的缺陷的缺陷 圖圖43:公司現今公司現今DLC優點優點 資料來源:Supermicro,招商證券 資料來源:Supermicro,招商證券 DLC市場份額市場份額2024年提升至年提升至15%,機架價格約,機架價格約200萬美元。萬美元。公司現在一個月出貨 1000 臺機架,一臺服務器機架 200 萬美元左右,一臺重量超過 3000 磅,公司目標是今年出貨機架超過 1 萬臺。這臺機架有 72 顆芯片,其他部分超過 60萬個,72 顆芯片大概重 1 磅,其他部分重達 2999 磅,有很多其他科技都應用于其中。公司2024年
55、希望將DLC市場份額從1%提高到15%,節約大量能源以供給GPU。在未來,算力吞吐率就是營收,因為 token 生成是 dollars per million tokens,而能源是 dollar per kilowatt hour,公司現在發明了一種新的商品,越快的生成,越高的吞吐率,越大的產能利用率,就會帶來越高的收入。在未來的大語言模型生成中,啟動時間、吞吐率、產能利用率十分重要,都對營收影響很大。公司將整套系統放進一個機架,再疊加軟件,將其連接上網絡,就建造好了數據中心。當選擇超威電腦進入客戶的工廠,啟動時間非???,產能利用率與吞吐率也非常高,從而獲得更多收入。圖圖44:Supermi
56、cro機架展示機架展示 圖圖45:Supermicro機架展示機架展示 資料來源:Supermicro、招商證券 資料來源:Supermicro、招商證券 下左圖支持 H100/H200/B100,下右圖支持 B200。產品均準備就緒,只待 NVIDIA 敬請閱讀末頁的重要說明 24 行業簡評報告 Chip。圖圖46:Supermicro產品展示產品展示 圖圖47:Supermicro產品展示產品展示 資料來源:Supermicro、招商證券 資料來源:Supermicro、招商證券 圖圖48:Supermicro產品展示產品展示 資料來源:Supermicro、招商證券 產品交付時間短至兩周
57、。產品交付時間短至兩周。NVIDIA Blackwell 有液冷與風冷,有 X86 與 Garce,有 NVLink 2/8/36/72,很多的組成部分與型號,基于客戶不同的產能利用率,不同的使用案例,可以選擇不同的數據中心,超威電腦都可以立刻滿足客戶需求,在兩周以內交付。在場產品在場產品100%軟件兼容軟件兼容。軟件是 HPC 最復雜的部分,有三個非常重要的軟件棧是一切的基礎,第一個是 CUDA,第二個是網絡連接,網絡連接在今天不僅是連接,而是 computing fabric,400Gbps,800Gbps,下一代會達到 1600。目前為分布式計算網絡連接的所有軟件是基于兩個軟件棧,一個是
58、 DOCA,另一個是Nickel,這兩個軟件使得公司能夠在網絡之間高效分配工作量,考慮到以太網并非為高性能計算設計的。液冷機架級應用:液冷機架級應用:每天液冷機架出貨量超每天液冷機架出貨量超50個,液冷可節省個,液冷可節省33%電能。電能。中等規模的 LLM 數據中心可容納 8000 個 H100 GPU 或 1000 個 HGX 系統。生成式 AI 工作負載對功耗的要求非常高。在采用了所有新的省電技術之后,數據中心的電力仍然不足,而建立一個新的數據中心可能需要數年時間。通過從傳統的風冷配置直接轉為液冷配置,公司的客戶可以節省 33%的電能。公司在此宣布公司已經兌現了兩周快速交付機架的承諾,這
59、種前所未有的速度和部署確保了數據中心能夠快速擴展,滿足不斷增長的需求。此外,公司正在將兩周交貨的承諾擴展到大規模交付的液冷 敬請閱讀末頁的重要說明 25 行業簡評報告 機架解決方案?,F在,公司每天的液冷機架出貨量已經超過 50 個。公司正在做的不僅是涉足液冷領域,而是主導機架規模的液冷解決方案。至今,超微已出貨超過 50 萬臺 NVIDIA GPUs,這一新的計算量級遠超當今世界前 20 大超級計算機的計算量總和。32 GPUs機架:機架:下圖機架為多功能設計的 32 GPUs 機架,目前可支持 NVIDIA H200,AMD MI300X 與 Intel Gaudi 也可使用,并適配風冷與液
60、冷環境。圖圖49:Supermicro產品展示產品展示 資料來源:Supermicro、招商證券 256 GPUs集群:集群:下圖為是 256 個 GPU 風冷集群的樣圖,液冷使公司能夠以一半的計算機架完成部署,將 AI 數據中心擴展向新的規模。圖圖50:Supermicro 256 GPUs集群集群9 Rack SU 圖圖51:Supermicro 256 GPUs集群集群5 Rack SU 資料來源:Supermicro、招商證券 資料來源:Supermicro、招商證券 敬請閱讀末頁的重要說明 26 行業簡評報告 SuperCloud Composer:公司的 SuperCloud Co
61、mposer 軟件將對整個解決方案起補充作用,允許客戶在一塊面板上查看與監控整個數據中心,包括芯片、帶傳感器的 GPU 與液冷塔。圖圖52:SuperCloud Composer軟件軟件 資料來源:Supermicro、招商證券 DLC方案節能方案節能40%,計算密度提高一倍,計算密度提高一倍。公司的 DLC 解決方案可高效利用 45攝氏度的熱瓦特,通過液冷系統將機架 90%的熱量散失,這優化了熱管理并提高硬件性能與計算吞吐量,顯著節省高達 40%的能源,較風冷將計算密度提高一倍。目前產能目前產能每月每月5000個機架,馬來西亞工廠個機架,馬來西亞工廠24Q4上線。上線。公司近期在美國、中國臺
62、灣以及海外其余地區均進行產能擴張,進一步供給全球數據中心部署。公司的新馬來西亞廠區將擴充產能,公司目前產能可支持每月 5000 個機架的設計與交付。圖圖53:馬來西亞工廠:馬來西亞工廠24Q4上線上線 資料來源:Supermicro、招商證券 Edge AI:公司 20 多年一直注重邊緣計算,利用 Building Blocks Solutions 來延伸設計know-how 從數據中心到緊湊型服務器,包括 2U Multi-node 系統與 Telco Virtualized RAN,在遠程零售應用中使用系統支持數據中心、GPU 和 AI。公司最新的 Hyper-E 緊湊型系統通過集成 3
63、double-width GPUs 來支持推理。這種優化配置適用于加速 AI 在零售業的應用,如自動結賬和防盜安全功能。公司的 敬請閱讀末頁的重要說明 27 行業簡評報告 Telco and Outdoor Edge 系統解鎖了更多機遇將邊緣 AI 帶到更多領域。公司的Outdoor Edge Systems 具有 IP65 評級,可在零下 47 攝氏度至 47 攝氏度的寬溫環境下運行,防止水和灰塵的干擾,這些系統均采用高核數 CPU 與多個企業級 GPU。圖圖54:Supermicro邊緣邊緣AI推理產品組合推理產品組合 資料來源:Supermicro、招商證券 總結:總結:30 多年來 D
64、LC 的市場份額都是 0%,目前不到 1%,但公司希望能在一年內將DLC 的市場份額提升到 15%,兩年內達到 30%。DLC 方案將獲得免費的 TCO bonus,一個數據中心將節約 6000 萬美元,并減少二氧化碳排放。目前公司每月出貨 1000 個 DLC 機架,未來將達到 2000 個,隨著積壓訂單越來越多,交付時間也將越來越長。圖圖55:Supermicro DLC份額規劃份額規劃 資料來源:Supermicro、招商證券 敬請閱讀末頁的重要說明 28 行業簡評報告 2、AI端端:AI PC加速落地加速落地,關注,關注ARM架構架構或或帶來帶來PC處處理器理器市場市場格局變化格局變化
65、(1)高通高通:展示驍龍展示驍龍X系列和系列和Copilot+PC如何助力重塑如何助力重塑PC,6月月中可購買中可購買 高通總裁兼高通總裁兼CEO安蒙發表安蒙發表主題演講,主題演講,重點闡述了搭載驍龍重點闡述了搭載驍龍X系列的系列的Copilot+PC正如何賦能正如何賦能PC行業變革。首批超過行業變革。首批超過20款搭載驍龍款搭載驍龍X Elite和驍龍和驍龍X Plus的的Copilot+PC現已開啟預售,現已開啟預售,6月月18日起可通過主要零售渠道購買。日起可通過主要零售渠道購買。高通驍龍高通驍龍X系列平臺賦能系列平臺賦能Copilot+PC設備。設備。高通強調 NPU 作為關鍵的差異化
66、因素,使搭載驍龍 X 系列的 PC 具有卓越性能,并讓 Copilot+體驗成為可能。將 AI 工作負載從 CPU 和 GPU 轉移到 NPU,可在顯著提升性能的同時,降低功耗。搭載驍龍 X Elite 和驍龍 X Plus 的設備支持 Copilot+PC體驗,擁有長達多天的電池續航、出色的每瓦特性能,NPU 算力達 45 TOPS,賦能終端側 AI 體驗。相比較 X86 電腦,ARM 電腦在架構上有著一定的優勢,驍龍 X Elite 采用的領先 NPU 能夠為筆記本電腦提供出色的 NPU 每瓦特性能,與 M3 相比高達其 2.6 倍,與酷睿 Ultra 7 相比高達其 5.4 倍。憑借領先
67、的高通 Oryon CPU,驍龍 X Elite 成為性能領先的 Windows 平臺,在ISO 供電情況下,驍龍 X Elite 的 CPU 性能比競品領先高達 51%,在 PC 達到相同 CPU 峰值性能時,功耗相比競品低 65%。圖圖56:高通高通X Elite擁有擁有出色的每瓦特性能出色的每瓦特性能 圖圖57:高通高通X Elite CPU性能領先性能領先 資料來源:高通,招商證券 資料來源:高通,招商證券 高通攜手高通攜手合作伙伴合作伙伴宏宏碁碁、華碩、戴爾、惠普、聯想、微軟和三星、華碩、戴爾、惠普、聯想、微軟和三星等等,重點,重點闡述了搭載驍龍闡述了搭載驍龍X系列的系列的Copil
68、ot+PC正如何賦能正如何賦能PC行業變革。行業變革。高通與微軟合作,搭載驍龍 X Elite 和驍龍 X Plus 的設備目前獨家支持 Copilot+PC體驗。此外,宏碁、華碩、戴爾、惠普、聯想和三星等合作伙伴推出了一系列基于 Snapdragon X Elite 平臺的 AI PC。敬請閱讀末頁的重要說明 29 行業簡評報告 圖圖58:高通驍龍:高通驍龍X系列平臺賦能的系列平臺賦能的Copilot+設備設備 資料來源:高通,招商證券 圖圖59:高通:高通合作伙伴引言合作伙伴引言 資料來源:高通,招商證券 AI應用開發:應用開發:除硬件之外,安蒙還介紹了高通技術公司用于創建下一代 AI應用
69、的行業領先的開發工具。高通 AI Hub 讓開發者能夠在五分鐘內在搭載驍龍平臺的設備上部署模型,無論是自有模型,還是來自高通技術公司持續增長的模型庫中的預優化即用型 AI 模型。全新面向 Windows 的驍龍開發套件為開發者提供了理想的硬件平臺,配備特別加速開發者版驍龍 X Elite 芯片組和廣受歡迎的可堆疊外觀設計。高通表示目前驍龍 X Elite 已經可以運廠商引言宏碁宏碁董事長兼執行長Jason Chen表示:我們很高興將宏碁與高通技術公司的合作關系擴展至Copilot+PC,利用最新驍龍X系列平臺打造全新筆記本電腦宏碁Swift 14 AI。我們期待上述全新PC帶來的嶄新AI體驗,
70、將開啟計算技術新時代。華碩華碩電腦共同執行長許先越表示:隨著AI PC時代的到來,華碩很高興與高通技術公司合作,為用戶帶來突破性創新。華碩Vivobook S 15搭載驍龍X Elite,它的推出是個人計算領域的重要里程碑。AI賦能的Copilot+PC憑借先進特性提高生產力、創造力和用戶體驗。與高通技術公司的合作,彰顯了我們致力于不斷追求技術突破的承諾。雙方將繼續合作推出更多創新AI PC,用前沿技術賦能用戶體驗。戴爾戴爾客戶端解決方案事業部總裁Sam Burd表示:AI PC的變革無疑已經到來,有望將生產力和效率提升至全新水平。戴爾全面擁抱AI PC時代,我們完整的AI PC產品組合就是強
71、有力的證明,這其中就包括搭載驍龍X系列的設備。得益于出色的性能、電池續航和全新AI體驗,用戶將更好地掌握時間,專注于最重要的任務?;萜栈萜展究偛眉鍯EO恩里克洛雷斯表示:AI PC的出現為行業創造了重要機遇,惠普很高興能夠在這一全新品類誕生之時與高通技術公司展開合作。Elitebook Ultra和OmniBook X的發布體現了雙方重新構想AI時代可能性的共同承諾。我們將借助驍龍X系列,為客戶提供行業領先的安全性和強勁的性能體驗。聯想聯想智能設備業務集團(IDG)總裁Luca Rossi表示:在聯想,創新從未停止,我們提供最佳計算體驗、設計和工程技術,創造技術更加智能的未來,讓人工智能惠及
72、每一個人。我們一直與高通技術公司保持合作,努力將這一愿景變為現實。得益于驍龍X Elite平臺,最新聯想ThinkPad T14s Gen 6和Yoga Slim 7x Copilot+PC將為企業用戶和消費者帶來令人驚嘆的性能、卓越能效和開創性的AI功能。微軟微軟董事長兼CEO薩提亞納德拉表示:PC正在被重塑,改變消費者對設備在生產力、創造力、溝通和娛樂方面的期待。上個月,我們宣布推出Copilot+PC迄今為止最快、最智能的Windows PC。這標志著整個行業的轉折點,而這一切都離不開與高通技術公司的合作。三星三星移動業務執行副總裁兼研發負責人Won-joon Choi表示:幾十年來,三
73、星與高通技術公司保持合作,為整個Galaxy生態系統打造出色的移動體驗。憑借搭載驍龍X Elite的Galaxy Book4 Edge,三星重新定義了AI PC品類,并將展示下一代AI PC的可能性。我們很高興看到Galaxy Book4 Edge用戶將如何利用互聯的Galaxy AI體驗和強大的驍龍X Elite提升生活品質,最大限度提高生產力并釋放創造力。敬請閱讀末頁的重要說明 30 行業簡評報告 行超過 1200 款游戲,并且高通也和動視暴雪、Epic Games、Remedy、育碧、EA 等廠商合作,實現更多游戲的兼容。圖圖60:高通:高通AI Hub 圖圖61:高通:高通X Elit
74、e可運行超過可運行超過1200款游戲款游戲 資料來源:高通,招商證券 資料來源:高通,招商證券 (2)ARM:25年年Arm設備將達設備將達1000多億臺多億臺,5年內獲得年內獲得Windows PC市場超過市場超過50%份額份額 Arm首席執行官首席執行官Rene Haas分享了憑借分享了憑借Kleidi AI和和Arm CSS等創新,公司等創新,公司預計預計到到2025年年Arm設備設備將將超過超過1000億臺億臺,公司,公司目標是在五年內獲得目標是在五年內獲得Windows PC市場超過市場超過50%的份額。的份額。Kleidi AI:哈斯指出 Arm 已成為全球所有主要操作系統的實際選
75、擇,例如微軟最近發布的 AI PC,其中最常用的應用程序現在 Arm 上的 Windows 上原生運行。事實上,在擁有 1800 萬軟件開發人員的生態系統中,使用 Arm CPU 進行設計的開發人員比當今任何其他處理器都多。為了確保這一點在Arm 計算平臺上實現,推出了 Arm KleidiAI,它是一套新的 AI 計算庫的一部分,可讓開發人員更輕松地在 Arm 上運行他們的 AI 應用程序。例如,當開發人員在 TensorFlow、PyTorch、Llama 3 和 MediaPipe 等框架中處理他們的模型時,KleidiAI 使他們能夠進入抽象層并利用 AI 工作負載的底層硬件功能來充分
76、發揮其性能潛力。Arm CSS:Arm 除了為支持 AI 開發者生態系統所做的所有出色工作之外,還需要繼續提供性能更高、能效更高的產品。為了進一步分享這一點,Arm介紹了最近宣布的用于客戶端設備的 Arm 計算子系統(CSS)。這是 Arm首次在領先的3納米節點上推出其CPU和GPU的物理實現。CSS for Client 使芯片制造商能夠專注于平臺的差異化以及 Armv9 架構能為他們的下一代產品帶來什么。將其與 KIeidiAI 結合使用時,開發人員擁有充分利用這些下一代硬件技術所需的工具。敬請閱讀末頁的重要說明 31 行業簡評報告 圖圖62:ARM Kleidi AI介紹介紹 圖圖63:
77、ARM CSS介紹介紹 資料來源:Arm,招商證券 資料來源:Arm,招商證券 圖圖64:Arm預計到預計到25年年Arm設備將達設備將達1000多億臺多億臺 資料來源:Arm,招商證券 (3)聯發科聯發科:加入加入Arm全面設計全面設計,新一代新一代Chromebook、智能電視、智能電視和顯示設備芯片亮相和顯示設備芯片亮相 COMPUTEX 2024 期間,聯發科展示了 AI 在廣泛領域的創新應用,推出兩款芯片產品。同時,副董事長暨執行長蔡力行博士于發表主題演講,暢談 MediaTek的技術如何賦能 AI 時代,持續改變移動通信、交通、智能家居、企業和工業環境,介紹了其在移動 SoC 領域
78、的技術進步,并宣布加入 Arm 全面設計生態項目。此外,聯發科宣布與 NVIDIA 合作通過 AI 和加速計算改變汽車行業。MediaTek加入加入Arm全面設計:全面設計:MediaTek 于 COMPUTEX 2024 宣布加入 Arm全面設計(Arm Total Design)生態項目。Arm 全面設計基于 Arm Neoverse 計算子系統,可滿足數據中心、基礎設施系統、電信等領域的 AI 應用性能和效率需求,并加速和簡化產品開發。MediaTek 擁有強大的 SoC 整合設計能力,可提供差異化的解決方案,通過已獲驗證的 Arm Neoverse CSS 可加速產品的上市進程,并可針
79、對特定應用領域的復雜 AI 計算需求提供卓越的解決方案。敬請閱讀末頁的重要說明 32 行業簡評報告 圖圖65:聯發科:聯發科加入加入Arm全面設計全面設計 資料來源:聯發科,招商證券 MediaTek推出兩款芯片產品,推出兩款芯片產品,面向高階 Chromebook 的 Kompanio 838 移動計算芯片,以及面向 4K 高階智能電視和顯示設備的 Pentonic 800 智能電視芯片,兩款產品具有較強的性能和 AI 運算能力。Kompanio 838:搭載高效的八核 CPU,擁有出色性能和多任務處理能力,可為輕薄的 Chromebook 產品提供全天電池續航時間,并且集成 AI 處理器
80、NPU 650,以高能效特性支持 AI 功能,支持 DDR4 和 LPDDR4X 內存。與前代產品相比,內存帶寬增加了一倍,數據吞吐量大幅提升。內置 Imagiq 7系 ISP 影像處理器,支持 AV1 硬件視頻解碼,以及雙 4K 顯示。此外,還支持 Filogic Wi-Fi 6 和 Wi-Fi 6E 無線連接技術,可為 Chromebook 帶來高達1.9 Gbps 的網絡連接速率,同時支持 2x2 天線和 WPA 3,提供穩定、可靠的連接和安全性。Pentonic 800智能電視:智能電視:該平臺適用于各類 4K 顯示設備,包括智能電視、智能監視器、商用顯示等大屏應用。與上代產品相比,內
81、置 AI 處理器性能提升 50%,內存帶寬占用至高可降低 60%。AI 處理器支持多種 AI 畫質增強技術,包括 AI 超分辨率、AI-Contrast 2.0、AI 場景識別畫質監測和 AI 物體識別畫質增強。為進一步優化游戲體驗,Pentonic 800 支持 4K 或 2K 165Hz 的可變刷新率。硬件視頻解碼引擎支持 HEVC、AV1、AVS3 高畫質規范和 VVC 等主流格式,提供高品質 4K 視頻播放效果。該芯片還支持MEMC、TCON 和高解析度音頻方案。圖圖66:聯發科:聯發科AI具備領先的具備領先的加速器能力加速器能力 圖圖67:聯發科:聯發科838 Kompanio 83
82、8產品展示產品展示 資料來源:聯發科,招商證券 資料來源:聯發科,招商證券 敬請閱讀末頁的重要說明 33 行業簡評報告 (4)AMD:搭載搭載Ryzen AI 300系列的系列的AI PC將于將于7月上市月上市,NPU性能業內領先性能業內領先 在 Computex 2024 主題演講中,AMD 詳細介紹了新的領先 CPU、NPU 和 GPU 架構,為從數據中心到 PC 的端到端 AI 基礎架構提供支持。AMD 公布了擴展的 AMD Instinct 加速器路線圖,介紹了每年推出的領先 AI 加速器,包括具有業界領先內存容量的新型 Instinct MI325X 加速器,計劃于 24Q4 上市。
83、AMD 宣布推出 Ryzen AI 300 系列和分別用于筆記本電腦和臺式電腦的 Ryzen 9000 系列處理器。AMD 表示搭載 AI 300 系列的首批筆記本電腦將于 7 月上市,已與宏碁、華碩、惠普、聯想、微星等公司簽訂了 100 多個消費和商用筆記本電腦設計合同。重新構想重新構想PC以實現智能、個性化體驗以實現智能、個性化體驗。AMD 與微軟、惠普、聯想和華碩的高管一起揭曉了由第三代 Ryzen AI 300 系列處理器和 Ryzen 9000 系列臺式機處理器提供支持的全新 PC 體驗。Ryzen AI 300系列:系列:AMD 詳細介紹了其下一代“Zen 5”CPU,專為在超級計
84、算機、云端和 PC 領域實現領先的性能和能效而構建。AMD 還推出了 AMD XDNA NPU 核心架構,與上一代產品相比,該架構可提供 50 TOPs的 AI 處理性能,并且生成性 AI 工作負載的預計能效比提高 2 倍?;?AMD XDNA 2架構的NPU是業界第一個也是唯一一個支持高級Block FP16數據類型的 NPU,與競爭性 NPU 使用的低精度數據類型相比,它可提供更高的準確性,且不會犧牲性能?!癦en 5”、AMD XDNA 2 和 AMD RDNA 3.5 顯卡共同為搭載 Ryzen AI 300 系列處理器的筆記本電腦帶來下一代 AI 體驗。Ryzen 9000系列:系
85、列:AMD 還發布了基于“Zen 5”架構的銳龍 9000 系列臺式機處理器,在游戲、生產力和內容創作方面均提供領先性能。AMD 稱銳龍 9 9950X 處理器是全球最快的消費級臺式機處理器。生態系統合作伙伴展示了與生態系統合作伙伴展示了與AMD關于關于AI PC的合作。的合作。微軟強調了其與 AMD 的長期合作伙伴關系,并宣布 Ryzen AI 300 系列處理器超出了微軟 Copilot+PC 的要求;惠普推出了搭載 AMD 的新型 Copilot+PC,包括 HP Pavilion Aero,并演示了在搭載 Ryzen AI 300 系列處理器的惠普筆記本電腦上本地運行的圖像生成器 St
86、able Diffusion XL Turbo;聯想發布了即將推出的搭載 Ryzen AI 300 系列處理器的消費級和商用級筆記本電腦,并重點介紹了如何利用Ryzen AI支持新的聯想AI軟件;華碩展示了搭載 Ryzen AI 300 系列處理器的面向商業用戶、消費者、內容創作者和游戲玩家的廣泛AI PC 產品組合。圖圖68:ARM下一代“下一代“Zen 5”CPU 圖圖69:ARM新的新的NPU性能領先性能領先 資料來源:AMD,招商證券 資料來源:AMD,招商證券 敬請閱讀末頁的重要說明 34 行業簡評報告 圖圖70:AMD AI PC合作伙伴合作伙伴 資料來源:AMD,招商證券 為下一
87、波邊緣為下一波邊緣AI創新提供動力創新提供動力。AMD 展示了其 AI 和自適應計算技術如何為下一波邊緣 AI 創新提供動力。AMD 整合了整個邊緣 AI 應用加速所需的 IP。全新 AMD Versal AI Edge 系列 Gen 2 整合了用于實時預處理的 FPGA 可編程邏輯、由XDNA技術支持的用于高效AI推理的下一代AI引擎以及用于后處理的嵌入式 CPU,為邊緣 AI 提供性能最高的單芯片自適應解決方案。AMD Versal AI Edge Gen 2 設備現已可供搶先體驗,目前有超過 30 個主要合作伙伴正在開發中。AMD 展示了如何在各個垂直領域實現邊緣人工智能,其中包括:展示
88、了如何在各個垂直領域實現邊緣人工智能,其中包括:Illumina 正在利用先進的 AMD 技術來釋放基因組測序的力量;斯巴魯正在使用 AMD Versal AI Edge Gen 2 設備為其 EyeSight ADAS 平臺提供支持;佳能將 Versal AI Core 系列用于其自由視點視頻系統,徹底改變了體育賽事直播和網絡直播的觀看體驗;日立能源的HVDC保護繼電器使用AMD自適應計算技術進行實時處理來預測電氣過電壓。(5)英特爾英特爾:公布公布Lunar Lake處理器架構細節處理器架構細節,將于將于24Q3為為80多種新型多種新型AI PC設計提供支持設計提供支持 在在Compute
89、x 2024期間,英特爾公布了最新技術,旨在大幅加速期間,英特爾公布了最新技術,旨在大幅加速AI生態系統生態系統的發展的發展從數據中心、云和網絡到邊緣和從數據中心、云和網絡到邊緣和PC,推出推出 Lunar Lake 客戶端處客戶端處理器架構,繼續擴大理器架構,繼續擴大AI PC品類。品類。Lunar Lake:英特爾公布了即將推出的 Lunar Lake 客戶端計算處理器的架構細節,該處理器經過重新設計,為 x86 能效樹立了新標桿,并通過無與倫比的 AI 提供領先的核心和圖形性能。與上一代相比,新的性能核心 P 核心和高效核心 E 核心可提供驚人的性能,而系統級芯片功耗降低了 40%。與上
90、一代相比,新的神經處理單元速度提高了 4 倍,從而實現了生成 AI 的相應改進。而新的 Xe2 圖形處理單元核心將游戲和圖形性能提高了 1.5 倍。從 2024 年第三季度開始,Lunar Lake 將為來自 20 多個合作伙伴的 80 多種新型 AI PC 設計提供支持。敬請閱讀末頁的重要說明 35 行業簡評報告 Gaudi 2 和和Gaudi 3:宣布英特爾 Gaudi 2 和 Gaudi3 人工智能加速器套件的定價,與競爭平臺相比,它們可提供高性能,且成本可降低三分之。系統中 Xeon 處理器與 Gaudi 人工智能加速器的組合提供了強大的解決方案,可使人工智能更快、更便宜、更易于訪問。
91、圖圖71:英特爾:英特爾Lunar Lake處理器亮點處理器亮點 資料來源:英特爾,招商證券(6)英偉達英偉達:AI下一波浪潮是下一波浪潮是Physical AI,關注機器人等熱門應用,關注機器人等熱門應用領域領域 在在AI端側,英偉達認為端側,英偉達認為AI下一波浪潮是下一波浪潮是Physical AI,重點闡述了機器人等相,重點闡述了機器人等相關應用關應用。公司機器人合作伙伴眾多,包括西門子、ArcBest、比亞迪電子、Idealworks 等,均將 Isaac Manipulator 與 Perceptor 集成進自身 AI 流程中用于加速智能機器人,如西門子的 SIMATIC Pick
92、 AI 集成了 Isaac Manipulato,在 ABB、庫卡、安川、等廣泛運行。NVIDIA 目前有兩個高質量機器人產品:1)自動駕駛汽車。NVIDIA 明年將于梅賽德斯車隊共同投入生產,2026 年 JLR 車隊投入生產,向世界提供完整堆棧。2)人型機器人。人型機器人基于基礎模型與 NVIDIA正在開發的世界理解能力取得大幅進步,通過演示與視頻能力可為其提供大量訓練數據。圖圖72:機器人方面的應用:機器人方面的應用 資料來源:英偉達,招商證券 敬請閱讀末頁的重要說明 36 行業簡評報告 圖圖73:機器人實圖:機器人實圖 資料來源:英偉達,招商證券 新款新款RTX AI電腦:電腦:這些
93、ACE 在云中也在 PC 中運行,公司在所有 RTX 里加入 Tensor core GPUs,公司為出貨 AI GPUs 做準備,原因很簡單,為了建造計算平臺,首先需要硬件,最終應用能給運行,如果沒有硬件,這些應用怎么能夠運行,所以公司每一個RTX GPU 都帶有 Tensor core processing,現在公司在全球有數以百萬計的G-Force RTX AI PCs,出貨 200 多款,這次大會上公司選出四款獨特的電腦,他們都能運行 AI。未來的電腦會變成 AI,成為用戶助手,所有運行的軟件都會被 AI 加強,例如照片編輯、寫作、所有使用的工具,電腦也能過通過數字人管理運行程序,PC
94、s 成為將會成為重要的 AI 平臺。圖圖74:新款:新款RTX AI電腦電腦 資料來源:英偉達,招商證券 敬請閱讀末頁的重要說明 37 行業簡評報告 分析師分析師承諾承諾 負責本研究報告的每一位證券分析師,在此申明,本報告清晰、準確地反映了分析師本人的研究觀點。本人薪酬的任何部分過去不曾與、現在不與,未來也將不會與本報告中的具體推薦或觀點直接或間接相關。評級評級說明說明 報告中所涉及的投資評級采用相對評級體系,基于報告發布日后 6-12 個月內公司股價(或行業指數)相對同期當地市場基準指數的市場表現預期。其中,A 股市場以滬深 300 指數為基準;香港市場以恒生指數為基準;美國市場以標普 50
95、0 指數為基準。具體標準如下:股票股票評級評級 強烈推薦:預期公司股價漲幅超越基準指數 20%以上 增持:預期公司股價漲幅超越基準指數 5-20%之間 中性:預期公司股價變動幅度相對基準指數介于5%之間 減持:預期公司股價表現弱于基準指數 5%以上 行業評級行業評級 推薦:行業基本面向好,預期行業指數超越基準指數 中性:行業基本面穩定,預期行業指數跟隨基準指數 回避:行業基本面轉弱,預期行業指數弱于基準指數 重要重要聲明聲明 本報告由招商證券股份有限公司(以下簡稱“本公司”)編制。本公司具有中國證監會許可的證券投資咨詢業務資格。本報告基于合法取得的信息,但本公司對這些信息的準確性和完整性不作任
96、何保證。本報告所包含的分析基于各種假設,不同假設可能導致分析結果出現重大不同。報告中的內容和意見僅供參考,并不構成對所述證券買賣的出價,在任何情況下,本報告中的信息或所表述的意見并不構成對任何人的投資建議。除法律或規則規定必須承擔的責任外,本公司及其雇員不對使用本報告及其內容所引發的任何直接或間接損失負任何責任。本公司或關聯機構可能會持有報告中所提到的公司所發行的證券頭寸并進行交易,還可能為這些公司提供或爭取提供投資銀行業務服務??蛻魬斂紤]到本公司可能存在可能影響本報告客觀性的利益沖突。本報告版權歸本公司所有。本公司保留所有權利。未經本公司事先書面許可,任何機構和個人均不得以任何形式翻版、復制、引用或轉載,否則,本公司將保留隨時追究其法律責任的權利。