《電子行業AI的進擊時刻系列13:英偉達GTC大會開幕走向代理式AI&物理AI時代-250319(23頁).pdf》由會員分享,可在線閱讀,更多相關《電子行業AI的進擊時刻系列13:英偉達GTC大會開幕走向代理式AI&物理AI時代-250319(23頁).pdf(23頁珍藏版)》請在三個皮匠報告上搜索。
1、 識別風險,發現價值 請務必閱讀末頁的免責聲明 1 1/2323 Table_Page 行業專題研究|電子 2025 年 3 月 19 日 證券研究報告 AI 的進擊時刻系列的進擊時刻系列 13 英偉達英偉達 GTC 大會開幕,走向大會開幕,走向代理式代理式 AI&物理物理 AI 時代時代 分析師:分析師:王亮 分析師:分析師:耿正 分析師:分析師:張大偉 SAC 執證號:S0260519060001 SFC CE.no:BFS478 SAC 執證號:S0260520090002 SAC 執證號:S0260523050001 021-38003658 021-38003660 021-3800
2、3657 請注意,耿正,張大偉并非香港證券及期貨事務監察委員會的注冊持牌人,不可在香港從事受監管活動。核心觀點:核心觀點:根據英偉達官網,英偉達根據英偉達官網,英偉達 GTC 大會開幕,黃仁勛發表主題演講。大會開幕,黃仁勛發表主題演講。黃仁勛表示,AI 已經從最初的感知式 AI,發展至生成式 AI,預計將進入代理式 AI(Agentic AI)和物理 AI(Physical AI)的時代。英偉達發布分布式推理服務庫英偉達發布分布式推理服務庫 NVIDIA Dynamo。在推理過程中,數據中心需要兼顧總輸出量(tokens per second for factory)和快速響應(tokens
3、per second for one user),推理過程中常使用多種并行策略。英偉達推出了分布式推理服務庫 Nvidia Dynamo,分解推理過程中的 prefill 和 decode 階段,動態分配兩個流程的GPU。Grace Blackwell NVLink72 芯片搭載 Dynamo 服務庫后,相比 Hopper 架構性能提升 25 倍。從 Token Revenue 的角度上來看,同樣在功耗為 100MW 的 AI Factory 中,Blackwell 的產出是 Hopper 的 40 倍。英偉達發布英偉達發布 Blackwell Ultra 和下一代和下一代 Vera Rubi
4、n AI 超級芯片。超級芯片。英偉達將在 2025 年下半年推出增強訓練和測試時間擴展推理能力的 Blackwell Ultra 芯片和 Blackwell Ultra NVL72。對于 Blackwell Ultra NVL72,其 FP4 推理算力達到 1.1EF,是 GB200 NVL72 的 1.5 倍。Vera Rubin 和 Vera Rubin NVL144 將在 2026 年下半年開始出貨,將采用 NVLink 144,每個 GPU 可以與其他 144 個 GPU 相連接,其 FP4 推理算力為 3.6EP,為 GB300 NVL72 的 3.3 倍。2027 年下半年,將推出
5、由四個 GPU 組成的 Vera Rubin Ultra,FP4 算力為 100PF,并將配備 1TB 的 HBM4e。機柜版本則將升級為 Vera Rubin Ultra NVL576,其 FP4 推理算力為 15EP,為 GB300 NVL72 的 14 倍。英偉達發布英偉達發布 CPO 交換機。交換機。Quantum-X Photonic Switch 支持 115.2Tb/s 的交換速率,預計于 2025 年下半年推出,支持 144 個 800G 網口/576 個 200G 網口。以太網協議交換機 Spectrum-X Photonic Switch 預計于 2026年下半年推出,最大
6、支持 512 個 800G 網口/2000 個 200G 網口,可以將 GPU 集群規模擴展到 10 萬個。英偉達發布通用的機器人基礎模型英偉達發布通用的機器人基礎模型 GR00T N1。GR00T N1 是全球首款開源的人形機器人功能模型,同時,英偉達與谷歌 DeepMind 以及迪士尼 Research 正合作開發,專為機器人學習設計的物理引擎 Newton,預計將于今年推出。投資建議:投資建議:AI 的進擊時刻,Scaling law 三輪驅動,AI 模型和 AI 應用快速發展,AI 硬件產業鏈深度受益;DeepSeek 有望引領開源生態,驅動國產 AI 產業鏈蓬勃發展,英偉達推動產業持
7、續升級,建議關注產業鏈相關標的。風險提示。風險提示。行業周期波動風險,AI 行業發展不及預期風險,新技術進展不及預期風險。相關研究相關研究:AI 的進擊時刻系列 12:DeepSeek One More Thing 2025-03-05 AI 的進擊時刻系列 11:國內 CSP CapEx 超預期,強化 AI 需求邏輯 2025-02-24 AI 的進擊時刻系列 10:國產 8 卡服務器 PCIe retimer 市場規模測算 2025-02-23 識別風險,發現價值 請務必閱讀末頁的免責聲明 2 2/2323 Table_PageText 行業專題研究|電子 重點公司估值和財務分析表重點公司
8、估值和財務分析表 股票簡稱股票簡稱 股票代碼股票代碼 貨幣貨幣 最新最新 最近最近 評級評級 合理價值合理價值 EPS(元元)PE(x)EV/EBITDA(x)ROE(%)收盤價收盤價 報告日期報告日期(元(元/股)股)2024E 2025E 2024E 2025E 2024E 2025E 2024E 2025E 立訊精密 002475.SZ CNY 40.86 2024/11/04 買入 48.45 1.89 2.42 21.62 16.88 12.45 10.69 19.30 19.80 北方華創 002371.SZ CNY 438.67 2024/10/30 買入 464.11 11.0
9、4 14.13 39.73 31.05 31.52 24.97 19.70 20.20 中微公司 688012.SH CNY 204.00 2024/08/25 買入 176.31 2.97 4.15 68.69 49.16 91.54 68.22 9.60 11.80 瀾起科技 688008.SH CNY 78.54 2024/10/31 買入 80.40 1.24 1.97 63.34 39.87 61.21 38.91 12.10 16.20 兆易創新 603986.SH CNY 129.91 2024/11/06 買入 102.82 1.71 2.73 75.97 47.59 62.9
10、7 40.44 7.10 10.10 長電科技 600584.SH CNY 37.51 2024/10/27 買入 45.88 0.91 1.43 41.22 26.23 13.38 11.93 5.90 8.50 卓勝微 300782.SZ CNY 87.31 2024/10/31 買入 100.21 1.17 1.82 74.62 47.97 35.30 24.26 5.90 8.40 滬硅產業 688126.SH CNY 19.41 2024/04/14 買入 26.52 0.09 0.12 215.67 161.75 33.45 26.00 1.60 2.10 拓荊科技 688072.
11、SH CNY 179.33 2024/10/29 買入 243.87 2.20 3.28 81.51 54.67 68.53 49.47 12.40 15.60 晶升股份 688478.SH CNY 33.90 2024/05/06 買入 49.95 1.12 1.73 30.27 19.60 29.69 18.25 9.00 12.20 盛美上海 688082.SH CNY 105.90 2024/08/08 買入 145.74 2.83 3.87 37.42 27.36 30.47 22.35 16.20 18.10 華海清科 688120.SH CNY 165.94 2024/10/30
12、 買入 213.06 4.41 5.60 37.63 29.63 33.04 25.59 16.30 17.10 東山精密 002384.SZ CNY 37.08 2024/05/06 買入 26.27 1.30 1.56 28.52 23.77 11.37 10.08 10.80 11.20 勝宏科技 300476.SZ CNY 91.51 2024/10/29 買入 53.69 1.39 2.15 65.83 42.56 26.83 19.89 13.90 15.60 晶晨股份 688099.SH CNY 82.99 2024/10/30 買入 84.62 1.88 2.75 44.14
13、30.18 36.38 26.03 12.40 15.40 斯達半導 603290.SH CNY 96.85 2024/04/09 買入 229.93 6.56 8.38 14.76 11.56 15.76 12.57 14.80 16.00 天岳先進 688234.SH CNY 70.69 2024/05/04 買入 85.76 0.40 0.73 176.72 96.84 54.63 41.96 3.20 5.60 中科飛測 688361.SH CNY 93.30 2024/04/30 買入 94.88 0.61 0.90 152.95 103.67 125.97 89.93 7.50 9
14、.80 唯捷創芯 688153.SH CNY 36.90 2024/04/29 買入 64.84 0.93 1.22 39.68 30.25 35.34 24.52 8.70 10.10 恒玄科技 688608.SH CNY 369.50 2024/09/06 買入 169.64 2.42 4.31 152.69 85.73 149.85 94.78 4.60 7.50 南芯科技 688484.SH CNY 37.51 2024/03/20 買入 47.89 0.87 1.19 43.11 31.52 42.67 30.63 8.50 10.40 聚辰股份 688123.SH CNY 82.5
15、4 2024/04/30 買入 84.03 2.79 4.21 29.58 19.61 24.99 17.11 18.30 21.70 數據來源:Wind、廣發證券發展研究中心 備注:表中估值指標按照最新收盤價計算 識別風險,發現價值 請務必閱讀末頁的免責聲明 3 3/2323 Table_PageText 行業專題研究|電子 目錄索引目錄索引 一、英偉達:走向代理式 AI&物理 AI 時代.6 二、AI 模型與應用.15(一)AI 模型.15(二)AI 應用.20 三、投資建議.21 四、風險提示.21 識別風險,發現價值 請務必閱讀末頁的免責聲明 4 4/2323 Table_PageTe
16、xt 行業專題研究|電子 圖表索引圖表索引 圖 1:AI 時代演變.6 圖 2:scaling law.6 圖 3:CSP 廠商 NVIDIA GPU 采購量.7 圖 4:數據中心資本支出預測.7 圖 5:CUDA X.7 圖 6:推理需綜合考慮吞吐量和響應時間.8 圖 7:NVIDIA Dynamo.8 圖 8:Blackwell 搭載 Dynamo 后性能提升.8 圖 9:Blackwell 推理性能.8 圖 10:Blackwell Ultra NVL72.9 圖 11:Vera Rubin NVL144.9 圖 12:Vera Rubin Ultra NVL576.9 圖 13:NVI
17、DIA Blackwell System.10 圖 14:NVIDIA Rubin System.10 圖 15:Rubin GPU 參數對比.10 圖 16:英偉達 CPO Photonic Switch.11 圖 17:NVIDIA Photonic.11 圖 18:NVIDIA 交換機推出時間.11 圖 19:英偉達 Road Map.12 圖 20:DGX Spark 和 DGX Station.13 圖 21:英偉達與通用汽車.13 圖 22:英偉達 Halos.13 圖 23:機器人基礎模型 GROOT N1.14 圖 24:機器人模擬用開源、物理引擎 Newton.14 圖 25
18、:GPT 模型結構.15 圖 26:MOE 模型.15 圖 27:GPT-3 的完整工作流程.15 圖 28:訓練 scaling law.17 圖 29:推理 scaling law.17 圖 30:大語言模型公開學術榜單.19 圖 31:多模態模型公開學術榜單.19 圖 32:大模型對硬件系統需求多樣性.19 圖 33:AI 應用 APP 訪問量.20 圖 34:AI 應用 web 訪問量.20 識別風險,發現價值 請務必閱讀末頁的免責聲明 5 5/2323 Table_PageText 行業專題研究|電子 表 1:GPT-3.5 模型參數符號.16 表 2:GPT-3.5 模型參數組成.
19、16 表 3:scaling law 解釋.16 表 4:模型訓練的并行策略.18 表 5:OpenAI 主要模型信息表.18 表 6:AI 終端進展.20 識別風險,發現價值 請務必閱讀末頁的免責聲明 6 6/2323 Table_PageText 行業專題研究|電子 一、英偉達:走向代理式一、英偉達:走向代理式 AI&物理物理 AI 時代時代 2025年3月19日,英偉達CEO黃仁勛在2025年GTC大會上發表主題演講。黃仁勛表示,AI已經從最初的感知式AI,發展至生成式AI,將進入代理式AI(Agentic AI)和物理AI(Physical AI)的時代。圖圖 1:AI時代演變時代演變
20、 數據來源:NVIDIA 官網,廣發證券發展研究中心 對于scaling law的發展,將會遵從(1)預訓練擴展、(2)后訓練擴展、(3)測試時間擴展,即“長思維”鏈的演進過程。黃仁勛表示,“AI的scaling law更具彈性,且實際上速度在超快提高(hyper-accelerated)?!眻D圖 2:scaling law 數據來源:NVIDIA 官網,廣發證券發展研究中心 識別風險,發現價值 請務必閱讀末頁的免責聲明 7 7/2323 Table_PageText 行業專題研究|電子 對于日益增長的計算需求,黃仁勛表示,2024年美國前四大CSP廠商購買了130萬塊英偉達的Hopper架構
21、芯片,2025年,預計將購買360萬Blackwell架構芯片。同時,預計到2028年,建設數據中心的資本支出將超過1萬億美元。圖圖 3:CSP廠商廠商NVIDIA GPU采購量采購量 圖圖 4:數據中心資本支出預測數據中心資本支出預測 數據來源:NVIDIA 官網,廣發證券發展研究中心 數據來源:NVIDIA 官網,廣發證券發展研究中心 GTC大會上,黃仁勛展示了英偉達與應用于各行業各學科AI加速的CUDA-X庫,包括天文學、粒子物理學、量子物理學、汽車、航空航天和半導體設計等領域。圖圖 5:CUDA X 數據來源:NVIDIA 官網,廣發證券發展研究中心 針對Reasoning Model
22、(思維連模型)的推理,相較于傳統的大語言模型,每個人工智能模型都會生成數以萬計的token,用于在每次提示時“思考”,對于算力和token數都提出了更高的要求。在推理過程中,數據中心需要兼顧總輸出量(tokens per second for factory)和快速響應(tokens per second for one user)。在大量GPU中高效編排和協調AI推理請求對于確保AI工廠以最低成本運行以最大化token收入至關重要。為此,推理過程中常使用多種并行策略,以獲得大吞吐量和低延時。英偉達推出了分布式推理服務庫NVIDIA Dynamo,分解推理過程中的prefill和decode階
23、段,動態 識別風險,發現價值 請務必閱讀末頁的免責聲明 8 8/2323 Table_PageText 行業專題研究|電子 調整GPU在兩個流程中的分配,用于解決無法提供足夠用戶所需token的問題,以獲得更好的經濟效益。圖圖 6:推理需綜合考慮吞吐量和響應時間推理需綜合考慮吞吐量和響應時間 圖圖 7:NVIDIA Dynamo 數據來源:NVIDIA 官網,廣發證券發展研究中心 數據來源:NVIDIA 官網,廣發證券發展研究中心 從性能結果上來看,Grace Blackwell NVLink72芯片搭載Dynamo服務庫后,相比Hopper架構可將性能提升25倍。此外,黃仁勛表示,從Toke
24、n Revenue的角度上來看,同樣在100MW的AI Factory中,Blackwell的產出是Hopper的40倍。圖圖 8:Blackwell搭載搭載Dynamo后性能提升后性能提升 圖圖 9:Blackwell推理性能推理性能 數據來源:NVIDIA 官網,廣發證券發展研究中心 數據來源:NVIDIA 官網,廣發證券發展研究中心 對于芯片與機柜的升級,黃仁勛在對于芯片與機柜的升級,黃仁勛在GTC大會上展示了大會上展示了Blackwell Ultra和下一代和下一代Vera Rubin AI超級芯片。超級芯片。黃仁勛表示,Grace Blackwell已全面投入生產,2025年下半年將
25、推出增強了訓練和測試時間擴展推理的Blackwell Ultra芯片以及Blackwell Ultra NVL72。對于Blackwell Ultra NVL72,其FP4推理算力達到1.1EF,是GB200 NVL72的1.5倍,并搭載了20TB的HBM和40TB的Fast Memory,并支持14.4TB/s的CX8交換機。Vera Rubin將在2026年下半年開始出貨。Vera Rubin和Grace Blackwell類似,集成了CPU和GPU。在Grace Blackwell中,Grace是CPU,Blackwell是GPU;而在Vera Rubin中,Vera是CPU,Rubin
26、是GPU。Rubin GPU FP4算力為50PF,并將配備288GB的HBM4。此外,對于Rubin來說,其機柜版本將升級為Vera Rubin NVL144,意味著Scale up將采用NVLink 144,著每個GPU可以與其他144個GPU相連接。其FP4推理算力為3.6EP,為GB300 NVL72的3.3倍。識別風險,發現價值 請務必閱讀末頁的免責聲明 9 9/2323 Table_PageText 行業專題研究|電子 預計到2027年下半年,英偉達將推出Vera Rubin Ultra,每個Rubin處理器由兩個GPU組成一個單芯片,而Rubin Ultra則由四個GPU組成,F
27、P4算力為100PF,并將配備1TB的HBM4e。對于機柜版本,則將繼續升級為Vera Rubin Ultra NVL576,意味著Scale up將采用NVLink 576,實現極致規模擴展。其FP4推理算力為15EP,為GB300 NVL72的14倍。圖圖 10:Blackwell Ultra NVL72 圖圖 11:Vera Rubin NVL144 數據來源:NVIDIA 官網,廣發證券發展研究中心 數據來源:NVIDIA 官網,廣發證券發展研究中心 圖圖 12:Vera Rubin Ultra NVL576 數據來源:NVIDIA 官網,廣發證券發展研究中心 識別風險,發現價值 請務
28、必閱讀末頁的免責聲明 1010/2323 Table_PageText 行業專題研究|電子 同時黃仁勛還展示了超級芯片NVIDIA Vera Rubin NVL576。在一個晶圓上集成了576個Rubin GPU,有144個NVLink Switch,實現FP4上15 EFLOPS的計算性能。圖圖 13:NVIDIA Blackwell System 圖圖 14:NVIDIA Rubin System 數據來源:NVIDIA 官網,廣發證券發展研究中心 數據來源:NVIDIA 官網,廣發證券發展研究中心 從參數對比的角度上來看,黃仁勛表示,Rubin的新能能可達到Hopper的900倍,而Bl
29、ackwell則是Hopper的68倍。從經濟來考量,Rubin的TCO/Perf則為Hopper的0.03。圖圖 15:Rubin GPU參數對比參數對比 數據來源:NVIDIA 官網,廣發證券發展研究中心 識別風險,發現價值 請務必閱讀末頁的免責聲明 1111/2323 Table_PageText 行業專題研究|電子 在網絡連接層面,英偉達正式推出在網絡連接層面,英偉達正式推出CPO交換機交換機Quantum-X Photonic Switch。支持115.2Tb/s的交換速率。IB協議交換機Quantum-X Photonic Switch預計于2025年下半年推出,支持144個800
30、G網口/576個200G網口。以太網協議交換機Spectrum-X Photonic Switch預計于2026年下半年推出,最大支持512個800G網口/2000個200G網口,可以將GPU集群規模擴展到10萬個。圖圖 16:英偉達英偉達CPO Photonic Switch 數據來源:NVIDIA 官網,廣發證券發展研究中心 圖圖 17:NVIDIA Photonic 圖圖 18:NVIDIA交換機推出時間交換機推出時間 數據來源:NVIDIA 官網,廣發證券發展研究中心 數據來源:NVIDIA 官網,廣發證券發展研究中心 識別風險,發現價值 請務必閱讀末頁的免責聲明 1212/2323
31、Table_PageText 行業專題研究|電子 本次GTC大會上,依照慣例,英偉達繼續展示了其Road Map。黃仁勛表示,Rubin之后的下一代GPU架構將命名為Feynman(物理學家理查德-費曼),預計該架構將于2028年亮相。圖圖 19:英偉達英偉達Road Map 數據來源:NVIDIA 官網,廣發證券發展研究中心 識別風險,發現價值 請務必閱讀末頁的免責聲明 1313/2323 Table_PageText 行業專題研究|電子 對于企業級計算,黃仁勛表示,宣布將發布兩款“AI時代的計算機”:DGX Spark和DGX Station。其均都使用Blackwell架構芯片。DGX
32、Spark采用GB10 Grace Blackwell超級芯片。DGX Station,由GB300 Grace Blackwell Ultra Desktop芯片驅動。圖圖 20:DGX Spark和和DGX Station 數據來源:NVIDIA 官網,廣發證券發展研究中心 對于物理AI時代的機器人和智能駕駛,英偉達在此次GTC大會上均有所更新。對于智能駕駛,黃仁勛表示幾乎每家自動駕駛公司都使用了大量NVIDIA的GPU,同時,黃仁勛宣布將擴大與通用汽車的合作。通用汽車將運用英偉達的技術幫助開發自動駕駛汽車,用英偉達的技術訓練AI制造模型。同時,英偉達推出了專注于汽車安全的AI解決方案Ha
33、los,從芯片級到系統級來確保行車安全。圖圖 21:英偉達與英偉達與通用汽車通用汽車 圖圖 22:英偉達:英偉達Halos 數據來源:NVIDIA 官網,廣發證券發展研究中心 數據來源:NVIDIA 官網,廣發證券發展研究中心 識別風險,發現價值 請務必閱讀末頁的免責聲明 1414/2323 Table_PageText 行業專題研究|電子 機器人方面,英偉達宣布推出通用的機器人基礎模型GR00T N1,它是全球首款開源的人形機器人功能模型,并推出Simulation Frameworks,用于加速機器人開發。此外,英偉達與谷歌DeepMind以及迪士尼Research正合作開發機器人模擬用的
34、開源、可擴展物理引擎,名為Newton,預計今年晚些時候完成。Newton是一個專門為機器人學習設計的物理引擎,它專注于基于反饋的強化學習,使用可驗證的物理獎勵。黃仁勛在現場展示了一步由英偉達、谷歌與迪士尼合作研發,并由最新的GR00T N1模型加持的機器人Blue。黃仁勛表示,“通用機器人時代已經到來。借助英偉達Isaac GR00T N1和新的數據生成以及機器人學習框架,世界各地的機器人開發人員將開辟AI時代的下一個前沿?!眻D圖 23:機器人基礎模型機器人基礎模型GROOT N1 圖圖 24:機器人模擬用開源、物理引擎機器人模擬用開源、物理引擎Newton 數據來源:NVIDIA 官網,廣
35、發證券發展研究中心 數據來源:NVIDIA 官網,廣發證券發展研究中心 識別風險,發現價值 請務必閱讀末頁的免責聲明 1515/2323 Table_PageText 行業專題研究|電子 二、二、AI 模型與應用模型與應用(一)(一)AI 模型模型 1.模型結構和組成模型結構和組成 圖圖 25:GPT模型結構模型結構 圖圖 26:MOE模型模型 數據來源:CSDN,廣發證券發展研究中心 數據來源:DeepSeek-V3 技術論文,廣發證券發展研究中心 圖圖 27:GPT-3的完整工作流程的完整工作流程 數據來源:Daniel DuagsThe GPT-3 Architecture,on a N
36、apkin,廣發證券發展研究中心 識別風險,發現價值 請務必閱讀末頁的免責聲明 1616/2323 Table_PageText 行業專題研究|電子 表表 1:GPT-3.5模型參數符號模型參數符號 符號 含義 d 隱藏維度(Hidden Size),GPT-3.5 取值 12288 V 詞匯表大?。╒ocabulary Size),GPT-3.5 取值 50,257 L Transformer 層數(Number of Layers),GPT-3.5 取值 96 h 注意力頭數(Number of Attention Heads),GPT-3.5 取值 96 dhead 每個注意力頭中特征向
37、量的維度,GPT-3.5 取值 128 dffn FFN 層擴展維度(通常是 4d),GPT-3.5 取值 49152 T 序列長度(Sequence Length),如訓練時 2048,推理時可變 B 批量大?。˙atch Size)N 參數總量(Total Number of Parameters)數據來源:CSDN,廣發證券發展研究中心 表表 2:GPT-3.5模型參數模型參數組成組成 組件 計算公式 每層參數量(B)總層數(L)總參數量(B)備注 嵌入層 V d+d 0.62 1 0.62 詞表大小 V=50,257,隱藏維度 d=12,288 自注意力層 4d2 0.6 96 57.
38、6 包含 Q/K/V 矩陣和輸出投影,d=12,288 前饋網絡(FFN)8 d2 1.2 96 115.2 FFN 維度 dff=4 d=49,152 層歸一化 4 d 0.00005 96 0.005 每個 Transformer 層包含 2 次層歸一化(自注意力后和 FFN 后)輸出層 V d 0.62 1 0.62 與嵌入層共享權重,無需額外參數 總計-1.8(每層)96 175 數據來源:CSDN,廣發證券發展研究中心 2.模型發展趨勢模型發展趨勢 在大規模語言模型(LLM)的研究中,Scaling Law(尺度定律)描述了模型性能如何隨著模型規模、訓練數據量和計算資源的增加而變化。
39、具體而言,預訓練Scaling Law、后訓練Scaling Law和測試時Scaling Law分別關注模型在不同階段的擴展規律。表表 3:scaling law解釋解釋 階段 描述 發展趨勢 預訓練 Scaling Law 研究模型在預訓練階段的擴展規律。隨著模型規模和訓練數據量的增加,性能提升顯著,但提升幅度可能逐漸減小。后訓練 Scaling Law 關注模型在預訓練后的微調階段的擴展規律。增加微調數據量和計算資源可以進一步提升模型性能,尤其在特定任務上。測試時 Scaling Law 研究模型在推理階段的擴展規律。在推理階段增加計算資源,如延長推理時間或增加計算量,可以顯著提升模型性
40、能。數據來源:CAMERON R.WOLFEScaling Laws for LLMs,廣發證券發展研究中心 識別風險,發現價值 請務必閱讀末頁的免責聲明 1717/2323 Table_PageText 行業專題研究|電子 圖圖 28:訓練訓練 scaling law 圖圖 29:推理推理 scaling law 數據來源:LifeArchitect.ai,廣發證券發展研究中心 數據來源:NVIDIA 官網,廣發證券發展研究中心 識別風險,發現價值 請務必閱讀末頁的免責聲明 1818/2323 Table_PageText 行業專題研究|電子 3.模型訓練的并行策略模型訓練的并行策略 表表
41、4:模型訓練的并行策略模型訓練的并行策略 并行策略 描述 優點 缺點 數據并行(DP)將訓練數據劃分為多個子集,每個子集在不同的設備上進行訓練,每個設備擁有模型的完整副本。-簡單易實現,適用于大多數模型。-每個設備需要存儲完整的模型副本,顯存占用較高。-能有效利用多設備的計算能力。-需要頻繁的梯度同步,可能導致通信開銷。張量并行(TP)將模型的單層或單個操作沿特定維度劃分,分布到多個設備上進行并行計算。-適用于模型層內的并行化,能有效利用多設備的計算能力。-需要精心設計張量劃分策略,避免通信瓶頸。-適用于需要處理大矩陣的模型。-實現復雜,需要處理設備間的通信。流水線并行(PP)將整個模型劃分為
42、多個階段,每個階段包含一部分模型層,并分配到不同的設備上。-適用于模型層間的并行化,能有效利用多設備的計算能力。-需要精心設計流水線劃分,避免瓶頸。-適用于層數較多的模型。-可能導致設備間的負載不均衡。專家并行(EP)將模型的不同專家(如混合專家模型中的專家)分布到不同的設備上進行并行計算。-能處理超大規模模型,減少單設備的顯存占用。-需要精心設計專家劃分策略,避免通信瓶頸。-適用于稀疏激活的模型。-實現復雜,需要處理設備間的通信。數據來源:CSDN,廣發證券發展研究中心 4.重點廠商的模型及排行榜重點廠商的模型及排行榜 表表 5:OpenAI 主要模型信息表主要模型信息表 模型名稱 發布時間
43、 參數量 核心技術 主要功能 GPT-3 2020 年 6 月 1750 億 Transformer,自監督學習 自然語言生成、對話、翻譯、代碼生成等 GPT-3.5 2022 年 11 月 未公開(比 GPT-3 更小更高效)Transformer,RLHF 相較于 GPT-3 提高性能和成本效率,為 ChatGPT 提供更流暢的對話能力 GPT-4 2023 年 3 月 未公開(估計 1.8 萬億)Transformer,RLHF,CLIP(視覺理解)語言理解、代碼生成、多模態(文本+圖像)GPT-4 Turbo 2023 年 11 月 未公開(優化版 GPT-4)Transformer,
44、高效推理 更快、更經濟的 GPT-4,適用于 OpenAI API 和 ChatGPT Sora 2024 年 2 月 未公開 擴散模型(Diffusion Models),Transformer 文本生成視頻,最長 60 秒高清視頻,支持多角度鏡頭和復雜場景 GPT-4o 2024 年 5 月 未公開 多模態(文本、圖像、音頻),強化視覺理解(CLIP)處理和生成文本、圖像和音頻,語音識別和翻譯,增強的多語言和視覺能力 GPT-4o mini 2024 年 7 月 未公開 多模態(文本、圖像、音頻)GPT-4o 的精簡版,適用于企業、初創公司和開發者的 AI 自動化服務 o1 2024 年
45、9 月 未公開 推理模型,鏈式思維,自我強化學習(Self-Play Reinforcement Learning),過程獎勵模型(Process Reward Model)復雜推理、科學、編碼任務,逐步解釋邏輯推理過程,在數學和編程任務上表現卓越 o3 2024 年 12 月 未公開 推理模型,鏈式思維 編程和數學領域的卓越表現,特別是在真實世界軟件任務評估和數學推理方面 o3-mini 2024 年 12 月 未公開 推理模型,鏈式思維 o3 的精簡版,提供更快的推理速度和更低的成本 數據來源:OpenAI 官網,廣發證券發展研究中心 識別風險,發現價值 請務必閱讀末頁的免責聲明 1919
46、/2323 Table_PageText 行業專題研究|電子 圖圖 30:大語言模型公開學術榜單:大語言模型公開學術榜單 圖圖 31:多模態模型公開學術榜單:多模態模型公開學術榜單 數據來源:司南 OpenCompass,廣發證券發展研究中心 數據來源:司南 OpenCompass,廣發證券發展研究中心 5.模型對硬件需求多樣化模型對硬件需求多樣化 圖圖 32:大模型對硬件系統需求多樣性大模型對硬件系統需求多樣性 數據來源:meta 官網,廣發證券發展研究中心 識別風險,發現價值 請務必閱讀末頁的免責聲明 2020/2323 Table_PageText 行業專題研究|電子 (二)(二)AI
47、應用應用 圖圖 33:AI應用應用APP訪問量訪問量 圖圖 34:AI應用應用web訪問量訪問量 數據來源:AI 產品榜,廣發證券發展研究中心 數據來源:AI 產品榜,廣發證券發展研究中心 表表 6:AI終端進展終端進展 24Q4 25Q1 25Q2 25Q3 25Q4 AI 手機手機 蘋果正式上線 Apple Intelligence iPhone 17 發布 AI 汽車汽車 特斯拉在中國大陸、歐洲上線 FSD 功能 AI 眼鏡眼鏡 百度發布小度 AI 眼鏡 小米發布 AI 眼鏡 三星發布 AI 眼鏡 AI PC 英特爾發布首款 AI PC 臺式機處理器酷睿Ultra 200S 高通發布 S
48、napdragon X Platform 芯片;AMD 發布 Ryzen AI Max 系列 APU AIOT 火山引擎發布 AI+硬件智躍計劃 數據來源:Apple 官網,Intel 官網,高通官網,VRAR 星球,IT 之家,中關村在線,53AI,廣發證券發展研究中心 識別風險,發現價值 請務必閱讀末頁的免責聲明 2121/2323 Table_PageText 行業專題研究|電子 三、投資建議三、投資建議 AI的進擊時刻,Scaling law三輪驅動,AI模型和AI應用快速發展,AI硬件產業鏈深度受益;英偉達新品發布,推動AI產業鏈持續升級;DeepSeek有望引領開源生態,驅動國產A
49、I產業鏈蓬勃發展建議關注產業鏈相關標的。四、風險提示四、風險提示(一)行業周期波動風險(一)行業周期波動風險 半導體行業具有很強的周期性,市場需求受到宏觀經濟、下游應用等多種復雜因素影響。若市場受到周期波動影響,相關企業的經營狀況可能會受到影響。(二)(二)AI行業發展不及預期行業發展不及預期 AI行業當前處于快速發展階段,行業應用前景、技術路線等仍存在較大不確定性。若后續發展放緩或技術路線改變,則對AI處理器和內存芯片的需求有不利影響,從而影響算力芯片行業整體需求。(三)新技術進展不及預期(三)新技術進展不及預期 技術創新是半導體行業最重要的驅動力。新技術發展和推廣的過程往往具有較大的不確定
50、性,受到研發投入、下游應用、市場競爭等多種因素影響。若新技術的研發、驗證、推廣進度不及預期,則可能對相關企業的經營狀況產生影響。識別風險,發現價值 請務必閱讀末頁的免責聲明 2222/2323 Table_PageText 行業專題研究|電子 廣發電子行業研究小組廣發電子行業研究小組 耿 正 :上海交通大學材料科學與工程學碩士,2020 年加入廣發證券發展研究中心。王 亮 :復旦大學經濟學碩士,2014 年加入廣發證券發展研究中心。謝 淑 穎:廈門大學電子工程學士、上海財經大學金融碩士,2018 年加入廣發證券發展研究中心。焦 鼎 :中國科學院大學博士,2022 年加入廣發證券發展研究中心。張
51、 大 偉:復旦大學電子與通信工程碩士,2021 年加入廣發證券發展研究中心。王 鈺 喬:上海交通大學碩士,2022 年加入廣發證券發展研究中心。李 佳 蔚:京都大學碩士,2022 年加入廣發證券發展研究中心。廣發證券廣發證券行業行業投資評級投資評級說明說明 買入:預期未來12 個月內,股價表現強于大盤 10%以上。持有:預期未來12 個月內,股價相對大盤的變動幅度介于-10%+10%。賣出:預期未來12 個月內,股價表現弱于大盤 10%以上。廣發證券廣發證券公司投資評級說明公司投資評級說明 買入:預期未來12 個月內,股價表現強于大盤 15%以上。增持:預期未來12 個月內,股價表現強于大盤
52、5%-15%。持有:預期未來12 個月內,股價相對大盤的變動幅度介于-5%+5%。賣出:預期未來12 個月內,股價表現弱于大盤 5%以上。聯系我們聯系我們 廣州市 深圳市 北京市 上海市 香港 地址 廣州市天河區馬場路26 號廣發證券大廈47 樓 深圳市福田區益田路6001 號太平金融大廈 31 層 北京市西城區月壇北街 2 號月壇大廈 18層 上海市浦東新區南泉北路 429 號泰康保險大廈 37 樓 香港灣仔駱克道 81號廣發大廈 27 樓 郵政編碼 510627 518026 100045 200120-客服郵箱 法律主體法律主體聲明聲明 本報告由廣發證券股份有限公司或其關聯機構制作,廣發
53、證券股份有限公司及其關聯機構以下統稱為“廣發證券”。本報告的分銷依據不同國家、地區的法律、法規和監管要求由廣發證券于該國家或地區的具有相關合法合規經營資質的子公司/經營機構完成。廣發證券股份有限公司具備中國證監會批復的證券投資咨詢業務資格,接受中國證監會監管,負責本報告于中國(港澳臺地區除外)的分銷。廣發證券(香港)經紀有限公司具備香港證監會批復的就證券提供意見(4 號牌照)的牌照,接受香港證監會監管,負責本報告于中國香港地區的分銷。本報告署名研究人員所持中國證券業協會注冊分析師資質信息和香港證監會批復的牌照信息已于署名研究人員姓名處披露。重要重要聲明聲明 廣發證券股份有限公司及其關聯機構可能
54、與本報告中提及的公司尋求或正在建立業務關系,因此,投資者應當考慮廣發證券股份有限公司及其關聯機構因可能存在的潛在利益沖突而對本報告的獨立性產生影響。投資者不應僅依據本報告內容作出任何投資決策。投資者應自主作出投資決策并自行承擔投資風險,任何形式的分享證券投資收益或者分擔證券投資損失的書面或者口頭承諾均為無效。本報告署名研究人員、聯系人(以下均簡稱“研究人員”)針對本報告中相關公司或證券的研究分析內容,在此聲明:(1)本報告的全部分析結論、研究觀點均精確反映研究人員于本報告發出當日的關于相關公司或證券的所有個人觀點,并不代表廣發證券的立場;(2)研究人員的部分或全部的報酬無論在過去、現在還是將來
55、均不會與本報告所述特定分析結論、研究觀點具有直接或間接的聯系。系因此投資者應當考慮存潛利益沖突而對獨性產生影響不僅依據內容 識別風險,發現價值 請務必閱讀末頁的免責聲明 2323/2323 Table_PageText 行業專題研究|電子 研究人員制作本報告的報酬標準依據研究質量、客戶評價、工作量等多種因素確定,其影響因素亦包括廣發證券的整體經營收入,該等經營收入部分來源于廣發證券的投資銀行類業務。本報告僅面向經廣發證券授權使用的客戶/特定合作機構發送,不對外公開發布,只有接收人才可以使用,且對于接收人而言具有保密義務。廣發證券并不因相關人員通過其他途徑收到或閱讀本報告而視其為廣發證券的客戶。
56、在特定國家或地區傳播或者發布本報告可能違反當地法律,廣發證券并未采取任何行動以允許于該等國家或地區傳播或者分銷本報告。本報告所提及證券可能不被允許在某些國家或地區內出售。請注意,投資涉及風險,證券價格可能會波動,因此投資回報可能會有所變化,過去的業績并不保證未來的表現。本報告的內容、觀點或建議并未考慮任何個別客戶的具體投資目標、財務狀況和特殊需求,不應被視為對特定客戶關于特定證券或金融工具的投資建議。本報告發送給某客戶是基于該客戶被認為有能力獨立評估投資風險、獨立行使投資決策并獨立承擔相應風險。本報告所載資料的來源及觀點的出處皆被廣發證券認為可靠,但廣發證券不對其準確性、完整性做出任何保證。報
57、告內容僅供參考,報告中的信息或所表達觀點不構成所涉證券買賣的出價或詢價。廣發證券不對因使用本報告的內容而引致的損失承擔任何責任,除非法律法規有明確規定??蛻舨粦员緢蟾嫒〈洫毩⑴袛嗷騼H根據本報告做出決策,如有需要,應先咨詢專業意見。廣發證券可發出其它與本報告所載信息不一致及有不同結論的報告。本報告反映研究人員的不同觀點、見解及分析方法,并不代表廣發證券的立場。廣發證券的銷售人員、交易員或其他專業人士可能以書面或口頭形式,向其客戶或自營交易部門提供與本報告觀點相反的市場評論或交易策略,廣發證券的自營交易部門亦可能會有與本報告觀點不一致,甚至相反的投資策略。報告所載資料、意見及推測僅反映研究人員
58、于發出本報告當日的判斷,可隨時更改且無需另行通告。廣發證券或其證券研究報告業務的相關董事、高級職員、分析師和員工可能擁有本報告所提及證券的權益。在閱讀本報告時,收件人應了解相關的權益披露(若有)。本研究報告可能包括和/或描述/呈列期貨合約價格的事實歷史信息(“信息”)。請注意此信息僅供用作組成我們的研究方法/分析中的部分論點/依據/證據,以支持我們對所述相關行業/公司的觀點的結論。在任何情況下,它并不(明示或暗示)與香港證監會第 5 類受規管活動(就期貨合約提供意見)有關聯或構成此活動。權益披露權益披露(1)廣發證券(香港)跟本研究報告所述公司在過去 12 個月內并沒有任何投資銀行業務的關系。版權聲明版權聲明 未經廣發證券事先書面許可,否則由此造成的一切不良后果及法律責任由私自翻版、復制、刊登、轉載和引用者承擔。