《電子行業專題報告:AI專題AI巨輪滾滾向前-240218(65頁).pdf》由會員分享,可在線閱讀,更多相關《電子行業專題報告:AI專題AI巨輪滾滾向前-240218(65頁).pdf(65頁珍藏版)》請在三個皮匠報告上搜索。
1、行 業 研 究 2024.02.18 1 敬 請 關 注 文 后 特 別 聲 明 與 免 責 條 款 電 子 行 業 專 題 報 告 AI 專題:AI 巨輪滾滾向前 分析師 鄭震湘 登記編號:S1220523080004 佘凌星 登記編號:S1220523070005 鐘琳 登記編號:S1220523070006 劉嘉元 登記編號:S1220523080001 行 業 評 級:推 薦 公 司 信 息 上市公司總家數 504 總股本(億股)4,966.92 銷售收入(億元)45,300.27 利潤總額(億元)3,462.59 行業平均 PE 49.50 平均股價(元)24.03 行 業 相 對
2、指 數 表 現 數據來源:wind 方正證券研究所 相 關 研 究 CES 2024:Mini/Micro LED 應用多點開花,新品大放光彩2024.01.20 半導體顯示專題三:供給與需求下的價格周期2024.01.15 CES 2024:科技春晚精彩紛呈,硬件創新閃耀舞臺2024.01.14 晶圓廠擴產&先進封裝,國產設備做大做強2024.01.09 文生視頻大模型文生視頻大模型 SoraSora 震撼登場,震撼登場,AIGCAIGC 新時代已至新時代已至。OpenAI 在 2024 年 2 月16 日發布文生視頻模型 Sora,該模型為基于 transform 架構的擴散模型,完美繼承
3、 DALLE 3 的畫質和遵循指令能力,并利用了 GPT 擴寫,具備超長生成時間(60s)、單視頻多角度鏡頭、理解物理世界三大突出優勢。我們認為,從 Runway、Pika 到 Sora,文生視頻大模型頻出,視頻長度從表情包長度的 3s-4s 到主流短視頻長度的 60s,模型對物理世界的理解愈加接近現實,已具備商業化落地價值,創作內容產業革命來臨,AIGC 新時代已至。除此之外,2024 年 2 月 15 日谷歌發布 Gemini 1.5 Pro,支持 100 萬 token上下文長度,Gemini 1.5 Pro 性能顯著增強,技術進步顯著。英偉達正式發布英偉達正式發布 Chat With
4、RTXChat With RTX,A AI I 加速普及。加速普及。這款應用適用于 Windows平臺,由 TensorRT-LLM 提供支持,并完全在本地運行。用戶可以利用 Chat With RTX 以自己的內容定制一個聊天機器人,從而體驗獨特的本地化系統設計和強大的功能。此次 Chat With RTX 的發布不斷加速人工智能的發展,加速了 AI 的普及和應用。同時此款應用改變人與 AI 的交互方式,用戶可以根據自己的需求定制聊天機器人,這使得 AI的使用更加靈活和便捷。Chat With RTX 也代表了大型語言模型技術發展的一個重要方向,即為本地化、個性化、隱私保護的 AI 應用提供
5、了新的可能。我們認為,AI 正逐漸普及,通用人工智能時代加速來臨。CESCES 百花齊放,百花齊放,AI+AI+終端終端智能化加速智能化加速。英偉達、AMD、高通分別推出 GeForce RTX 40 SUPER 系列、銳龍 8000G 系列、驍龍 XR2+Gen 2 等高性能處理器,性能水平實現躍升,助力 AI 加速滲透 PC、汽車、智能家居等終端場景。我們看到,三星大力布局人車互聯生態;英特爾在發布 AI PC 平臺的同時,推出 SDV SoC 賦能 AI+汽車;戴爾靈越系列搭載英特爾酷睿 Ultra 7,AI 能效再度提升;聯想十余款 AI PC 產品發布,規?;涞刂鸩酵七M;華碩搭載酷
6、睿 Ultra 9,各系列產品針對不同的目標客戶進行性能或配置上的優化,滿足差異化需求。我們認為,在高性能 AI 處理器的加持下,AI+N 類終端的時代浪潮已至,AI 改變的不只是 PC 與手機,科技賦能將全方位滲透,消費電子也將迎來全新的增長機遇。MRMR 為為 AIAI 最佳落地終端,高度賦能最佳落地終端,高度賦能 MRMR 內容與硬件。內容與硬件。AnyMAL 于 2023 年 9 月28 日發布,而 Meta Quest 3 于同日發布,兩者在時間上相近,且 Meta Quest 3 可收集多模態數據,將真實世界和虛擬世界無縫融合,實現 Meta Reality體驗,我們認為 AnyM
7、AL 相關研究成果有望為 Meta 的元宇宙產品線提供支持并應用到消費者市場。我們認為 MR 是 AI 最佳落地終端,泛社交、B 端應用拓展也擁有想象空間。英偉達:英偉達:H H200200 出貨在即,出貨在即,B B100100 在路上。在路上。2023 年 11 月 13 日,英偉達發布首款搭載 HBM3e 的 GPU H200,借助 HBM3e,H200 能以每秒 4.8 TB 的速度提供141GB 內存,與 NVIDIA A100 相比,容量幾乎翻倍,帶寬增加 2.4 倍。搭載HBM3e 的 H200 在處理 700 億參數的大模型時,推理速度較 H100 快了整整一倍,能耗降低了一半
8、。受 HBM3E 供應限制,預計 H200 將于 24Q2 實現出貨。英偉達 B100 原計劃發布時間為 2024Q4,但由于 AI 需求的火爆,已經提前至 2024Q2,目前已經進入供應鏈認證階段,B100 將能夠輕松應對 1730 億參數的大語言模型,比當前型號 H200 的兩倍還要強大。此外,B100 將采用方 正 證 券 研 究 所 證 券 研 究 報 告-31%-23%-15%-7%1%9%23/2/1823/5/223/7/14 23/9/25 23/12/7 24/2/18電子滬深300電子 行業專題報告 2 敬 請 關 注 文 后 特 別 聲 明 與 免 責 條 款 s 更高級
9、的 HBM 高帶寬內存規格,有望在堆疊容量和帶寬上繼續突破,超越現有的 4.8TB/s。根據英偉達產品路線圖,預計 2025 年將推出 X100,進一步豐富 GPU 產品矩陣,鞏固英偉達 AI 芯片龍頭地位。AMDAMD:MI300MI300 正式發布,正式發布,CoWoS+SoICCoWoS+SoIC 賦能賦能 3.5D3.5D 封封裝。裝。2023 年 12 月 6 日,AMD 在 Advancing AI 活動上宣布推出 Instinct MI300X,采用了 AMD CDNA3架構,搭載了 8 塊 HBM3,容量達 192GB。與 MI250X 相比,計算單元增加了約 40%、內存容量
10、增加 1.5 倍、峰值理論內存帶寬 3 增加 1.7 倍。在某些工作環境中,性能可達 H100 的 1.3 倍。MI300X 采用 3.5D 封裝,即通過混合鍵合技術實現 XCD、I/Odie 的 3D 堆疊,其次在硅中介層上實現與 HBM 的集成,從而實現了超過 1500 億個晶體管的高密度封裝。該封裝方案由臺積電提供,搭配 SoIC 技術與 CoWoS 技術共同實現。CoherentCoherent:8 80000G G 產品產品環比持續高增環比持續高增,2 2025025 年順應年順應 AIAI 發展推進發展推進 1 1.6.6T T 商業商業化化。2023Q4 Coherent 實現收
11、入 11.31 億美元,高于指引中值,yoy-17.45%,qoq+7.41%。受益于人工智能的蓬勃發展,AI/ML 相關數據收發器連續第三季獲得強勁訂單,800G 產品季度收入突破 1 億美元,環比增長超 100%,800G出貨量持續強勁增長,FY2024 公司預計超 50%的數據通信收發器收入將來自人工智能相關應用,2025 年向 1.6T 產品商業化發展前進以順應 AI 發展。AristaArista:云、:云、AIAI 和數據中心核心業務發展勢頭迅猛和數據中心核心業務發展勢頭迅猛。Arista 在 2023 年的核心業務由云、Al 和數據中心產品組成,建立在高度差異化的 Arista
12、可擴展操作軟件系統堆棧上,部署了 10G、25G、100G、200G 和 400G 的速度。Arista 云網絡產品提供了節能、高可用的區域,而不會增加冗余成本,因為數據中心對前端、后端存儲和計算集群的帶寬容量和網絡速度都有很高需求。Arista 預計 400 和 800 千兆以太網將成為 Al 后端 GPU 集群的重要試點,預計 2025 年實現 Al 網絡收入至少 7.5 億美元。國產算力把握機遇國產算力把握機遇乘勢而上乘勢而上。通過梳理 IC 先進算力公司公告及業務進展近況我們發現:目前國內 IC 先進算力公司在產品迭代、產能建設、斬獲大額訂單進展迅猛,其中產品迭代以及產能建設主要集中在
13、算力核心硬件以及AI 相關芯片中,同時從部分公司目前斬獲的訂單來看,主要集中在國產化算力相關項目中。我們認為,核心公司業務進展近況進一步印證了現階段板塊發展兩個核心要素:AI 方向的持續產品迭代、龐大的國產化算力需求。我們看好在 AI 算力需求高景氣的背景下,國內 AI 算力產業鏈將在 2024 年迎來更加快速的發展。HBM4HBM4 實現邏輯存儲垂直堆疊,混合鍵合助力帶寬提升。實現邏輯存儲垂直堆疊,混合鍵合助力帶寬提升。HPC 功耗問題突出,HBM 打破內存帶寬及功耗瓶頸,已成為 HPC 軍備競賽的核心。海力士憑借其先進封裝技術如 MR-MUF、混合鍵合和 2.5D FOWLP 技術,保持性
14、能領先,預計 HBM4 將于 2026 年面世,屆時將實現邏輯和存儲的垂直堆疊,對于鍵合、TSV 和散熱環節的需求將大幅提升?;旌湘I合是 HBM4 的關鍵技術,助力凸點間距縮小至 10um 以內,對應鍵合設備的單價將提升 3-5 倍,對控制精度和工作效率都提出了新的要求。投資建議:投資建議:見第八章詳細信息 風險提示:風險提示:AI 進展不及預期,研發進度不及預期,海外貿易摩擦影響。電子 行業專題報告 3 敬 請 關 注 文 后 特 別 聲 明 與 免 責 條 款 s 正文目錄 1 Sora、Gemini 1.5 Pro 相繼發布,AIGC 新時代已至.7 1.1 大模型 Sora 震撼登場,
15、AI 生成視頻領域里程碑.7 1.2 Gemini 1.5 Pro 性能顯著增強,長上下文理解取得突破.14 1.3 AI 生產力革命如火如荼,產業鏈上下游協同發展.16 2“AI+終端”智能化加速,手機、MR、機器人等新品迭出.19 2.1 三星 S24 系列引入 Galaxy AI,開啟移動 AI 新時代.19 2.2 大模型廠商創新不斷,AI 加持多種應用場景.21 2.3 英偉達正式發布 AI 聊天機器人.24 2.4 諸多新品亮相 CES,AI 終端時代來臨.25 2.5 MR 是 AI 的最佳落地形式,高度賦能內容生態.29 3 AI 驅動全球算力硬件環節創新與需求共振.35 3.
16、1 英偉達:H200 出貨在即,定制芯片業務儲備中.35 3.2 AMD:MI300 正式發布,2024 年銷售收入上調.39 3.3 AI 浪潮推動光模塊、交換機配套升級.41 4 國產算力把握機遇進展迅速.46 5 HBM4 實現邏輯存儲垂直堆疊,混合鍵合助力帶寬提升.51 5.1 SK 海力士:攜手臺積電合作開發 HBM4,資本開支回升.54 5.2 三星電子:DRAM 業務轉盈,TSV 產能加速擴張.55 5.3 美光:HBM3E 驗證進入尾聲,有望于 2024 年初量產.56 6 SK 海力士先進封裝持續發力,助力 HBM 性能領先.57 7 HBM4 或與處理器 3D 堆疊,混合鍵
17、合、TSV、散熱需求提升.60 8 投資建議.64 9 風險提示.64 電子 行業專題報告 4 敬 請 關 注 文 后 特 別 聲 明 與 免 責 條 款 s 圖表目錄 圖表 1:Sora 可生成 60s 視頻.7 圖表 2:Sora 單視頻多角度鏡頭.7 圖表 3:Sora 可以模擬影響世界狀況的動作.8 圖表 4:Sora 光影變換與物理世界相符.8 圖表 5:Sora 可通過圖片與提示一起生成視頻.9 圖表 6:Sora 可擴展生成的視頻.9 圖表 7:Patche 訓練 Sora.9 圖表 8:Sora 訓練中具有采樣的靈活性.10 圖表 9:不同訓練路徑生成的視頻效果對比.10 圖表
18、 10:Runway 支持文生視頻.10 圖表 11:運動筆刷支持獨立控制多達 5 個選定的區域.11 圖表 12:子彈分別控制可達到很強的空間立體感.11 圖表 13:運動筆刷控制面部運動與更復雜的軀體運動.11 圖表 14:運動筆刷控制多個角色.11 圖表 15:Pika 文生 3D 動畫.12 圖表 16:Pika“Expand canvas”擴展畫布功能.12 圖表 17:Pika 比例可調整.12 圖表 18:DreamPropeller 與其他可視化模型對比.13 圖表 19:Gemini 1.5 Pro 支持 100 萬 token 上下文長度.14 圖表 20:中型模型 Gem
19、ini 1.5 Pro 性能與 1.0 Ultra 相當.14 圖表 21:Gemini 1.5 Pro 在所有模式下“needle”召回99.7%.14 圖表 22:Gemini 1.5 Pro 可以識別核心自動區分方法的特定位置.15 圖表 23:Gemini 1.5 Pro 具有回答圖像查詢的能力.15 圖表 24:Gemini 1.5 Pro 可回答電影相關問題.15 圖表 25:Gemini 1.5 Pro 可以快速學習一門新的語言.16 圖表 26:MTOB 上 Kalamang英語翻譯的定量結果.16 圖表 27:Kalamang英語翻譯的定性例子.16 圖表 28:AI 產業圖
20、譜.17 圖表 29:服務器產業鏈圖譜.17 圖表 30:光通信產業鏈圖譜.18 圖表 31:交換機產業鏈圖譜.18 圖表 32:三星 Galaxy S24 系列.19 圖表 33:第三代驍龍 8(for Galaxy).19 圖表 34:通話實時翻譯功能.19 圖表 35:即圈即搜功能.20 圖表 36:超視覺夜拍功能.20 圖表 37:生成式編輯.20 圖表 38:小米 AI 圖像生成功能.21 圖表 39:小米“人車家全生態”.21 圖表 40:AI 消除.21 圖表 41:AI 通話摘要.21 圖表 42:聯想 Yoga Pro 9i.22 圖表 43:IdeaPad Pro 5i.2
21、2 圖表 44:華碩靈耀 14 雙屏.23 圖表 45:雷鳥 X2 Lite AR 眼鏡.23 電子 行業專題報告 5 敬 請 關 注 文 后 特 別 聲 明 與 免 責 條 款 s 圖表 46:奔馳 MBUX 虛擬助理示意圖.24 圖表 47:寶馬智能個人助理示意圖.24 圖表 48:Chat With RTX.24 圖表 49:GeForce RTX 40 SUPER 系列顯卡.25 圖表 50:基于 AI 技術性能升級.25 圖表 51:GeForce RTX 4080 SUPER 配置升級.26 圖表 52:與 Convai 合作開發生成式 AI.26 圖表 53:ACE 微服務.26
22、 圖表 54:銳龍 8000G 系列性能升級.27 圖表 55:全新 AMD 銳龍 5000 系列臺式機處理器.27 圖表 56:銳龍 8040 系列處理器.28 圖表 57:AMD Radeon RX 7600 XT.28 圖表 58:驍龍 XR2+Gen2.29 圖表 59:高通 XR 參考設計.29 圖表 60:驍龍汽車智聯平臺.29 圖表 61:驍龍座艙平臺.29 圖表 62:AnyMAL 輸出示例.30 圖表 63:圖像標題生成表現優于基線.31 圖表 64:多模態推理任務人工評估勝率優于基線.31 圖表 65:VQA 基準、視頻 QA 基準.31 圖表 66:AudioCaps 基
23、準數據集上的音頻字幕生成結果.31 圖表 67:音頻字幕生成能力優秀.32 圖表 68:Meta AI.32 圖表 69:Workrooms 截圖.33 圖表 70:首爾市政府開展元宇宙服務.34 圖表 71:工商銀行虛擬營業廳.34 圖表 72:AR 眼鏡用于醫療教學.35 圖表 73:英偉達 H200 性能.36 圖表 74:英偉達 H200 能耗降低.36 圖表 75:H200 大模型運行效果.37 圖表 76:H200 高速內存性能.37 圖表 77:A100/H100/H200/B100 性能.38 圖表 78:英偉達產品路線圖.38 圖表 79:最新款 Google Cloud T
24、PU v5p 性能提升顯著.39 圖表 80:AMD Instinct MI300X 與 H100 規格比較.39 圖表 81:AMD Instinct MI300X 配置.40 圖表 82:AMD Instinct MI300X 采用 3.5D 封裝.40 圖表 83:AMD Instinct MI300 截面圖.40 圖表 84:AMD 在多個 AI 領域產品線豐富.41 圖表 85:主要下游市場發展趨勢.41 圖表 86:數據通信收發器市場發展情況.42 圖表 87:2023 年數據通信收發器市場細分.42 圖表 88:2028 年數據通信收發器市場細分.42 圖表 89:不同傳輸速度的
25、數據中心以太網交換機細分市場潛力.43 圖表 90:以太網交換機以及 IB 交換機市場銷售預測.43 圖表 91:近五季度 Coherent 三大業務營收(億美元).44 圖表 92:FY2024Q2 Coherent 三大業務營收占比.44 電子 行業專題報告 6 敬 請 關 注 文 后 特 別 聲 明 與 免 責 條 款 s 圖表 93:數據中心以太網交換機收入預測.44 圖表 94:校園以太網交換機收入預測.44 圖表 95:數據中心高速以太網端口季度數據(百萬個).45 圖表 96:數據中心高速以太網端口年度數據(百萬個).45 圖表 97:部分國產芯片性能參數對比英偉達產品.46 圖
26、表 98:昇騰 910 與英偉達部分產品參數對比(TFLOPS,W).46 圖表 99:昇騰全棧 AI 軟硬件平臺結構.47 圖表 100:昇騰 CANN 異構計算架構.47 圖表 101:昇騰人工智能計算中心建設方案.47 圖表 102:燧原科技部分產品簡介.48 圖表 103:景嘉微 JM9-1 和 JM9-2 部分性能參數.48 圖表 104:寒武紀思元 370 系列智能加速卡參數.49 圖表 105:曦云 C500 僅用 5 小時完成功能測試.49 圖表 106:壁仞科技產品:壁礪 100P.50 圖表 107:壁仞科技產品:壁礪 104.50 圖表 108:摩爾線程 MTT S300
27、0.50 圖表 109:IC 先進算力部分公司重要公告&業務進展情況.51 圖表 110:存儲功耗限制整體性能表現.51 圖表 111:HBM 與 GDDR 結構對比.52 圖表 112:TSV 工藝帶來尺寸、功耗及帶寬優勢.52 圖表 113:英偉達 GPU 內存帶寬不斷提升.52 圖表 114:AMD Instinct MI300X.52 圖表 115:英偉達 GH200 GPU 首發 HBM3E.53 圖表 116:HBM3E 部分參數對比.53 圖表 117:HBM 產業鏈.53 圖表 118:海力士營收結構(十億韓元).54 圖表 119:SK 海力士 DRAM 分應用營收占比.54
28、 圖表 120:SK 海力士 NAND 分應用營收占比.54 圖表 121:HBM 供應時間線.55 圖表 122:美光 HBM3E 結構.56 圖表 123:海力士、三星、美光業績情況.56 圖表 124:SK 海力士 HBM 產品時間線.57 圖表 125:HBM 市場規模變動預估.57 圖表 126:SK 海力士 HBM 技術升級.58 圖表 127:MR-MUF 處理流程.58 圖表 128:MR-MUF 對比 TC-NCF 連接溫度下降 14.58 圖表 129:LMC 與晶圓熱收縮差異造成翹曲問題.59 圖表 130:EMC 不同對齊方式的空氣流動.59 圖表 131:FOWLP
29、方案.59 圖表 132:HBM4 結構示意圖.60 圖表 133:不同凸點間距(Bump Pitch)對應的技術(單位:um).61 圖表 134:混合鍵合進展.61 圖表 135:混合鍵合工藝流程及對應供應商.62 圖表 136:混合鍵合推動鍵合步驟和設備單價增加(單位:萬美元).62 圖表 137:封裝形式升級對鍵合機要求提高.63 圖表 138:混合鍵合系統累計需求(2023 年 6 月預測).63 電子 行業專題報告 7 敬 請 關 注 文 后 特 別 聲 明 與 免 責 條 款 s 1 1 SoraSora、GeGemini 1.5mini 1.5 P Proro 相繼相繼發布,發
30、布,AIGCAIGC 新時代已至新時代已至 1.11.1 大模型大模型 SoraSora 震撼震撼登場登場,AIAI 生成視頻領域里程碑生成視頻領域里程碑 OpenAI 在 2024 年 2 月 16 日發布文生視頻模型 Sora,突破了 AIGC 的高地,該模型完美繼承 DALLE 3 的畫質和遵循指令能力,并利用了 GPT 擴寫,具備超長生成時間(60s,Pika 1.0 為 3s)、單視頻多角度鏡頭、理解物理世界三大突出優勢。除文生視頻外,該模型還能支持通過現有的靜態圖像生成視頻,并能準確、細致地對圖像內容進行動畫處理;提取現有視頻,對其進行擴展或填充缺失的幀。優勢優勢 1 1#超長生成
31、時間。超長生成時間。Sora 支持 60s 視頻生成,一鏡到底,不僅主人物穩定,背景中的人物表現也十分穩定,可實現從大中景無縫切換到臉部特寫。相比之下,Pika 1.0 的視頻生成時間為 3s(可通過 Add 4s 功能增加 4s),Sora 支持時長遠超目前市場上已有的文生視頻模型。圖表1:Sora 可生成 60s 視頻 資料來源:OpenAI,數字生命卡茲克,方正證券研究所 優勢優勢 2#2#單視頻多角度鏡頭。單視頻多角度鏡頭。Sora 生成的視頻中,在有多角度鏡頭的情況下仍然能保證一致性,即使主體暫時離開視野也可保持不變。OpenAI 展示了如下提示詞的生成的視頻:一個美麗的剪影動畫展示
32、了一只狼對著月亮嚎叫,感到孤獨,直到它找到狼群,該視頻實現了多鏡頭無縫切換且保持了主體的一致。圖表2:Sora 單視頻多角度鏡頭 資料來源:OpenAI,數字生命卡茲克,方正證券研究所 電子 行業專題報告 8 敬 請 關 注 文 后 特 別 聲 明 與 免 責 條 款 s 優勢優勢 3 3#理解物理世界理解物理世界。目前 Sora 已經能生成具有多個角色、包含特定運動的復雜場景,不僅能理解用戶在提示中提出的要求,還了解這些物體在物理世界中的存在方式。我們看到 Sora 生成的視頻與世界互動,例如,畫家可以在畫布上留下新的筆觸,并隨著時間的推移而持續存在,一個人可以吃漢堡并留下咬痕。在汽車在山路
33、上行駛的視頻中,其汽車的陰影、樹影等隨鏡頭變化帶來的光影變換也符合物理世界。我們認為 Sora 已具備理解物理世界的能力。圖表3:Sora 可以模擬影響世界狀況的動作 資料來源:OpenAI,方正證券研究所 圖表4:Sora 光影變換與物理世界相符 資料來源:OpenAI,數字生命卡茲克,方正證券研究所 SoraSora 不僅能通過文字來生成視頻,還支持圖片生成視頻、擴展生成的視頻、視頻不僅能通過文字來生成視頻,還支持圖片生成視頻、擴展生成的視頻、視頻編輯以及視頻連接。編輯以及視頻連接。1)圖片生成視頻:Sora 能夠生成提供圖像和提示作為輸入的視頻;2)擴展生成的視頻:Sora 還能夠在時間
34、上向前或向后擴展視頻,雖然視頻的結局都是相同的,但起始視頻并不相同;3)視頻編輯:擴散模型啟用了多種根據文本提示編輯圖像和視頻的方法,使 Sora 能夠零鏡頭地改變輸入視頻的風格和環境;4)視頻連接:Sora 可以在兩個輸入視頻之間逐幀進行插值,從而在具有完全不同主題和場景構成的視頻之間創建無縫過渡。SoraSora光影光影變換與物理世界相符變換與物理世界相符提示:鏡頭跟隨一輛帶有黑色車頂行李架的白色老式SUV,它在陡峭的山坡上一條被松樹環繞的陡峭土路上加速行駛,輪胎揚起灰塵,陽光照在SUV上飛馳。土路,給整個場景投射出溫暖的光芒。土路緩緩地蜿蜒延伸至遠方,看不到其他汽車或車輛。道路兩旁都是紅
35、杉樹,零星散落著一片片綠意。從后面看,這輛車輕松地沿著曲線行駛,看起來就像是在崎嶇的地形上行駛。土路周圍是陡峭的丘陵和山脈,上面是清澈的藍天和縷縷云彩。電子 行業專題報告 9 敬 請 關 注 文 后 特 別 聲 明 與 免 責 條 款 s 圖表5:Sora 可通過圖片與提示一起生成視頻 圖表6:Sora 可擴展生成的視頻 資料來源:OpenAI,方正證券研究所 資料來源:OpenAI,方正證券研究所 我們認為 Sora 震撼效果的原因主要有:1)訓練端:基于 Transformer 架構的擴散模型,降維并通過 Patche 進行訓練;采樣的靈活性與獨特的訓練路徑(原始尺寸、時長訓練);利用 D
36、ALLE 3 re-captioning 功能,給訓練用的視頻素材都加上高質量文本描述;2)輸入端:利用 GPT 先將用戶輸入的提示詞精準詳盡擴寫,再將擴寫后的提示詞交給 Sora?;诨?TransformerTransformer 架構的架構的擴散模型擴散模型,降維并通過,降維并通過 PatchePatche 進行訓練。進行訓練。Sora 是一種擴散模型,可在學習大量先作的時候,學會圖像內涵與圖像之間的關系,采用Transformer 架構(主流視頻生成擴散模型較多采用 U-Net 架構),OpenAI 認為之前在大語言模型上的成功得益于 Token,Token 可以把代碼、數學以及各種
37、不同的自然語言進行統一,進而方便規模巨大的訓練,因此 OpenAI 創造了對應Token 的 Patche,用于訓練 Sora。為減少 Transformer 帶來的計算量壓力,OpenAI開發了一個視頻壓縮網絡,把視頻先降維到潛空間(latent,用更少的信息去表達信息的本質),然后再去拿這些壓縮過的視頻數據去生成 Patche,這樣就能使輸入的信息變少。圖表7:Patche 訓練 Sora 資料來源:OpenAI,方正證券研究所 訓練中具有采樣的靈活性,并通過訓練中具有采樣的靈活性,并通過原始尺寸、時長訓練原始尺寸、時長訓練。Sora 可以采樣寬屏1920 x1080p 視頻、垂直 108
38、0 x1920 視頻以及介于兩者之間的所有視頻,這使得Sora 可以直接以其原生寬高比為不同設備創建內容。與業內常用的把視頻截取成預設標準尺寸、時長后再訓練的路徑不同,OpenAI 選擇了原始尺寸、時長訓練,這使得 Sora 生成的視頻能更好地自定義時長、更好地自定義視頻尺寸、視頻會有更好的取景和構圖。提示:一只戴著貝雷帽和黑色高領毛衣的柴犬。圖片與提示生成的圖片與提示生成的8s8s視頻視頻電子 行業專題報告 10 敬 請 關 注 文 后 特 別 聲 明 與 免 責 條 款 s 圖表8:Sora 訓練中具有采樣的靈活性 圖表9:不同訓練路徑生成的視頻效果對比 資料來源:OpenAI,方正證券研
39、究所 資料來源:OpenAI,方正證券研究所 注:左側為截取尺寸視頻訓練后模型生成的視頻,右側為原始尺寸視頻訓練后模型生成的視頻 SoraSora 是是技術與路徑技術與路徑迭代的成果迭代的成果。從語言理解來看,在訓練端,OpenAI 利用 DALLE 3 re-captioning 功能,給訓練用的視頻素材都加上了高質量文本描述,在輸入端,通過 GPT 先將用戶輸入的提示詞精準詳盡擴寫,再將擴寫后的提示詞交給Sora。我們認為,該模型完美繼承 DALLE 3 的畫質和遵循指令能力,并利用了GPT 擴寫,Sora 震撼效果得益于 OpenAI 過去的工作,均具有很強的繼承性與延展性,是技術與路徑
40、迭代的成果。除 Sora 之外,Runway、Pika 等也可支持文生視頻:1 1)R Runwayunway:支持文生視頻,運動筆刷控制多物體運動支持文生視頻,運動筆刷控制多物體運動 R Runwayunway 支持文生視頻,時長為支持文生視頻,時長為 4 4s s。用“爆炸的宇宙 exploding universe”等簡單的提示詞,點擊 Generate 等待生成 4 秒視頻,可以寫視頻腳本,把不同的視頻短畫面合成長視頻,點擊 Extend 4s 按鈕,在原視頻上可以延長 4 秒;也可以把圖片直接拖進來,或者單擊圖片上傳區域,在本地選擇圖片,通過圖片來生成視頻。除此之外,Runway 還
41、具有 Green Screen 綠幕去背、Blur Faces 模糊人臉、Inpainting 移除影片物件等功能。圖表10:Runway 支持文生視頻 資料來源:覺醒 AI 繪畫,方正證券研究所 電子 行業專題報告 11 敬 請 關 注 文 后 特 別 聲 明 與 免 責 條 款 s RunwayRunway GenGen-2 2 視頻模型的運動筆刷(視頻模型的運動筆刷(Motion BrushMotion Brush)再進化)再進化,支持獨立控制多達,支持獨立控制多達5 5 個選定的區域。個選定的區域。升級后的運動筆刷支持復雜空間運鏡、人物表情控制、人物軀體控制與多個角色控制,最多可獨立控
42、制 5 個選定的區域。通過分別控制黑客帝國子彈瞬間的不同對象,可達到很強的立體空間感。除此之外,橡皮擦可對選錯的區域進一步微調,增加了易用性。圖表11:運動筆刷支持獨立控制多達 5 個選定的區域 圖表12:子彈分別控制可達到很強的空間立體感 資料來源:AI 奇點網,方正證券研究所 資料來源:AI 奇點網,方正證券研究所 圖表13:運動筆刷控制面部運動與更復雜的軀體運動 圖表14:運動筆刷控制多個角色 資料來源:AI 奇點網,方正證券研究所 資料來源:AI 奇點網,方正證券研究所 2 2)PikaPika:動畫領域優勢顯著,:動畫領域優勢顯著,DreamPropellerDreamPropell
43、er 提速提速 3D3D 生成生成 PikaPika 可單次生成可單次生成 7272 幀視頻,成立迄今已有幀視頻,成立迄今已有 7070 多萬用戶。多萬用戶。Pika 可以實現文生和圖生視頻,一鍵最多生成長度為 3 秒的 24 幀視頻,此外對于現有視頻,可以支持風格轉換、幕布擴展(expand)、內容編輯、擴展剪輯長度(extend)等功能,針對 Runway 短板進行升級。Pika 在單幀畫面擬真程度上具有出色的表現,具備良好的文生和圖生視頻能力,特別是在 2D、3D 動畫領域。電子 行業專題報告 12 敬 請 關 注 文 后 特 別 聲 明 與 免 責 條 款 s 圖表15:Pika 文生
44、 3D 動畫 資料來源:新智元,方正證券研究所 圖表16:Pika“Expand canvas”擴展畫布功能 資料來源:AI 科技評論,方正證券研究所 分辨率比例、幀數可調整,視頻輸出靈活。分辨率比例、幀數可調整,視頻輸出靈活?!癆spect ratio”和“Farmes per second”功能可調整視頻的分辨率比例、幀數??蛇x擇的分辨率包括 16:9、9:16、1:1、5:2、4:5、4:3,最高可生成 24 幀的視頻,視頻輸出靈活。圖表17:Pika 比例可調整 資料來源:AI 科技評論,方正證券研究所 電子 行業專題報告 13 敬 請 關 注 文 后 特 別 聲 明 與 免 責 條
45、款 s DreamPropellerDreamPropeller 基于分數蒸餾,助力文本到基于分數蒸餾,助力文本到 3D3D 生成速度提高生成速度提高 4.74.7 倍。倍。Pika 官方賬號披露了公司產品的技術細節,DreamPropeller 能夠在幾乎不損失生成質量的情況下,將文本到 3D 的生成速度提升 4.7 倍。實驗根據對 DreamFusion 圖庫中的 30 個提示進行測試評估,新模型速度均提高了 4 倍以上。在算力需求大、高質量數據集短缺、可控性較差等挑戰下,文生視頻是 AIGC 的高地,除 Runway、Pika 之外,Stability AI 也發布了 Stable Vi
46、deo Diffusion視頻模型,用戶可根據需要調整各種參數,如迭代步數、重繪幅度等,以協助創作者精確掌控畫面生成過程,Meta 推出了兩項基于 AI 的視頻編輯新功能;在開源上,AnimateDiff、MAKEAVIDEO、MagicAnimate 等也在布局 AI 視頻生成賽道。我們認為,從 Runway、Pika 到 Sora,文生視頻大模型頻出,視頻長度從表情包長度的 3s、4s 到主流短視頻長度的 60s,模型對物理世界的理解愈加接近現實,已具備強大的商業化落地價值,創作內容產業革命來臨,AIGC 新時代已至。圖表18:DreamPropeller 與其他可視化模型對比 資料來源:
47、新智元,方正證券研究所 電子 行業專題報告 14 敬 請 關 注 文 后 特 別 聲 明 與 免 責 條 款 s 1.21.2 G Geminiemini 1.51.5 ProPro 性能顯著增強,長上下文理解取得突破性能顯著增強,長上下文理解取得突破 GeminiGemini 1.51.5 ProPro 性能顯著增強,支持性能顯著增強,支持 100100 萬萬 tokentoken 上下文上下文長度長度。2024 年 2 月 15日谷歌發布 Gemini 1.5 Pro,支持 100 萬 token 上下文長度,谷歌透露內部研究版本已直沖 1000 萬。Gemini 1.5 Pro 性能顯著
48、增強,在長上下文理解方面取得突破,能僅靠提示詞學會訓練數據中沒有的新語言,其性能與谷歌迄今為止最大的模型 1.0 Ultra 相當,在對文本、代碼、圖像、音頻和視頻的綜合評估面板上進行測試時,在用于開發大語言模型的 87%的基準測試中,Gemini 1.5 Pro 優于1.0 Pro。圖表19:Gemini 1.5 Pro 支持 100 萬 token 上下文長度 圖表20:中型模型 Gemini 1.5 Pro 性能與 1.0 Ultra 相當 資料來源:谷歌,量子位,方正證券研究所 資料來源:谷歌,方正證券研究所 圖表21:Gemini 1.5 Pro 在所有模式下“needle”召回99
49、.7%資料來源:谷歌,方正證券研究所 注:結果以顏色編碼表示,綠色表示成功檢索,紅色表示不成功檢索 電子 行業專題報告 15 敬 請 關 注 文 后 特 別 聲 明 與 免 責 條 款 s Gemini 1.5 ProGemini 1.5 Pro 代碼、文本和視頻代碼、文本和視頻交互能力卓越。交互能力卓越。Gemini 1.5 Pro 能夠攝取整個大型代碼庫,如 JAX(746,152 個 token),并回答關于它們非常具體的查詢。除此之外,在給定 Les missamrables 全文的情況下具有回答圖像查詢的能力,原生的多模式允許它從手繪草圖中定位一個著名的場景,另外,Gemini 1.
50、5 Pro 可回答電影相關問題,如輸入 45 分鐘的整部電影,該模型在檢索時刻和時間戳精確到一秒的同時可無縫回答問題。圖表22:Gemini 1.5 Pro 可以識別核心自動區分方法的特定位置 資料來源:谷歌,方正證券研究所 圖表23:Gemini 1.5 Pro 具有回答圖像查詢的能力 資料來源:谷歌,方正證券研究所 圖表24:Gemini 1.5 Pro 可回答電影相關問題 資料來源:谷歌,方正證券研究所 電子 行業專題報告 16 敬 請 關 注 文 后 特 別 聲 明 與 免 責 條 款 s Gemini 1.5 ProGemini 1.5 Pro 新技能學習能力強大,有望提升稀有語言的
51、翻譯質量。新技能學習能力強大,有望提升稀有語言的翻譯質量。Gemini 1.5 Pro 僅基于其輸入中給出的參考材料學習新語言的能力,輸入一整本語法書,Gemini 1.5 Pro 就能在翻譯全球不到 200 人使用的卡拉曼語上達到人類水平,在英語到卡拉曼語的翻譯中,Gemini Pro 1.5 的 ChrF 達到了 58.3,略高于 MTOB論文報告的 57.0 ChrF 人類基準。而 GPT-4 Turbo 和 Claude 2.1 一次只能看完半本書,必須要微調或者使用外部工具。圖表25:Gemini 1.5 Pro 可以快速學習一門新的語言 資料來源:谷歌,方正證券研究所 圖表26:M
52、TOB 上 Kalamang英語翻譯的定量結果 圖表27:Kalamang英語翻譯的定性例子 資料來源:谷歌,方正證券研究所 資料來源:谷歌,方正證券研究所 1.31.3 AIAI 生產力革命如火如荼,產業鏈上下游協同發展生產力革命如火如荼,產業鏈上下游協同發展 A AI I 生產力革命生產力革命如火如荼,產業鏈上下游協同發展。如火如荼,產業鏈上下游協同發展。我們看到,AI 大模型的發展正在不斷加速 AGI 通用人工智能的到來,縱觀整個 AI 產業鏈,硬件和軟件的配合才能更好地實現多種終端應用的價值化落地,其中上游的基礎層包括 AI 模型生產工具(AI 算法框架+AI 開發平臺+AI 開放平臺
53、+預訓練大模型)、AI 算力基礎(AI 芯片+服務器+智算中心+云服務)、AI 數據資源(AI 基礎數據服務+數據治理),中游的技術層包括計算機視覺、智能語音、自然語言處理、知識圖譜和機器學習,下游的應用層則是百花齊放,以 AI+泛安防/泛互聯網/媒體/金融/醫療/工業/零售/政務為代表,還包括對話式 AI、機器人、自動駕駛、無人機等??梢灶A見的是,未來的 AI 時代又是生產力的爆發式革命。就硬件層面而言,我們針對性梳理了數據中心三大核心硬件產業鏈(服務器、光模塊、交換機),AI 的進步將促使硬件參數不斷提升,相關產業鏈有望充分受益。電子 行業專題報告 17 敬 請 關 注 文 后 特 別 聲
54、 明 與 免 責 條 款 s 圖表28:AI 產業圖譜 資料來源:艾瑞咨詢,方正證券研究所;注:展示為不完全列舉,公司 logo 大小及順序并不代表排名,下同 圖表29:服務器產業鏈圖譜 資料來源:電子發燒友,超微電腦官網,方正證券研究所 人工智能基礎層人工智能基礎層AI模型生產工具模型生產工具AI算法框架算法框架AI開放平臺開放平臺AI開發平臺開發平臺預訓練大模型預訓練大模型AI芯片芯片智能服務器智能服務器智算中心智算中心智能云服務智能云服務AI算算力基礎力基礎AI基礎數據服務基礎數據服務數據治理數據治理AI數據資源數據資源人工智能技術層人工智能技術層計算機視覺計算機視覺智能語音智能語音自然
55、語言處理自然語言處理知識圖譜知識圖譜機器學習機器學習人工智能應用層人工智能應用層AI+泛安防泛安防計算機視覺計算機視覺大數據智能大數據智能AI+泛互聯網泛互聯網智能智能搜索搜索內容審核內容審核圖像處理圖像處理人機交互人機交互對話式對話式AI消費級硬件消費級硬件自主無人系統自主無人系統智能智能機器人機器人智能駕駛智能駕駛無人機無人機上上游游中中游游下下游游服務器廠商服務器廠商互聯網廠商互聯網廠商運營商運營商CPU電源電源GPU散熱散熱內存內存PCBSSD光模塊光模塊主板主板/集成商集成商電子 行業專題報告 18 敬 請 關 注 文 后 特 別 聲 明 與 免 責 條 款 s 圖表30:光通信產業
56、鏈圖譜 資料來源:頭豹研究院,方正證券研究所 圖表31:交換機產業鏈圖譜 資料來源:頭豹研究院,方正證券研究所 10G及以下及以下上上游游中中游游下下游游光芯片光芯片100G硅光芯片硅光芯片25G及以上及以上無源芯片無源芯片有源光器件有源光器件無無源源光器件光器件光模塊光模塊電芯片電芯片光通信設備光通信設備電信市場電信市場數通市場數通市場交換芯片交換芯片CPU/PHY芯片芯片電子元器件電子元器件上上游游交換機交換機中中游游應用領域應用領域下下游游電子 行業專題報告 19 敬 請 關 注 文 后 特 別 聲 明 與 免 責 條 款 s 2 2“AIAI+終端”智能化加速,手機、終端”智能化加速,
57、手機、M MR R、機器人等新品迭出、機器人等新品迭出 2.12.1 三星三星 S24S24 系列系列引入引入 GalaxyGalaxy AIAI,開啟移動,開啟移動 AIAI 新時代新時代 S S2424 系列系列引入引入 GalaxyGalaxy AIAI,搭載驍龍,搭載驍龍 8 8 G Gen3en3。2024 年 1 月 18 日,三星電子正式推出新一代高端旗艦 Galaxy S24 系列,產品包括 Galaxy S24 Ultra、Galaxy S24+和 Galaxy S24。該系列搭載第三代驍龍 8(for Galaxy)高通首個專為生成式 AI 而打造的移動平臺,賦能 Gala
58、xy AI,相比上一代 CPU 和 GPU 性能分別提升 20%和 30%,NPU 性能顯著提升。此外,三星在國內攜手百度智能云,Galaxy AI 深度集成了百度文心大模型,而海外版建立在谷歌 AI 模型之上,均在智能文本、通話翻譯等方面提升用戶體驗。圖表32:三星 Galaxy S24 系列 圖表33:第三代驍龍 8(for Galaxy)資料來源:三星,方正證券研究所 資料來源:高通,方正證券研究所 A AI I 增強通話功能,增強通話功能,為用戶提供為用戶提供個人翻譯。個人翻譯。在溝通層面,S24 系列帶來 Galaxy AI全新通話實時翻譯功能,通話時點擊“通話輔助”,無需第三方應用
59、即可實現雙向語音和文字翻譯。實時翻譯的過程基于完全離線的 AI 技術,效率高、穩定性強,還保障了通話的隱私與安全。AI 驅動支持 13 種語言(17 個地區)的互譯,除了中英文,還包括法語、德語、日語、韓語等,也在短信與其他應用上通過寫作助手、轉錄助手進行翻譯、轉錄等生成文本的工作。圖表34:通話實時翻譯功能 資料來源:三星,方正證券研究所 電子 行業專題報告 20 敬 請 關 注 文 后 特 別 聲 明 與 免 責 條 款 s“即圈即搜即圈即搜”顛覆傳統在線搜索模式。顛覆傳統在線搜索模式。在搜索層面,即圈即搜功能使得用戶能夠圈選屏幕上的內容,包括視頻、圖像及文字,在無需離開當前頁面的情況下,
60、立即獲取更多相關信息。該功能不僅適用于網絡瀏覽器和相冊等應用,還可以在相機應用的實時取景畫面中使用。圖表35:即圈即搜功能 資料來源:三星,方正證券研究所 超視覺影像超視覺影像、智能修圖建議、智能修圖建議提升出片率。提升出片率。在影像拍攝上,搭載全新 AI 影像工具套件超視覺影像,超視覺夜拍功能升級,Galaxy S24 Ultra 的像素尺寸達到1.4m,相比前代機型提升了 60%,能夠在昏暗環境下捕捉到更多光線;在影像處理上,借助 Galaxy AI,可對照片進行清除、重新構圖和重錄等多種編輯。例如,利用第三代驍龍 8(for Galaxy)認知 ISP 的強大算力,能自由移動被選中的人物
61、或物體的位置,通過生成式 AI 在原位智能生成自然、協調的背景。圖表36:超視覺夜拍功能 圖表37:生成式編輯 資料來源:三星,方正證券研究所 資料來源:三星,方正證券研究所 電子 行業專題報告 21 敬 請 關 注 文 后 特 別 聲 明 與 免 責 條 款 s 2.22.2 大模型大模型廠商廠商創新創新不斷不斷,A AI I 加持多加持多種種應用應用場景場景 小米邁入“人車家全生態”小米邁入“人車家全生態”,M MWCWC 亮相在即亮相在即。2023 年 10 月,小米推出了新系統小米澎湃 OS,使 AI 大模型深入“人-車-家”整個生態系統。小米 14 系列的兩款新旗艦搭載該系統,是國內
62、第一款能夠在端側運行 AI 大模型的智能手機,搭載了小米自研的 60 億參數級大模型,能夠在手機上離線進行“文生圖”、“AI 擴圖”與“AI 去除路人”。此外,小米“影像旗艦”14 Ultra 以及首款電動車小米 SU7 將亮相 MWC 2024,展示其“人車家全生態”操作系統。圖表38:小米 AI 圖像生成功能 圖表39:小米“人車家全生態”資料來源:AI 奇點網,方正證券研究所 資料來源:芯語,方正證券研究所 O OPPOPPO 進入進入 AIAI 手機時代手機時代,推出,推出 ColorOS AIColorOS AI 新春版新春版。OPPO 在 2024 年 2 月 9 日的發布會上,宣
63、布正式進入 AI 手機時代,開啟“千萬用戶 AI 嘗鮮計劃”。推出 ColorOS AI 新春版,可應用在 OPPO 的 16 款機型上,包括 OPPO Find X7 系列、Find X6系列、Reno10 及 11 系列、一加 12 等。ColorOS AI 新春版帶來 AI 消除、AI 通話摘要、新小布助手、小布照相館、小布 AI 賀卡等重大更新。其中,AI 通話摘要可智能識別通話內容,生成重點信息摘要。圖表40:AI 消除 圖表41:AI 通話摘要 資料來源:OPPO,方正證券研究所 資料來源:OPPO,方正證券研究所 電子 行業專題報告 22 敬 請 關 注 文 后 特 別 聲 明
64、與 免 責 條 款 s 蘋果全力加碼人工智能蘋果全力加碼人工智能,iPhoneiPhone 1616 有望包括有望包括 A AI I 功能功能。在主流手機廠商中,蘋果還未推出 AI 手機,正在全力加碼人工智能,下一代 iPhone 和 iPad 軟件更新有望包括一系列新的 AI 功能。在最近的季度電話會議上,蘋果 CEO 表示在 AI 計劃上投入大量時間與努力。蘋果正接近完成 AI 軟件開發工具,將作為其旗艦編程軟件 Xcode 新版本的一部分。聯想聯想 A AI PCI PC 規?;涞?。規?;涞?。在 CES2024 上聯想推出 AI PC:1)兩款旗艦產品 Yoga Pro 9i 和 Y
65、oga 9i,配備 Yoga Creator Zone 生成式 AI軟件,可將基于文本的描述或草圖轉換為圖像;2)ThinkPad X1 Carbon AI、ThinkPad X1 二合一以及 IdeaPad Pro 5i 三款 AI PC 均搭載最新的英特爾酷睿 Ultra 處理器和 Windows 11 系統,作為英特爾 Evo筆記本系列,兼具高效的電源管理、強大的性能以及深度沉浸的使用體驗;3)聯想 LA AI 芯片是全新游戲陣容的關鍵核心,助力游戲本實現更流暢、自由的游戲體驗。圖表42:聯想 Yoga Pro 9i 圖表43:IdeaPad Pro 5i 資料來源:聯想,方正證券研究所
66、 資料來源:聯想,方正證券研究所 聯想將在聯想將在 M MWCWC 上展示新款上展示新款 A AI PCI PC。我們看到,聯想針對不同產品定位進行 AI 賦能。面向消費者的 Yoga 系列通過配備生成式 AI 軟件協助創作;B 端產品則更注重性能、體驗、算力方面;游戲本方面則通過 AI 芯片助力體驗。在即將舉行的MWC 上,聯想將推出最新的人工智能設備和基礎設施及解決方案組合,并展示兩款挑戰傳統個人電腦和智能手機外形的新概念產品。華碩靈耀華碩靈耀 14 14 雙屏雙屏端側端側 AIAI 性能性能出色。出色?!办`耀 14 雙屏”于 2024 年 2 月開售,配備主副兩塊 2.8K 分辨率可觸控
67、的 OLED 屏。內置英特爾酷睿 Ultra9 處理器,借助其三大 AI 引擎,能夠本地運行 AI 工具應用,通過內置的上百億參數大語言模型,高效地完成文章總結、故事創作、文案翻譯等繁瑣任務。在視頻編輯上,NPU 的強大性能讓剪映智能摳像處理的速度提升了 2.6 倍。電子 行業專題報告 23 敬 請 關 注 文 后 特 別 聲 明 與 免 責 條 款 s 圖表44:華碩靈耀 14 雙屏 資料來源:華碩,方正證券研究所 AIAI+ARAR 深度融合,雷鳥深度融合,雷鳥 X X2 2 LiteLite 問世。問世。雷鳥 X2 Lite 搭載業內領先的雙目全彩MicroLED+光波導方案,支持全場景
68、高透光、高亮度的全彩顯示。此外,雷鳥 X2 Lite 配備了高通驍龍 AR1 平臺,該芯片集成高通第三代 NPU,提供強大的 AI 處理能力,為大模型應用提供了重要的運算基礎。其內置的雷鳥自研大模型語音助手 Rayneo AI(Beta 版),可實現多輪自然語言對話、行程規劃、便捷百科問答、頭腦風暴等多項能力,給用戶帶來全新的“AI+AR”體驗。圖表45:雷鳥 X2 Lite AR 眼鏡 資料來源:雷鳥 XR,方正證券研究所 奔馳發布奔馳發布 MBUXMBUX 虛擬助理,寶馬發布基于亞馬遜大模型的智能個人助理。虛擬助理,寶馬發布基于亞馬遜大模型的智能個人助理。奔馳 MBUX運用生成式 AI 和
69、 3D 圖形技術,實現更加自然、直觀且高度個性化的人車互動;寶馬發布基于亞馬遜Alexa大語言模型提供的生成式人工智能技術而打造的全新一代 BMW 智能個人助理。智能助理化身一位寶馬汽車專家,為駕乘人員提供更人性化的幫助,及時解答有關車輛的疑問。電子 行業專題報告 24 敬 請 關 注 文 后 特 別 聲 明 與 免 責 條 款 s 圖表46:奔馳 MBUX 虛擬助理示意圖 圖表47:寶馬智能個人助理示意圖 資料來源:Forbes,方正證券研究所 資料來源:汽車之家,方正證券研究所 2.32.3 英偉達英偉達正式發布正式發布 AIAI 聊天機器人聊天機器人 近日英偉達正式發布Chat With
70、 RTX,這款應用適用于Windows平臺,由TensorRT-LLM 提供支持,并完全在本地運行。用戶可以利用 Chat With RTX 以自己的內容定制一個聊天機器人,從而體驗獨特的本地化系統設計和強大的功能。我們看到,Chat With RTX 的功能主要包括:1)文件處理:支持多種文件格式,如文本、pdf、doc/docx 和 xml 等。用戶只需將包含所需文件的文件夾指向給定目錄,Chat with RTX 會在幾秒鐘內將其加載到數據庫中。2)視頻內容處理:能夠加載 YouTube 播放列表的 URL,并提供視頻轉錄服務,以便用戶快速查詢視頻內容。3)個性化 AI 對話:允許用戶以
71、自己的資料(如文檔、筆記、視頻或其他數據)定制聊天機器人,使 AI 對話更具個性化。用戶可以與這個自定義的聊天機器人進行對話,快速靈活地獲得聊天機器人根據用戶內容給出的見解。圖表48:Chat With RTX 資料來源:NVIDIA,方正證券研究所 電子 行業專題報告 25 敬 請 關 注 文 后 特 別 聲 明 與 免 責 條 款 s 此次 Chat With RTX 的發布具有重要的意義,加速了 AI 的普及和應用。同時此款應用改變人與 AI 的交互方式,用戶可以根據自己的需求定制聊天機器人,這使得 AI 的使用更加靈活和便捷。Chat With RTX 也代表了大型語言模型技術發展的一
72、個重要方向,即為本地化、個性化、隱私保護的 AI 應用提供了新的可能。2.42.4 諸多新品亮相諸多新品亮相 CESCES,AIAI 終端時代來臨終端時代來臨 2.4.1 英偉達:AI 技術加持新顯卡,生成式 AI 改造游戲 NPC A AI I 技術加持,技術加持,G GPUPU 性能更勝一籌。性能更勝一籌。英偉達發布了全新的 GeForce RTX 40 SUPER系列顯卡,包含了 GeForce RTX 4080 SUPER、GeForce RTX 4070 Ti SUPER 和GeForce RTX 4070 SUPER 三款芯片,其中 Ti SUPER 的組合第一次出現在 GeFor
73、ce的命名規則中。RTX 40 SUPER 系列借助深度學習超級采樣技術(DLSS),游戲畫面中八分之七的像素都可以由 AI 生成,有效地降低了 GPU 渲染壓力、提升了游戲幀率。圖表49:GeForce RTX 40 SUPER 系列顯卡 圖表50:基于 AI 技術性能升級 資料來源:NVIDIA,方正證券研究所 資料來源:NVIDIA,方正證券研究所 1 1)RTX 4070 SUPERRTX 4070 SUPER:以進階級價格獲得超越旗艦的性能。與以進階級價格獲得超越旗艦的性能。與 RTX 4070 比較,該芯片增加 20%的 CUDA 核心。與上代旗艦 RTX 3090 相比,在圖形密
74、集度最高的游戲中,其運行速度更快,而功耗卻只有幾分之一,在開啟 DLSS 3 的情況下速度更是快了 1.5 倍。RTX 4070 SUPER 于 2024 年 1 月 17 日開售,售價人民幣 4899元起,以進階級價格獲得超越旗艦的性能。2 2)RTX 4070 Ti SUPERRTX 4070 Ti SUPER:更多更多 CUDACUDA 核心和更多內存,核心和更多內存,存儲擴增至 256-bit 的 16GB GDDR6X。該芯片能將高刷新率 1440p 面板性能發揮到極致,甚至可以在 4K 分辨率下游戲。此外,創作者也會樂于用它來編輯視頻和渲染大型 3D 場景。與 RTX 3070 T
75、i 相比,速度快 1.6 倍,配合 DLSS 3 時速度快 2.5 倍。RTX 4070 Ti SUPER于 2024 年 1 月 24 日開售,售價人民幣 6499 元起。3 3)RTX 4080 SUPERRTX 4080 SUPER:配備了更多 CUDA 核心,以及運行速度高達 23Gbps 的全球最快 GDDR6X 視頻內存(VRAM),是 4K 光追游戲和要求最苛刻的生成式 AI 應用的完美選擇。與 RTX 3080 Ti 相比:在對圖形性能要求非常高的游戲中,速度快 1.4倍;憑借 836TOPs 的 AI 算力,速度快 2 倍;生成視頻的速度快 1.5 倍,生成 AI圖像的速度快
76、 1.7 倍。RTX 4080 SUPER 售價人民幣 8099 元起,于 2024 年 1 月31 日開售。電子 行業專題報告 26 敬 請 關 注 文 后 特 別 聲 明 與 免 責 條 款 s 圖表51:GeForce RTX 4080 SUPER 配置升級 資料來源:NVIDIA,方正證券研究所 A ACECE 微服務使虛擬角色栩栩如生。微服務使虛擬角色栩栩如生。英偉達推出 ACE(Avatar Cloud Engine)微服務,將 A2F 和 RIVA ASR 這些 AI 模型融入游戲,前者使玩家能夠通過麥克風與 AI角色對話,后者通過音頻源為游戲角色生成豐富的面部動畫。在此次活動中
77、,英偉達展示了與開發平臺Convai 的最新合作成果:玩家與新一代 AI NPC 之間動態對話等交互能力。ACE 微服務不僅可以應用在游戲領域,也可用于虛擬客服等通過虛擬化身提供服務的領域?,F已開始采用 ACE 的開發者除了 Convai,還有Charisma.AI、Inworld、米哈游、網易游戲、掌趣科技、騰訊游戲、育碧和 UneeQ。圖表52:與 Convai 合作開發生成式 AI 圖表53:ACE 微服務 資料來源:NVIDIA,方正證券研究所 資料來源:NVIDIA,方正證券研究所 可以看到,英偉達如今正處于最新技術變革的中心:生成式人工智能(Generative AI),在 CES
78、 2024 上發布了從 RTX GPU 到軟件應用、開發工具等一系列重磅新品,均與高性能生成式 AI 功能相關,未來將繼續挖掘出 AI 驅動的生產潛力。電子 行業專題報告 27 敬 請 關 注 文 后 特 別 聲 明 與 免 責 條 款 s 2.4.2 AMD:全新桌面 APU 發布,推動高性能計算發展 銳龍銳龍 8000G8000G 系列系列開辟臺式機開辟臺式機 A AI I 新時代。新時代。上一代桌面 APU 銳龍 5000G 系列發布于2021 年,時隔兩年九個月,AMD 終于更新了桌面 APU 處理器銳龍 8000G 系列。銳龍 8000G 系列結合了獨立顯卡的強大性能與 Zen4 C
79、PU 核心,實現了高能效比。其中,銳龍 7 8700G 和銳龍 5 8600G 集成銳龍 AI 引擎,是首款搭載 NPU 的臺式電腦處理器,在臺式機領域率先具備加速 AI 軟件,優化 AI 工作負載,提高 AI 處理效率,并開啟了 AI 降噪等多項功能。圖表54:銳龍 8000G 系列性能升級 資料來源:AMD,方正證券研究所 新型號銳龍新型號銳龍 50005000 處理器處理器延長延長 AM4AM4 平臺平臺壽命。壽命。AMD 繼續推出新型號銳龍 5000 處理器,延長基于 AM4 架構非凡的平臺使用壽命,為用戶在構建生產力、游戲或內容創作的個人電腦系統時提供更多選擇。新產品包括新的銳龍 7
80、 5700X3D,利用強大的 3D V-Cache 技術,在游戲性能方面有巨大提升。圖表55:全新 AMD 銳龍 5000 系列臺式機處理器 資料來源:STH,方正證券研究所 全新銳龍全新銳龍 80408040 系列處理器帶來個人系列處理器帶來個人 A AI I 處理的飛躍。處理的飛躍。AMD 在上個月 Advancing AI大會上發布銳龍8040系列移動處理器,該系列將人工智能置于前沿和中心位置,在部分機型上集成了銳龍 AI NPU,帶來個人 AI 處理的下一個飛躍。其中 AI 性能算力從10TOPS提升至16TOPS,升幅高達60%,并使總算力從30TOPS增至39TOPS。宏碁、華碩、
81、聯想、惠普和雷蛇等 AMD 合作伙伴將推出更多搭載 Windows 11 的筆記本電腦和手持游戲系統,這些產品均采用 Ryzen 8040 系列處理器。電子 行業專題報告 28 敬 請 關 注 文 后 特 別 聲 明 與 免 責 條 款 s 圖表56:銳龍 8040 系列處理器 資料來源:ars technica,方正證券研究所 A AMDMD 新款新款 RX 7600 XTRX 7600 XT 顯卡顯卡 1616GBGB 大顯存可處理大顯存可處理 1440p1440p 游戲。游戲。AMD 還推出新款 Radeon RX 7600 XT 顯卡,配備 16GB 高速 GDDR6 顯存,適用于 1
82、440p 游戲或帶有光追的1080p 游戲。與 RX 7600 相比,顯存從 8GB 提升至 16GB,時脈從 2.25GHz-2.66GHz提升至 2.47GHz-2.76GHz,為此整卡功耗從 165W 提高至 190W。預計 2024 年 1 月24 日上市,售價 329 美元(2353 元人民幣)。圖表57:AMD Radeon RX 7600 XT 資料來源:ars technica,方正證券研究所 綜上產品可以看到,AMD 一直致力于推動高性能計算的發展邊界,全新銳龍 8000G系列處理器將高性能計算帶入下一個層次:游戲、AIPC 和超小型設備。AMD 未來將繼續與整個 AI 生態
83、系統深度合作,助力生成式 AI。2.4.3 高通:AI 處理器賦予 XR 新體驗,開啟出行全新時代 驍龍驍龍 X XR2+GR2+Gen2en2 支持超支持超 4 4K K 分辨率,大大提升畫面精細度。分辨率,大大提升畫面精細度。在 XR 方面,高通發布了驍龍 XR2+Gen 2 芯片,與上一代驍龍 XR2 Gen 2 相比,從支持單眼 3K 分辨率提升至單眼 4.3K,每秒傳輸幀數達到 90 幀,CPU 頻率、GPU 頻率分別提升了 20%電子 行業專題報告 29 敬 請 關 注 文 后 特 別 聲 明 與 免 責 條 款 s 和 15%,帶來了 25%的性能提升以及 50%的能效提升,同時
84、 AI 性能提升了 8 倍。其中,最關鍵的提升在于超 4K 分辨率,帶來畫面精細度提高,將一定程度上提高整個智能頭戴設備行業的水平。歌爾宣布與高通合作,三星和谷歌也計劃在將驍龍 XR2+Gen 2 應用在安卓系統上運行的虛擬現實產品上。圖表58:驍龍 XR2+Gen2 圖表59:高通 XR 參考設計 資料來源:高通,方正證券研究所 資料來源:TechRepublic,方正證券研究所 驍龍數字底盤為下一代生成式驍龍數字底盤為下一代生成式 A AI I 賦能。賦能。在汽車領域,高通展示了驍龍數字底盤解決方案的突破創新,該組合產品為下一代生成式 AI 提供賦能,涵蓋數字座艙、車聯網技術、網聯服務、先
85、進駕駛輔助與自動駕駛系統等多個方面。其中一項升級是“下一代生成式 AI 的數字座艙”,用于邊緣生成人工智能,這意味著根據不同的品牌和應用產品,汽車可以運行生成式 AI 應用程序,動態更新與駕駛員在路上相關的信息。博世基于高通的 Ride Flex SoC,以單顆 SoC 同時支持數字座艙、ADAS 和 AD 功能,實現下一代軟件定義汽車。圖表60:驍龍汽車智聯平臺 圖表61:驍龍座艙平臺 資料來源:高通,方正證券研究所 資料來源:高通,方正證券研究所 2.52.5 M MR R 是是 A AI I 的最佳落地形式,高度賦能的最佳落地形式,高度賦能內容內容生態生態 2.5.1 Meta 發布 A
86、nyMAL,研究成果有望整合入元宇宙產品線 AnyMALAnyMAL 實現圖像實現圖像/視頻視頻/音頻音頻/IMUIMU 運動傳感器數據運動傳感器數據等多模態數據轉換,創造新的等多模態數據轉換,創造新的S SOTAOTA。Meta 推出經過訓練的多模態編碼器集合 AnyMAL(Any-Modality Augmented Language Model),可實現各種模態(包括圖像、視頻、音頻和 IMU 運動傳感器電子 行業專題報告 30 敬 請 關 注 文 后 特 別 聲 明 與 免 責 條 款 s 數據)的數據轉換至 LLM 的文本嵌入空間,數據集包含包含 2 億張圖像、220 萬段音頻、50
87、 萬 IMU 時間序列、2800 萬段視頻等多種模態數據,利用圖像、視頻、音頻跨三種模式的多模態指令集對模型進行微調。AnyMAL 創造了新的 SOTA:在VQAv2 上提高了 7.0%的相對準確率,在零誤差 COCO 圖像字幕上提高了 8.4%的CIDEr,在 AudioCaps 上提高了 14.5%的 CIDEr。從 AnyMAL 的輸出示例來看,除了簡單的 QA 外,還能很好的解決靈感與建議、創新寫作、圖像字幕、隔行掃描形式、音頻信號推理、運動傳感器推理等多種不受拘束的任務。圖像標題生成表現、多模態推理任務人工評估勝率優于基線圖像標題生成表現、多模態推理任務人工評估勝率優于基線。我們看到
88、 AnyMAL-13B 和 AnyMAL-70B 性能差距較小,底層 LLM 能力對圖像標題生成任務影響較小,兩個變體在 COCO 和標有詳細描述任務(MM-IT-Cap)的 MM-IT 數據集上表現均明顯優于基線。在多模態推理任務的人工評估中,AnyMAL 性能強勁,與人工標注的實際樣本的差距較小,完整指令集微調的模型表現出最高的優先勝率。圖表62:AnyMAL 輸出示例 資料來源:機器之心,方正證券研究所 AnyMAL輸出示例:該模型理解各種輸入信號(即視覺、音頻、運動傳感器信號),并響應自由形式的用戶查詢。當多個模態交錯并作為輸入(例如最右邊圖像+IMU運動傳感器信號)時,模型將對它們進
89、行聯合推理。靈感與建議靈感與建議創新寫作QA圖像字幕隔行掃描的形式(圖像+運動傳感器)音頻信號推理運動傳感器推理電子 行業專題報告 31 敬 請 關 注 文 后 特 別 聲 明 與 免 責 條 款 s 圖表63:圖像標題生成表現優于基線 圖表64:多模態推理任務人工評估勝率優于基線 資料來源:機器之心,方正證券研究所 資料來源:機器之心,方正證券研究所 VQAv2VQAv2 提高提高 7.0%7.0%的相對準確率的相對準確率,音頻字幕生成能力優秀,音頻字幕生成能力優秀。我們看到 AnyMA 在 6 個不同的 VQA 數據集(H-Meme:hate Meme,S-QA:Science QA)上基
90、于 Zeroshot image 的 QA 結果,與基線視覺語言模型相比,AnyMAL 展示了具有競爭力的多模態推理能力,VQAv2 提高 7.0%的相對準確率,在視頻 QA 中的 STAR 中 AnyMA 表現也較為優秀。從 AnyMAL 的音頻字幕生成能力來看,AnyMAL 的表現明顯優于 CIDEr+10.9pp,SPICE+5.8pp,支持多音道音頻字幕生成能力,如嬰兒哭泣和女性說話同時進行。圖表65:VQA 基準、視頻 QA 基準 圖表66:AudioCaps 基準數據集上的音頻字幕生成結果 資料來源:機器之心,方正證券研究所 資料來源:機器之心,方正證券研究所 視頻視頻 QA QA
91、 基準基準VQA VQA 基準基準電子 行業專題報告 32 敬 請 關 注 文 后 特 別 聲 明 與 免 責 條 款 s 圖表67:音頻字幕生成能力優秀 資料來源:機器之心,方正證券研究所 MetaMeta 還推出測試版的聊天機器人還推出測試版的聊天機器人 Meta AIMeta AI,可以支持在可以支持在 QuestQuest 3 3 上面使用。上面使用。Meta AI 利用了 Llama 2 的技術和最新的大型語言模型研究,能生成文本回復及圖像,可以通過與微軟必應搜索引擎的合作獲得實時信息??梢允褂玫?App 包括 Whats App、Messenger 和 Instagram 等。圖表
92、68:Meta AI 資料來源:澎湃網,方正證券研究所 MetaMeta 發布發布 AnyMALAnyMAL,研究成果有望整合入元宇宙產品線。,研究成果有望整合入元宇宙產品線。AnyMAL 于 2023 年 9 月28 日發布,而 Meta Quest 3 于同日發布,兩者在時間上相近,且 Meta Quest 3可收集多模態數據,將真實世界和虛擬世界無縫融合,實現 Meta Reality 體驗,我們認為 AnyMAL相關研究成果有望為Meta的元宇宙產品線提供支持并應用到消費者市場。說明說明:在安靜的環境中敲擊鍵盤提示提示:你能猜出我的位置嗎?用一兩句話回答回答回答:根據打字的聲音,我猜你
93、是在一個安靜的室內環境,可能在辦公室或書房。打字的聲音清晰而清脆,帶有輕微的回聲或混響,表明這是一個天花板很高的房間或一個大而開放的空間說明說明:風很大,海浪沙沙作響提示提示:根據天氣,我應該穿什么?用一兩句話回答回答:回答:從風浪聲來看,暴風雨就要來了。最好多穿幾層,穿一些防水和保暖的衣服,以保持舒適和安全說明說明:一個嬰兒在電子語音的背景下哭泣,一個成年女性說話,打噴嚏,然后一個成年女性再次說話提示提示:用一到兩個句子描述這個聲音回應回應:這個聲音是一個孩子大聲的、高音調的尖叫,帶著一點嗚咽,好像孩子在哭和尖叫的同時。伴隨著這種聲音的背景是成年人低沉的聲音,可能是孩子的父母或看護人,他們用
94、安慰的語氣說話電子 行業專題報告 33 敬 請 關 注 文 后 特 別 聲 明 與 免 責 條 款 s 2.5.2 MR 為 AI 最佳落地終端,高度賦能 MR 內容與硬件 MRMR 為為 AIAI 最佳落地終端,高度賦能最佳落地終端,高度賦能 MRMR 內容與硬件。內容與硬件。近期 intiny 開發的完蛋!我被美女包圍了火速霸榜 Steam 國區熱銷第一名、全球第四,銷量破百萬,真人互動游戲爆火下,我們認為 MR 是 AI 最佳落地終端,泛社交、B 端應用拓展也擁有想象空間:1)辦公場景:Workrooms 是一個身臨其境的虛擬辦公室,無論是戴著 Meta Quest 頭戴式耳機,還是從
95、2D 屏幕上加入,都可以在這里與隊友會面、集思廣益、分享演示文稿并完成工作。同時,Workrooms 還支持 Zoom,讓連接更方便。表情豐富的虛擬化身:讓虛擬的形象看起來、行動起來和表現得與參會者一模一樣,并通過自然的面部表情和手勢豐富非語言交流。定制環境:用圖像和徽標定制辦公室。無論是在海灘邊破冰,還是在城市上空進行協作,都能為會議營造合適的氛圍。持久白板:在會議室或虛擬個人辦公室使用虛擬白板,勾畫想法或附加便箋,下次簽到時,白板上的內容依然存在。圖表69:Workrooms 截圖 資料來源:Meta 官網,方正證券研究所 2)政府服務:首爾市政府正式開展元宇宙服務,建立涵蓋經濟、教育、稅
96、務和行政等領域的行政服務平臺。該市還打算在接下來的五年里陸續推出更多涉及政府、商業、旅游和文化的服務。首爾市政府向媒體透露,社會正在經歷巨大的變革,非接觸式服務日益普及,信息通訊技術不斷進步,數字世代成為主導力量,首爾市政府就是基于這樣的形勢,提出了“元宇宙首爾”這一創新的行政服務理念。該平臺以自由、同行、聯接為核心價值,旨在包含各種公共服務,創建創意與溝通空間、平等的超現實空間、融合現實空間。電子 行業專題報告 34 敬 請 關 注 文 后 特 別 聲 明 與 免 責 條 款 s 圖表70:首爾市政府開展元宇宙服務 資料來源:澎湃,方正證券研究所 3)金融服務:中國工商銀行虛擬營業廳率先構建
97、“VR 智能眼鏡+元宇宙+智慧金融”場景。在虛擬營業廳中,用戶仿佛置身于真實的全景環境,不僅能體驗行走的空間感、縱深感,對網點的格局、設施、產品展示、展品細節、空間的大小也都能一目了然。工商銀行虛擬營業廳融合了虛擬數字人技術,客戶在虛擬空間中以第一人稱視角參觀虛擬網點,與人工智能虛擬數字人客服進行交互通過看、聽、說等多維度交互方式獲得更直接豐富的全新體驗。圖表71:工商銀行虛擬營業廳 資料來源:元宇宙界網站,方正證券研究所 4)醫療場景:內置 AI 醫療系統的 AR 眼鏡可以用于病情診斷、遠程會診和醫療教學:病情診斷:利用內置 AI 醫療系統的 AR 眼鏡,醫生可以直觀地觀察患者身體的狀況,并
98、實時獲取患者的生命體征分析,從而做出更加精準的病情診斷。這種技術的應用,不僅可以提升醫生的診斷水平,也可以節約醫生的時間和精力。AR 眼鏡能夠支持遠程會診的功能。電子 行業專題報告 35 敬 請 關 注 文 后 特 別 聲 明 與 免 責 條 款 s 遠程會診:通過 AR 眼鏡,患者和醫生可以進行實時的視頻交流,同時 AR 眼鏡可以傳送患者身體的數據和醫生的指導建議。這種技術可以增強患者和醫生之間的溝通效果和效率,同時也可以讓醫生更深入地了解患者的病情,從而更好地進行診斷和治療。醫療教學領域也可以利用 AR 眼鏡的技術。醫療教學:醫生可以通過 AR 眼鏡向學生實時傳達指導和建議,同時學生可以通
99、過 AR 眼鏡觀察患者的身體情況和醫生的操作過程。這種方式可以讓學生更加深入地了解患者的病情和治療方法,同時也可以讓醫生更好地進行指導和教學。圖表72:AR 眼鏡用于醫療教學 資料來源:搜狐新聞,方正證券研究所 3 3 AIAI 驅動全球算力硬件環節創新與需求共振驅動全球算力硬件環節創新與需求共振 3.13.1 英偉達:英偉達:H H200200 出貨在即,定制芯片業務儲備中出貨在即,定制芯片業務儲備中 首款搭載首款搭載 H HBM3EBM3E 的的 GPU H200GPU H200 于于 2 2023023 年年 1 11 1 月發布,預計月發布,預計 2 24Q24Q2 實現出貨。實現出貨
100、。2023年 11 月 13 日,英偉達發布首款提供 HBM3e 的 GPU,作為一種更快、更大的內存,HBM3e 可加速生成式 AI 和大型語言模型,同時能推進 HPC 工作負載的科學計算。借助 HBM3e,NVIDIA H200 能以每秒 4.8 TB 的速度提供 141GB 內存,與前前一代的 NVIDIA A100 相比,容量幾乎翻倍,帶寬增加 2.4 倍,在用于推理或生成問題答案時,性能較 H100 提高了 60%至 90%,采用 HBM3e 內存技術的H200 在處理 700 億參數的大模型時,推理速度較 H100 快了整整一倍,能耗降低了一半。受 HBM3E 供應限制,預計 H2
101、00 將于 24Q2 實現出貨。電子 行業專題報告 36 敬 請 關 注 文 后 特 別 聲 明 與 免 責 條 款 s 圖表73:英偉達 H200 性能 資料來源:半導體行業觀察,NVIDIA,方正證券研究所 圖表74:英偉達 H200 能耗降低 資料來源:半導體行業觀察,NVIDIA,方正證券研究所 H200 具備超過 460 萬億次的浮點運算能力,可支持大規模的 AI 模型訓練和復雜計算任務。HGX H200 采用了 NVIDIA NVLink 和 NV Switch 高速互連技術,為各種應用工作負載提供最高性能,包括對超過 1750 億個參數的最大模型進行的 LLM訓練和推理。借助 H
102、BM3e 技術的支持,H200 能夠顯著提升性能。在 HBM3e 的加持下,H200 能夠將 Llama-70B 推理性能提升近兩倍,并將運行 GPT3-175B 模型的性能提高了 60%。對于具有 700 億參數的 Llama2 大模型,H200 的推理速度比 H100快一倍,并且推理能耗降低了一半。此外,H200 在 Llama2 和 GPT-3.5 大模型上的輸出速度分別是 H100 的 1.9 倍和 1.6 倍。電子 行業專題報告 37 敬 請 關 注 文 后 特 別 聲 明 與 免 責 條 款 s 圖表75:H200 大模型運行效果 資料來源:半導體行業觀察,NVIDIA,方正證券研
103、究所 H200 芯片支持高達 48GB 的 GDDR6X 內存,其內存帶寬可達 936GB/s,有效提高了數據傳輸速度并降低了延遲。對比 H100 的 SXM 版本,顯存從 80GB 提升 76%,帶寬從每秒 3.35TB 提升了 43%。對于模擬、科學研究和人工智能等內存密集型 HPC應用,H200 的更高內存帶寬可以確保高效地訪問和操作數據。與傳統的與傳統的 CPUCPU 相相比,使用比,使用 H200H200 芯片可以將獲取結果的時間加速多達芯片可以將獲取結果的時間加速多達 110110 倍。倍。圖表76:H200 高速內存性能 資料來源:半導體行業觀察,NVIDIA,方正證券研究所 靜
104、待靜待 B B100100 發布,展望發布,展望 X X100100。英偉達 B100 的原計劃發布時間為 2024 年第四季度,但由于 AI 需求的火爆,已經提前至第二季度,目前已經進入供應鏈認證階段,B100 將能夠輕松應對 1730 億參數的大語言模型,比當前型號 H200 的兩倍還要強大。此外,B100 將采用更高級的 HBM 高帶寬內存規格,有望在堆疊容量和帶寬上繼續突破,超越現有的 4.8TB/s。根據英偉達產品路線圖,預計 2025 年將推出X100,進一步豐富 GPU 產品矩陣,鞏固英偉達 AI 芯片龍頭地位。電子 行業專題報告 38 敬 請 關 注 文 后 特 別 聲 明 與
105、 免 責 條 款 s 圖表77:A100/H100/H200/B100 性能 資料來源:半導體行業觀察,NVIDIA,方正證券研究所 圖表78:英偉達產品路線圖 資料來源:36Kr,NVIDIA,方正證券研究所 英偉達進軍定制英偉達進軍定制 A AI I 芯片領域。芯片領域。根據 CNBC,英偉達目前正在策劃建立全新部門旨在為云計算企業和其企業提供定制化芯片業務。根據 CNBC,定制化芯片或將專注于滿足特定設備或者系統的性能和功耗要求,其中或將包含特定的處理單元,傳感器集成、專用硬件加速器,以滿足特定領域的需求。目前根據 CNBC,英偉達已經和亞馬遜、Meta、微軟、谷歌和 OpenAI 商議
106、定制 AI 芯片的相關合作。在定制化 AI 芯片領域,谷歌旗下 TPU 已經實現多次迭代,目前迭代至 Cloud TPU v5 系列,其中 Cloud TPU v5p 為系列中性能最強 TPU,含有 8960 個芯片,芯片互聯速度可達4800 Gbps,在訓練LLM模型時速度相較于上一代TPU v4快1.92.8倍。電子 行業專題報告 39 敬 請 關 注 文 后 特 別 聲 明 與 免 責 條 款 s 圖表79:最新款 Google Cloud TPU v5p 性能提升顯著 資料來源:格隆匯,半導體行業觀察,方正證券研究所 3.23.2 A AMDMD:MI300MI300 正式發布,正式發
107、布,20242024 年銷售收入上調年銷售收入上調 2023 年 12 月 6 日,AMD 在 Advancing AI 活動上宣布推出 Instinct MI300X,采用了 AMD CDNA3 架構,搭載了 8 塊 HBM3,容量達 192GB。與 MI250X 相比,計算單元增加了約 40%、內存容量增加 1.5 倍、峰值理論內存帶寬 3 增加 1.7 倍。在某些工作環境中,性能可達 H100 的 1.3 倍。圖表80:AMD Instinct MI300X 與 H100 規格比較 資料來源:AMD,方正證券研究所 MI300MI300 采用采用 3.5D3.5D 封裝,封裝,I/OI/
108、O 密度進一步提升。密度進一步提升。MI300X 采用 3.5D 封裝,即通過混合鍵合技術實現 XCD、I/Odie 的 3D 堆疊,其次在硅中介層上實現與 HBM 的集成,從而實現了超過 1500 億個晶體管的高密度封裝。該封裝方案由臺積電提供,搭配 SoIC 技術與 CoWoS 技術共同實現。電子 行業專題報告 40 敬 請 關 注 文 后 特 別 聲 明 與 免 責 條 款 s 圖表81:AMD Instinct MI300X 配置 圖表82:AMD Instinct MI300X 采用 3.5D 封裝 資料來源:AMD,方正證券研究所 資料來源:AMD,方正證券研究所 SoICSoIC
109、 技術升級,技術升級,MI300MI300 帶寬升至帶寬升至 V V-CacheCache 的的 7 7 倍。倍。AMD 3D V-Cache 中的 SoIC 尺寸大小約為 7x10mm,邏輯芯片放置在垂直結構的下方;CCD 為 5nm 節點,X3D 為7nm 節點,通過 SoIC 可提供高達 2.5 TB/s 的垂直帶寬。在 MI300 中,SoIC 技術迎來進一步升級,尺寸擴大至 13x29mm(面積約為此前的 5 倍),邏輯芯片放置在了垂直結構的頂部以更好的散熱,5nm 的 XCD/CCD 堆疊在 6nm 節點的 IOD 上,垂直帶寬提升至 17TB/s(為 3D V-Cache 的 7
110、 倍)。圖表83:AMD Instinct MI300 截面圖 資料來源:AMD,方正證券研究所 根據 AMD 2023Q4 法說會,目前 MI300 已經成為 AMD 歷史產品中收入增速最快的產品,同時 AMD 法說會中表示,2024 年 MI 芯片銷售收入超過 35 億美金,高于此前預測 20 億美金。電子 行業專題報告 41 敬 請 關 注 文 后 特 別 聲 明 與 免 責 條 款 s 圖表84:AMD 在多個 AI 領域產品線豐富 資料來源:AMD 官網,方正證券研究所 3.33.3 A AI I 浪潮推動光模塊、交換機配套升級浪潮推動光模塊、交換機配套升級 根據 Coherent,
111、2023 年主要下游應用市場規模達 640 億美元。公司產品主要下游應用市場包括工業、通信、電子、使用儀器,2023 年通信市場規模達 230 億美元,2023-2028 年 CARG 為 14%,其次為工業市場,2023 年工業市場規模達 220 億美元,2023-2028 年 CARG 為 9%,電子器件市場規模達 140 億美元,CARG 為 20%,使用儀器市場規模為 50 億美元,CARG 為 8%,四大主要市場合計市場規模將達 640億美元,2023-2028 年 CARG 為 14%,其中通信方面 AI 將為主要驅動力。圖表85:主要下游市場發展趨勢 資料來源:Coherent,
112、方正證券研究所 數據通信收發器向高傳輸速率演進,數據通信收發器向高傳輸速率演進,2 2028028年年8 800G00G及以上產品市場占比將超及以上產品市場占比將超6 65%5%。根據 LightCounting 數據,數據通信收發器市場規模將由 2023 年的 51 億美元增長至 2028 年 153 億美元,2023-2028 年 CARG 為 24.6%,其中 800G 產品自 2023年起進入高速發展階段,800G 及以上產品預計 2028 年占數據通信收發器市場 65%以上份額,2023-2028 年 CARG 將達 65%。從細分產品來看,EML 產品占比快速提升,其中 AI 用
113、EML 產品 2028 年預計占整個市場 33%,市場規模達 50 億美元,較2023 年的 6 億美元較大提升,且市場占比由 12%提升至 33%。電子 行業專題報告 42 敬 請 關 注 文 后 特 別 聲 明 與 免 責 條 款 s 圖表86:數據通信收發器市場發展情況 資料來源:Coherent,LightCounting,Internal Estimates,方正證券研究所 圖表87:2023 年數據通信收發器市場細分 圖表88:2028 年數據通信收發器市場細分 資料來源:Coherent,LightCounting,方正證券研究所 資料來源:Coherent,LightCount
114、ing,方正證券研究所 以太網交換機市場潛力巨大。以太網交換機市場潛力巨大。Arista 于 2023Q4 宣布推出下一代 7130 系列交換機,用于超低延遲切換,加速 25G 網絡。憑借三個新的 25G 優化系統、增強的光學性能、25G 就緒 FPGA 應用程序和 FDK(FPGA 開發套件)更新,Arista 滿足了25G 市場數據分發和高頻交易(HFT)環境的需求。對于 400G,客戶群已從 2022年的 600 名增加到 2023 年的約 800 名。電子 行業專題報告 43 敬 請 關 注 文 后 特 別 聲 明 與 免 責 條 款 s 圖表89:不同傳輸速度的數據中心以太網交換機細
115、分市場潛力 資料來源:Arista,方正證券研究所 IBIB 交換機交換機 2 2024024 年有望持續高增。年有望持續高增。對 AI 應用的聚焦推動了英偉達 2023 年數據中心產品的銷售。與 2022 年相比,2023 年 IB 交換機的 ASIC 銷量增長預計近三倍,同時 LIGHT COUNTING 預計 2024 年 IB 交換機仍將維持強勁增長,預計 2023-2028年均復合增長率將達 24%,對應 2028 年 IB 交換機市場銷售規模將超 30 億美元。圖表90:以太網交換機以及 IB 交換機市場銷售預測 資料來源:LightCounting,云深知網絡,方正證券研究所 作
116、為全球光模塊、交換機代表企業,Coherent 和 Arista 業績向好,其中:Coherent:AI 驅動 800G 環比持續高增,1.6T 有望于 2025 年商業化 CoherentCoherent FYFY2 24 4Q Q2 2 收入環比增長超預期,收入環比增長超預期,AI/MLAI/ML 產品需求強勁。產品需求強勁。FY2024Q2 Coherent實現收入 11.31 億美元,高于指引中值,yoy-17.45%,qoq+7.41%;毛利潤 3.51億美元,yoy-14.60%,qoq+14.33%。分部門看,激光器部門收入 3.54 億美元,yoy-6.60%,qoq+5.36
117、%;網絡部門收入 5.24 億美元,yoy-13.96%,qoq+10.78%;材料部門收入 2.54 億美元,yoy-33.51%,qoq+3.67%。受益于人工智能的蓬勃發電子 行業專題報告 44 敬 請 關 注 文 后 特 別 聲 明 與 免 責 條 款 s 展,AI/ML 相關數據收發器連續第三季獲得強勁訂單,800G 產品季度收入突破1 億美元,環比增長超 100%,800G 出貨量持續強勁增長,FY2024 年公司預計超過 50%的數據通信收發器收入將來自人工智能相關應用,2025 年向 1.6T 產品商業化發展前進以順應 AI 發展,公司數據通信收發器龍頭地位穩定。圖表91:近五
118、季度 Coherent 三大業務營收(億美元)圖表92:FY2024Q2 Coherent 三大業務營收占比 資料來源:Coherent,方正證券研究所 資料來源:Coherent,方正證券研究所 Arista:云、數據中心業務發展迅猛 AristaArista公司季度營收向好。公司季度營收向好。2023Q4 Arista公司營收15.4億美元,環比增長2.1%,同比增長 20.8%。GAAP 毛利率為 64.9%,環比提升 2.5pcts,同比提升 4.6pcts。GAAP 凈收入為 6.1 億美元,同比提升 43.7%。分產品來看,云、人工智能和數據中心產品組成的核心業務占營收 65%,公
119、司交換機產品占 100、200 和 400G 端口交換領域 40%以上的份額,位居第一,預計 400G 和 800G 比特以太網將成為 AI 后端 GPU 集群的重要試點,公司作為交換機龍頭,有望深度受益于 AI 驅動下,數據中心以太網交換機市場的增長,實現營收進一步上升。圖表93:數據中心以太網交換機收入預測 圖表94:校園以太網交換機收入預測 資料來源:Arista,方正證券研究所 資料來源:Arista,方正證券研究所 云、云、A AI I 和數據中心核心業務發展勢頭迅猛。和數據中心核心業務發展勢頭迅猛。Arista 在 2023 年的核心業務由云、Al 和數據中心產品組成,建立在高度差
120、異化的 Arista 可擴展操作軟件系統堆棧上,部署了 10G、25G、100G、200G 和 400G 的速度。Arista 云網絡產品提供了節能、高可用的區域,而不會增加冗余成本,因為數據中心對前端、后端存儲和計0246810121416FY23 Q2FY23 Q3FY23 Q4FY24 Q1FY24 Q2激光器網絡材料激光器網絡材料電子 行業專題報告 45 敬 請 關 注 文 后 特 別 聲 明 與 免 責 條 款 s 算集群的帶寬容量和網絡速度都有很高需求。Arista 預計 400 和 800 千兆以太網將成為 Al 后端 GPU 集群的重要試點,預計 2025 年實現 Al 網絡收
121、入至少 7.5億美元。圖表95:數據中心高速以太網端口季度數據(百萬個)圖表96:數據中心高速以太網端口年度數據(百萬個)資料來源:Arista,方正證券研究所 資料來源:Arista,方正證券研究所 012345678CiscoROMArista0510152025202020212022CiscoROMArista電子 行業專題報告 46 敬 請 關 注 文 后 特 別 聲 明 與 免 責 條 款 s 4 4 國產算力把握機遇進展迅速國產算力把握機遇進展迅速 全球 AI 產業快速發展背景下,算力芯片重要性日益凸顯,英偉達等行業巨頭公司持續進行新品迭代,國產廠商同樣把握機遇快速發展。我們梳理
122、了英偉達及部分國內主流 AI 芯片廠商產品參數,從產品性能來看,盡管國內廠商由于起步較晚,產品性能整體落后于英偉達當前主流料號,但我們也看到如華為昇騰 910B 等產品性能已可比肩英偉達 A100 的參數性能。我們看好隨著國內廠商產品持續迭代,國內 AI 芯片與海外的差距將逐步縮小。圖表97:部分國產芯片性能參數對比英偉達產品 資料來源:公開資料整理,方正證券研究所 1 1)華為昇騰:)華為昇騰:目前昇騰產品線共有兩個系列產品:昇騰 310 和昇騰 910,其中昇騰 910 是基于自研華為達芬奇架構 3D Cube 技術,在算力方面完全達到設計規格,半精度(FP16)算力 320 TFLOPS
123、,整數精度(INT8)算力 640 TOPS,功耗310W。同時根據科大訊飛公告,目前昇騰同時根據科大訊飛公告,目前昇騰 910B910B 能力已經基本做到可對標英偉達能力已經基本做到可對標英偉達A100A100。圖表98:昇騰 910 與英偉達部分產品參數對比(TFLOPS,W)資料來源:海思半導體官網,Nvidia 官網,TechPowerUp,方正證券研究所 昇騰昇騰 A AI I 平臺:平臺:昇騰全棧 AI 軟硬件平臺可以分為硬件層、架構層、框架層、應用層,其中硬件層涵蓋開發者套件、加速模塊、加速卡等產品;架構層核心為 CANN異構計算架構;框架層則以昇思 MindSpore 為核心。
124、公司名稱公司名稱產品料號產品料號用途用途發布/推出時間發布/推出時間制程制程INT8算力(TOPS)INT8算力(TOPS)FP16算力(TFLOPS)FP16算力(TFLOPS)FP32算力(TFLOPS)FP32算力(TFLOPS)H200訓練2023年11月4nm-197967H100訓練2023年9月4nm4000160060A100訓練2020年5月7nm62431219.5昇騰310推理2018年10月12nm168-昇騰910訓練2019年8月7nm640320-云燧T20訓練2021年7月12nm25612832云燧i20推理2021年12月12nm25612832寒武紀思元3
125、70訓推一體2021年11月7nm2569624海光信息深算二號訓練2023年11月-壁仞科技BR100訓推一體2022年8月7nm2048-256英偉達華為燧原科技昇騰910昇騰910Nvidia A100Nvidia L40Nvidia L40S架構架構HUAWEI Da VinciNVIDIA AmpereNVIDIA Ada LovelaceNVIDIA Ada Lovelace FP16320312181.05362.05IINT8640624362733功耗功耗310300300350制程制程N7+N75 nm5 nm電子 行業專題報告 47 敬 請 關 注 文 后 特 別 聲 明
126、 與 免 責 條 款 s 圖表99:昇騰全棧 AI 軟硬件平臺結構 圖表100:昇騰 CANN 異構計算架構 資料來源:昇騰官網,方正證券研究所 資料來源:昇騰官網,方正證券研究所 昇騰賦能計算中心。昇騰賦能計算中心。在建設計算中心方面,昇騰 AI 提供了從底層硬件到頂層應用使能的人工智能全棧能力,以“1 中心+4 平臺”賦能產業發展。在硬件層面主要由 Atlas 900 AI 集群構成,其涵蓋數千顆昇騰 910 處理器,總算力最大可拓展至 3.2 EFLOPS。圖表101:昇騰人工智能計算中心建設方案 資料來源:昇騰官網,方正證券研究所 2 2)燧原科技:燧原科技:燧原科技成立于 2018
127、年 3 月,專注于 AI 云端算力產品,涵蓋芯片、板卡、智算一體機、液冷算力集群以及配套的軟件系統。2019 年 12 月,公司成功發布第一代訓練產品“云燧 T10”;2020 年 12 月,公司發布第一代推理產品“云燧 i10”;2021 年 7 月,公司發布第二代訓練產品“云燧 T20/T21”,并于同年的 12 月發布第二代推理產品“云燧 i20”。云燧 T20 和 i20 均基于邃思 2.0 打造,邃思 2.0 是同期國內最大的 AI 計算芯片,采用日月光 2.5D 封裝,在國內率先支持 TF32 精度,單精度張量 TF32 算力可達160TFLOPS。同時,邃思 2.0 也是國內同期
128、首個支持 HBM2E 的產品,最高容量達64GB,傳輸速率達 1.8TB/s。電子 行業專題報告 48 敬 請 關 注 文 后 特 別 聲 明 與 免 責 條 款 s 燧原科技產品歷經成熟商業化打磨。燧原科技產品歷經成熟商業化打磨。根據燧原科技,公司的芯片在出貨后就已應用于騰訊不同的業務部門、產品線上。同時,燧原科技還聯合之江實驗室,共同構建了超千卡規模的 AI 液冷集群。2023 年 10 月 25 日,弘信電子向燧原科技下發 9152 片芯片采購訂單,計劃于 2023 年底前完成全部芯片的交付,快速形成國產算力落地。圖表102:燧原科技部分產品簡介 資料來源:燧原科技官網,方正證券研究所
129、3 3)景嘉微:景嘉微:景嘉微是國內首家成功研制國產 GPU 芯片并實施大規模工程應用的公司。景嘉微掌握了一系列關鍵技術,包括芯片底層邏輯/物理設計、超大規模電路集成驗證、模擬接口設計、GPU 驅動程序設計等。在 GPU 體系結構、圖形繪制高效處理算法、高速浮點運算器設計、可復用模塊設計、快速大容量存儲器接口設計、低功耗設計等方面擁有豐富的技術積累。景嘉微先后成功研制出具有自主知識產權的高性能 GPU 芯片,如 JM5 系列、JM7 系列、JM9 系列等,為國內 GPU 技術的突破和發展做出了杰出的貢獻。圖表103:景嘉微 JM9-1 和 JM9-2 部分性能參數 型號型號 JM9JM9-1
130、1 JM9JM9-2 2 顯存容量 8GB 8GB 顯存帶寬 128GB/s 25.6GB/s 總線接口 PCIe 4.0 X8 PCIe 4.0 X8 FP32 性能 1.5 TFLOPS 512 GFLOPS 像素填充率 32G Pixels/s 8G Pixels/s 數據來源:景嘉微公告,方正證券研究所 4 4)寒武紀:寒武紀:成立于 2016 年,提供云邊端一體、軟硬件協同、訓練推理融合、具備統一生態的系列化智能芯片產品和平臺化基礎系統軟件。根據寒武紀官網,目前寒武紀具有智能加速卡、智能加速系統、智能邊緣計算模組、終端智能處理器IP、軟件開發平臺共 5 大業務。其中公司智能加速卡思元
131、 370 系列采用 7nm 制程,使用 chiplet 技術,集成 390 億個晶體管,最大算力高達 256TOPS(INT8)。電子 行業專題報告 49 敬 請 關 注 文 后 特 別 聲 明 與 免 責 條 款 s 圖表104:寒武紀思元 370 系列智能加速卡參數 資料來源:寒武紀官網,方正證券研究所 5 5)沐曦集成電路:沐曦集成電路:成立于 2020 年 9 月,其核心成員平均擁有近 20 年的高性能GPU 產品端到端研發經驗,并曾主導開發和量產了多款世界主流的高性能 GPU 產品。沐曦推出了曦思 N 系列 GPU 產品,專為 AI 推理而設計;曦云 C 系列 GPU 產品,用于千億
132、參數的 AI 大模型訓練和通用計算;以及曦彩 G 系列 GPU 產品,用于圖形渲染,以滿足數據中心對于高能效和高通用性算力需求的要求。沐曦的產品采用完全自主研發的 GPU IP,擁有完全自主知識產權的指令集和架構,并配備與主流 GPU 生態兼容的完整軟件棧,具備高能效和高通用性的天然優勢。根據沐曦官微,2023 年 6 月,旗下產品曦云 C500 僅用 5 小時便完成功能測試。圖表105:曦云 C500 僅用 5 小時完成功能測試 資料來源:沐曦官微,方正證券研究所 6 6)壁仞科技:壁仞科技:成立于 2019 年,專注于開發獨創的通用計算體系,并構建高效的軟硬件平臺,同時提供智能計算領域的一
133、體化解決方案。公司的發展路徑首先聚焦于云端通用智能計算,并逐步超越現有解決方案,在人工智能訓練、推理和圖MLU370-S4MLU370-X4MLU370-X8計算架構計算架構Cambricon MLUarch03Cambricon MLUarch03Cambricon MLUarch03制程工藝制程工藝7nm7nm7nmFP16FP1672 TFLOPS96 TFLOPS96 TFLOPSFP32FP3218 TFLOPS24 TFLOPS24 TFLOPS內存容量內存容量24GB24GB48GB內存帶寬內存帶寬307.2 GB/s307.2 GB/s614.4 GB/s最大熱功耗最大熱功耗7
134、5W150W250W電子 行業專題報告 50 敬 請 關 注 文 后 特 別 聲 明 與 免 責 條 款 s 形渲染等多個領域實現國產高端通用智能計算芯片的突破。在 2022 年,壁仞科技推出了旗下的首款旗艦 GPU 芯片:BR100。該芯片采用了 7nm 制程,并支持 PCIe 5.0 接口。根據壁仞科技發布會的介紹,BR100 的 16 位浮點算力超過 1000T,8 位定點算力超過 2000T,單芯片的峰值算力達到了 PFLOPS 級別。圖表106:壁仞科技產品:壁礪 100P 圖表107:壁仞科技產品:壁礪 104 資料來源:壁仞科技官網,方正證券研究所 資料來源:壁仞科技官網,方正證
135、券研究所 7 7)摩爾線程:摩爾線程:成立于 2020 年 10 月,專注于研發設計全功能 GPU 芯片及相關產品。他們的產品支持多種組合工作負載,包括 3D 圖形渲染、AI 訓練與推理加速、超高清視頻編解碼、物理仿真與科學計算等。摩爾線程注重算力與算效的平衡,旨在為中國科技生態合作伙伴提供強大的計算加速能力,并在數字經濟的多個領域廣泛發揮作用。根據摩爾線程官網的信息,旗下的 MTT S3000 產品具有 GPU 核心頻率 1.9GHz,32GB 容量的 DDR6 顯存,支持 FP32、FP16、INT8 等多種計算精度同時其 FP32 算力達到了 15.2TFLOPS。圖表108:摩爾線程
136、MTT S3000 資料來源:摩爾線程官網,方正證券研究所 產品迭代與國產化需求催生優質先進算力企業。產品迭代與國產化需求催生優質先進算力企業。通過梳理 2023 年 IC 先進算力公司公告及業務進展近況我們發現:目前國內 IC 先進算力公司在產品迭代、產能建設、斬獲大額訂單進展迅猛,其中產品迭代以及產能建設主要集中在算力核心硬件以及 AI 相關芯片中,同時從部分公司目前斬獲的訂單來看,主要集中在國產化算力相關項目中。我們認為,核心公司業務進展近況進一步印證了現階段板塊發展兩個核心要素:AI 方向的持續產品迭代、龐大的國產化算力需求。電子 行業專題報告 51 敬 請 關 注 文 后 特 別 聲
137、 明 與 免 責 條 款 s 圖表109:IC 先進算力部分公司重要公告&業務進展情況 資料來源:各公司公告,全國公共資源交易平臺,方正證券研究所 5 5 HBM4HBM4 實現邏輯存儲垂直堆疊,混合鍵合助力帶寬提升實現邏輯存儲垂直堆疊,混合鍵合助力帶寬提升 高性能計算功耗問題突出。高性能計算功耗問題突出。最開始數據中心通過提高 CPU、GPU 的性能進而提高算力,但處理器與存儲器的工藝、封裝、需求不同,導致二者之間的性能差距逐步加大。英偉達創始人黃仁勛曾表示計算性能擴展的最大弱點就是內存帶寬。以谷歌第一代 TPU 為例,其理論算力值為 90TFOPS,但最差真實值僅 1/9,即 10TFOP
138、S算力,因為其相應內存帶寬僅 34GB/s。此外,在傳統架構下,數據從內存到計算單元的傳輸功耗是計算本身能耗的約200倍,僅用于計算的能耗和時間占比很低,數據在內存與處理器之間的頻繁遷移帶來嚴重的功耗問題。圖表110:存儲功耗限制整體性能表現 資料來源:AMD,方正證券研究所 公司公司相關公告及業務進展相關公告及業務進展景嘉微2023/8/2定增項目通過:擬定增募集資金不超過39.74億元,計劃投向高性能通用GPU芯片研發及產業化項目約30.30億、投向通用 GPU 先進架構研發中心建設項目約9.45億。同時高性能通用GPU芯片項目將與第三方先進芯片封裝廠共建專用封測線。2023/8/17公告
139、:公司與中國移動、浙江信息組成的聯合體中標“浙東南數字經濟產業園數字基礎設施提升工程(一期)”項目,合計金額約7.53億,公司所占金額約5.28億。預計收到相應開工報告后40日內供貨、安裝調試完畢。2023/6/30日,公司中標沈陽市大東區城市建設局的“沈陽市汽車城新型基礎設施建設項目-智能計算中心”項目,中標金額約1.55億元,同時合同規定產品交付時間不得晚于2023年9月30日。海光信息2023H1海光三號為CPU主力銷售產品,海光四號、海光五號處于研發階段;DCU主力銷售產品為深算一號,深算二號已發布,深算三號研發進展順利。龍芯中科發展目標:到2025年開放市場的營收占公司營收比達到30
140、%。同時在2023年11月已發布3A6000產品,3A6000整機產品也已有小批量出貨。2023年7月公告,擬向不特定對象發行可轉債募資不超過20.0億,主要投向新一代 FPGA平臺開發及產業化、智能化可重構 SoC 平臺開發及產業化、新工藝平臺存儲器開發及產業化等多個項目中。2023年世界人工智能大會中,公司展出了第二款 FPAI芯片-FMQL100TAI,可搭載多種人工智能算法,同時兼具可重構性。紫光國微 在特種集成電路領域,相關圖像AI智能芯片也已在2023H1完成研發,開始進行推廣。復旦微電寒武紀-U電子 行業專題報告 52 敬 請 關 注 文 后 特 別 聲 明 與 免 責 條 款
141、s HBMHBM 打破內存帶寬及功耗瓶頸。打破內存帶寬及功耗瓶頸。不同于傳統的內存與處理器基于 PCB 互聯的形式,HBM 是基于與處理器相同的“Interposer”中介層互聯實現近存計算,從而顯著減少數據傳輸時間,節省布線空間。而基于 TSV 工藝的 DRAM 堆疊技術則顯著提升了帶寬,并降低功耗和封裝尺寸。根據 SAMSUNG,3D TSV 工藝較傳統 POP封裝形式節省了 35%的封裝尺寸,降低了 50%的功耗,并且帶來了 8 倍帶寬提升。圖表111:HBM 與 GDDR 結構對比 圖表112:TSV 工藝帶來尺寸、功耗及帶寬優勢 資料來源:AMD,方正證券研究所 資料來源:SAMSU
142、NG,方正證券研究所 HBMHBM 正成為正成為 HPCHPC 軍備競賽的核心。軍備競賽的核心。英偉達早在 2019 年便已推出針對數據中心和HPC 場景的專業級 GPU Tesla P100,當時號稱“地表最強”的并行計算處理器,DGX-1 服務器就是基于單機 8 卡 Tesla P100 GPU 互連構成。得益于采用搭載 16GB的 HBM2 內存,Tesla P100 帶寬達到 720GB/s,而同一時間推出的同樣基于 Pascal架構的 GTX 1080 則使用 GDDR5X 內存,帶寬為 320GB/s。此后英偉達數據中心加速計算 GPU V100、A100、H100 均搭載 HBM
143、 顯存。最新的 H100 GPU 搭載 HBM3 內存,容量 80Gb,帶寬超 3Tb/s,為上一代基于 HBM2 內存 A100 GPU 的兩倍。而作為加速計算領域追趕者的 AMD 對于 HBM 的使用更為激進,其最新發布的 MI300X GPU搭載容量高達192GB的HBM3顯存,為H100的2.4倍,其內存帶寬達5.2TB/s,為 H100 的 1.6 倍,HBM 正成為 HPC 軍備競賽的核心。圖表113:英偉達 GPU 內存帶寬不斷提升 圖表114:AMD Instinct MI300X 資料來源:英偉達,方正證券研究所 資料來源:AMD,方正證券研究所 高性能計算驅動高性能計算驅動
144、 HBMHBM 加速迭代,加速迭代,HBMHBM3 3 升級,升級,HBMHBM3 3E E 已在路上。已在路上。高性能計算驅動數據中心 HBM 需求井噴,HBM 升級速度近年明顯加快。SK 海力士于 2021 年 10 月宣電子 行業專題報告 53 敬 請 關 注 文 后 特 別 聲 明 與 免 責 條 款 s 布成功開發出容量為 16GB 的 HBM3 DRAM,2022 年 6 月初即宣布量產。僅過去 10個月,SK 海力士官網再次宣布已成功開發出垂直堆疊 12 個顆 DRAM 芯片、容量高達 24GB 的 HBM3 新品,并正在接受客戶公司的性能驗證。與此同時,海力士第五代 HBM 內
145、存 HBM3E 已在路上。英偉達于 2023 年 8 月 8 日發布的最新 GH200 預計將搭載 HBM3E 內存,并將于 2024 年 Q2 出貨。根據公開信息披露,該 HBM3E 芯片單 pin 最大帶寬達 8Gb/s,單棧最大帶寬達 1Tb/s,較上一代 HBM3 提升 25%。圖表115:英偉達 GH200 GPU 首發 HBM3E 圖表116:HBM3E 部分參數對比 HBM3E HBM3 HBM2E HBM2 Max Capacity 36GB 24GB 16GB 8GB Max Bandwidth Per Pin 9.2Gb/s 6.4Gb/s 3.6Gb/s 2.0Gb/s
146、Number of DRAM ICs per Stack 12 12 8 8 Effective Bus Width 1024-bit Voltage?1.1V 1.2V 1.2V Bandwidth per Stack 1.18TB/s 819.2GB/s 460.8GB/s 256GB/s 資料來源:英偉達,方正證券研究所 資料來源:半導體行業觀察,方正證券研究所 HBM 通過 TSV 技術垂直堆疊多個 DRAM,與 GPU 通過中介層互聯封裝在一起,已成為數據中心新一代內存解決方案。HBM 制造商主要包括 SK 海力士、三星和美光,XPU 由英偉達、AMD、博通等設計后交由臺積電、三星、
147、英特爾等 Foundry 廠商生產,再通過 2.5D 封裝技術如 CoWoS 進行封裝整合。圖表117:HBM 產業鏈 資料來源:SK Hynix,方正證券研究所 電子 行業專題報告 54 敬 請 關 注 文 后 特 別 聲 明 與 免 責 條 款 s 5.15.1 SKSK 海力士:海力士:攜手臺積電合作開發攜手臺積電合作開發 H HBM4BM4,資本開支回升,資本開支回升 S SK K 海力士海力士 2 23Q43Q4 單季收入同環比改善明顯,單季收入同環比改善明顯,D DRAM/NANDRAM/NAND 產品產品 A ASPSP 環比提升。環比提升。SK 海力士2023Q4實現收入11.
148、3萬億韓元,YoY+47%,QoQ+25%;毛利率20%,QoQ+17pcts;凈利率-12%,QoQ+12pcts。分產品看,DRAM 收入占比 65%,ASP QoQ+18-19%,NAND 收入占比 27%,ASP QoQ+40%。DRAM 方面,公司聚焦擴大銷售 HBM 和高密度DDR5 等高附加值產品以提高盈利能力,NAND 方面,公司減少了低毛利產品的銷售,擴大了移動存儲和 eSSD 產品的銷售。2023 年 DDR5 銷量同比增長了 4 倍以上,HBM3 銷量同比增長了 5 倍以上,受供需情況改善及下游 AI 產品復蘇驅動,23Q4 營收同環比改善。圖表118:海力士營收結構(十
149、億韓元)資料來源:SK Hynix,方正證券研究所 展望展望 2 2024024 年,年,A AI I 應用驅動存儲需求上升,供需格局進一步優化。應用驅動存儲需求上升,供需格局進一步優化。P PC C 端端受換機及Windows 系統升級,疊加 AI PC 后續大規模量產,PC 出貨量有望以中個位數百分比增長,且 AI PC DRAM 容量比普通 PC 高一倍以上,將長期推動 PC 出貨量和容量增長。智能手機方面智能手機方面,隨著搭載 AI 應用的智能手機的普及與消費者購買力的恢復,預計高密度與性能存儲產品需求強勁。服務器方面服務器方面,AI 廠商 Capex 的恢復及推理模型的持續演進,AI
150、 服務器出貨量持續上升,AI 投資 24 年有望復蘇。綜上,SK 海力士預計 2024 年 DRAM/NAND 位同比增長有望達 15%-18%,DRAMDRAM 庫存于庫存于24H124H1 達到正常水平,達到正常水平,NANDNAND 于于 24H224H2 實現實現供需格局優化。圖表119:SK 海力士 DRAM 分應用營收占比 圖表120:SK 海力士 NAND 分應用營收占比 資料來源:SK Hynix,方正證券研究所 資料來源:SK Hynix,方正證券研究所 02000400060008000100001200022Q423Q323Q4DRAMNANDOthers電子 行業專題報
151、告 55 敬 請 關 注 文 后 特 別 聲 明 與 免 責 條 款 s H HBM3EBM3E 已實現量產,資本開支同比回升。已實現量產,資本開支同比回升。海力士預計 2025 年 HBM市場將增長 40%,預計預計 HBMHBM 長期需求增長率超長期需求增長率超 60%60%,立足需求可見性,海力士已量產 2024 年需求有望大幅增長的 HBM3E 產品,預計 2024 年 TSV 同比產能翻倍,同時拓展 AI 服務器模組如 MCR DIMM 產品。2023 年公司資本開支同比下降 50%以上,2024 年資本開支同比回升,重點關注 HBM 等先進工藝的高需求高附加值產品,保障產品擴產及研
152、發動作順利進行,優先考慮擴大先進工藝產品量產及 TSV 與基礎設施建設。S SK K 海力士攜手臺積電,合作開發海力士攜手臺積電,合作開發 H HBM4BM4。SK 海力士制定“一個團隊戰略”,其重要組成部分是與臺積電建立 AI 芯片聯盟,合作開發第六代 HBM 芯片(HBM4),HBM4擬升級到更寬的 2048 位內存接口,以解決 1024 位內存接口“寬但慢”的問題,需要臺積電先進封裝技術驗證HBM4的布局和速度,預計臺積電將負責封裝工藝,以提升產品兼容性。根據目前規劃及進展,海力士將于 2026 年實現 HBM4 量產。同時 SK 海力士計劃在美國印第安納州建立 HBM 內存封裝工廠,屆
153、時有望與臺積電亞利桑那州工廠合作,助力英偉達實現在美國生產 GPU。圖表121:HBM 供應時間線 資料來源:Trendforce,方正證券研究所 5.25.2 三星電子:三星電子:DRAMDRAM 業務轉盈,業務轉盈,TSVTSV 產能加速擴張產能加速擴張 存儲業務復蘇,三星電子存儲業務復蘇,三星電子 2 23Q4 DRAM3Q4 DRAM 業務轉盈。業務轉盈。三星電子 23Q4 合計營收 67.8 萬億韓元,環比增長 0.6%,同比下降 3.8%;營業利潤為 2.8 萬億韓元,同比-34.6%,環比+16.7%。單季度毛利率 32%,同比+1.0pct,環比+1.1pcts;營業利潤率 4
154、.2%,同比-1.9pcts,環比+0.6pct。Q4 存儲業務營收為 15.71 萬億韓元,環比+49%,同比+29%。四季度期間,三星重點擴大 HBM、DDR5、UFS 4.0 等高附加值產品銷售,推動 DRAM 和 NAND 的庫存加速正?;?,DRAM 業務在 23Q4 恢復盈利。高端產品供給有限,客戶端需求持續強勁拉動內存市場進一步復蘇。高端產品供給有限,客戶端需求持續強勁拉動內存市場進一步復蘇。服務器長期以來相對低迷需求已出現復蘇跡象,2023 年因預算緊縮導致的服務器更換推遲需求恢復。AI 驅動,商用 PC 和旗艦智能手機單機價值增長,且產品更換周期臨近,換貨需求促進出貨量上升。產
155、品 ASP 上漲及庫存情況改善下,預計公司 24Q1 內存業務恢復盈利,其中其中 DRAMDRAM 庫存于庫存于 24Q224Q2 回歸正常,回歸正常,NANDNAND 于于 24H124H1 實現正?;瘜崿F正?;?,2024 年內存業務持續復蘇。電子 行業專題報告 56 敬 請 關 注 文 后 特 別 聲 明 與 免 責 條 款 s 擴大擴大 T TSVSV 產量,加速推出產量,加速推出 H HBMBM 產品。產品。三星通過推出業界首個基于 1Bnm 的行業最高容量 32G DDR5,增強公司在高密度 DDR5 市場的領導地位。生成式 AI 的普及拉動市場對先進 HBM 性能和容量需求的不斷增
156、長,公司計劃利用 TSV 產能的競爭力,進一步擴產以鞏固公司 HBM 的競爭力。此外,公司將適時推出新一代 HBM3E,并于 24H2 加速向 3E12i 過渡。5.35.3 美光:美光:HBM3EHBM3E 驗證進入尾聲,有望于驗證進入尾聲,有望于 2 2024024 年初量產年初量產 D DRAM/NANDRAM/NAND 價格走強,價格走強,A AI I 及數據中心業務驅動美光業績增長。及數據中心業務驅動美光業績增長。美光 FY24Q1 收入47.3 億美元,QoQ+18%,YoY+16%;NON-GAAP 毛利率 1%,QoQ+10pcts,YoY-22pcts,業績增長受 DRAM/
157、NAND 價格回升影響,預計伴隨搭載 AI 的智能手機、PC 等產品的大規模生產,終端存儲庫存進一步調整,2024 年 DRAM/NAND 價格將持續走強,供需結構進一步健康化。公司利用業界領先的數據中心解決方案組合來把握人工智能激增帶來的機遇,其中包括 HBM3E、D5、多種類型的高容量服務器內存模塊、LPDRAM 和數據中心 SSD,其中其中 H HBM3EBM3E 目前處于在目前處于在 NVIDIANVIDIA 下一代下一代 Grace Hopper Grace Hopper GH200GH200 和和 H200H200 平臺驗證的最后階段平臺驗證的最后階段,有望在有望在 2024202
158、4 年初量產年初量產,預計 2024 年 Capex位于 75-80 億美金,以支撐 HBM3E 產量提升。圖表122:美光 HBM3E 結構 資料來源:美光官網,方正證券研究所 圖表123:海力士、三星、美光業績情況 CY23Q4 業績 業績展望 SK 海力士 收 入 11.3 萬 億 韓 元,YoY+47%,QoQ+25%;毛利率 20%,QoQ+17pcts;凈利率-12%,QoQ+12pcts,庫存環比改善,ASP 環比增長十位數百分點 預計 24 年 DRAM 和 NAND 同比位增 15%-18%,資本開支同比增長,分終端應用,1)PC:24 年出貨量個位數增長,驅動因素為替換需求
159、及微軟系統升級(AIPC 的內存需求是 PC 的兩倍);2)Mobile:24 年智能手機出貨量增長約 5-8%,AI 手機以及不斷增多的 AI應用案例驅動了長期的替代需求;3)服務器:預計 24 年復蘇 三星電子 收入 67.78 萬億韓元,YoY-3.8%,QoQ+0.6%;毛 利 率 為 32.0%,YoY+1.0pct,QoQ+1.2pcts;營業利潤率為4.2%,YoY-1.9pcts,QoQ+0.6pct 預計 24Q1PC 和移動設備市場將延續 Q4 的復蘇趨勢,服務器市場出現復蘇跡象,高端服務器產品將保持強勁需求;公司將通過32GDDR5、新一代 HBM3E 和 Gen5 SS
160、D 等新產品增強競爭力 美光科技 營收 47 億美元,YoY+16%,QoQ+18%,超指引上限(42-46 億美元);GAAP 毛收入預計 51-55 億美元,中值 53 億美元,YoY+43.5%,QoQ+12.2%;GAAP 毛利率預計 10.5%13.5%,中值 12%,YoY+44.7pcts,電子 行業專題報告 57 敬 請 關 注 文 后 特 別 聲 明 與 免 責 條 款 s 利率-0.7%(指引 為-8%-4%),QoQ+10.1pcts,YoY-22.6pcts QoQ+12.7pcts;預計數據中心客戶的存儲庫存將在 2024 年上半年接近正常;預計預計 20242024
161、 年初開始年初開始 HBM3EHBM3E 量產量產,并在 FY24 產生數億美金 HBM 收入,FY24FY24 資本支出預計在資本支出預計在 7575-8080 億億美金美金 資料來源:各公司業績說明會,方正證券研究所 6 6 SKSK 海力士先進封裝持續發力,助力海力士先進封裝持續發力,助力 HBMHBM 性能領先性能領先 SKSK 海力士海力士引領引領 HBMHBM 市場市場,HBMHBM4 4 將于將于 2 2026026 年問世。年問世。SK 海力士于 2015 年推出首代HBM,對應 2GB 的容量和 1.0Gbps 的帶寬;于 2022 年推出 HBM3,是全球第一家且是唯一一家
162、實現量產的公司,可實現 12 層的堆疊和 5.6Gbps 的帶寬;2024 年預計將量產 HBM3E,容量、帶寬、散熱性能和能耗進一步優化。下一代 HBM4 將搭載混合鍵合技術,并與 Foundry 廠進行合作,預計將于 2026 年問世。圖表124:SK 海力士 HBM 產品時間線 資料來源:SK Hynix,方正證券研究所 HBMHBM 市場格局:三分天下,海力士領先。市場格局:三分天下,海力士領先。從市場格局來看,HBM 的市場份額仍由三大家所主導。根據 TrendForce,2022 年全年 SK 海力士占據了 HBM 全球市場規模的 50%。其次是三星,占 40%,美光占 10%。T
163、rendForce 預測,2023 年海力士和三星的 HBM 份額占比約為 46-49%,而美光的份額將下降至 4%-6%,并在 2024年進一步壓縮至 3%-5%。圖表125:HBM 市場規模變動預估 公司 2022 2023E 2024E SK hynix 50%46%-49%47%-49%Samsung 40%46%-49%47%-49%Micron 10%4%-6%3%-5%資料來源:TrendForce,方正證券研究所 電子 行業專題報告 58 敬 請 關 注 文 后 特 別 聲 明 與 免 責 條 款 s SKSK 海力士深耕先進封裝技術,海力士深耕先進封裝技術,HBMHBM 性能
164、領先。性能領先。SK 海力士 HBM 產品的升級主要體現在:更多層數 DRAM 的堆疊、更高的帶寬以及更好的散熱性能。SK 海力士引領HBM 產品性能不斷升級,HBM3/3E的散熱性能相較于 HBM2 實現了一倍的性能提升,背后是公司精細的 DRAM 層間高度控制、熱性能更好的塑封技術和凸點密度最大化等先進封裝技術的持續迭代。圖表126:SK 海力士 HBM 技術升級 資料來源:SK Hynix,方正證券研究所 取代取代 TCTC-NCFNCF,MRMR-MUFMUF 提高散熱性能。提高散熱性能。傳統的 HBM 芯片堆疊多數通過 TC-NCF(the thermo-compression bo
165、nding with non-conductive film,非導電膜的熱壓縮鍵接)工藝完成,但受限于材料流動性以及 bump 數量限制,存在導熱以及其他工藝缺陷等問題。MR-MUF(Mass reflow bonding with molded underfill,批量回流模制底部填充)是海力士的高端封裝工藝,通過將芯片貼附在電路上,在堆疊時,在芯片和芯片之間使用一種稱為在芯片和芯片之間使用一種稱為液態環氧液態環氧樹脂樹脂塑封(塑封(L Liquid iquid e epoxy poxy M Molding olding C Compoundompound,LMCLMC)的物質填充的物質填充
166、并并粘貼粘貼。對比 NCF,MR-MUF 能有效提高導熱率,并改善工藝速度和良率。圖表127:MR-MUF 處理流程 圖表128:MR-MUF 對比 TC-NCF 連接溫度下降 14 資料來源:A Study on the Advanced Chip to Wafer Stack for Better Thermal Dissipation of High Bandwidth Memory,方正證券研究所 資料來源:A Study on the Advanced Chip to Wafer Stack for Better Thermal Dissipation of High Bandwid
167、th Memory,方正證券研究所 MRMR-MUFMUF 工藝的核心難點工藝的核心難點在于堆疊芯片過程中產生的熱翹曲問題(LMC 與硅片之間的熱收縮差異導致),以及芯片中間部位的空隙難以填充。LMCLMC 是是 SKSK 海力士海力士 HBMHBM電子 行業專題報告 59 敬 請 關 注 文 后 特 別 聲 明 與 免 責 條 款 s 產品的核心材料產品的核心材料,本身具備可中低溫固化、低翹曲、模塑過程無粉塵、低吸水率以及高可靠性等優點,通過大量的材料配方調試及熱力學驗證解決熱收縮差異問題。另一方面,公司通過改變 EMC 與芯片的初始對齊方式以及圖案形狀有效解決了填充存在縫隙的問題。圖表12
168、9:LMC 與晶圓熱收縮差異造成翹曲問題 圖表130:EMC 不同對齊方式的空氣流動 資料來源:A Study on the Advanced Chip to Wafer Stack for Better Thermal Dissipation of High Bandwidth Memory,方正證券研究所 資料來源:A Study on the Advanced Chip to Wafer Stack for Better Thermal Dissipation of High Bandwidth Memory,方正證券研究所 SKSK 海力士海力士亦亦考慮在內存產品考慮在內存產品中采用中
169、采用 FOFO-WLPWLP,2.5D2.5D 扇出方案提供扇出方案提供高高性價比性價比。通過將兩個 DRAM 器件并排放置,該方案不再使用基板和中介層,預計將顯著縮小封裝尺寸和減薄封裝厚度,從而堆疊更多的芯片。FO-WLP 也省略了 TSV 工藝,從而大大降低成本。隨著布線長度的減少,電氣特性同樣得到改善。SK 海力士預計將FOWLP 方案用于圖形或移動應用,與 HBM 方案相比,FO-WLP 的成本優勢更大。圖表131:FOWLP 方案 資料來源:SK Hynix,方正證券研究所 電子 行業專題報告 60 敬 請 關 注 文 后 特 別 聲 明 與 免 責 條 款 s 7 7 H HBM4
170、BM4 或與處理器或與處理器 3 3D D 堆疊,混合鍵合、堆疊,混合鍵合、T TSVSV、散熱需求提升、散熱需求提升 據Joongang.co.kr報道,SK海力士已開始招聘CPU和GPU等邏輯芯片設計人員,或希望將高帶寬內存 HBM4 直接堆疊在處理器上。KAIST 電氣與電子系教授 Kim Jung-ho 表示這種存儲器與處理器的直接堆疊會對散熱帶來挑戰,如果散熱問題能夠比目前晚兩到三代得到解決,HBM 和 GPU 將能夠在沒有中介層的情況下進行堆疊。我們認為。從結構上看這一方案的核心變化在于去掉目前 CoWoS-S 結構中的硅 interposer(中介層),由目前的 GPU/CPU/
171、ASIC 處理器與 HBM 在 xy 軸放置的這種 2.5D 結構,向二者在 z 軸直接堆疊的 3D 結構升級。圖表132:HBM4 結構示意圖 資料來源:Techspace,方正證券研究所 從增量環節來看,我們認為:1 1)混合鍵合混合鍵合 hybridhybrid-bondingbonding 設備用量提升:設備用量提升:先進封裝升級的一項核心指標就是凸顯尺寸/間距的不斷縮小,目前的倒裝技術回流焊技術最小可實現 40-50um 左右的凸點間距,當凸點間距進一步縮小到 20um 時,目前部分龍頭廠商采用 TCB 熱壓鍵合設備解決應力與熱循環方面的問題,當凸點間距達到 10um 甚至無凸點(b
172、umpless)的情況下,則需要用到混合鍵合設備。2 2)TSVTSV 工藝難度和工序提升:工藝難度和工序提升:硅通孔技術(TSV)是通過在芯片和芯片之間、晶圓和晶圓之間制作垂直導通,實現芯片之間互連的技術,通過垂直互聯減小互聯長度、信號延遲,降低電容、電感,實現芯片間的低功耗、高速通訊。在集成度提升的過程中,TSV 的密度、孔徑的深寬比會進一步提高,從而帶來 TSV 制造工藝難度和工序數的提升。電鍍填孔環節是 TSV 制造中難度較大的環節,TSV 填充效果直接關系到后續器件的電學性能和可靠性,因此我們認為對相關的電鍍設備、電鍍液材料都會帶來更多的挑戰和機遇。3 3)散熱需求提升:)散熱需求提
173、升:高性能算力芯片、高帶寬內存的堆疊可能需要更復雜的方式解決散熱問題,由于新技術、新產品目前還沒有明確方案細則,但是從邏輯上推演電子 行業專題報告 61 敬 請 關 注 文 后 特 別 聲 明 與 免 責 條 款 s 我們認為芯片層間材料 EMC(特種環氧樹脂),以及芯片間(液冷/浸潤)整體電源管理方案(PMIC)具有潛在升級空間。綜上,我們看到未來隨著封裝集成度進一步提升,HPC 領域算力芯片由當前主流的 2.5D 封裝形式向 3D 升級是目前臺積電、SK 海力士、三星等龍頭半導體廠商積極布局的方向。在節省中介層成本的情況下,對混合鍵合、TSV、散熱等環節帶來更高要求,從而有望驅動相關環節供
174、應鏈升級?;旌湘I合成為趨勢,可實現混合鍵合成為趨勢,可實現 1 10 0umum 以內的凸點間距。以內的凸點間距。隨著芯片制造節點不斷縮小,封裝尺寸和凸點間距也需要相應縮小。目前主流倒裝技術為回流焊,最小可實現40-50um 左右的凸點間距,若進一步縮小凸點間距會帶來翹曲和精度問題,回流焊不再適用,而是轉用熱壓鍵合(TCB)的方式。當凸點間距縮小至 10um 時,TCB工藝中會產生金屬間化合物,導致導電性能下滑。為了在高集成度(凸點間距 10um以內)的芯片封裝中解決這些問題,混合鍵合技術正在得到越來越多的青睞。圖表133:不同凸點間距(Bump Pitch)對應的技術(單位:um)資料來源:
175、Semi engineering,IDTechEx,方正證券研究所整理 混合鍵合是一種永久鍵合工藝,其將介電鍵合(SiOx)與嵌入式金屬(Cu)結合起來形成互連,在業界被稱為直接鍵合互連(DBI)?;旌湘I合通過鍵合界面中的嵌入式金屬焊盤擴展了熔合鍵合,從而允許晶圓面對面連接?;旌湘I合可分為芯片到晶圓(Die to Wafer,D2W)以及晶圓到晶圓(Wafer to Wafer,W2W)的鍵合。目前來看 W2W 量產進度更快(良率更高),但上下晶圓尺寸和節點要求一致,適用于高產量的小芯片。而 D2W 更為靈活,在芯片尺寸較大時反而具有成本效益。圖表134:混合鍵合進展 資料來源:EVG,方正證
176、券研究所整理 電子 行業專題報告 62 敬 請 關 注 文 后 特 別 聲 明 與 免 責 條 款 s 混合鍵合工藝流程可分為焊盤形成、鍵合和鍵合后工藝三個部分?;旌湘I合工藝流程可分為焊盤形成、鍵合和鍵合后工藝三個部分。鍵合后工藝包括減薄、劃片、塑封等,與其他封裝的工藝較為類似。而焊盤形成相關工藝則與前道工藝較為類似,設備供應商主要為應用材料、北方華創等平臺型公司。鍵合過程相較于倒裝等技術對精度的要求更高,除了 BESI、ASMPT、Shibaura 等后道設備供應商以外,TEL、EVG 等公司也有相關設備可以提供。圖表135:混合鍵合工藝流程及對應供應商 資料來源:AMAT,方正證券研究所整
177、理 混合鍵合推動鍵合步驟和設備單價增加混合鍵合推動鍵合步驟和設備單價增加。以 AMD 的 EPYC 為例,從 2017 年的第一代霄龍處理器到 2023 年最新發布的第四代產品,生產過程中所需鍵合步驟從 4次提升到了超 50 次。鍵合技術從倒裝迭代至混合鍵合+倒裝,對鍵合設備也提出了更高的要求,Besi 相應開發了 8800 Ultra 以提供混合鍵合的鍵合功能,相比原來的倒裝鍵合機單價提升了 3-5 倍。圖表136:混合鍵合推動鍵合步驟和設備單價增加(單位:萬美元)2017 2019 2023 AMD 產品 第一代 GEN EPYC 第二代 GEN EPYC 第四代 GEN EPYC 所需固
178、晶步驟 4 9 50 固晶技術 倒裝 倒裝 混合鍵合+倒裝 Besi 設備型號 8800 FC Quantum 8800 Ultra 設備單價 50 150-250 UPH 9000 1500-2000 資料來源:Besi 官網,方正證券研究所 封裝形式演變封裝形式演變下,鍵合機需要更高的精度和更精細的能量控制下,鍵合機需要更高的精度和更精細的能量控制。封裝技術經歷了引線框架到倒裝(FC)、熱壓粘合(TCB)、扇出封裝(Fan-out)、混合封裝(Hybrid Bonding)的演變,以集成更多的 I/O,實現更薄厚度,從而承載更多復雜的芯片功能和適應更輕薄的移動設備。在最新的混合鍵合技術下,
179、鍵合密度從 5-10/mm2電子 行業專題報告 63 敬 請 關 注 文 后 特 別 聲 明 與 免 責 條 款 s 提升到 10k+/mm2,精度從 20-10um 提升至 0.5-0.1um,與此同時,能量/Bit 則進一步縮小至 0.05pJ/Bit,鍵合設備的控制精度和工作效率都需達到新高度。圖表137:封裝形式升級對鍵合機要求提高 引線鍵合引線鍵合 (19751975)倒裝封裝倒裝封裝(19951995)熱壓粘合熱壓粘合 (20122012)扇出封裝扇出封裝 (20152015)混合混合鍵合鍵合 (20182018)封裝形式 連接類型 引線 錫球/銅柱 銅柱 RDL/銅柱 銅-銅 連
180、接密度 5-10/mm2 25-400/mm2 156-625/mm2 500+/mm2 10k+/mm2 基板 有機物/引線 有機物/引線 有機物/硅 無 無 精度(um)20-10 10-5 5-1 5-1 0.5-0.1 能量/Bit(pJ/Bit)10 0.5 0.1 0.5 0.05 資料來源:Besi,方正證券研究所 混合鍵合拉動鍵合設備需求,存儲應用爆發值得期待混合鍵合拉動鍵合設備需求,存儲應用爆發值得期待。根據華卓精科招股書,1萬片晶圓/月的產能需要配置 4-5 臺晶圓級鍵合設備。Besi 預計 2024 年混合鍵合系統累計需求達 100 套,預計 2025 年后隨著混合鍵合技
181、術在存儲中的應用,2026 年累計需求將超 200 套(保守口徑)。圖表138:混合鍵合系統累計需求(2023 年 6 月預測)資料來源:Besi,方正證券研究所 電子 行業專題報告 64 敬 請 關 注 文 后 特 別 聲 明 與 免 責 條 款 s 8 8 投資建議投資建議 建議關注:算力芯片:英偉達、AMD、英特爾、谷歌、博通、景嘉微、寒武紀-U、海光信息、弘信電子(燧原科技)HBM:SK 海力士、三星、美光 服務器:超微電腦、工業富聯、浪潮信息、中科曙光、聯想集團 交換機:CISCO、ARISTA、Juniper、中興通訊、新華三、銳捷網絡、菲菱科思、盛科通信 PCB:ttmi、金像電
182、、滬電股份、勝宏科技、生益科技、南亞新材、光模塊:Coherent、Lumentum、中際旭創、新易盛、天孚通信、華工科技 交換芯片及光芯片:博通、Coherent、Lumentum、長光華芯、源杰科技、光迅科技、盛科通信 封測廠:日月光、安靠、長電科技、通富微電、甬矽電子、華天科技 封測設備:Besi、Shibaura、EBARA、DISCO、SUSS、新益昌、長川科技、中科飛測、芯碁微裝 封測材料:IBIDEN、欣興、SHINKO、陶氏、安美特、JSR、旭化成、法液空、Namics、興森科技、雅克科技、天承科技、艾森股份、華海誠科、德邦科技 9 9 風險提示風險提示 AI 進展不及預期:如
183、果未來 AI 應用產業化不及預期,則會對相關公司需求產生一定不利影響。研發進度不及預期:AI 芯片研發難度高,同時下游需求迭代快速,對芯片性能持續提出較高要求,如果相關公司無法持續跟進研發最新產品,存在市場份額丟失風險。海外貿易摩擦影響:受地緣政治影響,如果未來海外持續加大對國內半導體核心制造環節的制裁,則可能會對國內相關公司產業生產銷售產生不利影響。電子 行業專題報告 65 敬 請 關 注 文 后 特 別 聲 明 與 免 責 條 款s分析師聲明分析師聲明 作者具有中國證券業協會授予的證券投資咨詢執業資格,保證報告所采用的數據和信息均來自公開合規渠道,分析邏輯基于作者的職業理解,本報告清晰準確
184、地反映了作者的研究觀點,力求獨立、客觀和公正,結論不受任何第三方的授意或影響。研究報告對所涉及的證券或發行人的評價是分析師本人通過財務分析預測、數量化方法、或行業比較分析所得出的結論,但使用以上信息和分析方法存在局限性。特此聲明。免責聲明免責聲明 本研究報告由方正證券制作及在中國(香港和澳門特別行政區、臺灣省除外)發布。根據證券期貨投資者適當性管理辦法,本報告內容僅供我公司適當性評級為 C3 及以上等級的投資者使用,本公司不會因接收人收到本報告而視其為本公司的當然客戶。若您并非前述等級的投資者,為保證服務質量、控制風險,請勿訂閱本報告中的信息,本資料難以設置訪問權限,若給您造成不便,敬請諒解。
185、在任何情況下,本報告的內容不構成對任何人的投資建議,也沒有考慮到個別客戶特殊的投資目標、財務狀況或需求,方正證券不對任何人因使用本報告所載任何內容所引致的任何損失負任何責任,投資者需自行承擔風險。本報告版權僅為方正證券所有,本公司對本報告保留一切法律權利。未經本公司事先書面授權,任何機構或個人不得以任何形式復制、轉發或公開傳播本報告的全部或部分內容,不得將報告內容作為訴訟、仲裁、傳媒所引用之證明或依據,不得用于營利或用于未經允許的其它用途。如需引用、刊發或轉載本報告,需注明出處且不得進行任何有悖原意的引用、刪節和修改。評級評級說明:說明:類別類別 評級評級 說明說明 公司評級 強烈推薦 分析師
186、預測未來12個月內相對同期基準指數有20%以上的漲幅。推薦 分析師預測未來12個月內相對同期基準指數有10%以上的漲幅。中性 分析師預測未來12個月內相對同期基準指數在-10%和10%之間波動。減持 分析師預測未來12個月內相對同期基準指數有10%以上的跌幅。行業評級 推薦 分析師預測未來12個月內行業表現強于同期基準指數。中性 分析師預測未來12個月內行業表現與同期基準指數持平。減持 分析師預測未來12個月內行業表現弱于同期基準指數?;鶞手笖嫡f明 A股市場以滬深300 指數為基準;香港市場以恒生指數為基準,美股市場以標普500指數為基準。方正證券研究所聯系方式:方正證券研究所聯系方式:北京:西城區展覽館路 48 號新聯寫字樓 6 層 上海:靜安區延平路71號延平大廈2樓 深圳:福田區竹子林紫竹七道光大銀行大廈31層 廣州:天河區興盛路12號樓雋峰苑2期3層方正證券 長沙:天心區湘江中路二段36號華遠國際中心37層 E-mail: