電子行業深度報告:端側AI模型創新快速迭代看好蘋果引領AI硬件起飛-250223(21頁).pdf

編號:615266 PDF  DOCX 21頁 2.92MB 下載積分:VIP專享
下載報告請您先登錄!

電子行業深度報告:端側AI模型創新快速迭代看好蘋果引領AI硬件起飛-250223(21頁).pdf

1、證券研究報告行業深度報告電子 東吳證券研究所東吳證券研究所 1/21 請務必閱讀正文之后的免責聲明部分請務必閱讀正文之后的免責聲明部分 電子行業深度報告 端側端側 AI:模型創新快速迭代,看好蘋果引:模型創新快速迭代,看好蘋果引領領 AI 硬件起飛硬件起飛 2025 年年 02 月月 23 日日 證券分析師證券分析師 陳海進陳海進 執業證書:S0600525020001 證券分析師證券分析師 陳妙楊陳妙楊 執業證書:S0600525020002 行業走勢行業走勢 相關研究相關研究 信通院規范行業標準,AI 眼鏡落地拐點年 2025-02-20 為什么人形機器人的終局是消費電子?2025-02-

2、20 增持(維持)Table_Summary 投資要點投資要點 端側端側 AI 革新人機交互,革新人機交互,模型快速升級模型快速升級,巨頭引領行業發展巨頭引領行業發展:AI 自主化能力沿著“以指令為中心“到“以意圖為中心”持續提升。LLM 從各個層面改造終端,其中 Agent 對開放式問題必不可少,背后是大模型帶來的理解復雜輸入、進行規劃推理/合理使用工具的能力。據頭豹,端側 AI 市場規模 2023-2028 年預計 CAGR 高達 58%,2028 年超過 1.9 萬億元。從具體小模型性能表現上看,參數量對模型性能影響巨大,但受限于硬件,小模型的技術創新更加積極以提升有限參數量下的性能表現

3、,其中量化/剪枝/蒸餾是最主要的模型壓縮方式,各家小模型因數據集/壓縮精度/量化混合方式等差異預計帶來小模型的百花齊放。Agent 架構中,基礎模型本身要引入新的輸入類型,成為 VLA 模型,同時還增加了個性化和內存操作要求,均需要額外的優化。硬件變革核心在內存,蘋果發力內存創新應對內存瓶頸硬件變革核心在內存,蘋果發力內存創新應對內存瓶頸:相比于云端模型,硬件是端側模型的重要制約,需要升級以補齊短板。對比各家硬件,我們認為蘋果在內存/電池/散熱上提升空間巨大。我們認為內存及其操作帶來的能耗是當前最短板,預計成為硬件核心變革方向,如半精度的 7B 模型僅參數加載占用 DRAM 就超過 14GB,

4、同時 DRAM耗能比 SRAM 和計算高出兩個數量級。同時 iOS 和安卓內存利用效率差異巨大,我們認為安卓需要在 OS 層提供統一的 AI 基礎模型,而iOS 在模型壓縮之外則需要提高硬件內存以克服硬件瓶頸。除了簡單的增加內存容量外,蘋果在內存結構、耗能、傳輸速度等方面創新密集,如與三星合作開發獨立封裝形式,以及推進全新的 WMCM 封裝方式進一步提高芯片組合的靈活性和集成度。多模態多模態 UI 交互界面革命帶來交互界面革命帶來 Agent 的歷史機遇的歷史機遇:根據交互的模式,任務執行方法可分為基于 API 和基于用戶界面(UI)的方法。API 交互泛用性較弱。UI 界面方式在 Trans

5、former 架構下較好克服了任務和 UI元素之間的隱含關系,大幅提升了 GUI Agent 的可行性,有望成為主流。當前蘋果和谷歌均發力 UI 交互模型,蘋果的 Ferret-UI 和谷歌的Screen AI 模型都采用讀屏 AI視覺語言模型,采用統一編碼方式理解屏幕信息。從谷歌 UI 模型看,模型參數提升對性能影響較大,同時 5B模型對性能提升尚未飽和,有必要繼續提升模型性能。風險提示:風險提示:底層創新不及預期,技術發展不及預期,競爭加劇風險 表 1:重點公司估值(2025/2/21)代碼代碼 公司公司 總市值總市值(億元)(億元)收盤價收盤價(元)(元)EPS PE 投資評級投資評級

6、2023A 2024E 2025E 2023A 2024E 2025E 002475 立訊精密 3,255.57 44.98 1.51 1.89 2.36 29.72 23.80 19.06 買入 300433 藍思科技 1,443.04 28.96 0.61 0.83 1.10 47.76 34.89 26.33 買入 002938 鵬鼎控股 990.49 42.72 1.42 1.53 1.77 30.13 27.92 24.14 買入 002600 領益智造 748.47 10.68 0.29 0.28 0.40 36.49 38.14 26.70 買入 002384 東山精密 563.

7、98 33.06 1.15 1.01 1.58 28.71 32.73 20.92 買入 數據來源:Wind,東吳證券研究所 注:以上公司預測值來源于東吳證券研究所-9%-2%5%12%19%26%33%40%47%54%2024/2/232024/6/232024/10/222025/2/20電子滬深300 請務必閱讀正文之后的免責聲明部分請務必閱讀正文之后的免責聲明部分 行業深度報告 東吳證券研究所東吳證券研究所 2/21 內容目錄內容目錄 1.AI 技術在端側逐漸深化,引領全新人機協作方式技術在端側逐漸深化,引領全新人機協作方式.4 1.1.AI自主化能力逐漸提高,與系統融合程度提升.4

8、 1.2.基于用戶場景的端云混合架構.4 1.3.LLM從各個層面改造終端.5 1.4.消費級終端帶動端側 AI高速發展.6 2.端側模型逐步迭代,巨頭引領行業發展端側模型逐步迭代,巨頭引領行業發展.8 2.1.基礎的小模型迭代加速,技術創新大于參數量提升.8 2.2.端側模型需要進一步提升參數量以提高性能.9 2.3.量化/剪枝/蒸餾技術壓縮模型以降低硬件要求.9 2.4.Agent 架構差異帶來數據困境,Transformer是轉折點.10 3.硬件升級滿足高性能需求,適配核心在內存硬件升級滿足高性能需求,適配核心在內存.13 3.1.內存是端側硬件 AI推理能力的短板.13 3.2.安卓

9、和 iOS 內存利用效率差異大.14 3.3.蘋果硬件積極應變,創新方案集中內存方向.14 4.多模態多模態 UI 交互界面革命帶來交互界面革命帶來 Agent 的歷史機遇的歷史機遇.16 4.1.Transformer架構帶來 UI交互的機遇.16 4.2.蘋果和谷歌均發力 UI交互模型.17 5.風險提示風險提示.20 請務必閱讀正文之后的免責聲明部分請務必閱讀正文之后的免責聲明部分 行業深度報告 東吳證券研究所東吳證券研究所 3/21 圖表目錄圖表目錄 圖 1:AI智能化分級.4 圖 2:AI OS 架構.4 圖 3:終端 AI能力主線增強但當前依然不足.4 圖 4:端側和云端 AI處理

10、的分工示意.4 圖 5:蘋果的 AI生態架構.5 圖 6:增強型 LLM 架構.6 圖 7:提示鏈工作流.6 圖 8:AI Agent 架構圖.6 圖 9:存量消費終端設備結構(%,2023 年).7 圖 10:中國端側 AI行業市場規模,2018-2028E(億元).7 圖 11:小型模型比較.8 圖 12:各小型模型 MMLU基準測試得分.8 圖 13:Gemini Nano 與 Pro性能比較.9 圖 14:小型化技術-剪枝原理示意圖.10 圖 15:小型化技術-蒸餾原理示意圖.10 圖 16:量化與精度恢復對模型性能的影響(以未量化的模型表現為 1).10 圖 17:多模態大模型架構.

11、10 圖 18:Agent Transformer架構.10 圖 19:AI終端關鍵技術特征.11 圖 20:端側 Agent 的組成部分.11 圖 21:AI Agent 底層能力和高級能力之間的映射關系.11 圖 22:提升 Agent 效率的技術及其簡要說明.12 圖 23:常見移動設備中的內存層級結構.13 圖 24:計算和存儲操作的能耗.13 圖 25:主流手機 SoC對比.13 圖 26:安卓和 iOS 運行 App時內存占用對比.14 圖 27:安卓和 iOS 運行游戲時內存占用對比.14 圖 28:PoP 封裝的形式.15 圖 29:蘋果芯片封裝形式改變.15 圖 30:Age

12、nt 任務執行過程(以 GUI界面為例).16 圖 31:智能體和 API之間的調用方式示例(Extension 方式).16 圖 32:UI界面復雜,元素識別困難.17 圖 33:Ferret-UI-Anyres 架構.17 圖 34:Ferret-UI-anyres 準確率表現優異.18 圖 35:谷歌 Screen AI模型架構.18 圖 36:Screen AI模型的屏幕理解/問答/導航/摘要四類任務示例.19 圖 37:谷歌不同參數 Screen AI模型參數量及其分配細節.19 圖 38:不同參數的 Screen UI模型的表現.19 請務必閱讀正文之后的免責聲明部分請務必閱讀正文

13、之后的免責聲明部分 行業深度報告 東吳證券研究所東吳證券研究所 4/21 1.AI 技術在端側逐漸深化,引領全新人機協作方式技術在端側逐漸深化,引領全新人機協作方式 1.1.AI 自主化自主化能力能力逐漸提高逐漸提高,與系統融合,與系統融合程度提升程度提升 從指令到意圖從指令到意圖驅動驅動,AI 自動化能力自動化能力持續提升持續提升。根據自動化程度,可將個人智能助理(intelligent personal assistants,IPAs)分為 5 個級別。AI 自主化能力沿著“以指令為中心“到”以意圖為中心“持續提升,用戶只需要表達出需求,實現需求的過程將交由系統完成。從 L1-L3 級的智

14、能體都在用戶指令的被動驅動下工作,而 L4 級以上智能體能夠理解用戶的歷史數據,感知當前狀況,并在適當的時候主動提供個性化服務。大模型和智能體驅動下一代終端操作系統。大模型和智能體驅動下一代終端操作系統。當前的操作系統依然是建立在靜態規則和預定義的邏輯流程上,未來真正理解用、為用戶量身定制的原生智能 OS 將進一步拓展終端 OS 的內涵。從 AI技術在終端產品的落地上,一般經歷:單點特定的 AI增強實現應用層集成應用層集成 AIOS 智能化改造實現系統層融合系統層融合 AI(原子化控件化的(原子化控件化的 AI 能力)能力)以 AI為中心的全新 OS并且系統級 AI Agent出現。圖圖1:A

15、I 智能化分級智能化分級 圖圖2:AI OS 架構架構 數據來源:華為 AI 終端白皮書,東吳證券研究所 數據來源:華為 AI 終端白皮書,東吳證券研究所 1.2.基于用戶場景的基于用戶場景的端云混合架構端云混合架構 當前端側當前端側模型性能和云端大模型依然有較大差距,因此基于用戶場景的端云協同模型性能和云端大模型依然有較大差距,因此基于用戶場景的端云協同AI 將構筑全局化智能。將構筑全局化智能。根據具體的場景(用戶意圖、網絡情況、敏感隱私)以及所需的性能選擇端側或者云端執行,端側適合無網、隱私要求高、響應要求高的場景。圖圖3:終端終端 AI 能力主線增強但當前依然不足能力主線增強但當前依然不

16、足 圖圖4:端側和云端端側和云端 AI 處理的分工示意處理的分工示意 數據來源:高通,東吳證券研究所 數據來源:Oppo,東吳證券研究所 請務必閱讀正文之后的免責聲明部分請務必閱讀正文之后的免責聲明部分 行業深度報告 東吳證券研究所東吳證券研究所 5/21 蘋果通過蘋果通過小型本地模型小型本地模型+私有云模型私有云模型+第三方大模型三層架構第三方大模型三層架構實現系統級實現系統級 AI。蘋果在設備端部署一個參數量為 30 億的語言模型和一個圖像模型。同時具備一個編排層(Orchestration)協調多個模型,根據用戶請求調用對應能力的模型。無論是端側還是私有云模型都基于 Apple 芯片底座

17、以提供計算和安全支持,應用層都以 Siri、Writing Tools 等形式以實現用戶體驗的一致性。同時在外部第三方大模型上合作 ChatGPT 以響應更加開放和復雜的需求。圖圖5:蘋果蘋果的的 AI 生態架構生態架構 數據來源:蘋果,東吳證券研究所 1.3.LLM 從各個層面從各個層面改造終端改造終端 大模型在各個層面改造大模型在各個層面改造終端交互體驗,預計分為三種形式終端交互體驗,預計分為三種形式。最開始增強型 LLM 架構,可以增加單點的功能體驗,比如在翻譯/圖片處理/語音轉換中使用 AI;階段二主要以工作流形式,比如生成營銷文案并翻譯等;最后階段是針對開放問題的 Agent 形態。

18、這三種形態出現形式有先后,但是最終預計并存以針對不同特性的場景。最基礎的構建塊(增強型 LLM)工作流自主的 Agent,復雜性持續提升。同時雖然非 Agent 在自動化水平上提升有限,但是由于調用的是由于調用的是 LLM,在智能化水平、,在智能化水平、可處理任務等方面也有巨大的提升??商幚砣蝿盏确矫嬉灿芯薮蟮奶嵘?。請務必閱讀正文之后的免責聲明部分請務必閱讀正文之后的免責聲明部分 行業深度報告 東吳證券研究所東吳證券研究所 6/21 圖圖6:增增強型強型 LLM 架構架構 圖圖7:提示鏈提示鏈工作流工作流 數據來源:Building effective agents,東吳證券研究所 數據來源B

19、uilding effective agents,東吳證券研究所 注:工作流包括提示鏈/路由/并行化/工作程序/評估器等,此次僅以提示鏈舉例 對于開放式問題對于開放式問題 Agent 必不可少,要具備必不可少,要具備理解復雜的輸入、進行推理和規劃、可理解復雜的輸入、進行推理和規劃、可靠地使用工具靠地使用工具的能力的能力。Agent 可用于開放式問題,這些問題難以預測所需的步驟,無法硬編碼固定路徑。Agent 需要獨立規劃和操作,并可能返回用戶那里獲取更多信息或判斷。在執行工作中,Agent在每一步從環境中獲取“真實情況”,以評估進展,在遇到響應節點或者障礙的時候暫停以獲取人類反饋。人類只需要提

20、出需求人類只需要提出需求+監管成果,監管成果,AI 將將進行任務的分解、選擇工具、監控進度進行任務的分解、選擇工具、監控進度。圖圖8:AI Agent 架構圖架構圖 數據來源:谷歌Agent,東吳證券研究所 1.4.消費級終端帶動端側消費級終端帶動端側 AI 高速發展高速發展 AI 可以改造多種終端,可以改造多種終端,端側端側 AI 市場規模市場規模 2023-2028 年預計年預計 CAGR 高達高達 58%,2028 年超過年超過 1.9 萬億萬億。2023 年全球存量消費終端設備達 228 億臺,其中智能手機占29.8%、智能家居設備(不含 TV)占 26.3%,PC 和 PAD 占 1

21、7.6%。2023 年以前端側AI 技術已經在智能安防和車載設備兩個重要領域應用,快速發展但規模不大。從 2023年開始,隨著億級出貨量的 PC 和手機開始 AI 化,兩者龐大的市場將在未來支撐端側AI 行業迅速發展,2023 年中國端側 AI市場規模不到 2000億,預計 2028 年超過 1.9萬億,2023-2028年 CAGR為 58%。請務必閱讀正文之后的免責聲明部分請務必閱讀正文之后的免責聲明部分 行業深度報告 東吳證券研究所東吳證券研究所 7/21 圖圖9:存量消費終端設備結構(存量消費終端設備結構(%,2023 年年)圖圖10:中國端側中國端側 AI 行業市場規模,行業市場規模

22、,2018-2028E(億(億元)元)數據來源:華為AI 終端白皮書,東吳證券研究所 數據來源:頭豹,東吳證券研究所 29.80%26.30%17.60%13.10%8.80%4.40%智能手機智能家居設備PC+Pad智能電視智能耳機其它41274526 7299601939500186611266415395190710500010000150002000025000 請務必閱讀正文之后的免責聲明部分請務必閱讀正文之后的免責聲明部分 行業深度報告 東吳證券研究所東吳證券研究所 8/21 2.端側模型端側模型逐步迭代,巨頭引領行業發展逐步迭代,巨頭引領行業發展 2.1.基礎的小模型迭代基礎的小

23、模型迭代加速,技術創新大于加速,技術創新大于參數量提升參數量提升 通過通過技術進步,相同規模模型技術進步,相同規模模型性能性能持續提升持續提升。Gemma2 是谷歌 24 年 6 月發布的模型,通過架構和技術的改進提升了在規模相當的情況下的性能。如 Gemma2 和Gemma1 分別為 2T 和 3T tokens 上訓練,但是各類測試機的表現都大幅提升,包括評估語言理解能力的 MMLU 提升約 10pct,評估數學能力的 GSM8K 表現提升 9pct 等。同時橫向比較看,Gemma-2 2B 到 Gemma-2 9B 的表現提升遠高于 9B到 27B的提升。若選用 MMLU 數據集進行端側

24、模型的比較,首先我們認為隨著新技術的出現模型性能會快速提升,如 Gemma1 和 Gemma2。其次整體的模型性能和模型參數呈現明顯的正向關系。另外數據集的差異、蒸餾技術的使用等會帶來相同模型巨大的性能差異,如均為蘋果發布的 3B 模型,開源的 OpenELM-3B 性能遠低于 AFM-on-device。時間相近的各家發布的相同參數的模型性能基本處在同一檔次。圖圖11:小型模型小型模型比較比較 數據來源:谷歌,東吳證券研究所 圖圖12:各小型模型各小型模型 MMLU 基準測試得分基準測試得分 請務必閱讀正文之后的免責聲明部分請務必閱讀正文之后的免責聲明部分 行業深度報告 東吳證券研究所東吳證

25、券研究所 9/21 數據來源:谷歌、蘋果、微軟等,東吳證券研究所 2.2.端側模型需要進一步提升參數量以提高性能端側模型需要進一步提升參數量以提高性能 端側模型需要提高參數量端側模型需要提高參數量以提高各類任務能力。以提高各類任務能力。Gemini Nano 是谷歌 Gemini 系列中專用于設備端部署的小模型,其中 Nano 1 和 2 的參數量分別為 1.8B 和 3.25B,針對低/高內存設備。從對應的測試集看,1)參數對模型表現影響巨大,1.8B 參數的 Nano 1 全面弱于 Nano 2。2)縮減參數后模型在回答真實性方面依然保持相當的準確率,但是在推理/編碼/數學方面準確率較低,

26、相比 Gemini Pro 準確率大幅下降。圖圖13:Gemini Nano 與與 Pro 性能比較性能比較 數據來源:谷歌,東吳證券研究所 2.3.量化量化/剪枝剪枝/蒸餾蒸餾技術壓縮模型以降低硬件要求技術壓縮模型以降低硬件要求 量化量化/剪枝剪枝/蒸餾是主要的模型壓縮方式。蒸餾是主要的模型壓縮方式。為在有限的硬件資源上部署更多參數的模型(或在模型保持基本性能的情況下降低對硬件的需求),需要對模型進行壓縮。其中量化/剪枝/蒸餾是主要方法。量化量化:用低精度數值表示參數,可以減少模型的內存占用和計算開銷,比如從 32bits 轉化為 8bits,內存開銷為原來的 1/4,計算成本僅為原來的1/

27、16。剪枝剪枝:刪除不必要的神經元/權重參數/節點等。如下圖所示,修剪前需求執行 32次乘法累加和 32 個參數(權重)存儲在內存中,修剪后只需要 24 次乘法累加和 24 個參數,計算復雜性和內存都降低了 25%。蒸餾蒸餾:將大模型作為教師模型,用其輸出訓練一個性能接近但更輕量化的學生模型。如 Gemma 的 2B 和 9B 模型由 27B 的模型蒸25.6524.842.352.261.462.566.671.384.877.981.80102030405060708090 請務必閱讀正文之后的免責聲明部分請務必閱讀正文之后的免責聲明部分 行業深度報告 東吳證券研究所東吳證券研究所 10/

28、21 餾而來,蘋果 3B的 AFM-on-device也是由剪枝后的 6.4B 模型蒸餾而來。圖圖14:小型化技術小型化技術-剪枝原理示意圖剪枝原理示意圖 圖圖15:小型化技術小型化技術-蒸餾原理示意圖蒸餾原理示意圖 數據來源:NVIDIA,東吳證券研究所 數據來源:Knowledge Distillation:A Survey,東吳證券研究所 參數量參數量-性能性能的取舍帶來更多樣的創新方向的取舍帶來更多樣的創新方向以提升效率以提升效率。多重制約帶來各類方法百花齊放,如高質量的數據集,高效的訓練方式、先進的壓縮方法等創新方向。如蘋果使用混合精度量化實現 3.7bits 的量化水平后,針對量化

29、后的質量損失,蘋果加入準確率恢復適配器實現了近乎無損的量化壓縮。圖圖16:量化與精度恢復對模型性能的影響(以未量化的模型表現為量化與精度恢復對模型性能的影響(以未量化的模型表現為 1)數據來源:蘋果,東吳證券研究所 2.4.Agent 架構差異帶來數據困境,架構差異帶來數據困境,Transformer 是轉折點是轉折點 基礎模型本身:基礎模型本身:端側是端側是訓練訓練環節環節采用新的采用新的 Agent Transformer 架構,需要引入新的架構,需要引入新的輸入類型,成輸入類型,成為為 VLA 模型模型。視覺語言模型(VLMs)和大語言模型(LLMs)在任務規劃(做什么)方面展現出了頗具

30、潛力的能力。但是 Agent 的每項任務都需要底層控制策略(怎么做),才能在與環境的交互中取得成功,因此需要引入第三種通用數據類型Agent tokens。即 Agent 模型是一個 VLA 模型(Vision-Language-Action Model,即視覺-語言-動作模型),是一個融合了視覺、語言和動作的多模態大模型范式。圖圖17:多模態大模型架構多模態大模型架構 圖圖18:Agent Transformer 架構架構 請務必閱讀正文之后的免責聲明部分請務必閱讀正文之后的免責聲明部分 行業深度報告 東吳證券研究所東吳證券研究所 11/21 數據來源:AGENT AI,東吳證券研究所 數據

31、來源:AGENT AI,東吳證券研究所 Transformer 帶來狀態帶來狀態-動作交互策略學習機遇,有望大幅提升泛化能力動作交互策略學習機遇,有望大幅提升泛化能力。由于互聯網的數據以靜態數據組成,無法捕捉人類決策和環境交互作用,因此 Agent tokens非常不足。動作數據收集成本過高,傳統的訓練模式下存在泛化能力弱,自我容錯率低,成本過高的問題。但是由于大模型具備模糊匹配能力,在預訓練過程中,通過模糊匹配而非精準映射,學習策略進而提高泛化能力。同時我們更看好消費電子同時我們更看好消費電子 GUI 成為最成為最先落地的產品形態。先落地的產品形態?;A模型之外:基礎模型之外:Agent 還

32、增加了還增加了個性化和內存操作要求個性化和內存操作要求,需要基礎大模型基礎上,需要基礎大模型基礎上,個人個人 LLM 大模型大模型還還需要具備任務執行、情境感知和記需要具備任務執行、情境感知和記憶能力憶能力,考驗終端廠商要求極高,考驗終端廠商要求極高。個人 LLM 大模型需要具備:任務執行(將用戶的指令或主動感知到的任務轉化為針對個人資源的操作行動)、情境感知(感知用戶及環境的當前狀態,為任務執行提供全面的信息)、記憶(記錄用戶數據,使智能體能夠回顧過往事件、總結知識并實現自我進化)。圖圖19:AI 終端關鍵技術特征終端關鍵技術特征 圖圖20:端側端側 Agent 的組成部分的組成部分 數據來

33、源:華為AI 終端白皮書,東吳證券研究所 數據來源:PERSONAL LLM AGENTS,東吳證券研究所 推理推理能力能力之外,之外,端側模型對個性化和內存操作要求較高端側模型對個性化和內存操作要求較高,需要其它額外的優化,需要其它額外的優化。情境感知和記憶能力由更基礎的流程制程,主要包括智能體的推理、個性化和記憶檢索。比如任務執行過程中需要任務分解/規劃,背后是推理能力;需要切換任務,需要依靠個性化來調整任務的權重;同時執行過程中需要檢索歷史數據,背后是內存操作能力。圖圖21:AI Agent 底層能力和高級能力之間的映射關系底層能力和高級能力之間的映射關系 請務必閱讀正文之后的免責聲明部

34、分請務必閱讀正文之后的免責聲明部分 行業深度報告 東吳證券研究所東吳證券研究所 12/21 數據來源:PERSONAL LLM AGENTS,東吳證券研究所 圖圖22:提升提升 Agent 效率的技術及其簡要說明效率的技術及其簡要說明 數據來源:PERSONAL LLM AGENTS,東吳證券研究所 請務必閱讀正文之后的免責聲明部分請務必閱讀正文之后的免責聲明部分 行業深度報告 東吳證券研究所東吳證券研究所 13/21 3.硬件硬件升級滿足高性能需求,升級滿足高性能需求,適配適配核心在內存核心在內存 3.1.內存是端側硬件內存是端側硬件 AI 推理能力的短板推理能力的短板 內存和由內存操作帶來

35、的能耗是端側設備內存和由內存操作帶來的能耗是端側設備 AI 能力最短板能力最短板。模型的優化和壓縮的最終目的是為了提升端側 AI 推理能力,硬件是端側模型第二個必要的組成部分,硬件也將補齊短板。內存及其操作帶來的能耗是當前最短板。Meta 指出,由于 SRAM 緩存通常在 20MB,僅能容納一個 Transformer 塊,而 Flash 容量足夠但速度較慢,DRAM 是要和系統和其它應用共享,留給模型的 DRAM 空間更小,單個應用程序不應超過DRAM的 10%。蘋果論文LLM in a flash指出,在 LLM推理階段,僅將 7B參數,半精度的 LLM 的參數加載入 DRAM 所需空間就

36、超過 14GB。微軟的 3.8B 參數的 Phi-3-mini模型在 4 bits量化水平下需要占用 1.8GBDRAM。同時根據論文EIE,在相同的精度下,DRAM 耗能比 SRAM 耗能高兩個數量級(640:5),比計算耗能高更多。內存讀取是主要的耗能項。根據每 10 億參數生成1token需要耗能 0.1J,一個滿電的 iPhone 大約 50KJ,以 10Token/s 的速度僅支持 7B的模型運行不到 2 小時。同時能耗增加帶來散熱問題突出。圖圖23:常見移動設備中的內存層級結構常見移動設備中的內存層級結構 圖圖24:計算和存儲操作的能耗計算和存儲操作的能耗 數據來源:MobileL

37、LM,東吳證券研究所 數據來源:EIE,東吳證券研究所 注:該能耗為在 LPDDR2、45nm 工藝情況下計算 對比各家對比各家 SoC,蘋果在內存,蘋果在內存/電池電池/散熱上提升空間巨大。散熱上提升空間巨大。芯片制程上看,蘋果一般會優先拿到最先進的制程,但是蘋果的 DRAM 容量較安卓相差較大,目前最新手機僅為 8GB,相比安卓旗艦最高 24GB 差異明顯。蘋果的設備功耗極限潛力很高但受限于散熱無法全部發揮。同時蘋果和安卓手機的電池續航相差極大,蘋果增加電池容量的空間巨大,作為對比,iPhone 16 Pro Max 電池容量為 4685mAh,小米 15 Pro 為6100mAh。圖圖2

38、5:主流手機主流手機 SoC 對比對比 請務必閱讀正文之后的免責聲明部分請務必閱讀正文之后的免責聲明部分 行業深度報告 東吳證券研究所東吳證券研究所 14/21 數據來源:蘋果、高通等,東吳證券研究所 3.2.安卓和安卓和 iOS 內存利用效率差異大內存利用效率差異大 內存作為端側內存作為端側 AI 提升速度、規模和效率的短板,預計成為硬件核心變革方向。提升速度、規模和效率的短板,預計成為硬件核心變革方向。從當前 iOS 和安卓的內存占用來看,普遍 iOS 內存利用效率更高尤其是在應用程序上。根據 Android authority,相同的 App 在 iOS 的內存占用遠低于安卓。主要原因是

39、安卓為消除硬件差異性代碼運行在虛擬機中,需要編譯為中間語言,而 iOS 則是原生編寫因此內存占用較小,而游戲基本用游戲引擎均為原生編寫差異較小。同時在國內由于安卓監管較少,各 App 為?;盍舸婧笈_,集成功能等也增加了 App 的內存占用。因此我們認為安卓需要在 OS 層提供統一的 AI 基礎模型,而 iOS 在模型壓縮之外則需要提高硬件內存以克服單個功能占用大量內存的硬件瓶頸。圖圖26:安卓和安卓和 iOS 運行運行 App 時內存占用對比時內存占用對比 圖圖27:安卓和安卓和 iOS 運行游戲時內存占用對比運行游戲時內存占用對比 數據來源:Androidauthority,東吳證券研究所

40、數據來源:Androidauthority,東吳證券研究所 3.3.蘋果硬件積極應變,創新方案集中內存方向蘋果硬件積極應變,創新方案集中內存方向 除了增加內存容量之外,蘋果在內存結構除了增加內存容量之外,蘋果在內存結構、耗能、耗能、傳輸速度等方面創新密集。傳輸速度等方面創新密集。請務必閱讀正文之后的免責聲明部分請務必閱讀正文之后的免責聲明部分 行業深度報告 東吳證券研究所東吳證券研究所 15/21 蘋果合作三星研發獨立封裝蘋果合作三星研發獨立封裝形式形式。韓媒 The Elec 報道,三星應蘋果要求,開始研究新的 LPDDR DRAM 封裝方式獨立封裝,改變 2010 年起,iPhone 沿用

41、至今的堆疊式封裝(POP)方案內存直接疊在 SoC 上通過 Pitch 連接以最大限度減少設備體積。但是但是 PoP 技術由于芯片過于靠近,端側技術由于芯片過于靠近,端側 AI 負載要求下帶寬和散熱問題嚴重。負載要求下帶寬和散熱問題嚴重。通過分開封裝 DRAM 和 SoC,可以增加 I/O 引腳數量,提高數據傳輸速率和并行數據通道數量,并改善散熱性能,顯著提高內存帶寬并增強 iPhone 的 AI 能力。同時三星還嘗試在 iPhone DRAM 中應用 LPDDR6-PIM(內存內置存儲器)技術,該技術的數據傳輸速度和帶寬是 LPDDR5X 的兩到三倍,專為設備端 AI 設計。圖圖28:PoP

42、 封裝的形式封裝的形式 數據來源:IT 之家,東吳證券研究所 全新的全新的 WMCM 封裝方式進一步提高芯片組合的靈活性和集成度。封裝方式進一步提高芯片組合的靈活性和集成度。預計預計 2026 年年蘋蘋果芯片果芯片先進封裝方式將從現在的先進封裝方式將從現在的 InFO(集成扇(集成扇出型)改為出型)改為 WMCM 的封裝方式的封裝方式(Wafer-Level Chip-Scale Packaging)。相比于現在的單芯片封裝形式,。相比于現在的單芯片封裝形式,WMCM 可將可將多芯片多芯片集成在同一封裝中,可以開發更復雜的芯片,將集成在同一封裝中,可以開發更復雜的芯片,將 CPI、GPU、DR

43、AM、NPU 等等靈活的排列集成在一個封裝中靈活的排列集成在一個封裝中。WMCM 在信號傳輸方面在信號傳輸方面表現出色,能減少信號延遲表現出色,能減少信號延遲和干擾,對需要高速數據處理的設備和干擾,對需要高速數據處理的設備尤為重要。尤為重要。圖圖29:蘋果芯片蘋果芯片封裝封裝形式改變形式改變 數據來源:IT 之家,東吳證券研究所 請務必閱讀正文之后的免責聲明部分請務必閱讀正文之后的免責聲明部分 行業深度報告 東吳證券研究所東吳證券研究所 16/21 4.多模態多模態 UI 交互界面革命帶來交互界面革命帶來 Agent 的歷史機遇的歷史機遇 4.1.Transformer 架構帶來架構帶來 UI

44、 交互的機遇交互的機遇 AI 智能助理的任務執行過程先后分為兩個環節,包括規劃和定位。智能助理的任務執行過程先后分為兩個環節,包括規劃和定位。其中規劃包括使用哪些工具、哪些步驟進行執行等。定位可理解為執行過程中具體的工具(Tools)、技能或者坐標進行對外部環境的操作。圖圖30:Agent 任務執行過程(以任務執行過程(以 GUI 界面為例)界面為例)數據來源:Aria-UI:Visual Grounding for GUI Instructions,東吳證券研究所 根據交互的模式,任務執行方法可分為基于根據交互的模式,任務執行方法可分為基于 API 和基于用戶界面(和基于用戶界面(UI)的方

45、法,)的方法,GUI 有望在有望在 Transformer 加持下成為主流加持下成為主流。API 方式在運行時需要利用模型和內置的示例等方式來選擇合適的 API 進行交互。但是 API 交互方式依賴公開可用的 API,存在應用程序支持不夠全面、同時存在人類可以輕松執行但是 API 難以實現的任務、拓展性和自動化能力較弱等不足。UI 界面方式在 Transformer 架構下較好克服了任務和UI元素之間的隱含關系,大幅提升了 GUI Agent 的可行性。圖圖31:智能體和智能體和 API 之間的調用方式示例(之間的調用方式示例(Extension 方式)方式)數據來源:GoogleAgent,

46、東吳證券研究所 GUI 交互可進一步分為基于文本的交互可進一步分為基于文本的 GUI 交互和交互和多模態的多模態的 GUI 交互交互,當前,當前多模態多模態GUI 交互方式交互方式中中 Grounding 難度比難度比 Planning 更大。更大。視覺定位階段(Grounding)需要將規劃好的指令精準映射到實際界面元素上,確保操作的準確執行。其中 Grounding(精準定位)由于設備兼容性/指令多樣性/場景復雜性等原因,當前難度甚至比規劃決策階段更大,元素識別錯誤也是當前 LMMs GUI 模型的主要錯誤來源。多模態 GUI 交互方式數據不足、存在屏幕錄制要求高以及當前 LMMs 模型推

47、理能力有限的困擾。請務必閱讀正文之后的免責聲明部分請務必閱讀正文之后的免責聲明部分 行業深度報告 東吳證券研究所東吳證券研究所 17/21 圖圖32:UI 界面復雜,元素識別困難界面復雜,元素識別困難 數據來源:Ferret-UI:Grounded Mobile UI Understanding with Multimodal LLMs,東吳證券研究所 4.2.蘋果和蘋果和谷歌谷歌均發力均發力 UI 交互交互模型模型 蘋果在 24 年 4月推出 Ferret-UI 模型,Ferret-UI 通過一個視覺編碼器對圖像進行編碼,蘋果 Ferret-UI 加入任意分辨率(Anyres)技術切割放大子

48、圖像來解決 UI 交互中的小型對象識別問題,同時采用混合區域表示的方法進一步提高圖像的特征提取能力,將圖像特征和文本指令聯合編碼后進行推理,并精準根據任務要求執行。從測試看,模型針對定位任務/識別任務和高級任務表現均較為優秀。圖圖33:Ferret-UI-Anyres 架構架構 數據來源:蘋果,東吳證券研究所 請務必閱讀正文之后的免責聲明部分請務必閱讀正文之后的免責聲明部分 行業深度報告 東吳證券研究所東吳證券研究所 18/21 圖圖34:Ferret-UI-anyres 準確率表現優異準確率表現優異 數據來源:Ferret-UI:Grounded Mobile UI Understandin

49、g with Multimodal LLMs,東吳證券研究所 注 1:S2W:screen2words,WiC:widget captions,TaP:taperception 注 2:“i”:iPhone,“A”:Android,“Ref”:Referring,“Grd”:Grounding Screen AI 是谷歌是谷歌 24 年年 2 月推出的可讀屏月推出的可讀屏 AI 視覺語言模型,專門設計用于理解和視覺語言模型,專門設計用于理解和處理用戶界面(處理用戶界面(UI)和信息圖標,能夠理解和生成與屏幕元素相關的文本,如屏幕信)和信息圖標,能夠理解和生成與屏幕元素相關的文本,如屏幕信息理解

50、、問題回答、息理解、問題回答、UI 導航指令、內容摘要等導航指令、內容摘要等。從架構上,ScreenAI 使用視覺編碼器和語言編碼器組成的多模態編碼器。視覺編碼器基于 Vision Transformer(ViT)架構,將輸入的屏幕截圖作為一系列圖像嵌入,語言編碼器則處理截圖相關的文本信息,如UI 元素標簽和描述等。編碼器的輸出被傳遞給一個解碼器 T5,負責生成文本輸出,能夠根據輸入的圖像和文本嵌入生成自然語言響應。同時與蘋果類似,谷歌采用更靈活的屏幕分割策略以適用于不同的手機和電腦屏幕。圖圖35:谷歌谷歌 Screen AI 模型架構模型架構 數據來源:谷歌,東吳證券研究所 請務必閱讀正文之

51、后的免責聲明部分請務必閱讀正文之后的免責聲明部分 行業深度報告 東吳證券研究所東吳證券研究所 19/21 圖圖36:Screen AI 模型的屏幕理解模型的屏幕理解/問答問答/導航導航/摘要四類任務示例摘要四類任務示例 數據來源:谷歌,東吳證券研究所 模型參數提升對性能影響較大,模型參數提升對性能影響較大,尤其是在復雜任務中尤其是在復雜任務中,5B 模型對性能提升尚未飽模型對性能提升尚未飽和和。谷歌發布了三個 670M/2B和 5B 三個大小的模型,參數差異主要在圖像和文本編解碼器的大小,不同的編碼器支持不同的輸入,如正方形下 670M模型最大輸入分辨率為 720720,5B 模型則支持 81

52、2812 的最大輸入分辨率。從最后的模型表現中,所有的任務中增加模型規模都會提升性能,并且在最大的 5B 模型時性能提升尚未飽和。同時對于復雜任務,2B 和 5B模型之間的性能提升遠大于 670M 模型到 2B模型之間的提升。圖圖37:谷歌谷歌不同參數不同參數 Screen AI 模型模型參數量及其分配細節參數量及其分配細節 數據來源:谷歌,東吳證券研究所 圖圖38:不同參數的不同參數的 Screen UI 模型的模型的表現表現 數據來源:谷歌,東吳證券研究所 請務必閱讀正文之后的免責聲明部分請務必閱讀正文之后的免責聲明部分 行業深度報告 東吳證券研究所東吳證券研究所 20/21 5.風險風險

53、提示提示 底層創新不及預期底層創新不及預期:端側 AI 模型的發展需要底層技術架構和模型優化技術、硬件技術的創新,若創新不及預期,模型體驗較差會影響用戶體驗。技術發展不及預期技術發展不及預期:除了底層創新,新技術如新存儲方式等的落地也需要后端制造環節的技術落地和成本優化,若技術發展不及預期,產品成本或過高無法普及。競爭競爭加劇加劇風險風險:當前互聯網廠商/消費電子品牌廠商等均在搶占入口環節,競爭或加劇。免責及評級說明部分 免責聲明免責聲明 東吳證券股份有限公司經中國證券監督管理委員會批準,已具備證券投資咨詢業務資格。本研究報告僅供東吳證券股份有限公司(以下簡稱“本公司”)的客戶使用。本公司不會

54、因接收人收到本報告而視其為客戶。在任何情況下,本報告中的信息或所表述的意見并不構成對任何人的投資建議,本公司及作者不對任何人因使用本報告中的內容所導致的任何后果負任何責任。任何形式的分享證券投資收益或者分擔證券投資損失的書面或口頭承諾均為無效。在法律許可的情況下,東吳證券及其所屬關聯機構可能會持有報告中提到的公司所發行的證券并進行交易,還可能為這些公司提供投資銀行服務或其他服務。市場有風險,投資需謹慎。本報告是基于本公司分析師認為可靠且已公開的信息,本公司力求但不保證這些信息的準確性和完整性,也不保證文中觀點或陳述不會發生任何變更,在不同時期,本公司可發出與本報告所載資料、意見及推測不一致的報

55、告。本報告的版權歸本公司所有,未經書面許可,任何機構和個人不得以任何形式翻版、復制和發布。經授權刊載、轉發本報告或者摘要的,應當注明出處為東吳證券研究所,并注明本報告發布人和發布日期,提示使用本報告的風險,且不得對本報告進行有悖原意的引用、刪節和修改。未經授權或未按要求刊載、轉發本報告的,應當承擔相應的法律責任。本公司將保留向其追究法律責任的權利。東吳證券投資評級標準東吳證券投資評級標準 投資評級基于分析師對報告發布日后 6 至 12 個月內行業或公司回報潛力相對基準表現的預期(A 股市場基準為滬深 300 指數,香港市場基準為恒生指數,美國市場基準為標普 500 指數,新三板基準指數為三板成

56、指(針對協議轉讓標的)或三板做市指數(針對做市轉讓標的),北交所基準指數為北證 50 指數),具體如下:公司投資評級:買入:預期未來 6個月個股漲跌幅相對基準在 15%以上;增持:預期未來 6個月個股漲跌幅相對基準介于 5%與 15%之間;中性:預期未來 6個月個股漲跌幅相對基準介于-5%與 5%之間;減持:預期未來 6個月個股漲跌幅相對基準介于-15%與-5%之間;賣出:預期未來 6個月個股漲跌幅相對基準在-15%以下。行業投資評級:增持:預期未來 6個月內,行業指數相對強于基準 5%以上;中性:預期未來 6個月內,行業指數相對基準-5%與 5%;減持:預期未來 6個月內,行業指數相對弱于基準 5%以上。我們在此提醒您,不同證券研究機構采用不同的評級術語及評級標準。我們采用的是相對評級體系,表示投資的相對比重建議。投資者買入或者賣出證券的決定應當充分考慮自身特定狀況,如具體投資目的、財務狀況以及特定需求等,并完整理解和使用本報告內容,不應視本報告為做出投資決策的唯一因素。東吳證券研究所 蘇州工業園區星陽街?5 號 郵政編碼:215021 傳真:(0512)62938527

友情提示

1、下載報告失敗解決辦法
2、PDF文件下載后,可能會被瀏覽器默認打開,此種情況可以點擊瀏覽器菜單,保存網頁到桌面,就可以正常下載了。
3、本站不支持迅雷下載,請使用電腦自帶的IE瀏覽器,或者360瀏覽器、谷歌瀏覽器下載即可。
4、本站報告下載后的文檔和圖紙-無水印,預覽文檔經過壓縮,下載后原文更清晰。

本文(電子行業深度報告:端側AI模型創新快速迭代看好蘋果引領AI硬件起飛-250223(21頁).pdf)為本站 (YY) 主動上傳,三個皮匠報告文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對上載內容本身不做任何修改或編輯。 若此文所含內容侵犯了您的版權或隱私,請立即通知三個皮匠報告文庫(點擊聯系客服),我們立即給予刪除!

溫馨提示:如果因為網速或其他原因下載失敗請重新下載,重復下載不扣分。
客服
商務合作
小程序
服務號
折疊
午夜网日韩中文字幕,日韩Av中文字幕久久,亚洲中文字幕在线一区二区,最新中文字幕在线视频网站