《傳媒行業:Agent初具技術雛形重點關注三大演化方向-250520(15頁).pdf》由會員分享,可在線閱讀,更多相關《傳媒行業:Agent初具技術雛形重點關注三大演化方向-250520(15頁).pdf(15頁珍藏版)》請在三個皮匠報告上搜索。
1、 本報告版權屬于國投證券股份有限公司,各項聲明請參見報告尾頁。1 20252025 年年 0505 月月 2020 日日 傳媒傳媒 行業分析行業分析 AgentAgent 初具技術雛形,重點關注三大演初具技術雛形,重點關注三大演化方向化方向 證券研究報告證券研究報告 投資評級投資評級 領先大市領先大市-A A 維持維持評級評級 首選股票首選股票 目標價(元)目標價(元)評級評級 行業表現行業表現 資料來源:Wind 資訊 升幅升幅%1M1M 3M3M 12M12M 相對收益相對收益 1.4-8.1 14.2 絕對收益絕對收益 4.2-9.7 19.6 焦娟焦娟 分析師分析師 SAC 執業證書編
2、號:S1450516120001 王利慧王利慧 分析師分析師 SAC 執業證書編號:S1450523120002 相關報告相關報告 AI to C 四個方向:硬件入口、現象級應用、爆款內容、IP 運營系列 03:AI 對教育培訓影響的 6 層次分析 2025-04-17 AI to C 四個方向:硬件入口、現象級應用、爆款內容、IP 運營系列 02:傳媒互聯網視角下,內容產業的 AI 新敘事 2025-03-31 AI Agent 本質為“執行”功能,關注其與終端結合的應用落地AI 專題報告之19 2024-11-05 AI 新標的,助力并購行情的“形勢使然”還是“趨勢使2024-11-04
3、AGIAGI 正邁正邁向向自主行動自主行動階段階段,指向,指向 AgentAgent、具身智能、具身智能。人工智能技術經過幾輪迭代,已經基本邁過“感知-思考”的應用臨界點,正在逐步實現“自主行動”的發展階段,根據應用場景劃分為 Agent、具身智能兩個大方向。我們曾以人形機器人為切入點探討過具身智能相關的技術原理、發展路徑、主要參與者等,本篇將聚焦于本篇將聚焦于AgentAgent 方向,梳理其技術構成、演進階段等。方向,梳理其技術構成、演進階段等。20232023 年至今國內外模型迭代速度非???,年至今國內外模型迭代速度非???,推動了推動了 AgentAgent 產品感產品感知、規劃、記憶能
4、力提升知、規劃、記憶能力提升:1)GPT4、4o 模型從單一文本走向多模態,模型感知能力更全面;2)o1 通過后訓練增強推理能力,模型推理能力實現突破;3)上下文窗口擴展至 100 萬 token,模型記憶能力提升,將更了解用戶;4)模型使用成本大幅下降,試錯成本下降,2025年DeepSeek模型的報價為0.25-0.5元/百萬token,約為 GPT-4o 的 1/7。使用工具的能力是使用工具的能力是 LLMLLM 模型與模型與 AgentAgent 的最大區別的最大區別,MCPMCP 協議有協議有望推動望推動 AgentAgent 工具生態建立:工具生態建立:圍繞如何調用工具、交互更加高
5、效為主線,科技大廠先后探索出多種調用工具方式,其中以插件(plugin)、函數調用(Function Calling)、模擬人機交互(Computer use)三種方式最引人關注。2024 年 Anthropic 推出開放協議 MCP,屏蔽了不同模式工具與模型通信時的差異,統一由 MCP 協議轉換對接,實現了一次開發、多場景復用的目的,能有效節省研發資源,降低邊際開發成本,受到工具、模型及云廠商的廣泛認可。當前處于當前處于 workflowworkflow 到到 AgentAgent 的過渡期的過渡期,類比自動駕駛規則驅動類比自動駕駛規則驅動階段。階段??紤]到當前模型能力有限、業務場景對可控性
6、要求較高,當前許多產品本質上為 AI Workflow,即按照預先定義好的代碼路徑,協調大模型和各種工具的系統,用于保證交付結果的穩定性。參考自動駕駛方案,我們認為當前可類比于自動駕駛的規則驅動階段,我們預計真正 Agent 將實現從被動響應到主動執行的躍遷,進入到模型驅動階段,進一步地也有望走入感知、決策規劃、執行三位一體的端到端模型。AgentAgent 產品還在早期探索階段產品還在早期探索階段,若,若以前瞻以前瞻視角討論商業化,我視角討論商業化,我們認為產業鏈中以下幾條主線值得重點關注:們認為產業鏈中以下幾條主線值得重點關注:1)模型開源與閉源之爭,對大模型廠商商業化能力最為關鍵;2)科
7、技大廠爭先下場,爭奪產業鏈潛在價值點;3)工具層適合中小公司入局,但模型與工具層邊界有待清晰。投資建議:投資建議:-19%-9%1%11%21%31%2024-052024-092025-012025-05傳媒傳媒滬深滬深300300 本報告版權屬于國投證券股份有限公司,各項聲明請參見報告尾頁。2 行業分析行業分析/傳媒傳媒 1)利好算力基礎設施,訓練垂直場景中長尾模型算力、推理算力等需求將增長,關注商湯、阿里巴巴、騰訊;2)端側硬件:手機、PC 等硬件終端支持 Agent 本地部署,對端側算力要求提升,也將引來換機周期,關注小米集團;3)端側芯片:手機等終端算力不足,對芯片性能仍有增長需求。
8、4)To C:個人助手,關注現有 C 端應用、華為小藝等手機助手的升級迭代,關注小米集團、騰訊;5)To B:Mass 軟件平臺,用 AI 重塑 SaaS 等系統;私有化部署服務商,Agent 個性化需求解決仍不足,需要服務商基于客戶場景進行私有化定制,關注第四范式、云從科技等;風險提示:風險提示:技術進展不及預期、行業競爭加劇、商業模式變化 然”?AI 專題報告之 18 預計 AI 技術路徑將由大模型切向具身智能AI 專題“從上網到上算,由網絡世界至虛擬現實”之十七 2024-09-26 行業分析行業分析/傳媒傳媒 本報告版權屬于國投證券股份有限公司,各項聲明請參見報告尾頁。3 內容目錄內容
9、目錄 1.技術層:模型與工具能力顯著進化,類比自動駕駛規則驅動階段.4 1.1.發展路徑:AGI 正邁向自主行動階段,指向 Agent、具身智能.4 1.2.關鍵技術:模型與工具顯著進化,下一步提升可靠性、統一標準.4 1.2.1.模型:感知與推理能力提升&成本下降,但可靠性不足限制場景.5 1.2.2.工具:MCP&A2A 推動開發標準化,但標準主導權未定.7 1.3.所處階段:從工作流模式向 Agent 過渡,類比自動駕駛規則驅動階段.9 2.產業鏈:商業化模式仍處早期,關注三大主線下動態演化.11 2.1.主線 1:模型開源與閉源之爭,對大模型廠商商業化能力最為關鍵.11 2.2.主線
10、2:科技大廠爭先下場,爭奪產業鏈潛在價值點.12 2.3.主線 3:工具層適合中小公司入局,但模型與工具層邊界有待清晰.12 3.投資建議.13 4.風險提示.13 圖表目錄圖表目錄 圖 1.人工智能核心模塊及關鍵路徑.4 圖 2.Agent 與環境交互的鏈路.5 圖 3.AI Agent 基礎框架.5 圖 4.2023 年至今代表性模型及其他特點.6 圖 5.主流基礎模型在在推理、數學、代碼能力上的評分.6 圖 6.模型智能化水平與使用成本.6 圖 7.調用 OpenAI 模型成本顯著下降.7 圖 8.DeepSeek 模型報價.7 圖 9.MCP 的工作架構.8 圖 10.A2A 協議的工
11、作架構.8 圖 11.MCP、A2A 方案的關系.9 圖 12.智譜對 AGI 進行的分級與對應路線圖.10 圖 13.三種工作流模式.10 圖 14.自動駕駛技術演進路徑.11 圖 15.扣子空間合作客戶案例.13 表 1:MCP、A2A 主要的合作伙伴.9 表 2:Workflow 與 Agent 對比.10 表 3:模型 API 定價(每百萬 Token).11 表 4:國內外科技大廠代表性 Agent 產品.12 行業分析行業分析/傳媒傳媒 本報告版權屬于國投證券股份有限公司,各項聲明請參見報告尾頁。4 1.1.技術層技術層:模型與工具能力顯著進化,類比自動駕駛規則驅動階段:模型與工具
12、能力顯著進化,類比自動駕駛規則驅動階段 1.1.1.1.發展路徑:發展路徑:AGIAGI 正邁正邁向向自主行動自主行動階段階段,指向,指向 AgentAgent、具身智能、具身智能 參考人類處理問題的流程與能力來看,人工智能系統應當具備的三大核心模塊為:參考人類處理問題的流程與能力來看,人工智能系統應當具備的三大核心模塊為:1)1)感知模塊:感知模塊:類似于人類的眼睛、耳朵等感官一樣,人工智能需要借助攝像頭、傳感器等進行圖像、聲音等信息的收集,并將其傳輸至像大腦一樣的數據處理中樞進行信息處理;2)2)規劃規劃模塊:模塊:類似于人類大腦,人工智能應該有數據處理中心對所收集的數據進行處理分析,人類
13、根據大腦處理后的信息,并基于一定的經驗與知識對所處的環境進行判斷,并最終做出決策;3)3)行動模塊:行動模塊:在做出判斷后,人類通過語言或行動對外界做出反饋。AIAI 正在邁入自主行動正在邁入自主行動階段階段,指向,指向 AI AgentAI Agent、具身智能兩個方向。、具身智能兩個方向。人工智能技術經過幾輪迭代,已經基本邁過“感知-思考”的應用臨界點,正在逐步實現“自主行動”的發展階段。我們認為其應用場景劃分為兩個方向:1)若僅需要在數字世界完成交互,則指向 AI Agent,即能夠通過觀察環境并利用其可用的工具對環境采取行動以嘗試實現預設目標的程序(資料來源:谷歌 Agent 白皮書)
14、;2)在 Agent 基礎上,還需要借助硬件與現實物理世界進行交互,則指向“具身智能”,如智能駕駛、人形機器人等。圖圖1.1.人工智能核心模塊及關鍵路徑人工智能核心模塊及關鍵路徑 資料來源:國投證券證券研究所整理 我們曾在人形機器人的 AI 算法,如何借力于自動駕駛 FSD、英偉達入局加速產業進程,特斯拉等積極推動量產及應用落地中以人形機器人為切入點探討過具身智能相關的技術原理、發展路徑、主要參與者等,本篇將聚焦于本篇將聚焦于 AgentAgent 方向,梳理其技術構成、演進階段等。方向,梳理其技術構成、演進階段等。1.2.1.2.關鍵技術:模型與工具顯著進化,下一步提升可靠性、統一標準關鍵技
15、術:模型與工具顯著進化,下一步提升可靠性、統一標準 按照“感知按照“感知-決策規劃決策規劃-行動”的處理鏈路,行動”的處理鏈路,AgentAgent 產品設計需要包括記憶(儲存環境感知信產品設計需要包括記憶(儲存環境感知信息)、決策規劃、工具(用于交互獲取信息)三大模塊,其中模型能力、調用工具調用最為重息)、決策規劃、工具(用于交互獲取信息)三大模塊,其中模型能力、調用工具調用最為重要:要:1)模型承擔了感知、規劃、記憶的主要職能,模型承擔了感知、規劃、記憶的主要職能,以目前主流的 LLM+強化學習模型作為基礎模型,負責智能體感知、決策規劃能力,同時模型的上下文窗口用于存儲環境信息;2)工具用
16、于補充感知信息,輔助行動:工具用于補充感知信息,輔助行動:對于對話、生成圖片等簡易的任務,目前主流的 LLM幾乎都可以完成,無需工具;但復雜任務則需要調用工具補充信息以增強決策能力或者實現具體任務,比如在購買機票時查詢航班信息、下單等步驟;行業分析行業分析/傳媒傳媒 本報告版權屬于國投證券股份有限公司,各項聲明請參見報告尾頁。5 以訂購機票為例,智能體處理的流程大體為:以訂購機票為例,智能體處理的流程大體為:模型對訂購機票的問題分析得出用戶目的;編排層分析下一步的行動,如打開航班查詢工具輸入出發地、目的地獲取航班查詢工具返回結果;交給模型層組織語言,給客戶返回結果。圖圖2.2.Agent 與環
17、境交互的鏈路與環境交互的鏈路 圖圖3.3.AI Agent 基礎框架基礎框架 資料來源:阿里云官網、國投證券證券研究所 資料來源:LLM Powered Autonomous Agents、國投證券證券研究所 基于上述流程,我們推斷評估基于上述流程,我們推斷評估 AgentAgent 是否好用的關鍵標準包括是否好用的關鍵標準包括:1)強大的模型能力,能夠理解用戶意圖,擅長多步推理,輸出穩定可靠的結果;2)具備較強的工具拓展性,支持盡可能廣泛的工具,以增強智能體的交互能力、處理能力;3)具有較強的工程化能力,需要設計巧妙地工程化結構以提高輸出效率、降低算力成本。以下我們重點關注模型以下我們重點關
18、注模型與與工具的演進過程、工具的演進過程、當前行業格局當前行業格局。1.2.1.1.2.1.模型:感知與推理能力提升模型:感知與推理能力提升&成本下降,但可靠性不足限制場景成本下降,但可靠性不足限制場景 20232023 年至今國內外模型迭代速度非???,年至今國內外模型迭代速度非???,總體趨勢總體趨勢是基于是基于 Scaling LawScaling Law 本質,本質,使用使用超大規模超大規模高質量數據、模型算法和算力的提升高質量數據、模型算法和算力的提升提升提升模型效果模型效果。沿著該技術路徑推進,模型技術能力持。沿著該技術路徑推進,模型技術能力持續突破,對實現續突破,對實現 AgentA
19、gent 產品可成功表現為感知、決策規劃、記憶能力提升:產品可成功表現為感知、決策規劃、記憶能力提升:GPT4GPT4、4o4o 模型從單一文本走向多模態,模型感知能力更全面。模型從單一文本走向多模態,模型感知能力更全面。2023 年 3 月 OpenAI 推出GPT4,標志大模型從單一文本走向了多模態,能更好地理解圖片、視頻、音頻、代碼等信息,具備了視覺感知、聽覺感知能力;4o 在訓練階段將多模態數據一起喂給模型,進一步提升了多模態感知能力。(資料來源:OpenAI 官網)o1o1 通過后訓練增強推理能力,模型推理能力實現突破。通過后訓練增強推理能力,模型推理能力實現突破。為了提高模型的決策
20、能力,最初采用思維鏈(Chain-of-Thought)、思維樹(Tree-of-Thoughts)方式提高推理能力,至2024 年 9 月 OpenAI 推出 o1 模型,采用后訓練方式,在回答問題時模擬人類“慢思考”的過程,生成詳細推理步驟,包括分解問題、嘗試不同策略等,使模型在規劃決策上的能力有了突破;2025 年 2 月份推出 Deepreaserch,具備了端到端自主規劃能力。2025年 4 月 16 日,OpenAI 發布 o3 模型,根據外部專家的評估中,o3 在困難的現實任務中比 o1 犯的重大錯誤少 20%,在分析圖像、圖表和圖形等視覺任務中表現尤為出色。(資料來源:Open
21、AI 官網)上下文窗口擴展至上下文窗口擴展至 100100 萬萬 tokentoken,模型記憶能力提升,模型記憶能力提升,將更了解用戶。將更了解用戶。上下文窗口越長。用戶給模型的輸入越多,能夠給模型提供更多精確數據,使模型表現更好。2023 年 5 月,Anthropic 發布的 Claude 模型將上下文窗口拓展至 100K token,較發布前市場上主流的 token 擴大 10 倍;2023 年 11 月 Claude 模型將上下文窗口提升至 200K token,2025年 3 月谷歌 Gemini2.0 將上下文窗口拓展至百萬級別,相當于能夠同步處理多達 1,500 頁的文本或 3
22、 萬行代碼,使模型能夠處理更大規模的信息。目前研究領域有觀點認為,得上下文者得天下,特別是對用戶端交互數據的積累,隨使用時間沉淀,能幫助模型更好理解用戶需求,使用戶遷移成本變高,有望最終形成 C 端產品的競爭壁壘。行業分析行業分析/傳媒傳媒 本報告版權屬于國投證券股份有限公司,各項聲明請參見報告尾頁。6 圖圖4.4.2023 年至今代表性模型及其他特點年至今代表性模型及其他特點 資料來源:CSDN、OpenAI 官網、Anthropic 官網、國投證券證券研究所 從實現能力上,從實現能力上,GPT4GPT4 為代表的模型已基本達到大學生以上智能化水平為代表的模型已基本達到大學生以上智能化水平。
23、根據 Deepseek 等論文的評估數據,目前主流模型在任務理解、數學、代碼等任務的通過率基本在 70%-80%,在代表推理能力的高級問答場景的通過率相對薄弱,但也已經達到 50%左右。隨模型能力進一步迭代,推理場景的通過率有望進一步提升。根據瀾碼科技觀點,GPT4 的智能化程度已經基本達到大學生以上水平。圖圖5.5.主流基礎模型在在推理、數學、代碼能力上的評分主流基礎模型在在推理、數學、代碼能力上的評分 圖圖6.6.模型智能化水平與使用成本模型智能化水平與使用成本 資料來源:arxiv、Google、deepseek 技術社區、國投證券證券研究所 資料來源:瀾碼科技、國投證券證券研究所 其次
24、,模型使用成本大幅下降,試錯成本下降。其次,模型使用成本大幅下降,試錯成本下降。從 OpenAI 開發的系列模型調用收費來看,2023 年初 GPT-4 收費為 36 美元/百萬 token,到 2024 年推出 GPT-4o 時為 0.25 美元/百萬token,價格下降為 GPT-4 推出時的 1/144。2025 年 DeepSeek 模型的報價為 0.25-0.5 元/百萬 token,按照匯率換算約為 GPT-4o 的 1/7,價格進一步下探。得益于模型使用成本下降,基于模型進行應用研發的成本會下降,會提高企業、開發者的嘗試積極性,有望提高 AI Agent的場景滲透率。72.6%4
25、9.9%74.6%80.5%76.4%62.1%89.7%75.9%59.1%90.2%82.6%78.0%65.0%78.3%81.7%71.6%49.0%80.0%77.3%73.3%51.1%73.8%77.2%87.0%77.3%86.7%0%20%40%60%80%100%MMLUGPQAMATHHumanEvalGPT-4oGemini 2.0DeepSeek-V3Claude 3.5 SonnetQwen 2.5-72BLLaMA 3.1-405B豆包(Seed-Thinking-v1.5)行業分析行業分析/傳媒傳媒 本報告版權屬于國投證券股份有限公司,各項聲明請參見報告尾頁。7
26、 圖圖7.7.調用調用 OpenAI 模型成本顯著下降模型成本顯著下降 圖圖8.8.DeepSeek 模型報價模型報價 資料來源:OpenAI、騰訊新聞、國投證券證券研究所 資料來源:Deepseek 官網、國投證券證券研究所 但模型仍存在一些但模型仍存在一些問題問題,限制了其在一些嚴肅場景的滲透率提升,限制了其在一些嚴肅場景的滲透率提升:1 1)幻覺問題。)幻覺問題。大模型基于概率生成文本,在推理過程中對于缺失部分會進行“合理推測”,可能通過強行構建邏輯鏈產生事實錯誤。在諸如醫療等嚴肅的 To B 場景對幻覺問題的容忍度較低,導致企業在采用模型時的決策較為謹慎;2 2)上下文窗口不足上下文窗
27、口不足。通常來說,一個 token 大概對應英語里的四個字符或者四分之三的單詞,OpenAI 最新發布的 o3 模型上下文本窗口為 200K,即支持查詢約 15 萬英文單詞的內容,但這在需要處理大量資料的法律、商業咨詢等場景仍有不足。1.2.2.1.2.2.工具:工具:MCP&A2AMCP&A2A 推動開發標準化,但標準主導權未定推動開發標準化,但標準主導權未定 某種程度上,使用工具的能力是某種程度上,使用工具的能力是 LLMLLM 模型與模型與 AgentAgent 的最大區別,的最大區別,20232023 年至今年至今,圍繞如何調用圍繞如何調用工具工具、交互更加高效為主線交互更加高效為主線
28、,科技大廠先后探索出科技大廠先后探索出多種多種調用工具方式調用工具方式,其中以插件(,其中以插件(pluginplugin)、)、函數調用函數調用(Function CallingFunction Calling)、模擬人機交互()、模擬人機交互(Computer Computer useuse)三種方式最引人關注:)三種方式最引人關注:插件插件(PluginPlugin):):2023 年 OpenAI 在 ChatGPT 中推出插件功能,模型接受用戶提示詞后,根據意圖將其提供給更專業的插件產品,由其給出相應反饋后,由模型整理后輸出給用戶。在這種模式中,用戶請求、模型與工具的交互基于自然語言
29、的,函數調用函數調用(Function CallingFunction Calling):):2023 年 6 月,OpenAI 首次推出 Function Calling 功能,允許模型提取用戶輸入生成結構化輸出參數,比如都用 Json 對象定義工具名,調用預先定義好的外部 API、工具系統,用以執行具體操作,并于 2024 年 8 月正式發布,且整合入 GPT-4o 等模型中;模擬人機交互(模擬人機交互(Computer Computer useuse):):2024 年 11 月 Anthropic 推出 Computer use 功能,模擬人類操作模式與桌面應用交互,比如滑動、點擊、打
30、字等;2024 年 11 月,智譜推出Auto-GLM,通過圖形用戶界面(GUI)自主控制數字設備,實現更進一步的 Phone use,模擬人類與手機應用交互;2025 年 2 月,OpenAI 推出基于 Computer-Using Agent(CUA)模型的產品 Operator,結合 GPT-4o 的視覺能力和強化學習,通過截圖解析與圖形用戶界面(GUI)交互,模擬人類操作與網頁交互。與 Anthropic 不同在于Anthropic 的Computer use 功能前端模擬人類操作,但實際需要借助 API 接口執行,而 OpenAI 的Operator,本質基于多模態感知能力,直接對圖
31、形界面 GUI 進行交互。三種模式各有優劣,實際使用中結合需求、成本綜合考量。三種模式各有優劣,實際使用中結合需求、成本綜合考量。插件模式開發最簡單,且靈活,但是主要通過模糊的提示詞進行交互,返回結果容易出現偏差;函數調用模式輸出結構化參數,清晰可控,能夠減少因內容模糊反復試錯產生的調用模型成本,但不同模型、工具間的調用格式不統一,存在兼容問題;對于未開放接口的外部工具而言,基于 CUA 模型的 computer use 模式可以作為補充,通過模擬人機操作的方式執行功能,實現可拓展性,而且該種模式操作過程可見,有利于增強用戶信任。三種模式各有優劣,目前 Agent 產品多采用混合模式開發,基于
32、場景、使用效果、成本等進行綜合評估。行業分析行業分析/傳媒傳媒 本報告版權屬于國投證券股份有限公司,各項聲明請參見報告尾頁。8 MCPMCP 為模型與工具間通信提供為模型與工具間通信提供標準協議,有望標準協議,有望降低開發工具的邊際成本降低開發工具的邊際成本。2024 年 11 月Anthropic 推出開放協議 Model Context Protocol(MCP),如下圖架構,MCP 分為客戶端-服務器-本地數據庫三層架構,客戶端 MCP 中內置 LLM 模型、部分工具、IDE 集成環境,每個服務器本質上代表了一類封裝工具,用于搜索瀏覽器查詢內容、訪問數據庫、操作用戶界面等某種特定需求。封
33、裝后的服務器與客戶端通過預先定義好的標準協議(MCP)進行通信,其中標準協議中定義好了調用工具的規則,包括參數名、參數類型和參數描述等。MCP 的價值在于屏蔽了 Function calling、Computer use 等不同模式工具與模型通信時的差異,統一由MCP 協議轉換對接,實現了一次開發、多場景復用的目的,能有效節省研發資源,降低邊際開發成本。圖圖9.9.MCP 的工作架構的工作架構 資料來源:Anthropic 官網、國投證券證券研究所 GoogleGoogle 推出推出 A2AA2A 協議協議,重點關注重點關注 AgentAgent 間通信間通信。2025 年 4 月 9 日,谷
34、歌在 Google Cloud Next 25 大會上推出 Agent2Agent 協議(A2A),旨在讓分布式異構的 AI 智能體能夠相互通信,在具體執行過程中,每個 Agent 都需要提供一份 JSON 格式說明書(Agent Card),表示可以完成的任務能力,當客戶端 Agent 需要時會發起請求,雙方建立傳輸機制,無需共享內存、資源和工具即可進行動態、多模式通信。與 MCP 相比,A2A 協議增加主動能力發現、用戶安全驗證等能力,能夠滿足企業級代理生態所需要的安全要求。圖圖10.10.A2A 協議的工作架構協議的工作架構 資料來源:谷歌、國投證券證券研究所 A2AA2A 是對是對 M
35、CPMCP 的升維的升維從單體從單體 AgentAgent 走向多走向多 AgentAgent 協作,協作,但也存在潛在競爭。但也存在潛在競爭。MCP 專注于代理對工具或者資源的訪問,重點關注單個代理內部能力的提升;而 A2A 專注代理之間的通信與協作,適用于多代理協同工作的場景。從邏輯上看,從 MCP 到 A2A 是從單代理向多代理協作機制的演進,是管理層級的升維,在具體場景中兩種協議搭配互補,可以提高 Agent 能行業分析行業分析/傳媒傳媒 本報告版權屬于國投證券股份有限公司,各項聲明請參見報告尾頁。9 力。但從本質來看,兩種協議都在解決通信機制,且輸出結果均為結構化 JSON,當工具復
36、雜度提升后,可能也會以 Agent 形式存在,MCP 也有希望具備 A2A 能力,因此我們認為兩種協議也存在潛在競爭,MCP 與 A2A 的競爭可能會演變為 Anthropic、谷歌對協議標準主導權的爭奪。圖圖11.11.MCP、A2A 方案的關系方案的關系 資料來源:谷歌官網、國投證券證券研究所 MCPMCP、A2AA2A 均在均在構建生態體系構建生態體系,主導權之爭或為下一階段關注點,主導權之爭或為下一階段關注點。MCP 聚焦于模型與工具、資源的鏈接,受到工具、模型及云廠商的認可,目前接入 MCP 協議的包括 Github、Notion、阿里云、DeepSeek 等。谷歌 A2A 協議在企
37、業級場景做了優化,目前已獲得 50 多家科技企業和服務商支持,包括 Saleforce、埃森哲、德勤、C3.ai 等跨國企業。我們認為 MCP、A2A 兩種協議模式都推動了產業向標準化方向的演進,但主導權格局仍未清晰,建議關注 Anthropic、谷歌兩家科技公司在模型能力提升、技術路徑的選擇,將對生態格局產生影響。表表1 1:MCPMCP、A2AA2A 主要的合作伙伴主要的合作伙伴 領域領域 合作伙伴合作伙伴 MCPMCP 生態生態 云與數據 AWS、阿里云、Snowflake、MongoDB、Databricks 開發框架 LangChain、LlamaIndex、Hugging Face
38、 行業工具 GitHub(代碼)、Zapier(自動化)、Airtable(數據庫)、Notion(文檔)模型廠商 Anthropic(Claude)、DeepSeek、智譜 AI A2AA2A 生態生態 技術平臺 Google Cloud、MongoDB、LangChain、Cohere、Databricks 企業件 Salesforce(CRM)、SAP(ERP)、ServiceNow(IT 服務)、Workday(HR)、Atlassian(協作工具)行業服務 埃森哲、德勤、畢馬威、凱捷、Infosys(系統集成)重量應用 Box(文件管理)、UKG(勞動力管理)、Intuit(財稅)、
39、C3.ai(工業 AI)資料來源:Anthropic 官網、谷歌官網、CSDN、國投證券證券研究所 1.3.1.3.所處階段:從工作流模式向所處階段:從工作流模式向 AgentAgent 過渡,類比自動駕駛規則驅動階段過渡,類比自動駕駛規則驅動階段 AGIAGI 正處于正處于 L2L2 到到 L3L3 過渡階段,過渡階段,AgentAgent、機器人、機器人等場景需要解決自我進化難題等場景需要解決自我進化難題。智譜將 AGI 路線圖劃分為 5 級,分別為 L1 預訓練大模型、L2 對齊與推理、L3 自我學習、L4 自我認知、L5意識智能。L1 是預訓練過程;L2 是將預訓練知識與文本、用戶意圖
40、、圖片及多模態進行對齊,本質上是激活預訓練階段所學知識。目前 AGI 正位于從 L2 向 L3 發展的關鍵階段,需要提升模型的自我學習能力,通過反思、沉思獲得對自身行為做出調整優化。行業分析行業分析/傳媒傳媒 本報告版權屬于國投證券股份有限公司,各項聲明請參見報告尾頁。10 圖圖12.12.智譜對智譜對 AGI 進行的分級與對應路線圖進行的分級與對應路線圖 資料來源:智譜 AI、國投證券證券研究所 對應對應當前處于當前處于 workflowworkflow 到到 AgentAgent 的過渡期。的過渡期。但是考慮到當前模型能力有限、業務場景對可控性要求較高,當前許多產品本質上為 AI Work
41、flow,即按照預先定義好的代碼路徑,協調大模型和各種工具的系統,用于保證交付結果的穩定性,其與傳統的自動化工作流相比,部分由大模型驅動,比如增強感知理解,但到決策規劃部分仍不具備自主決策能力,需依據一定規則;Agent 是大模型自主決定處理過程和工具使用方式的系統,能獨立完成任務,具有適應性,我們認為當前正處在由 AI Workflow 模式向 Agent 模式過渡階段。表表2 2:WorkflowWorkflow 與與 AgentAgent 對比對比 Agent Workflow 核心能力核心能力 動態決策、環境交互 流程編排、規則執行 適用場景適用場景 開放任務、不確定性高 標準化流程、
42、確定性高 技術復雜度技術復雜度 高(需強化學習/LLM)中(依賴流程引擎)擴展性擴展性 通過多 Agent 協作提升 通過子流程嵌套擴展 資料來源:CSDN、國投證券證券研究所 圖圖13.13.三種工作流模式三種工作流模式 資料來源:智猩猩 GenAI、國投證券證券研究所 從從 workflowworkflow 走向真走向真 AgentAgent,類比于自動駕駛中規則驅動到模型驅動的演進。,類比于自動駕駛中規則驅動到模型驅動的演進。根據特斯拉 2022年 AI day 給出的自動駕駛方案,其感知模塊為神經網絡結構,而決策規劃模塊則是基于規則(以工程師定義規則為主)網絡與神經網絡相結合方案,因此
43、整個自動駕駛方案并非完全的端到端神經網絡。而 Fsd V12 版本的推出標志著決策規劃也進入到神經網絡階段,且實現了感知到決策規劃的端到端方案。參考自動駕駛方案,我們認為當前許多產品采用的workflow 模式可類比于自動駕駛的規則階段,而 Agent 進化之處在于讓它讓 AI 完成了從被動響應,到主動執行的躍遷,進入到模型驅動階段,進一步地也有望走入感知、決策規劃、執行三位一體的端到端模型。行業分析行業分析/傳媒傳媒 本報告版權屬于國投證券股份有限公司,各項聲明請參見報告尾頁。11 圖圖14.14.自動駕駛技術演進路徑自動駕駛技術演進路徑 資料來源:商湯公眾號、國投證券研究中心 2.2.產業
44、鏈:產業鏈:商業化模式仍處早期,關注三大主線下動態演化商業化模式仍處早期,關注三大主線下動態演化 基于上述技術的探討,我們認為基于上述技術的探討,我們認為模型能力仍在進化模型能力仍在進化、工具生態的豐富性及使用效果仍有待優、工具生態的豐富性及使用效果仍有待優化,因此化,因此 AgentAgent 產品產品還在還在早期探索階段早期探索階段。若以前瞻視角討論商業化,。若以前瞻視角討論商業化,我們認為產業鏈我們認為產業鏈中以下中以下幾條主線值得重點關注:幾條主線值得重點關注:2.1.2.1.主線主線 1 1:模型開源與閉源:模型開源與閉源之爭之爭,對大模型廠商商業化能力最為關鍵對大模型廠商商業化能力
45、最為關鍵 模型分為兩種商業模式:模型分為兩種商業模式:1)閉源模式,科技大廠自研,支持自身產品的同時為其他 Agent 提供接口,如 OpenAI 使用 GPT-4o、o1 模型,谷歌使用 Gemini 2.0 模型;2)采用開源模型,以 Manus 為例,主要采用開源模型 Claude 3.5,此外常用的開源模型包括 Meta 旗下的 Lamma系列、阿里 Qwen 系列、DeepSeek-V3。通常閉源模型的能力更強,而開源模型成本更低。DeepSeekDeepSeek 強能力強能力+低成本,有望強化開源生態。低成本,有望強化開源生態。2025 年 Deepseek-V3 上線并同步開源,
46、其能力基本達到 GPT-4o 的水平(詳見圖 5),處于行業前列,同時成本顯著下降,以每百萬 token輸入價格來看,GPT-4o 為 1.25-2.5 美元,而 DeepSeek-V3 則為 0.014-0.14 美元。強大的模型能力與極低的算力成本進一步推動開源生態的繁榮,有望刺激下游應用的探索。表表3 3:模型模型 APIAPI 定價(每百萬定價(每百萬 TokenToken)模型模型 輸入價格(美元輸入價格(美元/百萬百萬 tokenstokens)輸出價格(美元輸出價格(美元/百萬百萬tokenstokens)DeepSeek-R1 0.14(緩存命中)/0.55(未命中)2.19
47、OpenAI o3-mini 0.55(緩存命中)/1.10(未命中)4.40 OpenAI o1-mini 0.55(緩存命中)/1.10(未命中)4.40 OpenAI o1 7.50(緩存命中)/15.00(未命中)60.00 DeepSeek-V3 0.014(緩存命中)/0.14(未命中)0.28 OpenAI GPT-4o-mini 0.075(緩存命中)/0.15(未命中)0.60 OpenAI GPT-4o 1.25(緩存命中)/2.50(未命中)10.00 資料來源:智東西、國投證券證券研究所 我們認為開源與閉源之爭的影響將落在大模型廠商的商業化問題上,特別是對 OpenAI
48、、谷歌等頭部廠商,目前 OpenAI 在模型路徑上仍具備前瞻性,比如 OpenAI 率先推出 o1 等,開源廠商仍處在追趕階段。如果科技大廠保持領先,則有望通過 API 定價獲得收益;如 DeepSeek等開源廠商與 OpenAI 的差距持續縮小,那么閉源廠商通過授權 API 獲得收益的商業模式下將無法體現出性價比優勢,可能會直接下場做產品進行變現,從而產業鏈上模型、產品公司的競爭邊界可能模糊,影響產業鏈價值的分配。行業分析行業分析/傳媒傳媒 本報告版權屬于國投證券股份有限公司,各項聲明請參見報告尾頁。12 2.2.2.2.主線主線 2 2:科技大廠爭先下場,爭奪:科技大廠爭先下場,爭奪產業鏈
49、潛在價值點產業鏈潛在價值點 我們梳理了國內外科技大廠目前在 Agent 方向的布局,2025 年頭部科技大廠都在 AI Agent上重點布局,從產品能力來看:1)基本以當前市場上領先的推理模型為基座,包括 GPT-4o、o3、Claude 3.5、通義千問等;2)網頁瀏覽、交互為基本功能,在此基礎上不同廠商對數據分析、代碼等工具有所側重,阿里在云上支持 MCP,在嘗試借助標準化協議培養生態。表表4 4:國內外科技大廠代表性國內外科技大廠代表性 AgentAgent 產品產品 發布團隊發布團隊 代表產品代表產品 發布時間發布時間 模型層模型層 支持工具支持工具 產品特點產品特點 OpenAI O
50、perator 2025.1.23 GPT-4o 通過瀏覽器“查看”(通過屏幕截圖)和“交互”(使用鼠標和鍵盤允許的所有操作)Deep Research 2025.2.2 OpenAI o3 使用瀏覽器和 Python 工具 Anthropic AI Agent 2024.10 Claude 3.5 Sonnet 屏幕內容解讀;按鈕選擇與文本輸入;網站瀏覽與實時互聯網搜索;多步驟任務執行(數十至數百步)結合多模態交互能力、強調安全性和可定制性、模擬人類操作計算機界面、支持動態工具調用與自主決策 Monicia Manus 2025.3.6 GPT-4、Claude 3.5等 支持 200+AP
51、I 的智能調用,包括網絡搜索、數據分析、代表編寫、文檔生成等 虛擬機沙盒、多智能體協作架構、目標導向型推理框架 字節跳動 扣子空間 2025.4.18 豆包 支持瀏覽器自動化、文件管理、代碼生成,并集成 MCP(模型上下文協議)擴展能力,可調用第三方工具(如語音合成、網絡爬蟲)。通過拖拽式畫布配置任務流程,支持 LLM參與或獨立執行,適用于企業知識庫調用、API 集成等場景。智譜 AutoGLM 2025.4 開源 GLM-4 基座模型與GLM-Z1 推理模型 實時搜索、動態工具調用、支持跨端(網頁、PC、手機)自主執行指令 阿里 百煉 MCP 服務 2025.4 通義千問 200+大模型、5
52、0+MCP 服務(如高德API、飛書文檔)資料來源:騰訊網、OpenAI 官網、Anthropic、AutoGLM、阿里云、國投證券證券研究所 從產業鏈位置進行劃分從產業鏈位置進行劃分,目前入局,目前入局 AgentAgent 的科技大廠主要分為的科技大廠主要分為四四類:類:1 1)云廠商,)云廠商,以微軟、阿里云為代表,在云基礎算力同質化競爭基礎上需要疊加構建 Agent 產品的模型、工具等增值服務,以體現差異化,進而推動客戶擴大云計算消耗規模,從而形成閉環;2 2)大模型廠商,)大模型廠商,以 OpenAI、Anthropic 為代表,引領全球模型的技術研究方向,但未來兩家公司側重可能會有
53、不同,OpenAI 推出 Operator,在 Agent 產品形態上的探索最快;Anthropic優先構建了 MCP 標準協議,未來有望構建開發者生態;3 3)互聯網大廠,)互聯網大廠,如谷歌、騰訊,基于自身業務場景需求儲備了 AI 技術能力,AI 進入后可能會重塑業務場景,因此必須積極防御,借助豐富的數據、用戶壁壘率先構建優勢;且這類公司基于互聯網的產品經驗,對用戶使用習慣有深刻洞察,在產品設計等層面有優勢;4 4)硬件終端廠商,)硬件終端廠商,以 Apple、華為、小米等為代表。我們認為硬件仍將是 AI Agent 直接面對消費者的載體,盡管其硬件形態或許不一定是手機,因此出于防御心態,
54、硬件廠商需要關注下一代硬件形態;其次,基于上述技術的討論,Agent 產品需要調用工具交互,在應用層面進行交互可能面臨硬件廠商與應用廠商之間的商務關系、利益分配,如果能直接從系統層級交互,則推進效率更高,因此把控系統能力的廠商具有優勢。我們認為以上四類公司本質上是基于自身資源稟賦在布局 AI 技術重塑產業后價值鏈重新分配的結構性機會,隨技術能力邊界逐步清晰后,有望進一步確定價值鏈的分配機制。2.3.2.3.主線主線 3 3:工具層適合中小公司入局,但模型與工具層邊界有待清晰工具層適合中小公司入局,但模型與工具層邊界有待清晰 MCPMCP、A2AA2A 協議推動產業鏈分化,工具協議推動產業鏈分化
55、,工具層層?;谏鲜瞿P?、工具層的演化,我們推斷工具層更適合中小公司入局,因為解決特定場景任務時:1)能夠借助開源模型能力,算力需求相對小,開發難度低,入局門檻更低;此前插件模式一經推出后,曾涌現出許多插件產品,曾被視為模型的“App Store”時刻;2)易于積累垂直場景數據科技大廠的人力成本較為昂貴,無法窮盡所有的長尾場景,會給創業公司留出一定空間。行業分析行業分析/傳媒傳媒 本報告版權屬于國投證券股份有限公司,各項聲明請參見報告尾頁。13 目前市場上涌現了許多 Agent 產品,覆蓋代碼、電商、教育等場景,一定程度上,類比移動互聯網時代 app 應用爆發的場景。目前做得比較成功的場景,任
56、務定義明確且高度重復、模塊化、場景注重信息檢索,我們預計未來會逐步走入垂直場景,特別是一些大模型廠商不愿意入場的場景(可能是因為適用用戶相對較少等),但深耕可以積累優勢的場景,通常這些場景創業公司基于人力成本、組織靈活等優勢才可以與科技大廠形成差異化。圖圖15.15.扣子空間合作客戶案例扣子空間合作客戶案例 資料來源:扣子空間、國投證券證券研究所 但是存在隱患但是存在隱患,模型與工具層的技術邊界有待清晰。,模型與工具層的技術邊界有待清晰。隨著模型層能力提升,工具層能力可能會被模型吞噬,類似于 Jasper,因此模型與工具層的技術邊界有待清晰,值得重點關注,對應地 Agent 工具的研發過程中需
57、要注重壁壘的構建,特別是數據壁壘、用戶使用習慣的養成,不斷提升用戶的遷移成本。3.3.投資建議投資建議 1)利好算力基礎設施,訓練垂直場景中長尾模型算力、推理算力等需求將增長,關注商湯、阿里巴巴、騰訊;2)端側硬件:手機、PC 等硬件終端支持 Agent 本地部署,對端側算力要求提升,也將引來換機周期,關注小米集團;3)端側芯片:手機等終端算力不足,對芯片性能仍有增長需求。4)To C:個人助手,關注現有 C 端應用、華為小藝等手機助手的升級迭代,關注小米集團、騰訊;5)To B:Mass 軟件平臺,用 AI 重塑 SaaS 等系統;私有化部署服務商,Agent 個性化需求解決仍不足,需要服務
58、商基于客戶場景進行私有化定制,關注第四范式、商湯、云從科技等。4.4.風險提示風險提示 技術進展不及預期:技術進展不及預期:Agent 的發展依賴于底層基礎模型等能力的提升,一旦其技術瓶頸短期無法突破,可能導致 Agent 產品的可用性較差,無法達到商業化標準。行業競爭加?。盒袠I競爭加?。捍溯?AI 競爭門檻較高,需要大算力及高密度人才,因此大廠相對具有競爭優勢,對行業內的其他廠商造成競爭壓力,影響其獲客能力。商業模式變化:商業模式變化:Agent 產業仍處于商業發展早期,商業模型還不成熟、穩定,商業模式的調整可能會對產業鏈上各方利益分配產生影響,導致部分公司業績受損。行業分析行業分析/傳媒傳
59、媒 本報告版權屬于國投證券股份有限公司,各項聲明請參見報告尾頁。14 行業行業評級體系評級體系 收益評級:領先大市 未來 6 個月的投資收益率領先滬深 300 指數 10%及以上;同步大市 未來 6 個月的投資收益率與滬深 300 指數的變動幅度相差-10%至 10%;落后大市 未來 6 個月的投資收益率落后滬深 300 指數 10%及以上;風險評級:A 正常風險,未來 6 個月的投資收益率的波動小于等于滬深 300 指數波動;B 較高風險,未來 6 個月的投資收益率的波動大于滬深 300 指數波動;分析師聲明分析師聲明 本報告署名分析師聲明,本人具有中國證券業協會授予的證券投資咨詢執業資格,
60、勤勉盡責、誠實守信。本人對本報告的內容和觀點負責,保證信息來源合法合規、研究方法專業審慎、研究觀點獨立公正、分析結論具有合理依據,特此聲明。本公司具備證券投資咨詢業務資格的說明本公司具備證券投資咨詢業務資格的說明 國投證券股份有限公司(以下簡稱“本公司”)經中國證券監督管理委員會核準,取得證券投資咨詢業務許可。本公司及其投資咨詢人員可以為證券投資人或客戶提供證券投資分析、預測或者建議等直接或間接的有償咨詢服務。發布證券研究報告,是證券投資咨詢業務的一種基本形式,本公司可以對證券及證券相關產品的價值、市場走勢或者相關影響因素進行分析,形成證券估值、投資評級等投資分析意見,制作證券研究報告,并向本
61、公司的客戶發布。行業分析行業分析/傳媒傳媒 本報告版權屬于國投證券股份有限公司,各項聲明請參見報告尾頁。15 免責聲明免責聲明 本報告僅供國投證券股份有限公司(以下簡稱“本公司”)的客戶使用。本公司不會因為任何機構或個人接收到本報告而視其為本公司的當然客戶。本報告基于已公開的資料或信息撰寫,但本公司不保證該等信息及資料的完整性、準確性。本報告所載的信息、資料、建議及推測僅反映本公司于本報告發布當日的判斷,本報告中的證券或投資標的價格、價值及投資帶來的收入可能會波動。在不同時期,本公司可能撰寫并發布與本報告所載資料、建議及推測不一致的報告。本公司不保證本報告所含信息及資料保持在最新狀態,本公司將
62、隨時補充、更新和修訂有關信息及資料,但不保證及時公開發布。同時,本公司有權對本報告所含信息在不發出通知的情形下做出修改,投資者應當自行關注相應的更新或修改。任何有關本報告的摘要或節選都不代表本報告正式完整的觀點,一切須以本公司向客戶發布的本報告完整版本為準,如有需要,客戶可以向本公司投資顧問進一步咨詢。在法律許可的情況下,本公司及所屬關聯機構可能會持有報告中提到的公司所發行的證券或期權并進行證券或期權交易,也可能為這些公司提供或者爭取提供投資銀行、財務顧問或者金融產品等相關服務,提請客戶充分注意??蛻舨粦獙⒈緢蟾鏋樽鞒銎渫顿Y決策的惟一參考因素,亦不應認為本報告可以取代客戶自身的投資判斷與決策。
63、在任何情況下,本報告中的信息或所表述的意見均不構成對任何人的投資建議,無論是否已經明示或暗示,本報告不能作為道義的、責任的和法律的依據或者憑證。在任何情況下,本公司亦不對任何人因使用本報告中的任何內容所引致的任何損失負任何責任。本報告版權僅為本公司所有,未經事先書面許可,任何機構和個人不得以任何形式翻版、復制、發表、轉發或引用本報告的任何部分。如征得本公司同意進行引用、刊發的,需在允許的范圍內使用,并注明出處為“國投證券股份有限公司證券研究所”,且不得對本報告進行任何有悖原意的引用、刪節和修改。本報告的估值結果和分析結論是基于所預定的假設,并采用適當的估值方法和模型得出的,由于假設、估值方法和
64、模型均存在一定的局限性,估值結果和分析結論也存在局限性,請謹慎使用。國投證券股份有限公司對本聲明條款具有惟一修改權和最終解釋權。國投證券證券研究所國投證券證券研究所 深圳市深圳市 地地 址:址:深圳市福田區深圳市福田區福華一路福華一路 1 11 19 9 號安信金融大廈號安信金融大廈 3333 層層 郵郵 編:編:51804518046 6 上海市上海市 地地 址:址:上海市虹口區楊樹浦路上海市虹口區楊樹浦路 168168 號國投大廈號國投大廈 2828 層層 郵郵 編:編:200082200082 北京市北京市 地地 址:址:北京市西城區阜成門北大街北京市西城區阜成門北大街 2 2 號樓國投金融大廈號樓國投金融大廈 1515 層層 郵郵 編:編:100034100034