AI行業專題報告:工具生態逐步完善通用Agent曙光已現-250327(32頁).pdf

編號:620649 PDF  PPTX 32頁 3.21MB 下載積分:VIP專享
下載報告請您先登錄!

AI行業專題報告:工具生態逐步完善通用Agent曙光已現-250327(32頁).pdf

1、工具生態逐步完善,通用工具生態逐步完善,通用Agent曙光已現曙光已現計算機行業計算機行業分析師:耿軍軍郵箱:SAC執業資格證書編碼:S0020519070002AI行業專題報告行業專題報告投資評級推薦維持證券研究報告證券研究報告2025年年3月月27日日分析師:王朗郵箱:SAC執業資格證書編碼:S0020525020001請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分目錄目錄 第一部分:第一部分:Agent是人類的模仿者,調用工具來完成復雜任務是人類的模仿者,調用工具來完成復雜任務 第二部分:模型與工具并舉,助力第二部分:模型與工具并舉,助力Agent成熟與普及成熟與普及

2、第三部分:第三部分:GUI Agent浪潮迭起,自主性通用性不斷提升浪潮迭起,自主性通用性不斷提升 風險提示風險提示2請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分1 Agent是人類的模仿者,調用工具來完成復雜任務是人類的模仿者,調用工具來完成復雜任務31AI Agent能夠自主使用工具完成目標能夠自主使用工具完成目標AI Agent能使用工具來在現實世界中獲取實時信息或給出行動建議,為此,模型需要訪問外部工具,自主規劃和執行任務。寬泛地來說,生成式AIAgent可以被定義為一個應用程序,通過觀察周圍世界并使用可用的工具來實現其目標。Agent是自治的(autonomous

3、),只要提供了合適的目標,它們就能獨立行動,無需人類干預;即使是模糊的人類指令,Agent也可以推理出它接下來應該做什么,并采取行動,最終實現其目標。3圖:圖:AI Agent的運作范式的運作范式圖:圖:AI模型的運作范式模型的運作范式資料來源:Yu Huang,Roboraction.AILevels of AI Agents:from Rules to Large Language Models,國元證券研究所資料來源:Yu Huang,Roboraction.AILevels of AI Agents:from Rules to Large Language Models,國元證券研究所

4、請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分1 Agent是人類的模仿者,調用工具來完成復雜任務是人類的模仿者,調用工具來完成復雜任務41AI Agent能夠自主使用工具完成目標能夠自主使用工具完成目標Agent VS LLM:模型的知識僅限于其訓練數據,AI Agent通過工具連接外部系統,在模型自帶的知識之外,實時、動態擴展知識。模型缺乏原生邏輯層,需借助提示詞工程或使用推理框架(CoT、ReAct等)來形成復雜提示,指導模型進行預測,而AI Agent自帶原生認知架構,內置CoT、ReAct等推理框架或LangChain等編排框架。4模型模型AI Agent知識范圍知

5、識僅限于其訓練數據通過工具連接外部系統,能夠在模型自帶的知識之外,實時、動態擴展知識狀態與記憶無狀態,每次推理都跟上一次沒關系,除非在外部給模型加上會話歷史或上下文管理能力有狀態,自動管理會話歷史,根據編排自主決策進行多輪推理原生工具無有,自帶工具和對工具的支持能力原生邏輯層無。需要借助提示詞工程或使用推理框架(CoT、ReAct等)來形成復雜提示,指導模型進行預測有,原生認知架構,內置CoT、ReAct等推理框架或LangChain等編排框架表:表:AI Agent與與AI模型的區別模型的區別資料來源:Julia Wiesinger,Patrick Marlow,Vladimir Vusko

6、vic2024 Google團隊Agents白皮書,國元證券研究所請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分1 Agent是人類的模仿者,調用工具來完成復雜任務是人類的模仿者,調用工具來完成復雜任務52AI Agent基礎組件:模型、工具、記憶、規劃基礎組件:模型、工具、記憶、規劃5資料來源:Lilian WengLLM Powered Autonomous Agents,國元證券研究所AI Agent的基礎組件包括:模型(model)、工具(tool)、記憶(memory)、規劃(planning)。模型(model):Agent中用來做核心決策的大腦,可以是一個或多個

7、任何大小的模型。規劃(planning):將大型任務分解成較小的、可管理的子目標,從而高效處理復雜任務。工具(tool):基礎模型在文本和圖像生成方面非常強大,但無法與外部世界聯動,有了工具,Agent便能夠與外部數據和服務互動。記憶(memory):用于獲取、存儲、保留和稍后檢索信息的過程,幫助Agent積累經驗、自我進化,以更一致、合理有效的方式行動。圖:圖:LLM驅動的驅動的AI Agent系統系統請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分1 Agent是人類的模仿者,調用工具來完成復雜任務是人類的模仿者,調用工具來完成復雜任務62AI Agent的結構的結構mem

8、ory6圖:大模型智能體記憶方法圖:大模型智能體記憶方法資料來源:數據科學人工智能公眾號,國元證券研究所結構上,memory模塊通常包含短期記憶和長期記憶,短期記憶暫存最近的感知,長期記憶存儲重要信息供隨時檢索。格式上,可以用自然語言表達,或編碼為向量嵌入提高檢索效率;可以利用數據庫存儲,或組織為結構化列表表示內存語義。操作上,主要通過記憶讀取、寫入和反射三種機制與環境交互;讀取提取相關信息指導行動,寫入存儲重要信息,反射總結見解提升抽象水平。請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分1 Agent是人類的模仿者,調用工具來完成復雜任務是人類的模仿者,調用工具來完成復雜任

9、務72AI Agent的結構的結構planning復雜的任務通常涉及許多步驟,規劃(planning)作為一種結構化的思考過程,即組織思維、設定目標,并形成應對策略。Agent中推理和規劃的能力由LLM來實現,推理和規劃會賦予Agent學習的能力,有助于智能體學習積累知識和經驗。Agent可以對過去的行為進行自我批判和反思,從錯誤中吸取經驗,并為接下來的行動進行分析、總結,確保其與環境更好地保持一致,從而適應環境、更有效地執行任務并成功達成目標。7資料來源:AI應用研究Lab公眾號,國元證券研究所圖:圖:Agent的反思框架的反思框架請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款

10、部分1 Agent是人類的模仿者,調用工具來完成復雜任務是人類的模仿者,調用工具來完成復雜任務82AI Agent的結構的結構tools工具是基礎模型與外部系統進行實時、上下文感知的橋梁,目前主要有Functions、Extensions、Data Stores、Plugins等方式。Extensions:一種以標準化方式連接API與Agent的組件,使Agent能夠調用外部API,而不用管這些API背后的實現方式。Functions:模型可以設置一組已知的函數,根據規范決定何時使用哪個函數,以及函數需要哪些參數。Data Stores:向Agent提供增量數據,將傳入的文檔轉換為一組向量數據

11、庫嵌入(embedding),為Agent所用來提取信息,典型的例子是檢索增強生成(RAG)。8資料來源:Julia Wiesinger,Patrick Marlow,Vladimir Vuskovic2024 Google團隊Agents白皮書,國元證券研究所圖:圖:Data Stores允許允許Agent訪問各種格式的數據訪問各種格式的數據請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分1 Agent是人類的模仿者,調用工具來完成復雜任務是人類的模仿者,調用工具來完成復雜任務93AI Agent仍處于發展初期仍處于發展初期9圖:圖:Agent等級分類等級分類資料來源:Yu

12、Huang,Roboraction.AILevels of AI Agents:from Rules to Large Language Models,國元證券研究所L1級采用基于規則的AI;L2級轉而使用基于互動學習(IL)/強化學習(RL)的AI,并增添推理和決策能力;L3級改用基于LLM的AI替換互動學習/強化學習的方式,并增加記憶(Memory)與自我反思(reflection),達到專家級別性能;L4級在L3的基礎上,加強自我學習和泛化的能力,在特定任務上的表現超過人類;L5級在L4的基礎上,增加了個性(情感+性格)和協作行為(MultiAgent),性能表現全面超越人類。請務必閱讀

13、正文之后的免責條款部分請務必閱讀正文之后的免責條款部分目錄目錄 第一部分:第一部分:Agent是人類的模仿者,調用工具來完成復雜任務是人類的模仿者,調用工具來完成復雜任務 第二部分:模型與工具并舉,助力第二部分:模型與工具并舉,助力Agent成熟與普及成熟與普及 第三部分:第三部分:GUI Agent浪潮迭起,自主性通用性不斷提升浪潮迭起,自主性通用性不斷提升 風險提示風險提示10請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分2 模型與工具并舉,助力模型與工具并舉,助力Agent成熟與普及成熟與普及111AI Agent的工作原理的工作原理11圖:圖:Agent如何工作(以如

14、何工作(以ReAct推理框架為例)推理框架為例)資料來源:Julia Wiesinger,Patrick Marlow,Vladimir Vuskovic2024 Google團隊Agents白皮書,國元證券研究所AI Agent的響應質量依賴模型的推理能力和執行任務的能力的響應質量依賴模型的推理能力和執行任務的能力,包括選擇正確工具的能力包括選擇正確工具的能力,以及工具自身的好壞以及工具自身的好壞。AI Agent的工作可以類比廚師做菜:1)收集信息(輸入):顧客點的菜,后廚現有的食材等等;2)推理(思考):根據收集到的信息,判斷可以做哪些菜;3)做菜(行動):包括切菜、加調料、烹炒等等。在

15、以上每個階段,廚師(Agent)都根據需要進行調整,這個信息接收、規劃、執行和調整的循環描述的就是一個Agent用來實現目標的特定認知架構。Agent使用以上一種或多種推理技術(ReAct、Chain-of-Thought、Tree-of-Thoughts等),接受特定的用戶請求確定下一個最佳行動。請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分2 模型與工具并舉,助力模型與工具并舉,助力Agent成熟與普及成熟與普及122MultiAgent:群體協作提升系統性能:群體協作提升系統性能12為什么需要MultiAgent?隨著任務復雜度增加,單一智能體需要理解的語境和工具使用面

16、臨上下文窗口限制,導致性能下降;多智能體協作通過動態任務分解、專業化分工和協同工作克服這一挑戰,這種協作可能產生智能涌現,即系統整體表現超越單個智能體能力之和。多智能體系統協作模式:層級指揮模式下,指揮官智能體進行任務分解、整合各專家智能體返回的結果,專家智能體執行任務、返回結果。自由協作模式下,各個智能體分別交互,生成最終結果。多智能體框架包括OpenAI Swarm、AutoGen、MetaGPT等。圖:圖:MultiAgent的運作模式的運作模式資料來源:阿里云開發者公眾號,國元證券研究所圖:多智能體系統提升任務表現圖:多智能體系統提升任務表現資料來源:阿里云開發者公眾號,國元證券研究所

17、請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分2 模型與工具并舉,助力模型與工具并舉,助力Agent成熟與普及成熟與普及133MCP:AI工具統一接口,釋放工具統一接口,釋放Agent空前潛力空前潛力當大語言模型與外部系統交互,一個企業面對不同的框架或系統,都需要參考其協議,去開發對應Tool,這是一個非常重復的工作。MCP(Model Context Protocol,模型上下文協議)是Anthropic在2024年11月推出的一種開放協議,目的在于統一目的在于統一LLM和外部數據和外部數據源源、工具之間的通信協議工具之間的通信協議,支持多種大模型支持多種大模型,可類比可類

18、比AI應用程序的應用程序的USB-C接口接口。MCP組件:主機(MCP Host)是用戶與AI互動的應用程序(如Claude Desktop、IDE);服務器(MCP Server)位于工具端(如Slack、數據庫),能給予AI訪問特定資源的權限;客戶端(MCP Server)負責把AI的指令發送給服務端。13資料來源:騰訊云智慧傳媒公眾號,國元證券研究所圖:圖:MCP架構圖架構圖請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分2 模型與工具并舉,助力模型與工具并舉,助力Agent成熟與普及成熟與普及143MCP:AI工具統一接口,釋放工具統一接口,釋放Agent空前潛力空前潛

19、力圍繞MCP協議的生態系統正在逐步形成,有望重塑AI Agent格局,帶來新一代自主、多模態、深度集成的AI體驗。MCP客戶端:目前高質量的MCP客戶端主要集中在編碼領域,但隨著MCP協議成熟普及,未來有望涌現出更多面向商業應用場景的MCP客戶端。MCP 市 場 和 服 務 器 托 管 解 決 方 案:mcpt、Smithery和OpenTools等平臺,正在努力構建MCP服務器的“應用商店”,讓開發者能夠更方便地發現、分享和貢獻新的MCP服務器,有助于標準化高質量MCP服務器的訪問,讓AI Agent能夠動態地選擇和集成所需的工具。服務器生成工具(如Mintlify,Stainless)正在

20、降低創建MCP兼容服務的門檻。14圖:圖:MCP核心模塊核心模塊資料來源:a16z官網,國元證券研究所請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分目錄目錄 第一部分:第一部分:Agent是人類的模仿者,調用工具來完成復雜任務是人類的模仿者,調用工具來完成復雜任務 第二部分:模型與工具并舉,助力第二部分:模型與工具并舉,助力Agent成熟與普及成熟與普及 第三部分:第三部分:GUI Agent浪潮迭起,自主性通用性不斷提升浪潮迭起,自主性通用性不斷提升 風險提示風險提示15請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分3 GUI Agent浪潮迭起,自主性通

21、用性不斷提升浪潮迭起,自主性通用性不斷提升161GUI Agent從規則驅動邁向自治的端到端應用從規則驅動邁向自治的端到端應用16圖:圖:GUI Agent的發展歷程的發展歷程資料來源:ByteDance Seed,Tsinghua UniversityUI-TARS:Pioneering Automated GUI Interaction with Native Agents,國元證券研究所2024年10月,Anthropic發布了Claude 3.5 Sonnet,并加持Computer Use”能力,使其成為首個以圖形用戶界面(GUI)Agent形式,可在公開測試中控制電腦的AI模型;2

22、025年1月,OpenAI推出了Operator及其核心模型Computer-Using Agent(CUA),僅限$200/月的Pro用戶;2025年3月,Monica團隊發布“全球首款通用型AI Agent”的Manus,進一步將Computer Use Agent的概念推向產品化。請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分2025年1月24日,OpenAI發布AIAgent Operator,能在瀏覽器上執行簡單在線任務的網絡應用,如預訂音樂會門票、在線訂購雜貨等。關鍵技術:由基于GPT-4o構建的新模型Computer-Using Agent(CUA)提供支持,C

23、UA通過處理原始像素數據以了解屏幕上發生的情況,并使用虛擬鼠標和鍵盤完成操作,可以導航多步驟任務、處理錯誤并適應意外變化。Operator全計算機使用任務成功率:OSWorld(38.1%),WebArena(58.1%),WebVoyager(87%),超越之前最先進的基準結果;落后于人類在OS World測試中的表現(72.4%)。3 GUI Agent浪潮迭起,自主性通用性不斷提升浪潮迭起,自主性通用性不斷提升172OpenAI推出首款推出首款AI Agent Operator17圖:圖:Computer-Using Agent(CUA)運作機制運作機制資料來源:OpenAI官網,國元證

24、券研究所圖:圖:Computer-Using Agent(CUA)在在OS World基準測試中的表現基準測試中的表現資料來源:OpenAI官網,國元證券研究所請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分2025年3月12日,OpenAI發布全新Agents工具,旨在簡化Agent的開發,包括:1)新的Responses API:兼具Chat Completions API的簡單性和Assistants API的工具使用能力,支持此次新的三種內置工具;2)新的Agents SDK:開源,輕量且強大的框架,用于編排單Agent和多Agent工作流;3)三種內置工具:網絡搜索(

25、web search)、文件搜索(file search)、電腦使用(computer use)。OpenAI Agent SDK以開源以開源、易用搶占生態卡位易用搶占生態卡位,推動推動AI Agent在各行業的大規模部署:在各行業的大規模部署:目前流行的Agent開發框架如LangChain上手成本較高,其內部高度抽象的設計往往需要開發者深入理解原理才能靈活使用,而OpenAI的Agent SDK采用模塊化、可擴展的設計,提高了系統的靈活性和可擴展性,使得開發者能夠構建高度自定義的Agent應用。3 GUI Agent浪潮迭起,自主性通用性不斷提升浪潮迭起,自主性通用性不斷提升182Open

26、AI開源開源Agent SDK,助力,助力Agent應用開發應用開發18圖:圖:Agent SDK應用場景廣泛應用場景廣泛資料來源:小籽研記公眾號,國元證券研究所請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分Agent SDK提供了一個輕量且強大的架構,核心圍繞著幾個關鍵概念:Agent(代理)、Tools(工具)、AgentLoop(代理循環)、Handoff(任務交接)、Guardrails(任務護欄)、Tracing(任務狀態跟蹤)Agent:由開發者賦予特定角色的LLM實例,能夠使用各種工具來執行任務。Agent Loop(代理循環):代理自動執行任務的迭代過程。Ha

27、ndoff(任務交接):多Agent開發環境中,允許一個Agent將子任務交給另一個Agent,或將一個Agent的輸出作為另一個的輸入,簡化多Agent協作工作流。Guardrails(任務護欄):通過預定義的規則來驗證Agent的行為,確保安全性和可靠性。Tracing(任務狀態跟蹤):OpenAI在官方工作臺中提供了一個追蹤面板,開發者可在其中可視化所有代理的行為。3 GUI Agent浪潮迭起,自主性通用性不斷提升浪潮迭起,自主性通用性不斷提升192OpenAI開源開源Agent SDK,助力,助力Agent應用開發應用開發19圖:圖:OpenAI Agents SDK架構圖架構圖資料

28、來源:閑話AI公眾號,國元證券研究所請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分3 GUI Agent浪潮迭起,自主性通用性不斷提升浪潮迭起,自主性通用性不斷提升203中國創業團隊發布通用中國創業團隊發布通用AI Agent產品產品Manus2025年3月6日,中國創業團隊Monica發布一款名為Manus的產品,在評估通用人工智能助手解決現實世界問題的GAIA基準測試中,Manus取得了最先進(SOTA,State-of-the-Art)的成績,性能超越OpenAI Deep Research。作為全球首款真正意義上的通用AI Agent,Manus能夠獨立思考、規劃并執

29、行復雜任務,直接交付完整成果。其名稱來源于拉丁語Mens et Manus”,意為手腦并用,將知識用手執行。20圖:圖:Manus在在GAIA基準測試表現優秀基準測試表現優秀圖:圖:Manus官網使用案例官網使用案例資料來源:甲子光年公眾號,國元證券研究所資料來源:甲子光年公眾號,國元證券研究所請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分Manus產品團隊的創始人肖弘畢業于華中科技大學。2015年畢業后,肖弘創立夜鶯科技,專注于企業微信SaaS工具,推出了“微伴助手”“壹伴助手”,為企業提供高效的社交營銷工具。獲得騰訊、真格基金等知名投資機構數億元投資,服務超200萬B端用

30、戶。2022年,創立Monica,專注海外市場,這是一款All-in-One的AI助手,用戶在瀏覽器中點開圖標,就能直接使用其接入的各大主流模型。2023年,Monica通過收購熱門插件ChatGPT for Google迅速擴展用戶規模。收購后,Monica構建起AI工具矩陣,滿足不同場景需求。目前,Monica累計用戶已突破700萬,穩居AI Chrome插件第一梯隊。2024年7月,肖弘攜張濤、首席科學家季逸超共同創立Manus AI。張濤曾在字節跳動負責國際化產品,隨后在光年之外擔任產品負責人。季逸超在高二期間,便獨立開發了“猛犸瀏覽器”(Mammoth),這款瀏覽器在蘋果應用商店上線

31、后,迅速獲得了大量用戶的青睞。3 GUI Agent浪潮迭起,自主性通用性不斷提升浪潮迭起,自主性通用性不斷提升213Manus創始團隊創始團隊21圖:圖:Monica網頁版界面網頁版界面資料來源:Monica官網,國元證券研究所請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分提示詞:我是一名中學物理老師,正準備教授動量守恒定律。您能否創建一系列清晰準確的演示動畫,并將它們整理成一個簡單的HTML演示文稿?3 GUI Agent浪潮迭起,自主性通用性不斷提升浪潮迭起,自主性通用性不斷提升223Manus使用案例使用案例22資料來源:賽博禪心公眾號,國元證券研究所圖:圖:Manu

32、s使用案例使用案例請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分提示詞:我想要一份特斯拉股票的全面分析,包括:概述:公司概況、關鍵指標、業績數據和投資建議,財務數據:收入趨勢、利潤率、資產負債表和現金流分析,市場情緒:分析師評級、情緒指標和新聞影響,技術分析:價格趨勢、技術指標和支撐/阻力水平資產比較:市場份額和與主要競爭對手的財務指標對比價值投資者:內在價值、增長潛力和風險因素投資論點:SWOT分析和針對不同類型投資者的建議。3 GUI Agent浪潮迭起,自主性通用性不斷提升浪潮迭起,自主性通用性不斷提升233Manus使用案例使用案例23資料來源:賽博禪心公眾號,國元證

33、券研究所圖:圖:Manus使用案例使用案例請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分從技術實現角度來看,Manus的本質是“虛擬機+compute use+artifacts+多Agent協同”,核心是對現有Cursor類產品的再封裝,降低使用門檻,讓非技術用戶也能更輕松地利用AI進行復雜任務編排。Manus首席科學家對Less Structure,more Intelligence”設計哲學的闡釋:當你的數據足夠優質、模型足夠智能、架構足夠靈活、工程足夠扎實,那么Computer Use、Deep Research、CodingAgent等概念就從產品特性變為了自然涌現

34、的能力。在產品設計上,將人類通用可理解的做事過程展示給用戶,可通過對過程的反饋來糾正結果,進一步加深了可控性。3 GUI Agent浪潮迭起,自主性通用性不斷提升浪潮迭起,自主性通用性不斷提升243Manus創新點創新點24圖:圖:Manus產品理念產品理念Less structure,more intelligence圖:圖:Manus將執行過程全方位展示給用戶將執行過程全方位展示給用戶資料來源:蘭度的CoT公眾號,國元證券研究所資料來源:極客公園公眾號,國元證券研究所請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分3 GUI Agent浪潮迭起,自主性通用性不斷提升浪潮迭起

35、,自主性通用性不斷提升253Manus架構:模塊化的架構:模塊化的Multi Agent系統系統Manus架構是典型的Multi-Agent系統,每個代理可能基于獨立的語言模型或強化學習模型,彼此通過API或消息隊列通信。同時每個任務也都在沙盒中運行,避免干擾其他任務,同時支持云端擴展。規劃模塊:規劃模塊是Manus的“大腦”,負責理解用戶意圖,將復雜任務分解為可執行的步驟,并制定執行計劃。該模塊實現:任務理解與分析、任務分解與優先級排序、執行計劃制定、資源分配與工具選擇、語義理解與意圖識別(NLU)、復雜任務分解為DAG結構、異常處理與流程優化。記憶模塊:存儲和利用歷史信息,提高任務執行的連

36、貫性和個性化程度。該模塊管理三類關鍵信息:用戶偏好、歷史交互、中間結果。工具使用模塊:負責實際執行各種操作。該模塊能夠調用和使用多種工具來完成任務,包括:網絡搜索與信息檢索、數據分析與處理、代碼編寫與執行、文檔生成、數據可視化。25圖:以圖:以Manus為例的為例的Multi-Agent智能體系統工作流程智能體系統工作流程資料來源:架構師公眾號,國元證券研究所請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分2025年1月,字節跳動開源智能體系統TARS,基于自研原生GUI(圖形用戶界面)代理模型UI-TARS,能通過屏幕視覺解析與動作序列規劃,自動完成機票預訂等跨應用操作;支持

37、MCP,能夠更靈活地對接各類模型并整合新功能,以適應復雜多變的業務環境。在多項基準測試中表現出色:在VisualWebBench、WebSRC和ScreenQA-short等評測感知能力的基準上,取得領先;在定位能力評測基準ScreenSpot Pro、ScreenSpot和ScreenSpot v2上也表現優異。3 GUI Agent浪潮迭起,自主性通用性不斷提升浪潮迭起,自主性通用性不斷提升264字節開源通用型字節開源通用型AI Agent產品產品TARS26圖:圖:TARS官網使用案例:搜索、分析并總結英偉達過去一年的股價官網使用案例:搜索、分析并總結英偉達過去一年的股價資料來源:TAR

38、S官網,國元證券研究所圖:圖:UI-TARS基準測試中的表現刷線基準測試中的表現刷線SOTA資料來源:ByteDance Seed,Tsinghua UniversityUI-TARS:Pioneering Automated GUI Interaction with Native Agents,國元證券研究所請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分3 GUI Agent浪潮迭起,自主性通用性不斷提升浪潮迭起,自主性通用性不斷提升275國內國內AI Agent產品羅盤產品羅盤27資料來源:InfoQ官網,國元證券研究所圖:國內圖:國內AI Agent產品羅盤產品羅盤請務

39、必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分目錄目錄 第一部分:第一部分:Agent是人類的模仿者,調用工具來完成復雜任務是人類的模仿者,調用工具來完成復雜任務 第二部分:模型與工具并舉,助力第二部分:模型與工具并舉,助力Agent成熟與普及成熟與普及 第三部分:第三部分:GUI Agent浪潮迭起,自主性通用性不斷提升浪潮迭起,自主性通用性不斷提升 風險提示風險提示28請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分風險提示風險提示29 AI大模型技術進展不及預期的風險;AI Agent技術進展不及預期的風險;AI Agent商業化落地不及預期的風險;行業競爭

40、加劇的風險。請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分30(1)公司評級定義)公司評級定義(2)行業評級定義)行業評級定義 買入 股價漲幅優于基準指數 15%以上 推薦 行業指數表現優于基準指數 10%以上 中性 行業指數表現相對基準指數介于-10%10%之間 回避 行業指數表現劣于基準指數 10%以上 增持 股價漲幅相對基準指數介于 5%與 15%之間 持有 股價漲幅相對基準指數介于-5%與 5%之間 賣出 股價漲幅劣于基準指數 5%以上 投資評級說明投資評級說明備注:評級標準為報告發布日后的6個月內公司股價(或行業指數)相對同期基準指數的相對市場表現,其中A股市場基準

41、為滬深300指數,香港市場基準為恒生指數,美國市場基準為標普500指數或納斯達克指數,新三板基準指數為三板成指(針對協議轉讓標的)或三板做市指數(針對做市轉讓標的),北交所基準指數為北證50指數。分析師聲明分析師聲明作者具有中國證券業協會授予的證券投資咨詢執業資格或相當的專業勝任能力,以勤勉的職業態度,獨立、客觀地出具本報告。本人承諾報告所采用的數據均來自合規渠道,分析邏輯基于作者的職業操守和專業能力,本報告清晰準確地反映了本人的研究觀點并通過合理判斷得出結論,結論不受任何第三方的授意、影響,特此聲明。請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分31證券投資咨詢業務的說明證

42、券投資咨詢業務的說明根據中國證監會頒發的經營證券業務許可證(Z23834000),國元證券股份有限公司具備中國證監會核準的證券投資咨詢業務資格。證券投資咨詢業務是指取得監管部門頒發的相關資格的機構及其咨詢人員為證券投資者或客戶提供證券投資的相關信息、分析、預測或建議,并直接或間接收取服務費用的活動。證券研究報告是證券投資咨詢業務的一種基本形式,指證券公司、證券投資咨詢機構對證券及證券相關產品的價值、市場走勢或者相關影響因素進行分析,形成證券估值、投資評級等投資分析意見,制作證券研究報告,并向客戶發布的行為。法律聲明法律聲明本報告由國元證券股份有限公司(以下簡稱“本公司”)在中華人民共和國境內(

43、臺灣、香港、澳門地區除外)發布,僅供本公司的客戶使用。本公司不會因接收人收到本報告而視其為客戶。若國元證券以外的金融機構或任何第三方機構發送本報告,則由該金融機構或第三方機構獨自為此發送行為負責。本報告不構成國元證券向發送本報告的金融機構或第三方機構之客戶提供的投資建議,國元證券及其員工亦不為上述金融機構或第三方機構之客戶因使用本報告或報告載述的內容引起的直接或連帶損失承擔任何責任。本報告是基于本公司認為可靠的已公開信息,但本公司不保證該等信息的準確性或完整性。本報告所載的信息、資料、分析工具、意見及推測只提供給客戶作參考之用,并非作為或被視為出售或購買證券或其他投資標的的投資建議或要約邀請。

44、本報告所指的證券或投資標的的價格、價值及投資收入可能會波動。在不同時期,本公司可發出與本報告所載資料、意見及推測不一致的報告。本公司建議客戶應考慮本報告的任何意見或建議是否符合其特定狀況,以及(若有必要)咨詢獨立投資顧問。在法律許可的情況下,本公司及其所屬關聯機構可能會持有本報告中所提到的公司所發行的證券頭寸并進行交易,還可能為這些公司提供或爭取投資銀行業務服務或其他服務,上述交易與服務可能與本報告中的意見與建議存在不一致的決策。請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分32免責條款免責條款本報告是為特定客戶和其他專業人士提供的參考資料。文中所有內容均代表個人觀點。本公司

45、力求報告內容的準確可靠,但并不對報告內容及所引用資料的準確性和完整性作出任何承諾和保證。本公司不會承擔因使用本報告而產生的法律責任。本報告版權歸國元證券所有,未經授權不得復印、轉發或向特定讀者群以外的人士傳閱,如需引用或轉載本報告,務必與本公司研究所聯系并獲得許可。國元證券研究所國元證券研究所合肥合肥 上海上海 北京北京 地址:安徽省合肥市梅山路 18 號安徽國際金融中心 A 座國元證券 地址:上海市浦東新區民生路 1199 號證大五道口廣場 16 樓國元證券 地址:北京市東城區東直門外大街 46 號天恒大廈 A 座 21 層國元證券 郵編:230000 郵編:200135 郵編:100027

友情提示

1、下載報告失敗解決辦法
2、PDF文件下載后,可能會被瀏覽器默認打開,此種情況可以點擊瀏覽器菜單,保存網頁到桌面,就可以正常下載了。
3、本站不支持迅雷下載,請使用電腦自帶的IE瀏覽器,或者360瀏覽器、谷歌瀏覽器下載即可。
4、本站報告下載后的文檔和圖紙-無水印,預覽文檔經過壓縮,下載后原文更清晰。

本文(AI行業專題報告:工具生態逐步完善通用Agent曙光已現-250327(32頁).pdf)為本站 (蘆葦) 主動上傳,三個皮匠報告文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對上載內容本身不做任何修改或編輯。 若此文所含內容侵犯了您的版權或隱私,請立即通知三個皮匠報告文庫(點擊聯系客服),我們立即給予刪除!

溫馨提示:如果因為網速或其他原因下載失敗請重新下載,重復下載不扣分。
客服
商務合作
小程序
服務號
折疊
午夜网日韩中文字幕,日韩Av中文字幕久久,亚洲中文字幕在线一区二区,最新中文字幕在线视频网站