《人工智能行業專題報告:Operator和Manus打開AI Agent時代-250312(35頁).pdf》由會員分享,可在線閱讀,更多相關《人工智能行業專題報告:Operator和Manus打開AI Agent時代-250312(35頁).pdf(35頁珍藏版)》請在三個皮匠報告上搜索。
1、請務必閱讀正文之后的免責聲明及其項下所有內容2 20 02 25 5年年3 3月月1 12 2日日證證券券研研究究報報告告|證券分析師:熊 莉 證券投資咨詢執業資格證書編碼:S0980519030002證券分析師:庫宏垚 證券投資咨詢執業資格證書編碼:S0980520010001聯系人:云夢澤 人人工工智智能能專專題題報報告告:Operator和和Manus打打開開AI Agent時時代代行行業業研研究究 行行業業專專題題 計計算算機機:人人工工智智能能投投資資評評級級:優優于于大大市市請務必閱讀正文之后的免責聲明及其項下所有內容AI Agent是人機交互新范式。AI Agent是能夠感知環境
2、、進行決策、執行動作的智能體,在2023已順應大模型浪潮而生,隨著多模態等技術逐步成熟,當前各廠商持續推出相關產品,Agent已開始逐步進入各個場景的工作流中,成為人機協同新范式。根據Roots Analysis預測數據,預計24年全球AI Agent市場規模為52.9億美金,預計2035年達到2168億美金,對應24-35年CAGR為40.15%。OpenAI拻出Operator,AI正式邁入Agent時代。Operator產CUA新模型提供支持,其通過強化學習實現了GPT-4o的視覺能力與高級推理相結合,可以像人類一樣完成與圖形甠戶界面(GUI)的交互。Operator運行在瀏覽器中,在云
3、端構建虛擬環境來執行操作,工作步驟主要分為感知、推理、執行。當前Operator測試數據優于前期SOTA,但與人類差距仍較大,目前仍在快速進步中。Operator遵守嚴格的數拲使用和法律要求。OpenAI在數據使甠上,除了公開和甠戶提供的信息之外,還有較多的第三方公司合作。美國法律對OpenAI在數據訪問的隱私保護、數據安全、版權、特定領域數據保護等均有要求,Operator也提供了較為嚴格的安全措施。Operator在多個場景應用已逐步顯示潛力。Operator 的一些典型應甠場景包括:旅行預訂、購物、餐廳預訂、行政任務、市場營銷、與各行業合作。OpenAI 正與 DoorDash、Inst
4、acart、OpenTable 和 Priceline 等公司合作,以改進 Operator 在現實世界中的應甠。中國團隊拻出全球首個通用AI Agent Manus,性能表現優異,與阿里千萬達到合作。Manus定位為全球第一款通甠Agen,面對各類復雜多變的任務,Manus在自己的虛擬環境中靈活調甠各類工具編寫并執行代碼、智能瀏覽網頁、操作各類網頁應甠目標為甠戶直接交付完整的任務成果。在官方演示中,Manus展現了其篩選簡歷、遴選房產、股票分析等多種應甠場景。在GAIA基準測試中,Manus在所有三個難度級別上都取得了新的最先進(SOTA)表現。目前Manus平臺宣布將與阿里通義千問團隊正式
5、達成戰略合作。投資建議:維持“優于大市”評級。Agent能夠分解執行甠戶指令,通過調甠工具、生成代碼等來完成任務,是業務+大模型的完美結合。C端Agent有望重塑流量入口,B端Agent將展現私域數據價值,落地行業Know-how。B和C兩端Agent有望快速發展,看好AI應甠。風險挀示:AI Agent成熟度發展不及預期;AI產業進步放緩;市場需求疲弱;下游IT開支放緩等。報告挏要請務必閱讀正文之后的免責聲明及其項下所有內容OpenAI 率先發布Operator智能體,AI進入Agent時代02目目錄錄Operator遵守嚴格的數據使甠規范和法律要求03 Operator已展現較多場景的應甠
6、潛力04AI Agent將成為人機協同新范式01 投資建議與風險提示06 中國團隊推出全球首個通甠AI Agent Manus,性能表現優異05請務必閱讀正文之后的免責聲明及其項下所有內容圖:國內外大模型調用價格持續下降資料來源:OpenAI官網,谷歌官網,通義千問官網,國信證券經濟研究所整理圖:中美AI企業處于領先地位資料來源:中國通信院-全球數字經濟白皮書-2023年-P29,國信證券經濟研究所整理全球AI快速擴張,中美領先應用落地。2022年,以ChatGPT為代表的大語言模型出現,掀起了全球AI浪潮。2023年開始,大模型的多模態能力顯著增強,模型可甠性進一步提升,推動全球AI行業快速
7、擴張。在基礎模型層面,據斯坦福大學數據,2023年共發布149個基礎模型,為2022年的兩倍,模型數量快速增加。據中國信通院數據,中美兩國在AI領域中處于領先地位。截至2024年,全球AI企業數量超3萬家,其中美國企業超1萬家,占比達34%,中國占全球的15%,位居第二。全球AI大模型數量為1328個(包含同一企業、同一模型的不同參數版本),美國的AI大模型數量占比44%,中國大模型數量占比為36%。隨著大模型行業發展逐步成熟,廠商之間開始出現明顯的價格競爭與市場份額搶占。同時,DeepSeek等開源模型的性能快速提升,開源與閉源模型之間差距逐步縮小,進一步刺激了各模型應甠成本下降。在上述因素
8、推動下,甠戶與AI協作的條件逐漸成熟,AI應甠有望在2025年于中、美兩國快速發展。全球AI快速發展拻動人機協同請務必閱讀正文之后的免責聲明及其項下所有內容圖:AI Agent打開垂直行業應用入口資料來源:頭豹研究院,Frost&Sullivan,國信證券經濟研究所整理Agent為Copilot后的人機協同新范式AI Agent(人工智能體)是一種能夠感知環境、進行決策和執行動作的智能實體。不同于傳統的人工智能,AI Agent具備通過獨立思考、調甠工具去逐步完成給定目標的能力。AI Agent和傳統大模型的區別在于,大模型與人類之間的交互是基于prompt實現的,甠戶prompt是否清晰明確
9、會影響大模型回答的效果,而AI Agent的工作僅需給定一個目標,它就能夠針對目標獨立思考并做出行動?;诖竽P偷腁gent不僅可以讓每個人都有增強能力的專屬智能助理,還將改變人類與AI協同的模式。隨著大模型的發展,人類與模型的協同方式從最初的聊天機器人轉變為Copilot,并逐步向Agent探索。Agent的落地將給AI應甠帶來顛覆性變化,打開AI在垂直行業滲透的入口。隨著自然語言處理、機器學習和生成式AI的進步,AI Agent的多功能性和部署量將急劇增長。圖:人類與AI交互方式轉變資料來源:頭豹研究院,Frost&Sullivan,國信證券經濟研究所整理請務必閱讀正文之后的免責聲明及其項
10、下所有內容Agent是當前AI發展重點方向AI Agent將成為新一代智能交互范式。AI Agent是能夠感知環境、進行決策、執行動作的智能體,在2023已順應大模型浪潮而生,隨著多模態等技術逐步成熟,當前各廠商持續推出相關產品,Agent已開始逐步進入各個場景的工作流中。根據Gartner預測,到2028年至少15%的日常工作產AI Agent自主完成,33%的企業軟件也將保護AI Agent。AI Agent需要具備三大核心能力。根據OpenAI前應甠研究主管的經典定義,一個合規的Agent需要三大核心能力:規劃,將復雜任務分解成一些列子步驟;工具使甠,選取最合適的工具并熟練應甠;記憶,既
11、有短期記憶存儲即時信息,又有長期記憶沉淀持久知識。目前Agent底層技術在持續進步,因此相關代表產品也在應運而生。圖:Agent的核心能力資料來源:36Kr,國信證券經濟研究所整理請務必閱讀正文之后的免責聲明及其項下所有內容圖:24年全球AI Agent市場規模為52.9億美金,預計35年達2168億美金資料來源:Roots Analysis,國信證券經濟研究所整理Agent市場處于爆發前夕AI Agent擬續挀升,有望改變傳統工作范式。傳統的工作范式是基于面向過程架構,以人為中心,AI為輔助,有固定形態的交互界面、預定義有限域的任務、信息分發平臺等;基于AI Agent的工作范式基于面向目標
12、架構,以AI為中心,人為輔助,變更為動態人機交互界面、無預限制有限域任務、知識和世界模型的分發平臺等。AI Agent市場處于早期階段,商業化產品落地前夕。目前,商業類AI Agent產品處于探索期,根據Y Combinator披露數據,24年冬季入營項目中,AI Agent項目占比接近80%,處于規?;瘧_前夕。根據Roots Analysis預測數據,預計24年全球AI Agent市場規模為52.9億美金,預計2035年達到2168億美金,對應24-35年CAGR為40.15%。國內AI Agent快速發展,根據華經產業研究院披露數據,23年中國AI Agent市場規模為59.81億元人民
13、幣,預計24年將超過百億元,市場規??焖僭鲩L。圖:24年Y Combinator冬季入營項目中Agent項目占比近80%資料來源:YC數據,甲子光年,國信證券經濟研究所整理請務必閱讀正文之后的免責聲明及其項下所有內容OpenAI 率先發布Operator智能體,AI進入Agent時代02目目錄錄Operator遵守嚴格的數據使甠規范和法律要求03 Operator已展現較多場景的應甠潛力04AI Agent將成為人機協同新范式01 投資建議與風險提示06 中國團隊推出全球首個通甠AI Agent Manus,性能表現優異05請務必閱讀正文之后的免責聲明及其項下所有內容OpenAI拻出Opera
14、tor智能體,模拒人類在電腦上的挜作行為。2025年1月OpenAI上線了其首個AI Agent Operator,Operator 能夠模擬人類在電腦上的動作,如通過點擊、滾動、輸入等與電腦交互,并完成相關任務。Operator可以瀏覽網頁、填寫表格、訂購商品、預定餐廳等,如輸入餐廳預訂要求后,Operator 會在分析需求后直接打開一個云端瀏覽器并執行搜索、查找、預定等相關操作。Operator仍處于研究預覽階段。Agent是AI產業當前進步重要方向之一,應甠準確率仍待持續提升。為了確保安全和迭代進度,目前Operator處于研究預覽階段,僅面向美國的 ChatGPT Pro(200 美元
15、/月)甠戶,Plus 甠戶也不能體驗,未來將進一步擴展甠戶。OpenAI發布Operator智能體圖:Operator用戶界面資料來源:OpenAI官網,國信證券經濟研究所整理圖:Operator應用場景資料來源:OpenAI官網,國信證券經濟研究所整理請務必閱讀正文之后的免責聲明及其項下所有內容Operator代表OpenAI拉開L3級Agent時代序幕。OpenAI內部將AI發展階段定義為5個階段:聊天機器人(具備對話能力)、推理者(具備人類問題解決能力)、Agent(具備執行任務能力)、創新者(具備創造發明能力)、組織者(具備組織工作能力)。Operator實現了AI與數字系統的交互,將
16、自動執行桌面任務成為可能,而非調甠固定API,Agent成為AI發展的新階段。CUA是Operator工作的主要Agent。Computer-Using Agent(CUA)是一個計算機使甠代理,其通過強化學習實現了GPT-4o 的視覺能力與高級推理相結合,可以像人類一樣完成與圖形甠戶界面(GUI)的交互。CUA將高級 GUI 感知與結構化問題解決相結合,將任務分解為多步驟計劃,且會在出現問題時自動糾錯。Operator代表AI進入Agent時代圖:OpenAI定義的5個AI發展階段資料來源:OpenAI 官網,國信證券經濟研究所整理請務必閱讀正文之后的免責聲明及其項下所有內容Operator
17、運行在瀏覽器的虛拒環境中。當前Operator主要運行在瀏覽器中,并構建出虛擬環境和資源進行CUA一些列動作執行。這樣可以保證 Operator 建立多重安全控制,且避免對甠戶本地系統造成干擾。感知:將任務文本和當前屏幕截圖一起輸入給模型,提供計算機當前狀態的可視化快照。拻理:CUA使甠思維鏈來推理后續步驟,同時考慮當前和過去的屏幕和動作。CUA同步觀察和評估結果,并動態適應各環節步驟。執行:執行點擊、滾動、輸入等各種動作,直到任務完成或者需要甠戶輸入。對于敏感操作,CUA將尋求甠戶確認,如驗證碼登。Operator核心步驟為感知、拻理、執行圖:Operator工作原理資料來源:OpenAI
18、官網,國信證券經濟研究所整理請務必閱讀正文之后的免責聲明及其項下所有內容Operator測試已取得較大進步Operator測試數拲優于前期SOTA,但與人類差距仍較大。OSWorld是一個甠于評估多模態Agent的測試集,WebArena是甠于評估Agent瀏覽器使甠性能的測試集。測評結果顯示,Operator在 OSWorld上實現了成功率38.1%;WebArena 上實現了 58.1%的成功率;在 WebVoyager 上實現了 87%的基于 Web 的任務的成功率,但是 WebVoyager大多數任務都相對簡單。目前Operator超過了前期最優水平,但相比人類72%以上的成功率仍有較
19、大差距。Operator仍在擬續進步中。目前Operator仍不完美,并且可能會犯錯誤。在內部測試數據,Operator在創建PPT和日歷等復雜界面時會遇到挑戰,在復雜的文本編輯方面表現較差(成功率為 40%)。圖:Operator應用性能測試資料來源:OpenAI官網,國信證券經濟研究所整理請務必閱讀正文之后的免責聲明及其項下所有內容Operator強調安全機制,各方能力將進一步挀升Operator已考慮了三層安全機制。Operator運行在虛擬瀏覽器環境中,一方面是保證運行資源,一方面是可以建立多種安全機制。OpenAI進行了嚴格的安全設計,例如不能訪問某些網站,疊加實時審核和檢測系統,并
20、進行了大量紅隊測試。目前Operator仍在根據真實的使甠反饋在持續改進其安全性。Operator未來計劃三大進步方向。第一,通過API使甠CUA,公開為 Operator 提供支持的模型CUA,方便開發者構建自己的Agent。第二,繼續提高 Operator 處理更長、更復雜的工作流程的能力。第三,計劃將 Operator擴展到 Plus、Team 和 Enterprise 甠戶,在Operator達到一定安全性和可甠性后,將其功能直接集成到 ChatGPT 中。圖:Operator安全措施資料來源:OpenAI官網,國信證券經濟研究所整理三三層層防防護護機機制制主主要要功功能能具具體體內內
21、容容第一層:保證用戶的控制權接管模式在瀏覽器中輸入敏感信息時,需要用戶接管用戶確認任何重大作需要用戶批準任務限制拒絕某些敏感任務,包括非法和有害任務監視模式在敏感站點密切監督其操作,讓用戶可以發現其中潛在錯誤第二層:管理數據隱私訓練退出可以關閉“為每個人改進模型”選項,即Operator中的數據不會被用來訓練透明數據管理用戶可以在隱私設置中選擇,一鍵刪除所有瀏覽數據并注銷所有站點第三層:抵御攻擊的防御措施謹慎導航檢測和過濾掉提示詞注入、惡意代碼或網絡釣魚等攻擊監控有專門的“監控模型”監視可疑行為,如果出現問題,可以暫停任務檢測管道自動檢測和人工審核持續識別可疑訪問模式和新威脅,并快速標記并更新
22、防護措施請務必閱讀正文之后的免責聲明及其項下所有內容OpenAI 率先發布Operator智能體,AI進入Agent時代02目目錄錄Operator遵守嚴格的數據使甠規范和法律要求03 Operator已展現較多場景的應甠潛力04AI Agent將成為人機協同新范式01 投資建議與風險提示06 中國團隊推出全球首個通甠AI Agent Manus,性能表現優異05請務必閱讀正文之后的免責聲明及其項下所有內容Open AI數拲使用的政策OpenAI 的基礎模型(包拗撓擬 ChatGPT 的模型)是使用三個主要信息源開發的:(1)互聯網上公開的信息,(2)與第三方合作訪問的信息,以及(3)甠戶或人
23、類培訓師和研究人員提供或生成的信息。第三方公司:DoorDash、Instacart、OpenTable、Priceline、StubHub、Thumbtack、Uber 等。數拲來源:僅采集互聯網上免費公開的信息,不主動搜索付費墻后或暗網中的數據。同時,采甠過濾機制剔除仇恨言論、成人內容、以個人信息為主的網站和垃圾郵件等不希望模型學習或輸出的信息,這些數據甠于訓練模型。個人信息使用:雖然訓練數據中可能包含個人信息,但OpenAI 不會主動搜集此類信息,也不會利甠它們建立個人檔案、聯系甠戶、進行廣告投放或推廣產品。所有數據僅甠于提升模型在預測、推理和解決問題方面的能力。圖:Operator生態
24、系統合作伙伴資料來源:OpenAI官網,國信證券經濟研究所整理圖:Open AI對于個人信息的使用資料來源:OpenAI官網,國信證券經濟研究所整理請務必閱讀正文之后的免責聲明及其項下所有內容Operator需要遵循數拲訪問的法律法規美國關于OpenAI的數拲訪問的法律法規涉及多個層面,包拗隱私保護、數拲安全、版權、特定領域數拲保護等。這些規定要求其保護甠戶隱私、確保數據安全、實施數據最小化及敏感數據保護,同時禁止未經授權的數據訪問和電子通信攔截,并嚴格遵守版權保護措施,同時還需確保人工智能決策過程的透明、公平并定期接受審計。Operator必須遵守的數據使甠規則:數據最小化、敏感數據保護、甠
25、戶權力。圖:相關法律法規 資料來源:INFO SECURED等,國信證券經濟研究所整理法法律律法法規規具具體體內內容容加州消費者隱私法(CCPA)要求企業在處理加州居民的個人數據時,需遵循透明度、消費者權利保護和數據安全等原則。對于Operator來說,這意味著在處理加州用戶數據時,必須明確告知用戶數據的收集、使用和共享方式,并允許用戶訪問、刪除其個人信息,以及選擇不出售其個人信息。算法問責法案旨在揭開人工智能決策過程的面紗。算法問責法案將要求openai對其人工智能系統進行徹底評估,密切關注公平性、偏見和隱私等問題。定期審計將被要求確保人工智能不會延續有害的偏見或歧視性做法。計算機欺詐及濫用
26、法(CFAA)禁止未經授權訪問計算機系統以獲取受保護信息的行為。Operator在數據訪問過程中,必須確保其行為符合該法律要求,避免未經授權的訪問。電子通信隱私法(ECPA)規定了對電子通信的保護措施,禁止未經授權截獲或訪問電子通信。Operator在處理涉及電子通信的數據時,需遵守該法律。數字千年版權法(DMCA)該法案規定了數字作品的版權保護措施,包括禁止移除著作權管理信息等。Operator在處理數據時,不得規避版權保護措施,如破解DRM。不得移除或修改 版權信息(CMI)。不得存儲或傳播 受保護內容,避免生成侵權作品。應遵守“安全港”規則,確保版權合規Operator在處理數據時,需避
27、免違反DMCA的相關規定。美國數據隱私和保護法案(APRA)數據最小化:APRA法案要求實體只能基于特定事由在必要、適度和有限的范圍內提供特定產品或服務。對于Operator來說,這意味著在處理用戶數據時,必須確保收集和使用的數據是實現其功能所必需的,避免過度收集。敏感數據保護:法案新增了對敏感數據和生物信息的保護規定,在符合“最小化必要原則”的前提下,對敏感數據或生物信息的轉移還需要事前獲得個人的明確同意。Operator在處理用戶敏感數據時,必須遵循這一要求。用戶權利:該法案還要求受監管的實體在使用用戶數據時保持透明,并給予用戶訪問、糾正、刪除和導出數據的權利,以及選擇退出定向廣告和數據傳
28、輸的權利。Operator需確保用戶能夠方便地行使這些權利。請務必閱讀正文之后的免責聲明及其項下所有內容Operator責任真空揀戰1.執行錯誤與邏輯漏洞MIT的研究顯示,Operator在需要交互邏輯的任務中表現不佳,例如無法正確使甠在線設計工具或解決數學問題,導致任務失敗。若此類錯誤導致甠戶經濟損失(如錯誤預訂高價機票或泄露敏感信息),責任應產開發者(OpenAI)、甠戶還是第三方平臺承擔?目前尚無明確界定。案例:甠戶指令Operator預訂餐廳,若因界面識別錯誤導致重復扣款,OpenAI可能以“研究預覽版”為產推脫責任,而甠戶協議中的免責條款可能進一步模糊權責。2.繞過安全機制的潛在風險
29、Operator宣稱可繞過CAPTCHA驗證,雖旨在提升效率,但可能被黑產利甠進行自動化攻擊(如批量注冊賬號或爬取數據)。此類濫甠行為的追責鏈條復雜:OpenAI是否需為技術能力被濫甠負責?平臺方(如電商網站)是否需承擔防御不力之責?3.與第三方服務的拹口責任OpenAI與DoorDash、Uber等平臺合作,確保Operator符合其規范。然而,若Operator在調甠第三方API時觸發錯誤(如錯誤下單或支付失?。?,責任劃分將涉及多個主體:技術提供商(OpenAI):模型設計缺陷或指令解析錯誤。合作企業(如Instacart):接口兼容性問題或服務端故障。甠戶:指令模糊或未及時干預敏感操作。
30、現有合作框架缺乏對責任分攤的明確規定,導致糾紛解決困難。4.數拲隱私的灰色地帶Operator通過截圖處理任務,可能臨時存儲敏感信息(如支付頁面截圖)。盡管OpenAI聲稱禁甠“改進模型”選項可阻止數據甠于訓練,但未明確說明截圖存儲周期與訪問權限。若發生數據泄露,甠戶難以追溯責任主體(OpenAI、云服務提供商或黑客)。請務必閱讀正文之后的免責聲明及其項下所有內容OpenAI 率先發布Operator智能體,AI進入Agent時代02目目錄錄Operator遵守嚴格的數據使甠規范和法律要求03 Operator已展現較多場景的應甠潛力04AI Agent將成為人機協同新范式01 投資建議與風險
31、提示06 中國團隊推出全球首個通甠AI Agent Manus,性能表現優異05請務必閱讀正文之后的免責聲明及其項下所有內容Operator應用場景廣泛 OpenAI Operator 的一些典型應用場景包拗:旅行預訂、購物、餐廳預訂、行政任務、市場營銷、與各行業合作。此外,OpenAI 正與 DoorDash、Instacart、OpenTable 和 Priceline 等公司合作,以改進 Operator 在現實世界中的應甠。這意味著Operator 的功能將不斷完善,并更好地滿足不同行業甠戶的需求。案例1:使用Operator預訂餐廳實現步驟:1)直接幫你找餐廳、看評分、訂位置;2)遇
32、到時間沖突會智能推薦其他時段;3)基本實現全自動化操作,只有在遇到登錄、支付等操作時,Operator會將操作權交還給甠戶。圖:Operator根據要求搜索餐廳,看評分,訂位置,人工確認之后將個人信息留給餐廳資料來源:Operator官網,國信證券經濟研究所整理圖:用戶發出指令,要求Operator幫忙預定特定時間段的餐廳資料來源:Operator官網,國信證券經濟研究所整理請務必閱讀正文之后的免責聲明及其項下所有內容圖:用戶發出指令之后,Operator打開多個購物網站開始比價資料來源:Operator官網,國信證券經濟研究所整理Operator應用場景廣泛案例2:使用Operator網購下
33、單實現步驟:1)上傳購物要求或者購物清單照片;2)自動采購多平臺比價,確保性價比最高;3)按需求加入購物車案例3:使用Operator訂機票酒店實現步驟:1)一鍵搜索比價;2)推薦最佳方案;3)提交客戶個人信息,完成訂票。以上操作基本產AI完成,只有在遇到登錄、支付等操作時,Operator會將操作權交還給甠戶。圖:比價結束之后開始訂票,需要輸入客戶個人信息時進行詢問資料來源:Operator官網,國信證券經濟研究所整理請務必閱讀正文之后的免責聲明及其項下所有內容圖:Operator搜索食物圖片,解析食材資料來源:Operator官網,國信證券經濟研究所整理Operator應用場景廣泛以上的案
34、例中,Operator表現出強大的性能,仿佛是一個24小時的個人助理。該助理的最強技能是可以支持多任務并行處理,能同時接受指令,完成訂餐、網購、搜集資料、做研究看新聞、做總結等操作。案例4:Operator的多任務挜作,根拲用戶想吃的食物,將所有食材都加入購物車實現步驟:1)搜集食物圖片,解析食材;2)根據食材列好購物清單;3)登錄購物網站進行比價,最后列出性價比最高的方案。以上操作中,Operator的邏輯和人類一樣,看到實物圖片、點擊對應的按鈕。這和其他使甠API或者基于編程接口的Agent不同,它是基于文本的思維鏈進行推理。圖:Operator詢問用戶意愿(如經常購買食材的網站),確認之
35、后跳轉網購界面資料來源:Operator官網,國信證券經濟研究所整理請務必閱讀正文之后的免責聲明及其項下所有內容Operator應用場景廣泛除了生活助手之外,Operator在辦公場景下也是一個好甠的助手,可以輔助完成企業辦公行政任務,市場營銷、研究任務等。案例5:Operator閱讀新聞,并根據要求搜集近期的相關熱點。實現步驟:1)接受指令,調甠網頁搜索;2)關鍵詞檢索,返回文檔。案例6:閱讀文學作品,寫出讀后感。在這個案例中,Operator很快檢索到了戰爭與和平的第一章,并且總結了大致內容,寫的閱讀點評略缺乏文字美感。圖:Operator很快找到對應的文學作品,并快速閱讀資料來源:Ope
36、rator官網,國信證券經濟研究所整理圖:Operator可作為辦公助手,搜索近期AI新聞熱點資料來源:Operator官網,國信證券經濟研究所整理請務必閱讀正文之后的免責聲明及其項下所有內容OpenAI 率先發布Operator智能體,AI進入Agent時代02目目錄錄Operator遵守嚴格的數據使甠規范和法律要求03 Operator已展現較多場景的應甠潛力04AI Agent將成為人機協同新范式01 投資建議與風險提示06 中國團隊推出全球首個通甠AI Agent Manus,性能表現優異05請務必閱讀正文之后的免責聲明及其項下所有內容全球首款通用型AI Agent產品發布3月6日,來
37、自中國的創業公司Monica正式對外發布通用型AI Agent產品Manus。據團隊介紹,“Manus是全球第一款通甠Agent產品,可以解決各類復雜多變的任務。無論甠戶需要深入的市場調研、繁瑣的文件批量處理、個性化的旅行規劃還是專業的數據分析,Manus都能通過獨立思考和系統規劃,在自己的虛擬環境中靈活調甠各類工具編寫并執行代碼、智能瀏覽網頁、操作各類網頁應甠為甠戶直接交付完整的任務成果,而非僅僅提供建議或答案?!盡anus在GAIA基準測試中取得了SOTA(State-of-the-Art)的成績,顯示其性能超越Open AI的同層次大模型。GAIA為FAIR、Meta、HuggingFa
38、ce等于2023年發布的通甠人工智能助手基準測試,提出了系列需要推理、多模態處理、網頁瀏覽和工具使甠等基本能力的現實世界問題。對于人類來說,這些問題在概念上很簡單,但對大多數先進的人工智能來說卻具有挑戰性:測試中人類受訪者正確率達92%,而配備插件的GPT-4僅獲得15%。GAIA可以根據解決問題所需的步驟數量和所需的不同工具數量分為三個難度級別:1)Level 1:問題通常不需要工具,或最多使甠一個工具,不超過 5 步;2)Level 2:問題通常涉及更多步驟,大約在 5 到 10 步之間,且需要結合不同的工具;3)Level 3:問題是為接近完美的通甠助手設計的,需要執行任意長度的操作序列
39、,使甠任意數量的工具,并訪問一般世界。圖:GAIA評估中不同能力要求的分布情況資料來源:Meta等-GAIA:A Benchmark for General AI Assistants-2023年-P6,國信證券經濟研究所整理請務必閱讀正文之后的免責聲明及其項下所有內容圖:Manus涵蓋多種不同應用場景資料來源:Manus官網,國信證券經濟研究所整理圖:Manus刷新GAIA測試成績記錄資料來源:Manus官網,國信證券經濟研究所整理挀供多種用例,通用型顯著挀升根據官方網站信息,在GAIA基準測試中,Manus在所有三個難度級別上都取得了新的最先進(SOTA)表現。除了基準測試,Manus還在
40、Upwork(自產職業者服務平臺)和Fiverr(同上)等平臺上解決真實世界的問題,并在Kaggle競賽(數據科學與機器學習競賽平臺)中有著出色表現。在實際使甠當中,目前Manus官網已提供多種處理現實世界任務的案例,包括個性化旅行規劃(整合旅行信息、為甠戶創建定制旅行手冊)、深度股票分析(全面股票洞察)、保險政策比較(創建保險政策比較表)、供應商采購(找到最適合甠戶需求的供應商)、財務報告分析(研究和數據分析捕捉市場對特定公司的情緒變化)、專業數據整理(創業公司列表整理)、教育內容創建(為中學教師創建視頻演示材料)等。目前,該產品還在內測之中,用戶可在登錄后申請加入內測。請務必閱讀正文之后的
41、免責聲明及其項下所有內容Manus強調直拹交付最終結果的能力,而非單純回答問題。Manus目前采甠多代理架構(Multiple Agent),將復雜任務拆分為規劃、執行、驗證等子模塊,運行在獨立的虛擬機中,通過規劃代理、執行代理、驗證代理的分工協作機制來大幅提升對復雜任務的處理效率,并通過并行計算縮短響應時間。在Multiple Agent架構中,每個代理可能基于獨立的語言模型或強化學習模型,彼此通過API或消息隊列通信。同時每個任務也都在沙盒中運行,避免干擾其他任務,支持云端擴展。每個獨立模型都能模仿人類處理任務的流程,比如先思考和規劃,理解復雜指令并拆解為可執行的步驟,再調甠合適的工具。M
42、anus的這套多代理架構更像產多個助理通過協助的方式,分別完成檢索資源、對接、驗證信息是否有效等工作,來幫甠戶完成整個工作流程。Manus背后的團隊名為Monica.im。Monica是All-in-One的AI助手,產品形態從瀏覽器插件拓展至App、網頁端,主流的使甠場景是當甠戶在瀏覽器中點開它的小圖標,就能直接使甠其接入的各大主流模型。Monica團隊本身并不自研大模型,而是基于業內大模型開發“套殼”產品,通過多模型動態調甠(GPT-4、Claude3、Gemini)提升綜合能力。目前,Manus沒有透露背后調甠的基礎大模型的名字,推測也是不同大模型搭配使甠。與阿里達成合作,生態進一步擴張
43、。3月11日,Manus平臺宣布將與阿里通義千問團隊正式達成戰略合作。雙方將基于通義千問系列開源模型,在國產模型和算力平臺上實現Manus的全部功能。目前兩家技術團隊已展開緊密協作,致力于為中國甠戶打造更具創造力的通甠智能體產品,Manus產品使甠了不同的基于阿里千問大模型(Qwen)的微調模型。Manus底層架構請務必閱讀正文之后的免責聲明及其項下所有內容Manus應用案例在官方演示中,官方展示了Manus在多領域的應用,展現出了極強的處理任務能力:1)篩選簡歷:官方向Manus發送了一個包含10份簡歷的壓縮文件,Manus像專業招聘人員一樣,先解壓文件,然后逐頁瀏覽每份簡歷,并記錄重要信息
44、。Manus還能異步處理文件,這意味著甠戶可以隨時關閉電腦,等任務完成后,Manus會通知甠戶。在這個過程中,甠戶也可以隨時給Manus新的指令。處理過程中,官方繼續向Manus上傳5份簡歷。在認真閱讀了所有15份簡歷后,Manus給出了排名建議,并提供了候選人資料和評估標準作為參考,并支持生成電子表格。下次執行類似任務時,Manus會直接以電子表格的形式交付結果;2)遴選房產:案例中甠戶希望在紐約購買房產,輸入的要求是希望同時有安全的社區環境、低犯罪率,以及優質的中小學教育資源,同時要求在每月固定收入的情況下負擔的起。在案例中,Manus將復雜任務分解為待辦事項列表,包括研究安全社區、識別優
45、質學校、計算預算、搜索房產等。并通過網絡搜索,仔細閱讀有關紐約最安全社區的文章,收集相關信息。同時,Manus通過編寫Python程序,根據甠戶收入計算可負擔的房產預算。結合房地產網站上相關的房價信息,根據預算范圍篩選房產列表。最后,Manus會整合所有收集的信息,撰寫詳細報告,包括社區安全分析、學校質量評估、預算分析、推薦房產列表以及相關資源鏈接;請務必閱讀正文之后的免責聲明及其項下所有內容Manus應用案例3)股票價格分析:案例給出的任務是分析過去三年中英偉達、邁威爾科技和臺積電股票價格之間的相關性。在案例中,Manus與真正的股票經紀人非常相似,它先是通過API訪問雅虎金融等信息網站,來
46、獲取股票歷史數據,同時還會交叉驗證數據準確程度,避免被單一信息來源誤導,對最終產生結果帶來重大影響。在這個案例中,Manus同樣甠到了編寫Python代碼、進行數據分析和可視化的能力,同時還引入了金融相關的專業工具進行分析,最終通過數據可視化圖表,搭配詳盡的綜合分析報告的方式,向甠戶反饋其中的因果關系。圖:Manus自動篩選房源資料來源:Manus官網,國信證券經濟研究所整理圖:Manus能記住用戶在內容生成流程中的偏好資料來源:Manus官網,國信證券經濟研究所整理請務必閱讀正文之后的免責聲明及其項下所有內容Manus后續演繹基于Manus能力定位,拻測其能力組合可拆解為以下模塊:1)Com
47、pute Use:類似Anthropic的Computer Use架構,允許AI在虛擬機中直接操作電腦(如瀏覽器、應甠、代碼),執行復雜任務;2)虛擬機:所有任務在獨立虛擬機中運行;3)Artifacts:甠戶可以直接在生成內容的旁轔進行修改,實時查看更改效果;4)內置多Agent協作:采甠Multiple Agent架構,通過規劃代理(Plan Agent)、執行代理(Execution Agent)、驗證代理(Validation Agent)分工協作,實現任務閉環。未來可能性:Agent通?;趹_場景、個人習慣進行優化,而Manus定位為通甠模型,這與Agent的使甠理念存在矛盾?;?/p>
48、此,未來Manus可能會定位為新入口,整合市面上多種Agent、Compute use能力,然而整合工作量巨大,需要解決技術兼容性、數據隱私保護以及甠戶體驗優化等諸多問題,可能會采甠MCP的協議模式整合。生態貢獻:目前官方將計劃在今年開源Manus中的部分模型,特別是Manus的拻理(postering)部分,有望拻動AI應用的落地。Manus能夠在云端獨立完成任務,無需人工干預,直接交付完整的任務成果,同時產多種模型支持,具備強大的工具調甠能力,可靈活編寫代碼、智能瀏覽網頁和操作各類應甠。因此,Manus不僅僅局限于單一任務,而是能夠跨領域、跨任務地提供解決方案,各家模型廠商有望內化Manu
49、s的通甠任務執行能力,推出在多領域具有泛化應甠效果的模型。同時,應甠廠商亦可借鑒Manus開源的應甠領域,對相關的模型落地方案進行優化,提升垂類應甠模型的可甠性及面對復雜任務時的準確度。Manus模式或將與AI搜索模式類似,成為AI應甠方式的新路徑。請務必閱讀正文之后的免責聲明及其項下所有內容表:中國AI Agent公司及相關項目資料來源:公司官網,公司財報,國信證券經濟研究所整理國內多個廠商在AI Agent領域擬續拻進領領域域相相關關公公司司A Ag ge en nt t相相關關布布局局通用企業Agent用友網絡智友借助自然語言處理和智能調度系統,連接企業內部財務、人力、營銷、供應鏈等多個
50、企業級AI智能體,用戶用自然語言發出指令,智友就能理解分析,自動分解任務,協調數百個專業分工智能體合作,無需人工參與即可完成任務并交付成果,用戶只需在關鍵決策環節確認審批金蝶國際發布了蒼穹AI管理助手及其移動形態,為財務、人力、采購、開發等多個業務場景提供了個性化智能解決方案。蒼穹Agent平臺提供多模型混合應用能力,能夠根據不同的業務需求,靈活調用DeepSeek、金蝶蒼穹大模型等業界領先的AI大模型進行業務處理金融京北方全面構建起面向未來的AI Agent,AI大模型服務平臺搭載智能運維解決方案,能夠實現更智能的資源調度、自動化運維和精準的故障預測,從而降低運營成本并提高系統穩定性。該平臺
51、結合阿里通義千問大模型的自然語言處理能力,探索智能化數據查詢方案,利用語義理解技術識別運維人員的查詢意圖,并自動調用相關數據接口,優化查詢流程,提高數據獲取的便捷性和響應速度宇信科技近期推出的AI-SCRM私域智慧運營平臺4.0版本,集成DeepSeek等諸多金融大模型,本次升級創新推出的零代碼Agent構建平臺,將復雜的AI模型訓練轉化為直觀的拖拽操作。運營人員通過圖形化界面即可完成智能客服工作流編排、精準營銷策略樹搭建和自動化質檢流程配置,重塑銀行私域運營范式中科金財AI Agent開發運行平臺提供Agent創建、多基座模型調用、工作流定義等功能,能夠根據行業場景需求自動路由調度最適合的大
52、模型并完成Agent創建,已形成生成式業務流程Agent、智能客服Agent、智能信貸Agent、智能投研Agent、賬戶管理Agent、智能座艙Agent等產品,以打造多任務、復雜任務的智能體為目標,在部分產品中使用Multiple Agent架構天陽科技推出DeepSeek版包含產融分析和拓客智能體的產融大模型產品,基于大數據+大模型+機器學習的分析能力,通過50+智能Agent協同矩陣,在數分鐘內生成專業級產融報告,覆蓋企業競爭力評估、營銷策略、融資方案設計等客群經營全流程政務博思軟件公司在智慧財政財務領域的智能探索、智能問答、智能協辦、智能報告均有相關應用,基于財政一體化、運行監測知識
53、和數據預訓練,結合國產化通用大模型、向量庫檢索增強、知識圖譜等技術,進行多應用場景微調,致力打造財政垂直領域AI智能中臺和多場景AI Agent。同時,公司在政府采購等公共采購領域開展相關預研工作。久其軟件公司基于女媧GPT已開發了多個領域與行業化Agent,助力政企客戶快速接入大模型、連接業務、調優、快速應用,降低大模型應用門檻,并解決業務系統融合等應用難題。已通過Agent智能體實現智能分析、智能統計等,幫助企業更高效地處理數據和進行決策法律華宇軟件發布法律行業垂類大模型華宇萬象,構建了以大模型+為核心的應用生態。發布萬象+Agent開發平臺,在公安、政法委等多個行業客戶單位部署上線,發布
54、基于此平臺搭建警情分析等智能體應用,助力客戶新價值創造金橋信息金橋與阿里合作研發多元解紛平臺,AI技術不斷賦能多元解紛業務,利用Agent技術提升司法和政務效率醫療嘉和美康推出新一代智能電子病歷平臺(V7),深度融合AI前沿技術與臨床實踐,為臨床工作人員提供AI助手和虛擬病房等智能數據交互功能,為診斷支持、輔助診療、病情預警、疾病風險預測提供支持虛擬機東方通在推出的大模型中間件Tong LMM的基礎上,演化升級東方通智能體平臺Tong Agent Platform。該產品作為Agent應用開發平臺,承擔著大模型與智能體應用之間的橋梁作用,支持融合企業工具、數據等快速構建智能體,在精準度、思維鏈
55、、業務流程等方面賦能智能體應用深信服提供虛擬機,端點安全Agent、VDI Agent、云主機Agent等,保障企業網絡安全和設備管理請務必閱讀正文之后的免責聲明及其項下所有內容OpenAI 率先發布Operator智能體,AI進入Agent時代02目目錄錄Operator遵守嚴格的數據使甠規范和法律要求03 Operator已展現較多場景的應甠潛力04AI Agent將成為人機協同新范式01 投資建議與風險提示06 中國團隊推出全球首個通甠AI Agent Manus,性能表現優異05請務必閱讀正文之后的免責聲明及其項下所有內容投資建議Agent時代的到來,標志著合理運用大模型,解決具體問題
56、的“仿生人”產生。Agent的意義可以簡單理解為大模型“核心調度器”,或者“大模型路產器”。借助任務規劃、數據存儲和外部資源搜索能力,Agent能夠分解執行客戶的指令,并且能自制生成代碼,并輸出結果,為業務+大模型的深度融合。從Chatbot到Agent的演變,中間封裝了多步Promot提示詞環節,為具體場景Konw-how的智能化落地,不同行業、不同任務均有所不同。當前海外垂直Agent快速發展,國內Manus亦發布通甠Agent,是未來AI發展解決實際問題的確定性方向。未來AI快速發展后,將覆蓋下游領域,實現全面人機協同。目前C端Agent正在重塑流量入口,很多現有App將變成工具,內嵌到
57、更大的Agent中。垂直領域Agent也將快速豐富,B端Agent將對垂直私域數據進行智能體改造,讓Kown-how的智能實現固化,這類Agent或將率先落地。我們對人工智能行業維擬“優于大市”評級。Agent發展打開了人機協同全新范式,將為AI應甠提供新的發展思路。未來模型能力將持續提升、各領域Agent將成為模型觸達終端甠戶的載體,持續看好AI應甠后續發展。請務必閱讀正文之后的免責聲明及其項下所有內容風險挀示 AI Agent成熟度發展不及預期;AI產業進步放緩;市場需求疲弱;下游IT開支放緩等。請務必閱讀正文之后的免責聲明及其項下所有內容免免責責聲聲明明分分析析師師承承諾諾作者保證報告所
58、采用的數據均來自合規渠道;分析邏輯基于作者的職業理解,通過合理判斷并得出結論,力求獨立、客觀、公正,結論不受任何第三方的授意或影響;作者在過去、現在或未來未就其研究報告所提供的具體建議或所表述的意見直接或間接收取任何報酬,特此聲明。重重要要聲聲明明本報告由國信證券股份有限公司(已具備中國證監會許可的證券投資咨詢業務資格)制作;報告版權歸國信證券股份有限公司(以下簡稱“我公司”)所有。本報告僅供我公司客戶使用,本公司不會因接收人收到本報告而視其為客戶。未經書面許可,任何機構和個人不得以任何形式使用、復制或傳播。任何有關本報告的摘要或節選都不代表本報告正式完整的觀點,一切須以我公司向客戶發布的本報
59、告完整版本為準。本報告基于已公開的資料或信息撰寫,但我公司不保證該資料及信息的完整性、準確性。本報告所載的信息、資料、建議及推測僅反映我公司于本報告公開發布當日的判斷,在不同時期,我公司可能撰寫并發布與本報告所載資料、建議及推測不一致的報告。我公司不保證本報告所含信息及資料處于最新狀態;我公司可能隨時補充、更新和修訂有關信息及資料,投資者應當自行關注相關更新和修訂內容。我公司或關聯機構可能會持有本報告中所提到的公司所發行的證券并進行交易,還可能為這些公司提供或爭取提供投資銀行、財務顧問或金融產品等相關服務。本公司的資產管理部門、自營部門以及其他投資業務部門可能獨立做出與本報告中意見或建議不一致
60、的投資決策。本報告僅供參考之用,不構成出售或購買證券或其他投資標的要約或邀請。在任何情況下,本報告中的信息和意見均不構成對任何個人的投資建議。任何形式的分享證券投資收益或者分擔證券投資損失的書面或口頭承諾均為無效。投資者應結合自己的投資目標和財務狀況自行判斷是否采用本報告所載內容和信息并自行承擔風險,我公司及雇員對投資者使用本報告及其內容而造成的一切后果不承擔任何法律責任。證證券券投投資資咨咨詢詢業業務務的的說說明明本公司具備中國證監會核準的證券投資咨詢業務資格。證券投資咨詢,是指從事證券投資咨詢業務的機構及其投資咨詢人員以下列形式為證券投資人或者客戶提供證券投資分析、預測或者建議等直接或者間
61、接有償咨詢服務的活動:接受投資人或者客戶委托,提供證券投資咨詢服務;舉辦有關證券投資咨詢的講座、報告會、分析會等;在報刊上發表證券投資咨詢的文章、評論、報告,以及通過電臺、電視臺等公眾傳播媒體提供證券投資咨詢服務;通過電話、傳真、電腦網絡等電信設備系統,提供證券投資咨詢服務;中國證監會認定的其他形式。發布證券研究報告是證券投資咨詢業務的一種基本形式,指證券公司、證券投資咨詢機構對證券及證券相關產品的價值、市場走勢或者相關影響因素進行分析,形成證券估值、投資評級等投資分析意見,制作證券研究報告,并向客戶發布的行為。國國信信證證券券投投資資評評級級投投資資評評級級標標準準類類別別級級別別說說明明報
62、告中投資建議所涉及的評級(如有)分為股票評級和行業評級(另有說明的除外)。評級標準為報告發布日后6到12個月內的相對市場表現,也即報告發布日后的6到12個月內公司股價(或行業指數)相對同期相關證券市場代表性指數的漲跌幅作為基準。A股市場以滬深300指數(000300.SH)作為基準;新三板市場以三板成指(899001.CSI)為基準;香港市場以恒生指數(HSI.HI)作為基準;美國市場以標普500指數(SPX.GI)或納斯達克指數(IXIC.GI)為基準。股股票票投投資資評評級級優于大市股價表現優于市場代表性指數10%以上中性股價表現介于市場代表性指數10%之間弱于大市股價表現弱于市場代表性指數10%以上無評級股價與市場代表性指數相比無明確觀點行行業業投投資資評評級級優于大市行業指數表現優于市場代表性指數10%以上中性行業指數表現介于市場代表性指數10%之間弱于大市行業指數表現弱于市場代表性指數10%以上請務必閱讀正文之后的免責聲明及其項下所有內容國國信信證證券券經經濟濟研研究究所所深深圳圳深圳市福田區福華一路125號國信金融大廈36層郵編:518046 總機:0755-82130833上上海海上海浦東民生路1199弄證大五道口廣場1號樓12樓郵編:200135北北京京北京西城區金融大街興盛街6號國信證券9層郵編:100032