計算機行業深度研究:AI Agent通往AGI的核心基礎-240715(40頁).pdf

編號:168400 PDF  DOC 40頁 5.17MB 下載積分:VIP專享
下載報告請您先登錄!

計算機行業深度研究:AI Agent通往AGI的核心基礎-240715(40頁).pdf

1、 免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。1 證券研究報告 計算機計算機 AI Agent:通往:通往 AGI 的核心基礎的核心基礎 華泰研究華泰研究 計算機計算機 增持增持 (維持維持)研究員 謝春生謝春生 SAC No.S0570519080006 SFC No.BQZ938 +(86)21 2987 2036 研究員 彭鋼彭鋼 SAC No.S0570523090001 +(86)21 2897 2228 聯系人 袁澤世,袁澤世,PhD SAC No.S0570122080053 +(86)21 2897 2228 行業走勢圖行業走勢圖 資料來源:Wind,華泰研究

2、重點推薦重點推薦 股票名稱股票名稱 股票代碼股票代碼 目標價目標價 (當地幣種當地幣種)投資評級投資評級 金山辦公 688111 CH 354.50 買入 泛微網絡 603039 CH 41.97 買入 福昕軟件 688095 CH 73.96 買入 用友網絡 600588 CH 16.03 買入 鼎捷軟件 300378 CH 24.27 買入 同花順 300033 CH 156.20 買入 中控技術 688777 CH 61.05 買入 寶信軟件 600845 CH 52.60 買入 中科創達 300496 CH 62.65 買入 資料來源:華泰研究預測 2024 年 7 月 15 日中國內

3、地 深度研究深度研究 LLM 推動推動 AI Agent 進入新階段,進入新階段,AI 應用商業化或加速應用商業化或加速 AI Agent 是一種能夠感知環境、進行決策和執行動作的智能實體,從發展歷程看,經歷了用邏輯規則和符號封裝知識、快速響應環境、基于強化學習等發展階段。隨著大語言模型(LLM)的快速發展,AI Agent 在感知、記憶、規劃、行動等模塊方面的能力均得到了進一步的提升。我們認為 LLM 推動 AI Agent 進入了新階段,與 LLM 結合的 AI Agent 在智能化程度、自主性方面有進一步提升的潛力,通過與終端的進一步結合,有望推動 AI 應用商業化加速。AI Agent

4、 能力提升:感知能力提升:感知/規劃規劃/記憶模塊強化或工程化優化記憶模塊強化或工程化優化 從 AI Agent 的研究看,AI Agent 的要素基本上可以分為感知、定義、記憶、規劃、行動五類模塊。從 AI Agent 的能力提升路徑看,主要包括:1)單個模塊的持續強化:感知模塊的模態持續豐富、記憶模塊增長上下文或提供更加豐富的數據來源、規劃模塊中通過 CoT 或 ReAct 等方式提升推理能力、行動模塊補充第三方插件;2)系統性方式優化:如通過將 AI 各個模塊作為整體發揮作用,利用不同環境之間交互獲取的跨模態數據,在物理和虛擬世界中運行等。綜上,在底層模型升級+工程化方法改進的共同推進下

5、 AI Agent的性能有望持續提升。Agent 自動解決固定范式的問題,關注自動解決固定范式的問題,關注 Agent Workflow 基于 LLM 的 Agent 實踐已經取得一定的成果,從 AutoGPT、GPTs、Devin等案例中可以看出,當前 Agent 將 LLM 應用于信息檢索、工具學習、任務分解、垂直知識學習、人機交互等場景,實現了能力的突破。一方面 LLM相比傳統 NLP 在處理文本信息中的效率有所提升,另一方面特定數據訓練賦予 LLM 較好的解決垂類問題的能力,基于此當前 LLM 對于固定范式下解決問題已經能夠實現較好的自動化。我們認為通過 Agent Workflow

6、的方式,能夠更好的實現 AI Agent 與具體任務的結合,或將推動 LLM 技術在更復雜的應用場景中進一步提升效率。Agent 改變人機交互方式,關注軟硬件產業機遇改變人機交互方式,關注軟硬件產業機遇 AI+終端實現了安全性與個性化的結合,為 Agent 落地打下良好基礎。AI Agent 有望改變人機交互的方式,落地方式包括 AIPC、AI 手機等。終端掌握了重要的交互入口,據 Apple WWDC,Siri 用戶每天發出的語音請求數量高達 15 億次,大量的交互為 Agent 提供了豐富的場景載體;此外通過壓縮模型到適合端側大小的模型,使用優化算法加速推理,實現在端側落地。對比 Agen

7、t 的技術架構,往往也需要基礎模型和小模型的共同支撐,我們認為端側模型技術的發展(模型壓縮等技術)有助于 Agent 落地于終端。相關公司梳理相關公司梳理 從 AI Agent 的進展看,在理論研究中發現通過 CoT(思維鏈)、ReAct(推理+行動)等方式能夠完成部分的任務規劃,且長期看通過 AI Agent 或有望進一步走向整體智能;在實踐中,通過將 AI 助手嵌入工作流也已打造出基于特定數據、場景的 Agent 產品雛形,我們認為隨著:1)底層大模型能力的提升;2)Agent+工作流的工程化實踐深入,AI Agent 能力有望進一步提升,或將推動 AI 商業化進程加速。重點關注公司:1)

8、協同辦公廠商:包括金山辦公、泛微網絡、福昕軟件等;2)垂直應用廠商:包括用友網絡、鼎捷軟件、同花順、中控技術、寶信軟件等;3)終端廠商:中科創達等。風險提示:模型能力進步不及預期;安全性風險;本研報中涉及到未上市公司和未覆蓋個股內容,均系對齊客觀公開信息的整理,并不代表本研究團隊對該公司、該股票的推薦或覆蓋。(42)(31)(19)(8)4Jul-23Nov-23Mar-24Jul-24(%)計算機滬深300 免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。2 計算機計算機 正文目錄正文目錄 核心觀點.5 與市場觀點的不同之處.5 AI Agent:通過通過 AGI 的核心基礎的核

9、心基礎.6 AI Agent:LLM 推動推動 AI Agent 進入新階段進入新階段.8 智能助手到 Agent:由搜索匹配走向規劃與交互式決策.8 分模塊持續突破+系統性優化推動 AI Agent 能力提升.11 感知:模型端原生多模態推進,Agent 多模態感知能力可期.11 記憶:模型端上下文長度持續突破,向量外部存儲與檢索強化長期記憶.12 規劃:關注 LLM 對于任務分解算法及反思提煉能力的改變.13 行動:工具使用能力為關鍵,具身智能為新方向.13 多路徑共同提升 Agent 整體智能化水平,有望逐步通向整體智能.14 路徑一:模態豐富+具身智能+多 Agent 協同.15 路徑

10、二:通過提升整體性或利用工作流解決復雜問題.16 AI Agent 技術逐步落地,智能性仍有提升空間技術逐步落地,智能性仍有提升空間.18 AutoGPT:利用 LLM 逐步拆解任務,外掛插件提升能力.18 卡耐基梅隆 Agent:利用 LLM 強化信息獲取及工具使用.20 Devin:利用 AI 實現自主編程.21 AI Agent:智能性仍有提升空間,關注 Agent Workflow.22 模型模型&MaaS 廠商:憑豐富工具廠商:憑豐富工具&實踐經驗把握發展機遇實踐經驗把握發展機遇.24 MaaS 廠商側重 2B 業務場景:2B 提供落地工具+2D 提供開發框架.24 2B:基于業務卡

11、位,提供落地工具.24 2D:提供開發框架,卡位開發者場景.27 模型廠商落地:GPTs 通過配置實現定制化,打造 LLM 垂直領域助手.27 應用廠商:具備垂直數據與工程化優勢,關注工作流卡位應用廠商:具備垂直數據與工程化優勢,關注工作流卡位.29 與工作流結合,推動 Agent 落地以 Servicenow 為例.29 基于私有數據,打造智能應用以 Salesforce 為例.30 終端廠商:推動人機交互升級,率先實現終端廠商:推動人機交互升級,率先實現 Agent 落地落地.32 總結:從總結:從 AI Agent 有望逐步通向有望逐步通向 AGI.34 相關公司梳理相關公司梳理.35

12、風險提示.35 圖表目錄圖表目錄 圖表 1:AI Native(AI 原生應用).6 圖表 2:AI Agent:改變人機交互方式.6 圖表 3:GPT-4o 已初步具備 Agent 能力.6 免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。3 計算機計算機 圖表 4:AI Agent:下一代大模型的核心能力.7 圖表 5:AI Agent:能力體現.7 圖表 6:AI Agent:發展復盤.8 圖表 7:語音助手&聊天機器人:技術架構.9 圖表 8:AI Agent:技術框架.9 圖表 9:馮 諾依曼結構.10 圖表 10:AI Agent:技術框架.10 圖表 11:AI Ag

13、ent:感知模塊及落地路徑.11 圖表 12:Google Gemini:多模態融合.11 圖表 13:OpenAI GPT4o:端到端多模態.11 圖表 14:AI Agent:記憶模塊及落地路徑.12 圖表 15:大模型支持上下文長度情況.12 圖表 16:AI Agent:規劃模塊及落地路徑.13 圖表 17:AI Agent:行動模塊及落地路徑.14 圖表 18:AGI 分級.14 圖表 19:通用人工智能(AGI):研究進展.15 圖表 20:AI Agent:三種應用場景.15 圖表 21:Foundation Agent.16 圖表 22:Agent AI 系統概述.17 圖表

14、23:Agent workflows:有效提升 Human Eval 測試表現.17 圖表 24:AutoGPT:任務流程.18 圖表 25:AutoGPT:程序示例.19 圖表 26:AutoGPT:第一方插件.19 圖表 27:AutoGPT:部分第三方插件.20 圖表 28:Agent:系統框架.20 圖表 29:Agent:文檔搜索概述.21 圖表 30:SWE 基準測試結果.22 圖表 31:Devin:能力示例.22 圖表 32:AI Agent:實踐情況.23 圖表 33:從自動化到智能化:AI Agent.23 圖表 34:MaaS 廠商:業務布局.24 圖表 35:智能 Co

15、pilot:產品界面.24 圖表 36:Microsoft Copilot Studio 與傳統方式的對比.25 圖表 37:智能 Copilot:操作界面.25 圖表 38:Amazon Bedrock 功能特性.26 圖表 39:Amazon Bedrock:解決方案架構.26 圖表 40:AutoGen:模式概覽.27 圖表 41:GPTs 創建方式.27 圖表 42:首批官方 GPTs.28 圖表 43:部分第三方 GPTs.28 免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。4 計算機計算機 圖表 44:Now Platform:覆蓋多個工作流.29 圖表 45:Now

16、 assist:應用場景.29 圖表 46:Servicenow:電信專用 GenAI 解決方案.30 圖表 47:Einstein GPT:應用場景.30 圖表 48:Einstein Copilot:擴展.31 圖表 49:AI 終端:結合安全性+個性化,利于 Agent 落地.32 圖表 50:交互入口:Siri.32 圖表 51:Apple Intelligence.33 圖表 52:從 Agent 到 AGI.34 圖表 53:提及公司表.35 圖表 54:重點推薦公司一覽表.36 圖表 55:重點推薦公司最新觀點.36 免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。5

17、 計算機計算機 核心觀點核心觀點 AI Agent 是通往是通往 AGI 的核心基礎。的核心基礎。從用戶角度感知 AI Agent,其具備連續、復雜、多步驟、多任務的執行能力,從基本框架看,當前對 AI Agent 整體框架的設計基本上可以分為感知、定義、記憶、規劃、行動五類模塊。我們認為從實踐上看,當前 AI Agent 對于執行特定領域的任務已經體現出一定的自主性,未來隨著模型的升級,任務規劃、工具選擇能力有望進一步進化。從框架上,通過單個模塊加強、系統性優化等路徑,AI Agent 有望逐步通向AGI。AI Agent 落地帶來多個層次的產業機遇。落地帶來多個層次的產業機遇。1)MaaS

18、 廠商:有望受益于模型升級機遇。大模型廠商與 MaaS 廠商合作推廣 B 端的大模型產品,MaaS 廠商提供落地工具和開發框架,有望首先受益于底層大模型能力突破帶來的 AI Agent 發展機遇;2)應用廠商:憑借垂直數據與工程化優勢實現 Agent 落地。以 Agent workflow 為代表的工程化優化與垂直數據訓練同樣是 Agent 落地的可行路徑之一,看好擁有垂直數據與工程化優勢的應用廠商。3)終端廠商:Agent 推動人機交互變革。Agent 能力既可以通過 AI 重構硬件來實現,也可以通過AI 改造軟件來體現(軟件的自動化執行),終端廠商擁有重要的語音助手交互入口,在端側軟硬件生

19、態中具備良好的卡位,端側 Agent 有望首先落地。與市場觀點的不同之處與市場觀點的不同之處 市場認為市場認為現有現有基礎基礎模型能力無法支撐模型能力無法支撐 Agent 應用,應用,Agent 落地落地進程較為漫長進程較為漫長。我們認為Agent 能力提升存在多種路徑,模型能力提升只是路徑之一。除此之外,通過垂直數據訓練、Agent Workflow 等方式能夠在同一基礎模型中針對具體任務實現更好的效果;此外終端憑借 AI 重構軟件+硬件也有望在現有模型能力基礎上實現部分類 Agent 功能。因此在現有基礎模型基礎上,部分 Agent 應用仍有望落地。市場市場對對 Agent+終端的研究終端

20、的研究聚焦于硬件層面。聚焦于硬件層面。市場對于 Agent 對終端產業的影響更多聚焦于產業鏈相關硬件公司,認為 Agent 有望帶動換機潮,且需要相關硬件的支持。我們認為 Agent在實現方式上,也需要模型、軟件、數據、生態的支持,在終端廠商之間 AI 能力也存在一定的差異,軟件算法及生態領域的研究也十分重要。從影響看,我們認為 Agent+終端有望推動人機交互變革,除了在終端銷售量價方面的變化外,可能對終端應用的商業模式產生更加深遠的影響。免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。6 計算機計算機 AI Agent:通過通過 AGI 的核心基礎的核心基礎 Agent 有望降

21、低人機交互門檻有望降低人機交互門檻。我們認為,這一輪 AI 產業變革,核心本質不是在原有產品上增加或者減少什么功能,而是改變人機交互方式。這種人機交互方式不僅體現在硬件載體上,更是覆蓋到軟件載體。其實現的路徑就是通過 Agent 來實現,Agent 作為智能輔助助理,其具備自我決策和執行能力,能夠完成連續服務多步驟的任務。我們認為,這是未來 Killer APP 應該具備的核心特征。Agent 對人機交互方式的改變,我們將其可以類比為Dos 系統向 Windows 系統的轉變,帶來的人機交互方式的變化,降低了人機交互的門檻。圖表圖表1:AI Native(AI 原生應用原生應用)資料來源:CS

22、DN、華泰研究 圖表圖表2:AI Agent:改變人機交互方式改變人機交互方式 資料來源:CSDN、華泰研究 AI Agent:下一代大模型的核心能力下一代大模型的核心能力。Agent 能力的實現,還是需要大模型具備相應的能力。我們的判斷:Agent 或是下一代大模型邊際變化最大的能力。我們可以看到,GPT-4o模型已經開始具備 Agent 能力雛形,Google 的 Astra 也開始具備人機多模態交互多步驟任務完成的能力。圖表圖表3:GPT-4o 已初步具備已初步具備 Agent 能力能力 資料來源:CSDN、華泰研究 免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。7 計算機

23、計算機 圖表圖表4:AI Agent:下一代大模型的核心能力下一代大模型的核心能力 資料來源:CSDN、華泰研究 AI Agent:能力體現能力體現。如何從用戶角度感知 Agent 能力?我們將其總結為:連續、復雜、多步驟、多任務的執行能力。1)連續:指的是大模型能夠對用戶的任務指令,進行任務拆解,分解為多個步驟,對步驟進行規劃排序、連續執行。2)復雜:目前大模型智能解決單個任務,或者簡單少數多個任務,無法完成多個復雜任務。3)多步驟:多步驟與連續密切相關,在大模型執行后續步驟的同時,能夠對任務目標和前序任務隨時保持記憶,步驟的規劃執行能力要強。圖表圖表5:AI Agent:能力體現能力體現

24、資料來源:CSDN、華泰研究 我們認為,AI 大模型的 Agent 能力是通往 AGI 的核心基礎。我們或將看到 Agent 能力有望逐步體現:1)單一簡單任務執行,2)單一復雜任務執行,3)多步驟簡單任務執行,4)多步驟復雜任務執行,5)連續多步驟復雜任務執行。這些能力的實現都依賴于大模型能力的提升。我們認為,Agent 能力有望在 GPT-4 的后續模型中逐步體現出來。另外需要特別注意的是:Agent 是一種能力,是 AI 重構人機交互方式實現的工具。Agent 能力既可以通過 AI 重構硬件來實現,也可以通過 AI 改造軟件來體現(軟件的自動化執行)。免責聲明和披露以及分析師聲明是報告的

25、一部分,請務必一起閱讀。8 計算機計算機 AI Agent:LLM 推動推動 AI Agent 進入新階段進入新階段 LLM 推動推動 AI Agent 進入新階段。進入新階段。AI Agent 經歷了幾大階段,包含:1)符號 Agent:采用邏輯規則和符號表示來封裝知識并促進推理過程,典型代表為基于知識的專家系統;2)反應 Agent:主要關注 Agent 與其環境之間的交互,強調快速和實時的響應,設計時優先考慮直接的輸入輸出映射;3)基于強化學習的代理:主要關注如何使 Agent 通過與環境的互動進行學習,典型代表如 AlphaGo;4)具有遷移學習和元學習的 Agent:引入遷移學習實現

26、不同任務之間知識的共享和遷移,通過元學習使 Agent 學習如何學習;5)基于大型語言模型(LLM)的代理。將 LLM 作為大腦的主要組成部分或 Agent 的控制器,并通過多模態感知和工具利用等策略擴展其感知和行動空間,通過思維鏈(CoT)和問題分解等技術使 Agent獲得與符號代理相當的推理及規劃能力,并且可以通過從反饋中學習和執行新的行動,獲得與環境的互動能力。圖表圖表6:AI Agent:發展復盤:發展復盤 資料來源:The Rise and Potential of Large Language Model Based Agents:A Survey、華泰研究 智能助手到智能助手到

27、Agent:由搜索匹配走向規劃與交互式決策由搜索匹配走向規劃與交互式決策 聊天機器人:主要基于知識圖譜、檢索等技術。聊天機器人:主要基于知識圖譜、檢索等技術。為在 AI Agent 之前,典型的以人機自然交互為特點的產品包括智能語音助手、開域聊天機器人。從架構看,開域聊天機器人以發布于 2014 年 5 月的微軟小冰為例,其架構主要包括對話管理模塊、技能庫,其中對話管理模塊主要使用同理心計算方法,利用對話背景、用戶查詢、用戶信息等維度的信息構建對話狀態向量,并據此決定之后的對話策略。聊天模塊則通過檢索產生回答候選集(包括基于配對數據的檢索、使用 GRU-RNN seq2seq 框架的神經響應生

28、成器、知識圖譜+未配對數據等方法),并利用排序模塊進一步選擇回答。從技術上看,開域聊天機器人具備 AI Agent的雛形,主要通過向量計算、基于 RNN 框架的生成、知識圖譜強化等技術實現對人類意圖的準確理解及回應。智能語音智能語音助手:架構上已經具備意圖分析、任務規劃、服務調用等模塊。助手:架構上已經具備意圖分析、任務規劃、服務調用等模塊。以 Siri 為例,智能語音助手的架構與 AI Agent 具備一定相似性。該系統可劃分為輸入系統、活躍本體、執行系統、服務系統和輸出系統五個子系統。在活躍本體內部,利用各種詞典資源,模型資源實例化對用戶的輸入信息進行具體加工;執行系統則是將用戶原始的文本

29、輸入解析為內部的語義表示,并決定下一步操作,包括“對話流控制器”(根據領域判斷誘導用戶提供所需的參數)、“任務流控制器”(被“對話流控制器”調用,界定完成一件任務或者解決某個問題由哪些步驟構成,這些步驟之間是何種關系,Siri 的任務模型是由一些領域無關的通用任務模型和若干領域相關任務構成)。我們認為從架構上看,智能語音助手已經具備意圖分析、任務規劃、服務調用幾大核心模塊。免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。9 計算機計算機 圖表圖表7:語音助手語音助手&聊天機器人:技術架構聊天機器人:技術架構 資料來源:CSDN、華泰研究 從輸入到輸出,從輸入到輸出,AI Agent

30、 技術框架基本確立。技術框架基本確立。當前對 AI Agent 整體框架的設計基本上可以分為感知、定義、記憶、規劃、行動五類模塊,其中感知模塊主要處理各類輸入,解決智能體與環境交互的問題;定義模塊主要包含了 Agent 的屬性、目標等信息;記憶模塊包括短期記憶及長期記憶,用于面對復雜任務時提供歷史策略等;規劃模塊包括任務的分解、反思、推理推斷、策略制定等,是 Agent 的大腦;行動模塊包括以文字、具身行動、工具指令等多種形式輸出結果。從偏向于輸入端的感知、定義,到處理端的記憶、規劃,再到輸出端的行動,我們認為 AI Agent 的技術框架與此前智能語音助手的技術框架在模塊設置上存在一定相似性

31、。圖表圖表8:AI Agent:技術框架:技術框架 資料來源:arXiv、華泰研究 免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。10 計算機計算機 AI Agent 架構與當前主流計算架構有相似性。架構與當前主流計算架構有相似性。在 Agent AI Towards a Holistic Intelligence中,研究人員闡述了新的 Agent 范式,Agent AI 能夠基于感官輸入自主執行適當的和上下文相關的動作,與先前互動策略的區別是在訓練后,主體的行動將直接影響任務規劃,而不需要從環境中接收反饋來規劃其后續行動作為先前的互動范式。當前計算機主流的馮 諾依曼結構則是事先

32、將編制好的程序(含指令及數據)存入主存儲器中,計算機在運行程序時自動地、連續地從存儲器中依次取出指令且執行。從構成上看,馮諾依曼機由運算器、存儲器、控制器、輸入設備和輸出設備五大部件組成;AI Agent 同樣具備輸入信息、處理信息、輸出信息的三大部件,在架構上二者具備相似性。圖表圖表9:馮諾依曼結構馮諾依曼結構 注:圖中紅色線為指令流、藍色線為數據流 資料來源:CSDN、華泰研究 AI Agent 是是 LLM 和人類在計算任務中分工的重新劃定。和人類在計算任務中分工的重新劃定。相比主流的計算架構,AI Agent實現了能力的進一步提升。AI Agent 主要由在環境和感知中具有任務規劃和觀

33、察能力的Agent(感知可類比輸入、規劃可類比人類規劃)、Agent 學習(強化學習,類比人類反思)、記憶(類比存儲)、行動(類比輸出)、認知和意識(類比控制)五個模塊構成,模塊上基本能夠對應。從作用上 AI Agent 的感知方面更加強調對于多模態信息的獲取能力,不局限于數據的輸入;認知方面主要用于協調每個 Agent AI 組件,強調了復雜動態環境中交互式Agent 的集成方法的重要性,突出了交互式決策的作用。我們認為 AI Agent 實現了將人類利用編程解決特定任務的過程進一步的接管,從解決問題的執行環節進一步向思考如何解決問題的規劃環節滲透。圖表圖表10:AI Agent:技術框架:

34、技術框架 資料來源:Agent AI Towards a Holistic Intelligence、華泰研究 免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。11 計算機計算機 AI Agent 具備兩條能力提升路徑。具備兩條能力提升路徑。根據分工劃分模塊的方式是當前得到較為廣泛采用的 AI Agent 技術框架,與之對應的,針對 AI Agent 的能力提升同樣可以從分模塊能力突破、系統性優化兩條路徑展開。在分模塊能力突破中,相比于 LLM 支撐的聊天機器人(如ChatGPT),我們認為 AI Agent 在感知模塊中具備更加豐富的模態理解能力,在記憶模塊中能夠結合更加豐富的數

35、據來源,在規劃模塊中具備更強的規劃、反思能力,在行動模塊中能夠提供更加豐富的輸出,此外在系統性優化的過程中,AI Agent 也有望逐步向通用人工智能過渡。分模塊持續突破分模塊持續突破+系統性系統性優化優化推動推動 AI Agent 能力提升能力提升 感知:模型端原生多模態推進,感知:模型端原生多模態推進,Agent 多模態感知能力可期多模態感知能力可期 感知模塊:從單一模態向多模態延伸。感知模塊:從單一模態向多模態延伸。感知模塊的核心功能主要是幫助 Agent 獲取信息,可以與計算機中的鼠標、鍵盤等各類輸入設備進行類比。從核心功能看,基于 LLM 的 AI Agent 在信息輸入方面強調多模

36、態感知的能力,包括視覺、聽覺、觸覺等感知能力,涉及文本、圖像、視頻、3D 等多種模態。從落地路徑看,當前對于跨模態的落地方式主要包括通過變換器將非文本模態轉為文本模態、對非文本模態進行編碼并將編碼器與 LLM 對齊,或通過結合思維鏈技術、結合知識,強化 Agent 對于不同模態信息的理解能力。圖表圖表11:AI Agent:感知模塊及落地路徑:感知模塊及落地路徑 資料來源資料來源 感知模塊感知模塊 落地路徑落地路徑 復旦 NLP 團隊 如何使基于 LLM 的 Agent 獲得多模式感知能力,包括文本、視覺、聽覺輸入以及其他潛在的輸入形式,如觸覺反饋、手勢和 3D 地圖,以豐富主體的感知領域并增

37、強其多功能性。理解文本輸入中的隱含含義(強化學習、指令微調);圖像字幕(為圖像輸入生成相應的文本描述)、使用變換器對視覺信息進行編碼、將視覺編碼器與 LLM 對準;掩碼機制(使 Agent 理解不同時間幀之間關系);調用現有工具集或模型存儲庫來感知音頻信息、將感知方法從視覺領域遷移到音頻領域;結合硬件設備探索其他輸入方式 上交團隊 提示 Agent 逐步解釋感知,作為一個感知鏈,已被證明可以提高行動成功率。多模式感知是實現通用人工智能的關鍵步驟之一。感知的單向解釋;從整合環境反饋中受益匪淺,特別是在環境發生變化的多回合互動的背景下 斯坦福大學/Microsoft(李飛飛等)與人類一樣,強大的多

38、模式感知對于智能體理解其環境至關重要。視覺感知是最重要的能力之一,使代理能夠理解世界,例如圖像、視頻、游戲。同樣,音頻感知對于理解人類意圖至關重要 基于知識的 LLM 代理可以提高 2D 和 3D 場景理解、生成和編輯的性能;通過集成 Agent AI 框架,大型基礎模型能夠更深入地理解用戶輸入,從而形成一個復雜且自適應的 HCI 系統 資料來源:arXiv、華泰研究 端到端原生多模態模型不斷落地。端到端原生多模態模型不斷落地。從產業進展看,端到端的原生多模態模型逐步落地。2023年 11 月 Google 推出原生多模態模型 Google Gemini,從一開始便在不同模態上(包括文字、音頻

39、、圖片、視頻、PDF 文件等)進行了預訓練,然后利用額外的多模態數據進行微調以提升有效性,實現了多模態數據訓練的突破。2024 年原生多模態模型在應用端進一步取得突破,2024 年 5 月 Open AI 發布 GPT-4o,不同于傳統的模型級聯和拼接,GPT-4o是跨文本、視覺和音頻端到端地訓練的新模型,這意味著所有輸入和輸出都由同一神經網絡處理,基于此,我們認為相較于此前的智能語音助手,基于 LLM 的 AI Agent 對于多種模態信息的綜合處理能力進一步加強。圖表圖表12:Google Gemini:多模態融合:多模態融合 圖表圖表13:OpenAI GPT4o:端到端多模態:端到端多

40、模態 資料來源:Google 官網、華泰研究 資料來源:OpenAI 官網、華泰研究 免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。12 計算機計算機 記憶:模型端上下文長度持續突破,向量外部存儲與檢索強化長期記憶記憶:模型端上下文長度持續突破,向量外部存儲與檢索強化長期記憶 記憶模塊:短期記憶關注模型變化,長期記憶關注數據處理與檢索技術。記憶模塊:短期記憶關注模型變化,長期記憶關注數據處理與檢索技術。在記憶模塊中,現有研究多數把記憶劃分為短期記憶、長期記憶,其中短期記憶主要來自于上下文學習,受到 Transformer 的有限上下文窗口長度的限制,長期記憶則具備參數知識存儲(模

41、型訓練)、非參數知識存儲(外部搜索)的方式實現,目前常用的方式主要是通過外部向量存儲,Agent以查詢的方式快速檢索訪問。相較于智能語音助手產品長期記憶主要記憶的是用戶個人信息等靜態信息,長期記憶的內容進一步豐富、數據量進一步提升;短期記憶系統則實現了更長的對話內容支持,有助于進一步解決復雜問題。圖表圖表14:AI Agent:記憶模塊及落地路徑:記憶模塊及落地路徑 資料來源資料來源 記憶模塊記憶模塊 落地路徑落地路徑 OpenAI(LilianWeng)短期記憶:我認為所有的上下文學習都是利用模型的短期記憶進行學習。長期記憶:這為代理提供了長時間保留和調用(無限)信息的能力,通常是通過利用外

42、部矢量存儲和快速檢索。感覺記憶作為原始輸入的學習嵌入表示,包括文本、圖像或其他模態;上下文學習中的短期記憶。它是短而有限的,因為它受到 Transformer 的有限上下文窗口長度的限制。作為外部向量存儲的長期內存,代理可以在查詢時處理,可通過快速檢索訪問 外部記憶可以緩解有限注意力跨度的限制。標準實踐是將信息的嵌入表示保存到可以支持快速最大內積搜索(MIPS)的向量存儲數據庫中。人大高瓴人工智能學院 存儲從環境中感知到的信息,并利用記錄的記憶來促進未來的行動。記憶模塊可以幫助智能體積累經驗,自我進化,并以更一致、合理和有效的方式行事。短期存儲器類似于由轉換器架構約束的上下文窗口內的輸入信息。

43、長期內存類似于外部矢量存儲,代理可以根據需要快速查詢和檢索。記憶讀?。喝绾螠蚀_檢索 記憶寫入:需要解決如何存儲與現有記憶相似的信息、當記憶達到其存儲極限時,如何刪除信息 記憶反射。目標是為代理提供獨立總結和推斷更抽象、復雜和高級信息的能力。Agent能夠將存儲在內存中的過去經歷總結為更廣泛、更抽象的見解。復旦 NLP 團隊 當面對復雜的問題時,記憶機制有助于主體有效地重新審視和應用先前的策略。此外,這些記憶機制使個人能夠通過借鑒過去的經驗來適應陌生的環境。提高 Transformer 的長度限制(文本截斷、分割輸入、強調文本的關鍵部分、修改注意力機制以降低復雜性);總結記憶(使用提示、分層方法

44、);用矢量或數據結構壓縮存儲器(為記憶部分、計劃或對話歷史嵌入向量、將句子轉換為三元組配置、SQL數據庫集成);記憶檢索。上交團隊 短期記憶更具時間特異性,提供了明確的、最近的上下文。長期記憶對任務更為普遍,是對整個世界的宏觀和抽象理解。這可以包括存儲生產系統本身的過程記憶、存儲關于世界的事實的語義記憶和存儲代理過去行為序列的情節記憶。長期記憶可以依賴于參數和非參數知識存儲。它們可以來自語言代理的可訓練參數,也可以作為可以通過檢索系統利用的外部知識來維護。樹搜索。記憶可以用樹結構存儲,并通過在樹上搜索來獲取。矢量搜索。將日常記憶作為嵌入存儲在這個矢量數據庫中。當 Agent 遇到新的情況并需要

45、回憶過去的記憶時。資料來源:arXiv、華泰研究 大模型支持上下文長度持續上升,外部存儲方式不斷豐富。大模型支持上下文長度持續上升,外部存儲方式不斷豐富。隨著大模型的迭代持續推進,當前大模型所能支持的上下文長度不斷提升,2024 年 5 月 Google 在 Google I/O 2024 開發者大會上宣布推出 Gemini 1.5 Pro 的個人預覽版,最多可容納 200 萬 token 數。我們認為隨著大模型支持上下文長度的提升,大模型賦能的 Agent 在短期記憶能力方面或將進一步上升。在長期記憶方面,外部存儲的方式也不斷豐富,提供相關產品的廠商包括向量數據庫廠商、添加向量檢索功能的傳統

46、數據庫廠商、封裝向量及知識庫的應用廠商。圖表圖表15:大模型支持上下文長度情況大模型支持上下文長度情況 資料來源:各公司官網、華泰研究 0.52248163212812812812820010001048200005001,0001,5002,0002,500OpenAI GPT 1OpenAI GPT 3Meta LLaMA 1Meta LLaMA 2Meta LLaMA 3OpenAI GPT 3.5Meta LLaMA 2 LongOpenAI GPT 4 TurboOpenAI GPT 4omoonshot-v1Microsoft Phi-3Anthropic Claude 2Anth

47、ropic Claude 3Gradient LLaMA 3Google Gemini 1.5 Pro上下文長度(k token)免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。13 計算機計算機 規劃:關注規劃:關注 LLM 對于任務分解算法及反思提煉能力的改變對于任務分解算法及反思提煉能力的改變 規劃模塊:目標分解與反思提煉為兩大核心任務。規劃模塊:目標分解與反思提煉為兩大核心任務。規劃模塊是 AI Agent 能夠解決復雜問題的關鍵模塊,從功能看主要包括子目標分解、反思及提煉等,其核心能力來自于底層模型的推理能力。計算機誕生初期,多步驟問題的規劃往往由人腦完成,計算機充當解決

48、問題的工具。而隨著任務分解算法(如層次化任務網絡(HTN)、任務樹、分層強化學習、規則引擎等)的發展,計算機開始承擔部分的規劃任務,如智能語音助手中的任務流控制器主要用于分解任務步驟,判斷步驟關系,RPA 與業務規則引擎結合實現業務流程的自動化等。隨著 LLM 技術的發展,通過微調或思維鏈(CoT)等技術對 AI Agent 進行干預,使 Agent逐步提升了規劃的效率。圖表圖表16:AI Agent:規劃模塊及落地路徑:規劃模塊及落地路徑 資料來源資料來源 規劃模塊規劃模塊 落地路徑落地路徑 OpenAI(LilianWeng)子目標和分解:Agent 將大型任務分解為較小的、可管理的子目標

49、,從而實現對復雜任務的高效處理。反思和提煉:Agent 可以對過去的行為進行自我批評和反思,從錯誤中吸取教訓,并為未來的步驟進行提煉,從而提高最終結果的質量。任務分解:任務分解:思維鏈(CoT)將大任務轉換為多個可管理的任務,并為模型思維過程的解釋提供線索。思維樹通過在每一步探索多種推理可能性來擴展 CoT。它首先將問題分解為多個思考步驟,并在每個步驟中生成多個想法,從而創建一個樹狀結構。反思提煉:反思提煉:ReAct 通過將動作空間擴展為特定任務的離散動作和語言空間的組合,將推理和動作整合在LLM中。前者使LLM能夠與環境交互(例如使用維基百科搜索API),而后者則促使 LLM 生成自然語言

50、的推理痕跡。Reflexion 是一個為代理提供動態記憶和自我反思能力以提高推理技能的框架。Chain of Hindsight 鼓勵模型通過明確地向其提供一系列過去的輸出來改進其自身的輸出,每個輸出都附有反饋。人大高瓴人工智能學院 當面對復雜的任務時,人類傾向于將其分解為更簡單的子任務,并單獨解決。規劃模塊旨在賦予智能體這種人類能力,從而使智能體的行為更加合理、有力和可靠。無反饋規劃:無反饋規劃:在這種方法中,代理在采取行動后不會收到可能影響其未來行為的反饋。單一路徑推理、多路徑推理、外部規劃等 帶反饋的規劃:帶反饋的規劃:環境反饋、人類反饋、模型反饋(反饋通常是基于預先訓練的模型生成的)復

51、旦 NLP 團隊 規劃模塊的核心是推理能力。通過推理,代理將復雜的任務解構為更易于管理的子任務,為每個任務制定適當的計劃此外,隨著任務的進展,Agent 可以使用內省來修改他們的計劃,確保它們更好地與現實世界的環境相一致 思維鏈(CoT)方法、自一致性、自潤色、自精煉、選擇推理等;自適應策略(如 CoT)、分層規劃、單一策略、與特定領域的規劃者集成 利用內部反饋機制,通常從預先存在的模型中獲得見解;量身定制的人類反饋;從有形或虛擬的環境中獲得反饋 上交團隊 CoT 應用于通過計劃或決策誘導代理人推理 行動鏈(將決策轉化為 CoT 推理問題)、應用 CoT 提示方法,在與環境的交互過程中引出 L

52、LM 的推理能力、在精心策劃的數據集上微調 LLM 資料來源:arXiv、華泰研究 利用利用 ReAct 方式發揮方式發揮 LLM 推理能力。推理能力。ReAct(Reasoning and Acting)指使用 LLM 以交錯的方式生成推理軌跡和特定于任務的操作,從而實現兩者之間的更大協同作用:推理軌跡幫助模型誘導、跟蹤和更新行動計劃以及處理異常,而操作允許它與外部源(例如知識庫或環境)交互以收集更多信息。具體可通過為每個工具提供描述,讓 LLM 選擇工具,或為Agent 提供搜索工具、查找工具,讓 LLM 與文檔庫交互。ReAct 方式能夠將必要的知識提供給 LLM 供其分析決策,避免其因

53、使用超出訓練過程中的數據進行邏輯分析時產生幻覺和錯誤判斷的情況。但從當前的實踐看,ReAct 方式仍然存在對于復雜問題的解決能力有限、成本相對不可控(LLM 拆解、循環任務的方式存在不確定性)、響應速度較 API 慢等局限性。我們認為未來隨著 LLM 性能的提升及 LLM 工程化落地方式的創新,LLM 推理能力有望得到更加充分的發揮。行動:工具使用能力為關鍵,具身智能為新方向行動:工具使用能力為關鍵,具身智能為新方向 行動模塊:關注微調、工具使用與具身智能技術發展。行動模塊:關注微調、工具使用與具身智能技術發展。行動模塊是 AI Agent 輸出推理結果,對外部產生影響的重要途經,從輸出的形式

54、看包括文本、對工具的使用、具身動作等。在工具使用方面,當前主要的落地方式是通過微調或預先設定的模型描述框架,讓 Agent 調用對應的外部 API,從而實現對現成功能的使用或對特定信息的訪問搜集。而通過元工具學習等方法,Agent 對于工具的使用能夠在同類型的不同具體工具之前實現技能的遷移,未來隨著模型能力的進一步提升,Agent 有望實現對工具的創建;隨著具身智能技術的發展,Agent 有望對物理世界產生進一步的影響。免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。14 計算機計算機 圖表圖表17:AI Agent:行動模塊及落地路徑:行動模塊及落地路徑 資資料來源料來源 行動模

55、塊行動模塊 落地路徑落地路徑 OpenAI(LilianWeng)Agent 學習調用外部 API 來獲取模型權重中缺少的額外信息(通常在預訓練后很難更改),包括當前信息、代碼執行能力、對專有信息源的訪問等等。MRKL 簡稱“模塊化推理、知識和語言”,是一種用于自主主體的神經符號體系結構。MRKL 系統被提議包含一組“專家”模塊,通用 LLM 作為路由器將查詢路由到最合適的專家模塊。這些模塊可以是神經的(例如深度學習模型)或符號的(例如數學計算器、貨幣轉換器、天氣 API)。HuggingGPT 是一個使用 ChatGPT 作為任務規劃器的框架,根據模型描述選擇 HuggingFace 平臺中

56、可用的模型,并根據執行結果總結響應。對 LM 進行了微調,以學習使用外部工具 API:TALM(工具增強語言模型)、Toolformer 人大高瓴人工智能學院 負責將 Agent 的決定轉化為具體結果。該模塊位于最下游的位置,并直接與環境相互作用。它受到配置文件、內存和計劃模塊的影響。在 LLM 中,模型輸入和輸出直接相關,Agent 可以通過不同的策略和來源采取行動,如通過記憶回憶采取行動(查詢記憶、協作 Agent 等)、根據其預先生成的計劃采取行動。復旦 NLP 團隊 接收大腦模塊發送的動作序列,并執行與環境交互的動作。包括文本輸出、工具使用、基于 LLM 的Agent 配備具身動作 與

57、工具結合,專門的工具使 LLM 能夠增強其專業知識;利用 LLM 了解工具;從演示中學習和從反饋中學習使用工具;元工具學習;創建工具及自調試;具身智能 資料來源:arXiv、華泰研究 多路徑共同提升多路徑共同提升 Agent 整體智能化水平,有望逐步通向整體智能整體智能化水平,有望逐步通向整體智能 LLM+Agent 是通向通用人工智能(是通向通用人工智能(AGI)的路徑之一。)的路徑之一。AI Agent 用來描述表現出智能行為并具有自主性、反應性、主動性和社交能力的人工實體,能夠使用傳感器感知周圍環境、做出決策,然后使用執行器采取行動,具備以上特征的 Agent 是實現 AGI 的關鍵一步

58、。據2023 年 11 月 Google DeepMind 發布的論文 Levels of AGI:Operationalizing Progress on the Path to AGI,考慮 AGI 性能、通用性和自主性級別,AGI 的發展可按 L0-L5 分級。按該分級方法,目前在狹義 AI 上人類已經實現了在特定的任務上讓 AI 超越人類,但是對于廣義的 AGI 僅實現到 L1 階段,典型代表是 ChatGPT、Bard 和 Llama。從更廣義的評判標準看,基于 LLM 的 Agent 評估工作還從效用、社會性、價值等角度開展,我們認為當前基于LLM 的 Agent 從能力上看受到

59、LLM 能力上限的限制,未來隨著 Agent 的不斷升級,有望逐步逼近 AGI,具體的路徑包括模態豐富、具身智能、多 Agent 協同、系統優化等。圖表圖表18:AGI 分級分級 性能性能(行行)x 通用性通用性(列列)狹義狹義 特定的任務或任務組特定的任務或任務組 廣義廣義 廣泛的非物理任務,包括學習新技能等元認知能力廣泛的非物理任務,包括學習新技能等元認知能力 Level 0:無無 AI 狹狹義非義非 AI 計算器軟件;編譯器 廣義非廣義非 AI 人類參與的計算,如 Amazon Mechanical Turk Level 1:涌現涌現 相當于或稍優于普通人 涌現狹義涌現狹義 AI 古典人

60、工智能 GOFAI;基于簡單規則的系統,比如 SHRDLU 涌現涌現 AGI ChatGPT,Bard,Llama 2 Level 2:勝任勝任 至少達到熟練成年人的中等水平 勝任狹義勝任狹義 AI 如 Jigsaw 的毒性檢測器;智能音箱,如 Siri,Alexa,或 Google Assistant;視覺問答系統,如 PaLI;IBM 的 Watson;在某些特定任務上的最新水平的大語言模型(例如,寫短篇文章、簡單編程)勝任勝任 AGI 還未實現 Level 3:專家專家 至少達到熟練成年人中的頂尖水平 專家狹義專家狹義 AI 例如 Grammarly 的拼寫和語法檢查器;生成圖像模型,如

61、 Imagen 或 Dall-E 2 專家專家 AGI 還未實現 Level 4:大師大師 至少達到熟練成年人中的極高水平 大師狹義大師狹義 AI 深藍(Deepblue),AlphaGo 大師大師 AGI 還未實現 Level 5:超人類超人類 超越所有人類的表現 超人類超人類狹義狹義 AI AlphaFold,AlphaZero,StockFish 人造超智能人造超智能(ASI)還未實現 資料來源:Levels of AGI:Operationalizing Progress on the Path to AGI、華泰研究 免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。15

62、計算機計算機 路徑一:模態豐富路徑一:模態豐富+具身智能具身智能+多多 Agent 協同協同 Agent 具有五個層級,信息維度不斷豐富有望推動能力提升。具有五個層級,信息維度不斷豐富有望推動能力提升。Yonatan Bisk 在 Experience Grounds Language 中提出 World Scope(WS),來描述自然語言處理到通用人工智能(AGI)的研究進展,包括語料庫-互聯網-感知(多模態 NLP)-具身-社會 5 個層級。當前多數 LLM建立在互聯網層級,具有互聯網規模的文本輸入和輸出。而隨著 LLM 進一步配備擴展的感知空間和行動空間,有望進一步通向感知、具身層級,未

63、來多個 Agent 共同工作,有望產生涌現的社會現象,達到第五層級。圖表圖表19:通用人工智能(通用人工智能(AGI):研究進展):研究進展 資料來源:Experience Grounds Language、華泰研究 多多 Agent 協同或出現團體行為,提升智能化程度。協同或出現團體行為,提升智能化程度。從 Agent 落地方式看,可分為單 Agent部署、多 Agent 交互和人-Agent 交互三種方式,其中多 Agent 交互及人-Agent 協同通過不同的方式給予 Agent 反饋,有助于 Agent 不斷強化解決問題的能力。更進一步的模擬 Agent社會框架中,在個人層面 Agen

64、t 表現出計劃、推理和反思等內在行為,以及涉及認知、情感和性格的內在個性特征。Agent 和其他 Agent 可以組成團體并表現出團體行為,如合作。在環境中其他 Agent 也是環境的一部分,Agent 有能力通過感知和行動與環境互動。圖表圖表20:AI Agent:三種應用:三種應用場景場景 資料來源:The Rise and Potential of Large Language Model Based Agents:A Survey、華泰研究 免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。16 計算機計算機 關注基礎智能體進展。關注基礎智能體進展。據英偉達科學家 Jim F

65、an 的演講,基礎智能體(Foundation Agent)是掌握廣泛技能,控制許多身體,并能夠泛化到多個環境中的單一算法。隨著模型得到信息數量的提升及訓練速度的加快,理論上模型能夠掌握的技能數量、可控制的身體形態或載體、所能掌握的現實情況有望不斷提升。例如在 Minecraft 中,Voyager 通過引入反饋(來自代碼運行錯誤、虛擬人物狀態、虛擬環境狀況),使虛擬人物在游戲環境中能夠不斷學習新的技能;機器人訓練 Agent MetaMorph 通過設計特殊詞匯描述機器人的具體身體部位,利用 Transformer 輸出電機控制,實現對機器人的控制。通過對訓練進行加速,有望將 Agent的能

66、力進一步泛化,最終實現自主的基礎 Agent。圖表圖表21:Foundation Agent 資料來源:Nvidia 官網、華泰研究 路徑二:通過提升整體性或利用工作流解決復雜問題路徑二:通過提升整體性或利用工作流解決復雜問題 通過提升通過提升 Agent AI 整體性有助于解決復雜問題。整體性有助于解決復雜問題。除了單個模塊、環節的技術突破,模塊間的互動方式也是 Agent 能力的重要影響因素。當前的 AI Agent 對于被動結構化任務的處理已有較為豐富的實踐,但距離在復雜環境中扮演動態互動角色仍有一定的差距,我們認為除了單個模塊的能力提升,圍繞 AI Agent 整體系統的優化或將成為

67、AI Agent 能力進一步提升的重要驅動力。據Agent AI Towards a Holistic Intelligence,研究人員提出一個將大型基礎模型集成到 Agent 動作中的具體系統Agent AI 系統,該系統強調 AI 作為有凝聚力的整體發揮作用。按系統層級看,自下而上分別為數據-預訓練模型-調優模型-任務-跨模態-不可知的現實(新范式/物理世界/虛擬現實/元宇宙/涌現能力等)-整體智能。在數據端,該系統強調利用不同環境之間的交互獲取的跨模態數據,在系統端則結合了大型基礎模型對開放世界環境中感官信息的理解,最終 AI 展示了較好的跨學科、跨任務能力,涵蓋了機器人、游戲和醫療保

68、健系統等新興領域。長期看該路徑或將逐步通向整體智能。免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。17 計算機計算機 圖表圖表22:Agent AI 系統概述系統概述 資料來源:arXiv、華泰研究 Agent Workflow 通過流程優化提升任務效果。通過流程優化提升任務效果。2024 年 3 月,斯坦福大學吳恩達教授在博客中提出在 HumanEval 數據集中,使用 GPT-3.5(Zero-shot)的測試正確率為 48.1%。GPT-4(Zero-shot)為 67.0%。而通過與 Agent workflow 配合,GPT-3.5 實現了 95.1%的正確率。在加入

69、Agent workflow 后,模型在具體任務中的能力有了明顯的提升。Agent workflow 是一種新的工作流程,要求 LLM 多次迭代文檔。從設計模式上,Agent 有四種模式:1)Reflection(反思):讓智能體審視和修正自己生成的輸出;2)Tool Use(使用工具):LLM被賦予 Web 搜索、代碼執行或其他功能,以幫助它收集信息、采取行動或處理數據;3)Planning(規劃):讓 LLM 提出并執行一個多步驟計劃來實現目標;4)Multiagent collaboration(多智能體協作):多個智能體合作完成任務。我們認為 Agent Workflow 通過對LLM

70、 應用的流程優化,有助于提升 Agent 解決具體任務的準確性,LLM 應用端廠商有望借鑒此方法推動更多垂類 LLM 落地。圖表圖表23:Agent workflows:有效提升:有效提升 Human Eval 測試表現測試表現 資料來源:Deeplearning.ai 官網、華泰研究 免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。18 計算機計算機 AI Agent 技術逐步落地,智能性仍有提升空間技術逐步落地,智能性仍有提升空間 從 AI Agent 的落地方式看,基于 LLM 的 Agent 產品眾多,但各自在自主程度,能力范圍上有一定差異。本節我們選取部分典型案例展開分析

71、,具體包括:AutoGPT(2023.3)、卡耐基梅隆大學智能 Agent 系統(2023.4)、Devin(2024.2)。AutoGPT:利用:利用 LLM 逐步拆解任務,外掛插件提升能力逐步拆解任務,外掛插件提升能力 AutoGPT 具備具備 AI Agent 的雛形。的雛形。AutoGPT 是一個構建在 GPT-4 基礎上的開源 Python 應用程序,由視頻游戲公司 Significant Gravitas Ltd 的創始人 Toran Bruce Richards 于 2023年 3 月 30 日推出,其功能包括從互聯網收集信息、存儲數據、通過實例生成文本、訪問各種網站和平臺以及使

72、用 LLM 執行摘要的能力,常用于市場研究、網站創建、博客寫作和創建播客。從所需工具看,構建 AutoGPT 需要 Python(程序)、OpenAI API 密鑰(大模型)、Pinecone API 密鑰(向量數據庫產品)、Git(開放源碼版本控制)、ElevenLabs API(可選語音相關模塊)。我們認為 AutoGPT 具備實現多種任務的能力,具備 AI Agent 的雛形。圖表圖表24:AutoGPT:任務流程:任務流程 資料來源:Github、華泰研究 利用利用 LLM 拆分任務。拆分任務。從實現功能的步驟看,AutoGPT 的構建分為:1)本地下載 Auto-GPT項目及相關資源

73、;2)輸入 AI 名稱、AI 角色以及最多 5 個目標;3)任務創建或排序:了解目標,生成任務列表,并提及實現這些任務的步驟,審查任務順序以確保其在邏輯上有意義;4)任務執行:利用 GPT-4、互聯網和其他資源來執行這些任務;5)生成結果:具體結果形式包括 Thoughts(AI Agent 在完成動作后分享他們的想法)、Reasoning(解釋了為什么選擇特定的行動方針)、Plan(該計劃包括新的任務集)、Criticism(通過確定局限性或擔憂來批判性地審查選擇),本質上是 ReAct(Reason+Act)的應用。從實現步驟看,人類在其中給出基本的任務步驟后,AutoGPT 通過調用 L

74、LM,實現對任務的理解與拆分。LLM 分解任務受模型能力及數據的限制。分解任務受模型能力及數據的限制。AutoGPT 的能力范圍仍然受到 Python 函數集能力邊界的限制,在搜索網絡、管理內存、與文件交互、執行代碼和生成圖像等具備較豐富可調用函數的領域效果較好,但對于更為復雜的任務處理能力有限。此外,LLM 在分解問題的模式上較為固定,并且存在受到預訓練數據和知識的限制,對于重復出現的子問題識別能力不足等問題。免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。19 計算機計算機 圖表圖表25:AutoGPT:程序示例:程序示例 資料來源:Github、華泰研究 通過調用插件實現能力

75、的擴展。通過調用插件實現能力的擴展。2023 年 6 月 Auto-GPT 更新至 v0.4.1,AutoGPT 對于插件的支持進一步強化,從插件的功能看,第一方插件主要功能包括信息檢索(搜索引擎、新聞、社媒、百科等)、任務規劃、智能生成(郵件回復等)、API 調用等;第三方插件則實現了對 AutoGPT 能力邊界的進一步擴展,添加了交易、使用 AI 工具、數據庫查詢、功能集成等。我們認為插件幫助 AutoGPT 進一步提升了用工具獲取信息、加工信息的能力,使得Agent 的能力邊界得到進一步的延展。圖表圖表26:AutoGPT:第一方插件:第一方插件 Plugin 描述描述 Astro In

76、fo 這提供了有關宇航員的 Auto-GPT 信息。API Tools 這允許 Auto-GPT 進行各種 API 調用。Baidu Search 該搜索插件將百度搜索引擎集成到 Auto-GPT 中。Bing Search 該搜索插件將 Bing 搜索引擎集成到 Auto-GPT 中。Bluesky 啟用 Auto-GPT 從 Bluesky 檢索帖子并創建新帖子。Email 利用 AI 自動起草和智能回復電子郵件。News Search 該搜索插件使用 NewsAPI 聚合器將新聞文章搜索集成到 Auto-GPT 中。Planner 適用于 Auto-GPT 的簡單任務規劃器模塊 Rand

77、om Values 啟用 Auto-GPT 以生成各種隨機數和字符串。SceneX 使用 Auto-GPT SceneX 插件探索超越像素的圖像敘事。SerpApi 在 SerpApi 支持的各種搜索引擎上進行搜索,并從結果中獲取豐富的信息。Telegram 一個運行流暢的 Telegram 機器人,可以為您提供通常通過終端獲得的所有消息。Twitter Auto-GPT 能使用 Tweepy 通過 API 訪問 Twitter 來檢索帖子和其他相關內容。Wikipedia Search 這允許 Auto-GPT 直接使用維基百科。WolframAlpha Search 這允許 AutoGPT

78、 直接使用 WolframAlpha。資料來源:Github、華泰研究 免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。20 計算機計算機 圖表圖表27:AutoGPT:部分第三方插件:部分第三方插件 插件插件 描述描述 Alpaca-Trading 使用 Auto-GPT 交易股票和加密貨幣、紙幣或實時交易 AutoGPTReddit 訪問 Reddit AutoGPT User Input Request 允許 Auto-GPT 在連續模式下專門請求用戶輸入 BingAI 啟用 Auto-GPT 通過 BingAI 獲取信息,節省時間、API 請求,同時保持準確性。這并不會消除

79、對 OpenAI API 密鑰的需求 Crypto 使用 Auto-GPT 交易加密貨幣 Discord 通過 Discord 與您的 Auto-GPT 實例交互 Dolly AutoGPT Cloner 一種組合和運行多個協作的 Auto-GPT 進程的方法,直到核心具有多代理支持 Google Analytics 將您的 Google Analytics 帳戶連接到 Auto-GPT。IFTTT webhooks 該插件允許您使用 Maker 輕松集成 IFTTT 連接 iMessage 使用 Auto-GPT 發送和獲取 iMessage Instagram Instagram 訪問 M

80、astodon 簡單的 Mastodon 插件,可通過 Mastodon 帳戶發送嘟嘟聲 MetaTrader 將您的 MetaTrader 賬戶連接到 Auto-GPT。Mindware AutoGPT 的應用程序商店。使用一個 API 密鑰,即可解鎖對越來越多插件的訪問。Notion Auto-GPT 的 Notion 插件。Slack 該插件允許接收命令并將消息發送到 Slack 通道 Spoonacular 使用 Auto-GPT 查找食譜靈感 System Information 該插件在提示符中添加了一行額外的內容,作為 AI 使用當前系統可能支持的 shell 命令的提示。通過合

81、并此插件,您可以確保 AI 模型提供更準確且特定于系統的 shell 命令,從而提高其整體性能和實用性。TiDB Serverless 將 TiDB Serverless 數據庫連接到 Auto-GPT,啟用從數據庫獲取查詢結果 Todoist-Plugin 允許 Auto-GPT 以編程方式與您的 Todoist 交互,以創建、更新和管理您的 Todoist Weather 一個簡單的天氣插件,圍繞 python-weather Web-Interaction 啟用 Auto-GPT 以與網站充分交互,允許 Auto-GPT 單擊元素、輸入文本和滾動 Website-Carbon-Footp

82、rint 利用 Auto-GPT 的網站碳足跡 API WolframAlpha 訪問 WolframAlpha 進行數學計算并獲取準確信息 YouTube 各種 YouTube 功能,包括下載和理解 Zapier webhooks 該插件可讓您輕松集成 Zapier 連接 Project Management 輕松簡化您的項目管理:Jira、Trello 和 Google 日歷變得毫不費力 RabbitMQ 該插件允許您通過微服務與 Auto-GPT 實例進行通信。資料來源:Github、華泰研究 卡耐基梅隆卡耐基梅隆 Agent:利用:利用 LLM 強化信息獲取及工具使用強化信息獲取及工具

83、使用 利用利用 LLM 強化搜索。強化搜索。2023 年 4 月卡耐基梅隆大學在論文 Emergent autonomous scientific research capabilities of large language models中提出了一個智能代理系統,它結合了多種大型語言模型,用于自主設計、規劃和執行科學實驗。其中利用 LLM 的模塊包括“網頁搜索器”、“文檔搜索器”,無需 LLM 的模塊包括“代碼執行器”、“自動化”,另有 Planner模塊用于協調各個細分模塊。Planner 模塊輸出 Google 查詢指令給網頁搜索器、輸出文檔查詢指令給文檔搜索器,進行文檔的查找梳理,為執

84、行部分提供所需的參數及文檔信息,最后由代碼執行器、自動化模塊進行實驗。在此案例中,LLM 主要用于強化文檔及互聯網知識的檢索,實質上對具體任務的執行過程由搜索結果得到。圖表圖表28:Agent:系統框架:系統框架 資料來源:Emergent autonomous scientific research capabilities of large language models、華泰研究 免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。21 計算機計算機 通過細分領域內容提升執行準確度。通過細分領域內容提升執行準確度。在本案例中,通過為文檔搜索領域添加垂直領域內容有助于提升執行的準確

85、度。具體來看主要有兩種方式,第一種是通過對指令進行編碼并結合向量搜索,對專門的 API 文檔進行搜索與匹配,提升輸入 Planner 的編碼質量;另一種方式是通過補充文檔指南,提示使用專用工具的特定語言體系進行功能推薦。結合了專業知識庫及文檔后,Agent 的知識范疇不再局限于大模型訓練的語料,能夠完成對具體工具的正確使用。在本案例中,Agent 自動調整代碼以應對專用軟件包缺失、自動搜索說明文檔調整工具的效果,并完成了布洛芬的合成、阿司匹林合成、鈴木反應研究、天冬氨酸合成。圖表圖表29:Agent:文檔搜索概述文檔搜索概述 資料來源:Emergent autonomous scientifi

86、c research capabilities of large language models、華泰研究 Devin:利用:利用 AI 實現自主編程實現自主編程 Devin利用利用AI實現自主編程。實現自主編程。2024年3月AI初創公司Cognition發布AI軟件工程師Devin,Devin 可以規劃和執行需要數千個決策的復雜工程任務,可在每一步都回憶起相關的上下文,隨著時間的推移學習,并糾正錯誤,此外 Devin 還可以與用戶積極協作,實時報告其進度,接受反饋,并根據需要與用戶一起完成設計選擇。研究人員在 SWE 基準上評估了 Devin,要求代理解決 Django 和 scikit-

87、learn 等開源項目中發現的現實 GitHub 問題。Devin 端到端正確解決了 13.86%的問題,遠遠超過了之前 1.96%的最先進水平。Devin 沒有得到幫助,而所有其他模型在給出了要編輯的確切文件的條件下,以前最好的模型也只能解決 4.80%的問題。免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。22 計算機計算機 圖表圖表30:SWE 基準測試結果基準測試結果 資料來源:Cognition 官網、華泰研究 多種多種 AI 技術結合,技術結合,Agent 形態初具。形態初具。從技術方面,Devin 集成了機器學習、深度學習和自然語言處理,以理解代碼、從現有模式中學習并

88、自主生成代碼,并配備了自己的代碼編輯器、命令行和瀏覽器。從 Devin 的任務實現方式看,主要分為幾個步驟:1)理解用戶意圖,通過 LLM 等 NLP 技術分析用戶的自然語言描述,提取關鍵功能和要求,將用戶分解為任務清單;2)自主學習專業材料(如 API 文檔、開源庫、源碼),掌握代碼結構,LLM 技術可用于加強對專業材料的理解能力,代碼結構的模式識別與匹配則可以通過機器學習模型強化;3)生成代碼并根據用戶的提示調 Bug。我們認為從實現方式看,對于現有文檔的學習與實踐,已經初步具備 Agent 的形態,未來隨著模型能力的進一步提升,Agent 在細分領域的能力有望進一步提升。圖表圖表31:D

89、evin:能力示:能力示例例 能力能力 示例示例 學習如何使用不熟悉的技術 在閱讀了一篇博客文章后,Devin 在 Modal 上運行 ControlNet,為 Sara 生成帶有隱藏消息的圖像。端到端構建和部署應用程序 制作了一個互動網站,模擬生活游戲!它逐步添加用戶要求的功能,然后將應用程序部署到Netlify。自主發現并修復代碼庫中的錯誤 Devin 幫助用戶維護和調試他的開源競爭編程書籍 訓練和微調自己的人工智能模型 為一個大型語言模型設置了微調,只提供了 GitHub 上研究存儲庫的鏈接。解決開源存儲庫中的 bug 和功能請求 只要有一個指向 GitHub 問題的鏈接,Devin 就

90、可以完成所需的所有設置和上下文收集??梢詾槌墒斓纳a存儲庫做出貢獻 SWE 基準測試中。Devin 解決了 SympyPython 代數系統中對數計算的錯誤。Devin 設置代碼環境,復制錯誤,并自行編寫代碼和測試修復程序。資料來源:Cognition 官網、華泰研究 AI Agent:智能性仍有提升空間,關注:智能性仍有提升空間,關注 Agent Workflow 模型架構突破模型架構突破+特定數據推動特定數據推動 LLM Agent 能力突破。能力突破。從 AI Agent 的落地方式看,基于 LLM的 Agent 實踐已經取得一定的成果。具體包括:1)利用 LLM 較強的文本處理能力,實

91、現了信息檢索及工具使用效率的提升;2)利用 LLM 的任務分解能力,實現了簡單問題的步驟分解與規劃;3)利用 LLM 的文本生成能力,打造更加自然的人機交互;4)利用 LLM的可調試性,打造能夠解決垂直領域任務或具備垂直領域知識體系的應用。以上能力突破的基礎一方面來自于 Transformer 架構下,LLM 能力相比傳統 NLP 方法的效率提升,如更加自然的人機交互、更強的文本處理能力;另一方面則來自于特定數據類型訓練賦予 LLM的能力,如從任務分解數據訓練中得到的任務規劃能力、配置特定文件后得到的解決特定領域問題的能力。免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。23 計算

92、機計算機 圖表圖表32:AI Agent:實踐情況:實踐情況 資料來源:各公司官網、華泰研究 LLM Agent 自主化、智能性仍存在提升空間。自主化、智能性仍存在提升空間。從 LLM Agent 的實踐看,當前的 LLM Agent對于執行特定領域的任務已經體現出一定的自主性(如完成科學試驗、搜索資料撰寫報告等),LLM 對于固定范式下解決問題能夠實現較好的自動化,但在解決問題的泛化能力方面,當前主要的 Agent 產品仍距離通用的 Agent 有一定的差距。主要體現在:1)任務規劃方面:當前 Agent 主要基于現有的成熟任務流程進行復現,或基于訓練數據對任務進行簡單的拆分;2)工具使用方

93、面:當前 Agent 基本按照人類的部署進行流程化的操作和嘗試,工具的使用主要通過調用第三方 API 進行。未來隨著底層模型能力的提升。我們認為 AI Agent 有望在以下方面實現能力提升:1)在任務規劃方面從基于規則、參數的規劃能力逐步向基于實踐的反思、迭代進化;2)在工具使用與選擇方面,從基于人類配置的特定工具,向多種工具的選擇規劃進化,甚至更進一步的創造適用于 LLM 的工具。圖表圖表33:從自動化到智能化:從自動化到智能化:AI Agent 資料來源:各公司官網、華泰研究 免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。24 計算機計算機 模型模型&MaaS 廠商:憑豐富

94、工具廠商:憑豐富工具&實踐經驗把握發展機遇實踐經驗把握發展機遇 MaaS 廠商側重廠商側重 2B 業務場景:業務場景:2B 提供落地工具提供落地工具+2D 提供開發框架提供開發框架 面向面向 2B 市場,市場,MaaS 廠商不斷完善廠商不斷完善 Agent 落地工具。落地工具。大模型廠商與 MaaS 廠商合作,共同為 B 端客戶提供基于大模型的產品,其中大模型廠商推動底層模型的能力升級,MaaS巨頭則憑借良好的產品、客戶基礎,提供相應的開發及定制化工具,幫助 B 端客戶打造基于大模型的業務應用。其中較有代表性的廠商為微軟、Amazon、Google。我們認為 MaaS廠商通過云服務實現了基礎軟

95、件層面的良好卡位,而 AI Agent 在 B 端落地及 D 端開發的過程中多需要數據的調用及算力的支撐,MaaS 廠商憑此前的良好卡位實現了業務的延伸,通過提供落地工具和開發框架,成為 AI Agent 市場的重要參與者,也有望首先受益于底層大模型能力突破帶來的 AI Agent 發展機遇。圖表圖表34:MaaS 廠商:業務布局廠商:業務布局 資料來源:各公司官網、華泰研究 2B:基于業務卡位,提供落地工具:基于業務卡位,提供落地工具 Microsoft Copilot Studio 新增新增智能智能 Copilot 功能。功能。在 Microsoft Build 2024 上,微軟發布Mi

96、crosoft Copilot Studio 新功能,讓開發者能根據特定任務和功能,構建主動響應數據和事件的“智能 Copilot”?;谶@類新功能的“智能 Copilot”可通過記憶和知識了解上下文、推理操作和輸入,基于用戶反饋進行學習,并在不知道如何處理時尋求幫助,從而獨立管理復雜、長期運行的業務流程。在技術架構上,通過 Instructions(指令)+Triggers(動機)+Knowledge(知識)+Actions(行動)的流程,實現 AI 的自動化應用。此外包括插件和連接器在內的智能 Copilot 擴展,允許客戶通過將其連接到新的數據源和應用程序來增強 Microsoft Co

97、pilot 智能副駕駛,從而擴展其功能。此外,智能 Copilot 還可通過反饋不斷改善。微軟通過在 2B 定制化工具 Microsoft Copilot Studio 中提供智能 Copilot,實現了 AI 與工作流的初步結合,打造了垂直場景中 AI 的自動化應用。圖表圖表35:智能智能 Copilot:產品界面:產品界面 資料來源:Microsoft 官網、華泰研究 免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。25 計算機計算機 圖表圖表36:Microsoft Copilot Studio 與傳統方式的對比與傳統方式的對比 傳統傳統 Microsoft Copilot

98、Studio 規劃(復雜任務的異步編排)通過人工方式進行確認,銜接多個環節,可能需要數小時甚至數天才能完成 使用生成式人工智能規劃和推理來管理復雜、多步驟、長期運行的任務。如,對新訂單做出反應意味著確定是否需要核實庫存、觸發正確的付款流程、如果金額超過某個閾值則向主管發送批準請求,并回復確認。記憶和語境 重復確認基本信息,如:您是誰、您的保單號是多少、您的地址是多少。對話沒有連續性。從用戶之前的對話中學習,并利用這些知識不斷個性化互動。對話將變得長期、具有語境并高度個性化。監控、學習和改進 交互的改善主要通過底層模型的進步實現,改善周期較長 Copilot 現在可以學習和適應,提供監控和教學功

99、能,以改善其交互。每個 Copilot 都會記錄其活動的全面歷史記錄,使其性能透明化,包括用戶交互、采取的行動和收到的反饋,您只需單擊幾下即可查看它做出了哪些決定,并糾正和教導它們。安全性 主要通過權限管理等安全產品保障數據安全,對于 AI 模型主要通過控制訓練數據的方式保障安全性 嚴格在開發者定義的指令、知識和行動范圍內運行。鏈接到副駕駛的數據源遵守嚴格的安全措施和控制,并通過 Copilot Studio 的統一管理中心進行管理。這包括數據丟失預防、強大的身份驗證協議等。資料來源:Microsoft 官網、華泰研究 在在 IT、人力、營銷等應用場景下實現、人力、營銷等應用場景下實現 AI+

100、自動化。自動化。從設備采購到銷售和服務的客戶接待,用戶都可以讓基于 Microsoft Copilot Studio 構建的智能副駕駛為其工作。例如:1)IT 幫助臺。IT 支持涉及工單、訂單號、批準和庫存水平,Copilot 與 IT 服務管理應用程序交互,根據上下文和記憶解決 IT 工單,創建設備更新的采購訂單,以及聯系經理并獲得批準;2)員工入職。Copilot 會迎接新員工,解釋人力資源數據,并回答問題。它會向新員工介紹伙伴,提供培訓和截止日期,協助填寫表格,并安排第一周的會議,指導新員工完成為期數周的入職和帳戶設置流程;3)銷售和服務的私人禮賓服務??衫门c客人之前對話的記憶來記住客

101、人的偏好、進行預訂、處理投訴并回答與所提供的產品和服務相關的問題。Copilot從互動中學習并提出處理客戶場景的新方法。圖表圖表37:智能智能 Copilot:操作界面:操作界面 資料來源:Microsoft 官網、華泰研究 免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。26 計算機計算機 Amazon:通過:通過 Bedrock 提供提供 Agents 相關功能相關功能。在模型個性化方面,借助 Agents for Amazon Bedrock,用戶可以通過簡單的幾個步驟創建和部署完全托管式的 Agent,通過動態調用 API 來執行復雜的業務任務。Amazon Bedrock

102、 可以根據用戶提供的自然語言指令,如“你是專門處理未結理賠的保險代理人”,完成任務所需的 API 架構,并使用來自知識庫的私有數據來源詳細信息創建提示語。Agents for Amazon Bedrock 可將用戶請求的任務分解為較小的子任務,Agent 會確定正確的任務順序,并處理中途出現的錯誤狀況。圖表圖表38:Amazon Bedrock 功能特性功能特性 資料來源:Amazon 官網、華泰研究 Amazon Bedrock Agent 與與 Amazon 產品產生良好協同。產品產生良好協同。Amazon 在云服務領域具備良好的產品積累,一方面,Agent 產品與 Amazon 原有基礎

103、軟硬件產品能夠實現良好的協同,在向量數據存取方面推出 Amazon OpenSearch Serverless 服務,幫助個性化數據與 AI 實現良好整合、在應用端推動 AI 與 Amazon QuickSight 等應用的結合;另一方面,Agent 工具與公司本身業務系統能夠實現良好的整合。如 Agent 能夠和知識庫協同工作,從而實現任務編排、交互式數據收集、任務旅行、調用 API、數據查詢、來源歸因等任務。通過檢索增強生成,能從用戶選擇的相應知識庫中查找信息,并提供回復。得益于 Amazon 在基礎層的良好基礎,Agent 具備較好的可控性,能夠實現追蹤思維鏈推理、自定義操作架構,并在

104、Agent 調用操作時重新獲得控制權等功能,能夠在所選的后端服務中實現業務邏輯。能夠在后臺執行耗時的操作(異步執行),同時繼續編排流程。圖表圖表39:Amazon Bedrock:解決方案架構:解決方案架構 資料來源:Amazon 官網、華泰研究 免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。27 計算機計算機 2D:提供開發框架,卡位開發者場景:提供開發框架,卡位開發者場景 面向面向 2D 市場,市場,MaaS 廠商提供底層的開發框架。廠商提供底層的開發框架。如微軟 AutoGen 框架,支持使用多個代理來開發 LLM 應用程序,這些代理可以相互對話來解決任務。AutoGen

105、代理是可定制的、可對話的,并且無縫地允許人類參與。他們可以采用 LLM、人力輸入和工具組合的各種模式運作。AutoGen 可用于定義代理交互行為,開發人員可以使用自然語言和計算機代碼為不同的應用程序編寫靈活的對話模式。通過自動化多個語言模型代理之間的聊天,開發人員可以輕松地讓他們自主或根據人工反饋共同執行任務,包括需要通過代碼使用工具的任務。AutoGen 提供多代理會話框架作為高級抽象,使用此框架可以方便地構建大語言模型工作流程。同時,AutoGen 還提供一系列工作系統,涵蓋了來自各個領域的廣泛應用,包括自動翻譯、自動摘要、智能建議等。AutoGen 還支持增強型大語言模型推理 API,可

106、用于提高推理性能并降低成本。圖表圖表40:AutoGen:模式概覽:模式概覽 資料來源:AutoGen 官網、華泰研究 模型廠商落地:模型廠商落地:GPTs 通過配置實現定制化,打造通過配置實現定制化,打造 LLM 垂直領域助手垂直領域助手 三大功能打造定制三大功能打造定制 GPT。GPTs 是為特定目的創建的 ChatGPT 的自定義版本,由 OpenAI于 2023 年 11 月推出。在構建方式上,GPTs 通過提供 Instructions、Expanded knowledge、Actions 三大能力,優化應用的個性化、垂直化、融合化能力。1)Instructions:用戶可在Conf

107、igure 界面手動補充希望 GPT 應用實現的個性化能力;2)Expanded knowledge:用戶可在 Configure 界面上傳額外的文件作為應用的知識參考,打造符合垂直場景、具備專業知識的垂類應用;3)Actions:用戶可額外添加 ChatGPT 與其它應用程序的連接,進一步實現模態融合與應用融合。此外在配置選項卡中還可以進行自定義操作,即可以通過提供有關端點、參數的詳細信息以及模型應如何使用它的描述,實現對第三方 API 的調用。圖表圖表41:GPTs 創建方式創建方式 資料來源:OpenAI 官網、華泰研究 免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。28

108、計算機計算機 GPTs 具備垂直化、多模具備垂直化、多模態態、開放性特點。、開放性特點。OpenAI 官方推出 16 個 GPTs 應用,涵蓋工作、學習、生活、體驗四大應用場景。配置了特定的文件后 GPTs 能力邊界得到拓展,可用于為使用者提供棋盤游戲介紹、數學題指導等,載入多模態模塊后的 GPTs,能夠生成貼紙、繪本等圖片。第三方 GPTs 則包括工作助手、學習助手、生活助手、趣味工具等。從落地產品特點上,我們認為 GPTs 具備垂直化、多模態、開放性的特點。垂直化指應用多基于垂直場景的知識基礎(特定 IP、特定領域知識等);多模態指應用結合了文本、圖像、音頻、視頻等多種模態,提供了豐富的呈

109、現方式;開放性指在應用的開發上門檻較低,用戶可通過簡單的配置實現特定領域 GPTs 的開發。圖表圖表42:首批官方首批官方 GPTs 資料來源:OpenAI 官網、華泰研究 圖表圖表43:部分第三方部分第三方 GPTs 資料來源:OpenAI 官網、華泰研究 免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。29 計算機計算機 應用廠商:具備垂直數據與工程化優勢,關注工作流卡位應用廠商:具備垂直數據與工程化優勢,關注工作流卡位 與工作流結合,推動與工作流結合,推動 Agent 落地落地以以 Servicenow 為例為例 Servicenow:具備覆蓋多個工作流的業務基礎。:具備覆蓋

110、多個工作流的業務基礎。ServiceNow 主要產品 now 平臺。公司基于統一的 Now 平臺為客戶提供工作流的自動化和數字化解決方案。其中技術工作流(Technology)包括 IT 服務管理、IT 運營管理、IT 資產管理、安全運營、集成風險管理、戰略投資組合管理、ServiceNow 云可觀測性等??蛻艉托袠I(Customer and Industry)及員工工作流(Employee)包括客戶服務管理、現場服務管理、人力資源服務交付、工作場所服務交付、法律服務交付等。創建者工作流(Creator)和其他包括應用程序引擎、自動化引擎、平臺基礎、源到支付操作等。Now 平臺實現了對客戶多領

111、域工作流的覆蓋,為 Agent的落地打下了良好的基礎。圖表圖表44:Now Platform:覆蓋多個工作流:覆蓋多個工作流 資料來源:Servicenow 官網、華泰研究 Now assist:AI 重要應用,場景不斷擴展。重要應用,場景不斷擴展。23Q3 公司在 Now 平臺中加入了 Now Assist(AI 助手)功能,發布 Now Assist for Search(從客戶環境中提取信息,實現加強搜索,精準回答)等產品。Now 平臺的更新便于客戶在工作流中集成 AI 能力,相關功能在 ITSM、HR、客戶服務和 Creator 四條產品線中投入使用。23Q4 公司發布新功能 Now

112、Assist in Virtual Agent,該產品通過高級對話式 AI 聊天加快了問題解決速度;Now Assist for Field Service Management 通過幫助技術人員在首次訪問中完成工作、識別必要的設備、提供維修建議并自動快速跟進,降低成本。圖表圖表45:Now assist:應用場景:應用場景 資料來源:Servicenow 官網、華泰研究 免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。30 計算機計算機 結合行業方案,打造結合行業方案,打造 Agent 深入應用。深入應用。ServiceNow 推出針對電信行業的生成式 AI 解決方案 Now A

113、ssist for Telecommunications Service Management(TSM),它基于 Now 平臺構建。在產品特性上,TSM 具備如下特征:1)提供主動體驗??焖僮R別并解決問題。為客戶提供自助服務工具,讓他們自行學習、進行更改和解決問題。2)自動解決問題。讓客戶了解當前的中斷以及如何解決這些中斷。3)利用 AIOps 和機器學習自動化和優化運營工作流,以提高整個組織的效率并降低成本。我們認為深化行業應用有助于 Agent 在垂直領域打造標桿應用。未來企業的工作流或以 gen AI 為核心進行設計,隨著實時數據打通、系統集成度進一步提升,自然語言或在部分場景中取代代碼

114、成為新的業務流程構建方式。圖表圖表46:Servicenow:電信專用:電信專用 GenAI 解決方案解決方案 資料來源:Servicenow 官網、華泰研究 基于私有數據,打造智能應用基于私有數據,打造智能應用以以 Salesforce 為例為例 基于私有數據,打造垂直領域智能應用?;谒接袛祿?,打造垂直領域智能應用。除了在原有系統中的工作流基礎,垂直業務數據也是應用廠商打造 Agent 應用的重要優勢。以 Salesforce 為例,其在營銷銷售等領域具備較好的業務數據基礎?;诖斯敬蛟炝诉m用于 CRM 的對話式 AI,特色是以客戶的公司數據為基礎。從產品布局看,2023 年 3 月公司

115、發布 AI 應用 Einstein GPT,首次將生成式AI 應用到客戶關系管理領域;2023 年 9 月發布 Einstein 1 平臺(核心包括 AI 助手 Einstein Copilot),并與新的 Data Cloud 原生集成,客戶可以通過 Data Cloud 和 Tableau 接收、協調和探索數據,將數據的力量擴展到每個業務領域,為 AI 應用打造了良好的數據基礎。圖表圖表47:Einstein GPT:應用場景:應用場景 資料來源:Salesforce 官網、華泰研究 免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。31 計算機計算機 通過擴展設置將通過擴展設置

116、將 AI 嵌入工作流中。嵌入工作流中。Einstein Copilot 可以通過擴展與原有工作流結合,可通過創建調用流程、Apex 代碼、提示和 MuleSoft API 的自定義操作來擴展 AI 助手的功能,為 Copilot 提供精確的指示,以無縫執行任務并快速完成工作。具體包括:1)對話:向 AI助手提問并給出指示。獲得清晰、可信且可操作的答復;2)操作:使用現成的操作查詢并匯總 Salesforce 中的記錄。根據獨特的業務需求創建自定義操作,提取相關數據;3)規劃師:生成并執行基于來自 CRM、數據云或外部來源的業務數據的一組指導性操作;4)分析:使用全面的儀表板監控和改進 Copi

117、lot,以獲得諸如采用率、參與度和行動可用性等關鍵績效指標。圖表圖表48:Einstein Copilot:擴展:擴展 資料來源:Salesforce 官網、華泰研究 免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。32 計算機計算機 終端廠商:推動人機交互升級,率先實現終端廠商:推動人機交互升級,率先實現 Agent 落地落地 AI+終端終端:結合安全性:結合安全性+個性化,為個性化,為 Agent 落地打下良好基礎。落地打下良好基礎。垂直數據有助于 Agent 形成個性化的能力,AI 部署于終端有助于實現個性化和安全性的良好結合。以 AIPC 為例,通過 AI 能力的本地化部署

118、,使 PC 擁有持續學習能力、提供個性化并保護用戶隱私的服務、配備知識庫適應用戶需求以及可自然交互。AIPC 能夠根據用戶使用習慣、行為和喜好進行自適應和優化為用戶在操作過程中提供更多的個性化建議和支持。AIPC 在終端側進行運算,能夠提供更多的情境信息,如用戶的移動狀態、個人偏好和設備上的多媒體信息?;诮K端的本地數據,Agent 能夠提供更加個性化的服務,本地處理也有助于保障數據的安全性,綜上,我們認為終端 AI 能力的加強有利于 Agent 落地加速。圖表圖表49:AI 終端:結合安全性終端:結合安全性+個性化,利于個性化,利于 Agent 落地落地 資料來源:CSDN、華泰研究 智能手

119、機:智能手機:Siri 為為 Apple Intelligence 重要交互入口。重要交互入口。在智能手機領域,語音交互助手為AI 重要的人機交互入口,有望成為 Agent 落地 C 端的重要場景。據 Apple WWDC,Siri 用戶每天發出的語音請求數量高達 15 億次。在 Apple Intelligence 的支持下,更加智能和自然,并且除了語音,也加入了文字交互能力。1)Siri 目前具有更好的語言理解能力,即使表述不清或者多次表述,Siri 也能識別用戶意圖。2)Siri 也能做“視覺推理”,Apple 稱之為“屏幕感知”,可以理解屏幕上的內容并對其采取行動。3)Siri 能在保

120、障隱私情況下,利用用戶設備上信息的了解來幫助找到正在尋找的內容,如短信、郵件。4)在應用程序內和跨應用程序無縫地執行操作。例如美化照片后,將照片放到備忘錄的某條記事中。未來隨著 Siri 逐步接入多步驟任務處理等功能,有望推動智能手機端 Agent 的落地。圖表圖表50:交互入口:交互入口:Siri 資料來源:Apple 官網、華泰研究 免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。33 計算機計算機 端側模型發展有助于端側模型發展有助于 Agent 落地終端。落地終端。以 Apple Intelligence 為例,其中基礎模型進行各種下游任務微調,得到適合不同下游任務的一組獨

121、立模型;通過 Adapter 微調方法,得到模型權重的小集合,疊加在公共基礎模型上,讓基礎模型能夠選擇需要的能力;最后通過壓縮模型到適合端側的大小,使用優化算法加速推理,實現在端側落地。對比 Agent 的技術架構,往往也需要基礎模型和小模型的共同支撐,我們認為端側模型技術的發展(模型壓縮等技術)有助于 Agent 落地于終端。圖表圖表51:Apple Intelligence 資料來源:Apple 官網、華泰研究 免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。34 計算機計算機 總結:從總結:從 AI Agent 有望逐步通向有望逐步通向 AGI 基礎模型能力提升基礎模型能力提

122、升+工作流工作流接入有望加快接入有望加快 AI Agent 商業化商業化。從 Agent 的發展看,人類在逐步強化程序的自動化、智能化程度。在 AI Agent 的嘗試中,應用廠商結合深度學習等算法、知識圖譜、RPA 等技術實現了部分的自動化,其核心是在存量知識的基礎上,實現由程序自主解決部分問題。LLM 的出現是這一框架下的重要突破,LLM 通過預訓練吸收知識,以大量參數存儲知識,通過 Transformer 的注意力機制,實現了對存量知識吸收理解效率的進一步提升。在解決問題的過程中,相較于傳統的 RPA 等基于規則的自動化方式,體現出了更強的靈活性。我們認為隨著基礎模型能力的進一步提升,A

123、I Agent 在任務規劃中的靈活性、在知識吸收運用的效率方面的上限或將進一步提升。在當前的基礎模型能力下,若將AI Agent 與工作流進一步結合,在工作流程中嵌入 AI Agent 實現部分問題的智能+自動化解決,AI Agent 實用性或將進一步改善,商業化或進一步加速。圖表圖表52:從從 Agent 到到 AGI 資料來源:CSDN、華泰研究 從從 LLM 到到 AI Agent 到到 AGI。據 On the Principles of Parsimony and Self-Consistency for the Emergence of Intelligence(2022),智能的

124、原則包括簡約性、自洽性。其中簡約性要求要求系統通過計算有效的方式來獲得緊湊和結構化的表示,自洽性要求自主智能系統通過最小化被觀察者和再生者之間的內部差異來尋求最自洽的模型來觀察外部世界。我們認為 LLM 以黑盒的方式實現了知識的高效吸收,通過人類對齊實現了自洽性;基于 LLM 的AI Agent 在 LLM 基礎上能夠通過工作流方式引入人類對齊實現自洽,通過垂直數據強化特定領域的知識能力;而隨著知識壓縮的效率的進一步提升(Scaling Laws 或白盒大模型等方式),打造閉環系統完成對知識的驗證,未來有望逐步實現 AGI。免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。35 計算

125、機計算機 相關公司梳理相關公司梳理 從當前 AI Agent 的進展看,在理論研究中發現通過 CoT(思維鏈)、ReAct(推理+行動)等方式能夠完成部分的任務規劃,且長期看通過 AI Agent 或有望進一步走向整體智能;在實踐中,通過將 AI 助手嵌入工作流也已打造出基于特定數據、場景的 Agent 產品雛形,我們認為隨著:1)底層大模型能力的提升;2)Agent+工作流的工程化實踐深入,AI Agent能力有望進一步提升,或將推動 AI 商業化進程加速,建議重點關注 AI 應用與終端產業鏈公司,具體包括:1)協同辦公廠商:)協同辦公廠商:包括金山辦公、泛微網絡、福昕軟件等;2)垂直)垂直

126、應用廠商:應用廠商:包括用友網絡、鼎捷軟件、同花順、中控技術、寶信軟件等;3)終端廠商:終端廠商:中科創達等。圖表圖表53:提及公司表提及公司表 公司代碼公司代碼 公司簡稱公司簡稱 MSFT US Microsoft(微軟)GOOGL US Google(谷歌)META US Meta(臉書)AMZN US Amazon(亞馬遜)NOW US Servicenow CRM US Salesforce(賽富時)未上市 OpenAI 688111 CH 金山辦公 603039 CH 泛微網絡 688095 CH 福昕軟件 600588 CH 用友網絡 300378 CH 鼎捷軟件 300033 C

127、H 同花順 688777 CH 中控技術 600845 CH 寶信軟件 資料來源:Bloomberg、華泰研究 風險提示風險提示 模型能力進步不及預期。模型能力進步不及預期。AI Agent 需要底層大語言模型(LLM)提供能力支持,LLM 增強了 Agent 獲取信息,學習的能力,并且使 Agent 獲得了規劃的能力,若底層模型能力的進步不及預期,Agent 可能存在能力進步緩慢的風險,對于更進一步的復雜任務可能無法完成,影響 AI Agent 產品的推廣速度。安全性風險。安全性風險。AI Agent 當前在編程、文本生成等細分場景已實現較好的落地效果,可應用于程序實現,媒體宣傳等領域。雖然

128、目前多數模型廠商在模型設定中加入了針對安全性的保護機制,但若相關機制失效,AI Agent 被不當使用,可能產生虛假、有害信息,存在安全方面的風險。本研報中涉及到未上市公司和未覆蓋個股內容,均系對齊客觀公開信息的整理,并不代表本研報中涉及到未上市公司和未覆蓋個股內容,均系對齊客觀公開信息的整理,并不代表本研究團隊對該公司、該股票的推薦或覆蓋。本研究團隊對該公司、該股票的推薦或覆蓋。免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。36 計算機計算機 圖表圖表5454:重點重點推薦推薦公司一覽表公司一覽表 最新收盤價最新收盤價 目標價目標價 市值市值(百萬百萬)EPS(元元)PE(倍倍

129、)股票名稱股票名稱 股票代碼股票代碼 投資評級投資評級(當地幣種當地幣種)(當地幣種當地幣種)(當地幣種當地幣種)2023 2024E 2025E 2026E 2023 2024E 2025E 2026E 金山辦公 688111 CH 買入 191.38 354.50 88,429 2.85 3.63 4.85 6.44 67.15 52.72 39.46 29.72 泛微網絡 603039 CH 買入 30.90 41.97 8,053 0.69 0.97 1.11 1.29 44.78 31.86 27.84 23.95 福昕軟件 688095 CH 買入 42.40 73.96 3,87

130、9-0.99-0.03 0.29 0.72-42.83-1,413.33 146.21 58.89 用友網絡 600588 CH 買入 9.41 16.03 32,168-0.28 0.07 0.17 0.24-33.61 134.43 55.35 39.21 鼎捷軟件 300378 CH 買入 15.76 24.27 4,247 0.56 0.69 0.89 1.15 28.14 22.84 17.71 13.70 同花順 300033 CH 買入 99.13 156.20 53,292 2.61 3.19 3.92 4.86 37.98 31.08 25.29 20.40 中控技術 688

131、777 CH 買入 37.85 61.05 29,898 1.39 1.86 2.46 3.31 27.23 20.35 15.39 11.44 寶信軟件 600845 CH 買入 31.30 52.60 90,282 1.06 1.32 1.65 2.08 29.53 23.71 18.97 15.05 中科創達 300496 CH 買入 47.65 62.65 21,881 1.01 1.33 1.75 2.26 47.18 35.83 27.23 21.08 資料來源:Bloomberg,華泰研究預測 圖表圖表55:重點推薦公司最新重點推薦公司最新觀點觀點 股票名稱股票名稱 最新觀點最新

132、觀點 金山辦公金山辦公(688111 CH)AI 商業化有望加快,維持商業化有望加快,維持“買入買入”評級評級 金山辦公發布一季報,24Q1 營收 12.25 億元(yoy+16.54%),歸母凈利 3.67 億元(yoy+37.31%),扣非凈利 3.52 億元(yoy+40.56%)。銷售/管理/研發費用率為 17.62%/9.22%/33.03%,同比-6.11pct/-0.72pct/-0.75pct,收入穩健增長+費用管控推動利潤快速增長。我們認為隨著 C 端定價推進,B 端產品落地,AI 商業化有望加快。我們預計 24-26 年公司 EPS 為 3.63/4.85/6.44 元,收

133、入 58.47/77.36/102.64 億元,可比公司平均 24E 17.2xPS(Wind),考慮公司 AI 產品快速迭代,給予 24 年 28xPS,目標價 354.50 元,維持“買入”。風險提示:付費用戶增長不及預期、AI 商業化不及預期。報告發布日期:2024 年 04 月 23 日 點擊下載全文:金山辦公點擊下載全文:金山辦公(688111 CH,買入買入):AI 商業化有望加快商業化有望加快 泛微網絡泛微網絡(603039 CH)關注下游需求恢復情況,維持“買入”評級關注下游需求恢復情況,維持“買入”評級 泛微網絡發布一季報,2024 年 Q1 實現營收 3.43 億元(yoy

134、+3.13%、qoq-65.51%),歸母凈利 2799.47 萬元(yoy+4764.41%、qoq-83.27%),扣非凈利 1737.72 萬元(yoy+343.16%)。公司收入邊際改善,同比增速較 23Q4 提升 2.27pct,降本增效推動利潤恢復。關注下游需求恢復情況與AI 商業化推進情況。我們預計公司 2024-2026 年 EPS 分別為 0.97、1.11、1.29 元,可比公司 24 年 Wind 一致預期 PE 均值 43.4x,給予公司 24 年43.4 倍 PE,目標價 41.97 元,維持“買入”評級。風險提示:產品拓展不及預期,下游需求不及預期,市場競爭加劇。報

135、告發布日期:2024 年 04 月 26 日 點擊下載全文:泛微網絡點擊下載全文:泛微網絡(603039 CH,買入買入):關注下游需求修復情況關注下游需求修復情況 福昕軟件福昕軟件(688095 CH)24Q1 收入加速增長收入加速增長+虧損同比收窄,維持虧損同比收窄,維持“買入買入”評級評級 福昕軟件發布年報及一季報,2023 年實現營收 6.11 億元(yoy+5.33%),歸母凈利-9094 萬元(22 年為-174 萬元),扣非凈利-1.79 億元(22 年為-0.78 億元)。24Q1 營收 1.69 億元(yoy+16.87%、qoq+0.33%),歸母凈利-1060.90 萬元

136、(同比收窄 6.47%),扣非凈利-2065.62 萬元(同比收窄 21.55%)。虧損主因訂閱轉型影響收入增速+費用投入力度加大。隨著轉型逐步深入,收入有望逐步加速增長。我們預計公司 2024-2026 年 EPS分別為-0.03、0.29、0.72 元??杀裙?24 年 ifind 一致預期 PS 均值為 9.1 倍,給予 2024 年 9.1 倍 PS,目標價 73.96 元,維持“買入”評級。風險提示:新應用拓展不及預期;市場競爭風險;聯營企業業績波動風險。報告發布日期:2024 年 04 月 29 日 點擊下載全文:福昕軟件點擊下載全文:福昕軟件(688095 CH,買入買入):2

137、4Q1 收入加速增長,關注收入加速增長,關注 AI 商業化商業化 用友網絡用友網絡(600588 CH)轉型完成收入加速增長,維持“買入”評級轉型完成收入加速增長,維持“買入”評級 用友網絡發布一季報,2024 年 Q1 實現營收 17.49 億元(yoy+18.61%、qoq-57.21%),歸母凈利-4.53 億元(yoy-14.17%、qoq-816.52%),扣非凈利-4.51 億元(yoy+8.97%)。隨著公司行業化組織轉型完成,人才結構不斷優化,交付效率提升,收入有望加速增長。我們預計公司 2024-2026年 EPS 分別為 0.07、0.17、0.24 元。分部估值,24E

138、傳統業務凈利/云收入 4.8 億元/83.9 億元,可比公司平均 24E 29.1xPE/4.9xPS(Wind),給予24E 29.1xPE/4.9xPS,對應市值 139/409 億元,總市值 548 億元,目標價 16.03 元,維持“買入”評級。風險提示:宏觀經濟波動;市場競爭加劇。報告發布日期:2024 年 04 月 26 日 點擊下載全文:用友網絡點擊下載全文:用友網絡(600588 CH,買入買入):大客云收入高增,轉型完成收入加速增長大客云收入高增,轉型完成收入加速增長 鼎捷軟件鼎捷軟件(300378 CH)收入增長穩健,關注收入增長穩健,關注 AI 商業化進展商業化進展 鼎捷

139、軟件發布年報,2023 年實現營收 22.28 億元(yoy+11.65%),歸母凈利 1.50 億元(重述 yoy+12.27%),扣非凈利 1.22 億元(yoy+1.77%);經營性凈現金流為 1.08 億元,同比-45.34%。2024Q1 實現營收 4.06 億元(yoy+13.27%),歸母凈利-969.37 萬元(23Q1 為-1062.08 萬元),扣非凈利-1397.61 萬元(23Q1 為-1757.26 萬元)。我們預計公司 2024-2026 年 EPS 分別為 0.69、0.89、1.15 元??杀裙酒骄?24E 31.2xPE(Wind),考慮公司率先完成產品落地

140、與收入轉化,產品迭代具備先發優勢,給予 24E 35xPE,對應目標價 24.27 元,維持“買入”評級。風險提示:行業競爭加劇風險,新產品和新領域拓展低于預期風險。報告發布日期:2024 年 04 月 26 日 點擊下載全文:鼎捷軟件點擊下載全文:鼎捷軟件(300378 CH,買入買入):收入增長穩健,關注收入增長穩健,關注 AI 商業化進展商業化進展 免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。37 計算機計算機 股票名稱股票名稱 最新觀點最新觀點 同花順同花順(300033 CH)費用投入加大壓制利潤,關注費用投入加大壓制利潤,關注 AI 應用商業化成效應用商業化成效 同

141、花順發布一季報,2024 年 Q1 實現營收 6.19 億元(yoy+1.47%、qoq-48.08%),歸母凈利 1.04 億元(yoy-15.03%、qoq-83.56%),扣非凈利9896.03 萬元(yoy-14.58%)。24Q1 公司毛利率為 82.54%,同比+0.14pct。公司利潤下滑主因資本市場波動影響收入增速+研發等投入力度加大。隨著資本市場景氣度逐步修復,疊加公司 AI 應用商業化成效逐步顯現,業績有望重回增長;我們預計公司 2024-2026 年 EPS 分別為 3.19、3.92、4.86 元??杀裙?2024 年 Wind 一致預期 PE 均值為 49.0 倍,

142、給予公司 2024 年 49.0 倍 PE,目標價 156.20 元,維持“買入”評級。風險提示:市場交易金額的波動;技術落地效果不及預期。報告發布日期:2024 年 04 月 23 日 點擊下載全文:同花順點擊下載全文:同花順(300033 CH,買入買入):費用投入加大壓制利潤,關注費用投入加大壓制利潤,關注 AI 商業化成效商業化成效 中控技術中控技術(688777 CH)收入收入+利息收入增長推動利潤高增,維持利息收入增長推動利潤高增,維持“買入買入”評級評級 中控技術發布一季報,2024 年 Q1 實現營收 17.38 億元(yoy+20.25%),歸母凈利 1.45 億元(yoy+

143、57.39%),扣非凈利 1.19 億元(yoy+76.05%),利潤高增主因:1)收入快速增長,運營效率提升;2)財務費用-0.30 億元(去年同期 0.03 億元),主要由于利息收入增長;24Q1 經營性現金流量凈額-6.77 億元(去年同期-7.23 億元),主要由于 Q1 發放年終獎及回款占比較低。我們認為公司積極開拓新業務/新地區/新行業,增長有望持續。預計 2024-2026 年 EPS 為 1.86/2.46/3.31 元,可比公司平均 24E 32.8xPE(Wind),給予 24E 32.8xPE,目標價 61.05 元,維持“買入”。風險提示:產品擴張效果低于預期、海外市場

144、拓展低于預期。報告發布日期:2024 年 04 月 17 日 點擊下載全文:中控技術點擊下載全文:中控技術(688777 CH,買入買入):業績穩健增長,期待海外不斷突破業績穩健增長,期待海外不斷突破 寶信軟件寶信軟件(600845 CH)寶信寶信 24Q1:營收:營收 yoy+34.44%,歸母凈利潤,歸母凈利潤 yoy+18.19%寶信軟件發布一季報,2024 年 Q1 實現營收 33.91 億(yoy+34.44%);歸母凈利 5.90 億(yoy+18.19%);扣非凈利 5.86 億(yoy+20.31%)。維持盈利預測,預計公司 2024-2026 年 EPS 分別為 1.32/1

145、.65/2.08 元,可比公司 24 年 Wind 一致預期 PE 均值為 27 倍,鑒于寶信在國產大中型 PLC和工業機器人領域的龍頭地位和加速推進,給予公司 24E 40 xPE,目標價 52.60 元(前值 51.29 元),維持“買入”。風險提示:下游需求低于預期,產品拓展低于預期。報告發布日期:2024 年 04 月 24 日 點擊下載全文:寶信軟件點擊下載全文:寶信軟件(600845 CH,買入買入):營收高增,營收高增,PLC&機器人值得期待機器人值得期待 中科創達中科創達(300496 CH)研發投入加大利潤承壓,維持“買入”評級研發投入加大利潤承壓,維持“買入”評級 中科創達

146、發布一季報,2024 年 Q1 實現營收 11.78 億元(yoy+1.01%、qoq-13.75%),歸母凈利 9075.91 萬元(yoy-46.10%、qoq+164.92%),扣非凈利 8540.87 萬元(yoy-46.23%)。經營性凈現金流為 1.64 億元,同比-50.21%。利潤下滑主因研發投入力度加大,經營凈現金流下滑主因銷售回款減少、職工相關支出及其他經營支付的現金增加。我們預計公司 2024-2026 年 EPS 分別為 1.33、1.75、2.26 元,可比公司 2024E 平均估值47.2xPE(Wind 一致預期),給予公司 2024 年 47.2xPE,對應目標

147、價 62.65 元,維持“買入”評級。風險提示:下游需求波動;技術落地不及預期。報告發布日期:2024 年 04 月 24 日 點擊下載全文:中科創達點擊下載全文:中科創達(300496 CH,買入買入):研發投入加大利潤承壓,關注端側智能機遇研發投入加大利潤承壓,關注端側智能機遇 資料來源:Bloomberg,華泰研究預測 免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。38 計算機計算機 免責免責聲明聲明 分析師聲明分析師聲明 本人,謝春生、彭鋼,茲證明本報告所表達的觀點準確地反映了分析師對標的證券或發行人的個人意見;彼以往、現在或未來并無就其研究報告所提供的具體建議或所表迖的

148、意見直接或間接收取任何報酬。一般聲明及披露一般聲明及披露 本報告由華泰證券股份有限公司(已具備中國證監會批準的證券投資咨詢業務資格,以下簡稱“本公司”)制作。本報告所載資料是僅供接收人的嚴格保密資料。本報告僅供本公司及其客戶和其關聯機構使用。本公司不因接收人收到本報告而視其為客戶。本報告基于本公司認為可靠的、已公開的信息編制,但本公司及其關聯機構(以下統稱為“華泰”)對該等信息的準確性及完整性不作任何保證。本報告所載的意見、評估及預測僅反映報告發布當日的觀點和判斷。在不同時期,華泰可能會發出與本報告所載意見、評估及預測不一致的研究報告。同時,本報告所指的證券或投資標的的價格、價值及投資收入可能

149、會波動。以往表現并不能指引未來,未來回報并不能得到保證,并存在損失本金的可能。華泰不保證本報告所含信息保持在最新狀態。華泰對本報告所含信息可在不發出通知的情形下做出修改,投資者應當自行關注相應的更新或修改。本公司不是 FINRA 的注冊會員,其研究分析師亦沒有注冊為 FINRA 的研究分析師/不具有 FINRA 分析師的注冊資格。華泰力求報告內容客觀、公正,但本報告所載的觀點、結論和建議僅供參考,不構成購買或出售所述證券的要約或招攬。該等觀點、建議并未考慮到個別投資者的具體投資目的、財務狀況以及特定需求,在任何時候均不構成對客戶私人投資建議。投資者應當充分考慮自身特定狀況,并完整理解和使用本報

150、告內容,不應視本報告為做出投資決策的唯一因素。對依據或者使用本報告所造成的一切后果,華泰及作者均不承擔任何法律責任。任何形式的分享證券投資收益或者分擔證券投資損失的書面或口頭承諾均為無效。除非另行說明,本報告中所引用的關于業績的數據代表過往表現,過往的業績表現不應作為日后回報的預示。華泰不承諾也不保證任何預示的回報會得以實現,分析中所做的預測可能是基于相應的假設,任何假設的變化可能會顯著影響所預測的回報。華泰及作者在自身所知情的范圍內,與本報告所指的證券或投資標的不存在法律禁止的利害關系。在法律許可的情況下,華泰可能會持有報告中提到的公司所發行的證券頭寸并進行交易,為該公司提供投資銀行、財務顧

151、問或者金融產品等相關服務或向該公司招攬業務。華泰的銷售人員、交易人員或其他專業人士可能會依據不同假設和標準、采用不同的分析方法而口頭或書面發表與本報告意見及建議不一致的市場評論和/或交易觀點。華泰沒有將此意見及建議向報告所有接收者進行更新的義務。華泰的資產管理部門、自營部門以及其他投資業務部門可能獨立做出與本報告中的意見或建議不一致的投資決策。投資者應當考慮到華泰及/或其相關人員可能存在影響本報告觀點客觀性的潛在利益沖突。投資者請勿將本報告視為投資或其他決定的唯一信賴依據。有關該方面的具體披露請參照本報告尾部。本報告并非意圖發送、發布給在當地法律或監管規則下不允許向其發送、發布的機構或人員,也

152、并非意圖發送、發布給因可得到、使用本報告的行為而使華泰違反或受制于當地法律或監管規則的機構或人員。本報告版權僅為本公司所有。未經本公司書面許可,任何機構或個人不得以翻版、復制、發表、引用或再次分發他人(無論整份或部分)等任何形式侵犯本公司版權。如征得本公司同意進行引用、刊發的,需在允許的范圍內使用,并需在使用前獲取獨立的法律意見,以確定該引用、刊發符合當地適用法規的要求,同時注明出處為“華泰證券研究所”,且不得對本報告進行任何有悖原意的引用、刪節和修改。本公司保留追究相關責任的權利。所有本報告中使用的商標、服務標記及標記均為本公司的商標、服務標記及標記。中國香港中國香港 本報告由華泰證券股份有

153、限公司制作,在香港由華泰金融控股(香港)有限公司向符合證券及期貨條例及其附屬法律規定的機構投資者和專業投資者的客戶進行分發。華泰金融控股(香港)有限公司受香港證券及期貨事務監察委員會監管,是華泰國際金融控股有限公司的全資子公司,后者為華泰證券股份有限公司的全資子公司。在香港獲得本報告的人員若有任何有關本報告的問題,請與華泰金融控股(香港)有限公司聯系。免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。39 計算機計算機 香港香港-重要監管披露重要監管披露 華泰金融控股(香港)有限公司的雇員或其關聯人士沒有擔任本報告中提及的公司或發行人的高級人員。金山辦公(688111 CH)、中控技

154、術(688777 CH):華泰金融控股(香港)有限公司、其子公司和/或其關聯公司在本報告發布日擔任標的公司證券做市商或者證券流動性提供者。有關重要的披露信息,請參華泰金融控股(香港)有限公司的網頁 https:/.hk/stock_disclosure 其他信息請參見下方“美國“美國-重要監管披露”重要監管披露”。美國美國 在美國本報告由華泰證券(美國)有限公司向符合美國監管規定的機構投資者進行發表與分發。華泰證券(美國)有限公司是美國注冊經紀商和美國金融業監管局(FINRA)的注冊會員。對于其在美國分發的研究報告,華泰證券(美國)有限公司根據1934 年證券交易法(修訂版)第 15a-6 條

155、規定以及美國證券交易委員會人員解釋,對本研究報告內容負責。華泰證券(美國)有限公司聯營公司的分析師不具有美國金融監管(FINRA)分析師的注冊資格,可能不屬于華泰證券(美國)有限公司的關聯人員,因此可能不受 FINRA 關于分析師與標的公司溝通、公開露面和所持交易證券的限制。華泰證券(美國)有限公司是華泰國際金融控股有限公司的全資子公司,后者為華泰證券股份有限公司的全資子公司。任何直接從華泰證券(美國)有限公司收到此報告并希望就本報告所述任何證券進行交易的人士,應通過華泰證券(美國)有限公司進行交易。美國美國-重要監管披露重要監管披露 分析師謝春生、彭鋼本人及相關人士并不擔任本報告所提及的標的

156、證券或發行人的高級人員、董事或顧問。分析師及相關人士與本報告所提及的標的證券或發行人并無任何相關財務利益。本披露中所提及的“相關人士”包括 FINRA定義下分析師的家庭成員。分析師根據華泰證券的整體收入和盈利能力獲得薪酬,包括源自公司投資銀行業務的收入。中控技術(688777 CH):華泰證券股份有限公司、其子公司和/或其聯營公司在本報告發布日之前的 12 個月內擔任了標的證券公開發行或 144A 條款發行的經辦人或聯席經辦人。中控技術(688777 CH):華泰證券股份有限公司、其子公司和/或其聯營公司在本報告發布日之前 12 個月內曾向標的公司提供投資銀行服務并收取報酬。中控技術(6887

157、77 CH):華泰證券股份有限公司、其子公司和/或其聯營公司預計在本報告發布日之后 3 個月內將向標的公司收取或尋求投資銀行服務報酬。金山辦公(688111 CH)、中控技術(688777 CH):華泰證券股份有限公司、其子公司和/或其聯營公司在本報告發布日擔任標的公司證券做市商或者證券流動性提供者。華泰證券股份有限公司、其子公司和/或其聯營公司,及/或不時會以自身或代理形式向客戶出售及購買華泰證券研究所覆蓋公司的證券/衍生工具,包括股票及債券(包括衍生品)華泰證券研究所覆蓋公司的證券/衍生工具,包括股票及債券(包括衍生品)。華泰證券股份有限公司、其子公司和/或其聯營公司,及/或其高級管理層、

158、董事和雇員可能會持有本報告中所提到的任何證券(或任何相關投資)頭寸,并可能不時進行增持或減持該證券(或投資)。因此,投資者應該意識到可能存在利益沖突。新加坡新加坡 華泰證券(新加坡)有限公司持有新加坡金融管理局頒發的資本市場服務許可證,可從事資本市場產品交易,包括證券、集體投資計劃中的單位、交易所交易的衍生品合約和場外衍生品合約,并且是財務顧問法規定的豁免財務顧問,就投資產品向他人提供建議,包括發布或公布研究分析或研究報告。華泰證券(新加坡)有限公司可能會根據財務顧問條例第 32C 條的規定分發其在華泰內的外國附屬公司各自制作的信息/研究。本報告僅供認可投資者、專家投資者或機構投資者使用,華泰

159、證券(新加坡)有限公司不對本報告內容承擔法律責任。如果您是非預期接收者,請您立即通知并直接將本報告返回給華泰證券(新加坡)有限公司。本報告的新加坡接收者應聯系您的華泰證券(新加坡)有限公司關系經理或客戶主管,了解來自或與所分發的信息相關的事宜。免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。40 計算機計算機 評級說明評級說明 投資評級基于分析師對報告發布日后 6 至 12 個月內行業或公司回報潛力(含此期間的股息回報)相對基準表現的預期(A 股市場基準為滬深 300 指數,香港市場基準為恒生指數,美國市場基準為標普 500 指數,臺灣市場基準為臺灣加權指數,日本市場基準為日經 2

160、25 指數),具體如下:行業評級行業評級 增持:增持:預計行業股票指數超越基準 中性:中性:預計行業股票指數基本與基準持平 減持:減持:預計行業股票指數明顯弱于基準 公司評級公司評級 買入:買入:預計股價超越基準 15%以上 增持:增持:預計股價超越基準 5%15%持有:持有:預計股價相對基準波動在-15%5%之間 賣出:賣出:預計股價弱于基準 15%以上 暫停評級:暫停評級:已暫停評級、目標價及預測,以遵守適用法規及/或公司政策 無評級:無評級:股票不在常規研究覆蓋范圍內。投資者不應期待華泰提供該等證券及/或公司相關的持續或補充信息 法律實體法律實體披露披露 中國中國:華泰證券股份有限公司具

161、有中國證監會核準的“證券投資咨詢”業務資格,經營許可證編號為:91320000704041011J 香港香港:華泰金融控股(香港)有限公司具有香港證監會核準的“就證券提供意見”業務資格,經營許可證編號為:AOK809 美國美國:華泰證券(美國)有限公司為美國金融業監管局(FINRA)成員,具有在美國開展經紀交易商業務的資格,經營業務許可編號為:CRD#:298809/SEC#:8-70231 新加坡:新加坡:華泰證券(新加坡)有限公司具有新加坡金融管理局頒發的資本市場服務許可證,并且是豁免財務顧問。公司注冊號:202233398E 華泰證券股份有限公司華泰證券股份有限公司 南京南京 北京北京

162、南京市建鄴區江東中路228號華泰證券廣場1號樓/郵政編碼:210019 北京市西城區太平橋大街豐盛胡同28號太平洋保險大廈A座18層/郵政編碼:100032 電話:86 25 83389999/傳真:86 25 83387521 電話:86 10 63211166/傳真:86 10 63211275 電子郵件:ht- 電子郵件:ht- 深圳深圳 上海上海 深圳市福田區益田路5999號基金大廈10樓/郵政編碼:518017 上海市浦東新區東方路18號保利廣場E棟23樓/郵政編碼:200120 電話:86 755 82493932/傳真:86 755 82492062 電話:86 21 28972

163、098/傳真:86 21 28972068 電子郵件:ht- 電子郵件:ht- 華泰金融控股(香港)有限公司華泰金融控股(香港)有限公司 香港中環皇后大道中 99 號中環中心 53 樓 電話:+852-3658-6000/傳真:+852-2567-6123 電子郵件: http:/.hk 華泰證券華泰證券(美國美國)有限公司有限公司 美國紐約公園大道 280 號 21 樓東(紐約 10017)電話:+212-763-8160/傳真:+917-725-9702 電子郵件:Huataihtsc- http:/www.htsc- 華泰證券(新加坡)有限公司華泰證券(新加坡)有限公司 濱海灣金融中心 1 號大廈,#08-02,新加坡 018981 電話:+65 68603600 傳真:+65 65091183 版權所有2024年華泰證券股份有限公司

友情提示

1、下載報告失敗解決辦法
2、PDF文件下載后,可能會被瀏覽器默認打開,此種情況可以點擊瀏覽器菜單,保存網頁到桌面,就可以正常下載了。
3、本站不支持迅雷下載,請使用電腦自帶的IE瀏覽器,或者360瀏覽器、谷歌瀏覽器下載即可。
4、本站報告下載后的文檔和圖紙-無水印,預覽文檔經過壓縮,下載后原文更清晰。

本文(計算機行業深度研究:AI Agent通往AGI的核心基礎-240715(40頁).pdf)為本站 (拾億) 主動上傳,三個皮匠報告文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對上載內容本身不做任何修改或編輯。 若此文所含內容侵犯了您的版權或隱私,請立即通知三個皮匠報告文庫(點擊聯系客服),我們立即給予刪除!

溫馨提示:如果因為網速或其他原因下載失敗請重新下載,重復下載不扣分。
客服
商務合作
小程序
服務號
折疊
午夜网日韩中文字幕,日韩Av中文字幕久久,亚洲中文字幕在线一区二区,最新中文字幕在线视频网站