《AI行業專題·Agent:智能體基建厚積薄發商業化應用曙光乍現-250424(40頁).pdf》由會員分享,可在線閱讀,更多相關《AI行業專題·Agent:智能體基建厚積薄發商業化應用曙光乍現-250424(40頁).pdf(40頁珍藏版)》請在三個皮匠報告上搜索。
1、智能體基建厚積薄發,商業化應用曙光乍現 西南證券研究院 海外研究團隊 2025年4月 AI專題Agent 核心觀點 AI發展階段從推理者走向智能體,模型底座智能水平提升。目前,AI發展水平正從推理者向智能體Agent演進,AI產品逐步能夠理解目標、具備外部記憶和推理能力,相關智能體產業鏈正經歷從模型能力提升到應用商業化的系統性躍遷。AI大模型能力由預訓練、后訓練、測試時三條擴展曲線推進,其中,預訓練奠定模型內部智能上限,后訓練及測試時擴展分別釋放模型在特定領域和推理方面的潛力,當前基礎模型迭代放緩,逐步從訓練擴展向測試時擴展轉變,主次曲線迎來切換,從而對大規模集群依賴程度下降、推理算力需求攀升
2、,更加聚焦AI產品的商業化能力和生態建設。中間工具厚積薄發,開發者生態積極構建。在中間層,智能體生態所需的通信協議與開發工具快速涌現,Anthropic MCP協議、谷歌A2A協議等代表性技術正助力構建智能體新型操作系統,為模型與工具、智能體與智能體之間建立統一的交互接口。其中,2025年3月MCP Server發現平臺Smithery的服務器創建數量較2月實現3倍增長,A2A已得到50多家合作伙伴的支持,開發者生態加速繁榮。開發工具與底層框架的標準化,可類比為互聯網時代移動手機的USB-C接口,或者類比為用于App和操作系統之間通信的Android API,將加速AI智能體商業化進程。初代產
3、品創收加速,商業化應用曙光乍現。在應用層,智能體應用分為跨行業通用產品和垂類專業產品,前者發展相對成熟,部分產品已開始規?;瘧?,后者商業化起步略晚,但有望成為B端數智化轉型的重要抓手。目前,智能體作為交互式AI產品開始快速落地,初代產品Cursor、Glean等已實現上億美金年經常性收入(ARR),展現出較高成的長潛力,并出現基于實際交付成果、任務完成率等指標的新收費模式。整體來看,AI智能體產品正形成“底層模型能力升級+中間工具繁榮+商業場景落地”的基礎設施與應用協同的演進路徑,未來AI智能體應用還需進一步提升規劃能力、具備更好的記憶、擁有更強的多模態理解能力,釋放變現潛力。相關標的:1)
4、推理算力:英偉達、博通;2)中間工具和數據層:谷歌、Snowflake;3)下游應用:Salesforce、SAP、Shopify;4)云服務:亞馬遜、微軟、谷歌。風險提示:AI技術進展不及預期;AI商業化進展不及預期;投資回報不及預期等風險。1 一、AI發展階段:從推理者轉向智能體,開始學會調用工具 目 錄 二、Agent模型層:底座智能水平提升,推理能力成為核心 三、Agent中間層:中間工具厚積薄發,開發者生態積極構建 四、Agent應用層:初代產品創收加速,商業化應用曙光乍現 五、相關標的及風險提示 2 模型多維能力持續提升,AI從推理者轉向智能體。根據OpenAI對AI發展的理解和定
5、義,AI水平可分為五大等級:一是聊天機器人(Chatbot),能夠用自然語言進行對話;二是推理者,基于推理模型,解決人類級別的智力問題;三是智能體(Agent),能夠代表用戶采取行動;四是創新者;五是組織。過去,在ChatGPT等聊天機器人產品推出時,大模型通常采取一次性推理,用戶與聊天機器人的交互形式呈現為簡單的一問一答。而在推理模型的不斷發展之下,AI模型逐漸能夠與自己對話,實現內部思考,具備推理能力。當前,隨著大模型在交互/認知/泛化/自主等多維度能力持續提升,AI正從推理者轉向智能體,逐步具備采取行動及處理任務的能力,智能體產品加速推進。1.1 AI等級:AI發展水平劃為五大等級,當前
6、正從推理者轉向智能體 AI發展水平劃分為五大等級 資料來源:Bloomberg reporting,OpenAI,西南證券整理 聊天機器人 聊天機器人 推理者 推理者 智能體 智能體 創新者 創新者 組織 組織 具備語言對話能力的人工智能具備語言對話能力的人工智能 具備解決人類水平問題的能力具備解決人類水平問題的能力 能夠采取行動的系統能夠采取行動的系統 能夠幫助發明創新的人工智能能夠幫助發明創新的人工智能 能夠完成組織工作的人工智能能夠完成組織工作的人工智能AI等級 AI等級 交互能力 交互能力 認知能力 認知能力 泛化能力 泛化能力 多領域泛化 多領域泛化 處理事實 處理事實 簡單式一問一
7、答 簡單式一問一答 自主能力 自主能力 依賴人類指令按步驟執行命令 依賴人類指令按步驟執行命令 3 系統中協同運作 系統中協同運作 上下文深入交流 上下文深入交流 環境中動態交互 環境中動態交互 創新性思考 創新性思考 鏈式推理 鏈式推理 局限于特定領域任務 局限于特定領域任務 跨領域整合 跨領域整合 設定目標自主完成復雜任務 設定目標自主完成復雜任務 定義 定義 用戶:給出任務目標用戶:給出任務目標 AI:通過使用工具并進行規劃,直接完成任務,甚至具備修正能力AI:通過使用工具并進行規劃,直接完成任務,甚至具備修正能力 用戶:給出明顯指令用戶:給出明顯指令 AI:具備一定的理解力和工具使用能
8、力,但仍需用戶逐步確認AI:具備一定的理解力和工具使用能力,但仍需用戶逐步確認 用戶:給出明確且具體的每一步指令用戶:給出明確且具體的每一步指令 AI:根據一個指令產生一個動作AI:根據一個指令產生一個動作4 AI產品目前處于中間過渡形態,智能體有望革新交互效率。過去,傳統聊天機器人只能執行明確指令,用戶需要逐次下達任務指令,AI模型根據一個指令進行一個動作;當前,中間形態的AI產品已初步具備目標理解和推理能力,可以根據用戶的模糊需求主動采取一部分行動,但仍然需要依賴用戶反饋進行下一步操作;未來,真正的AI智能體將能夠根據最終目標自主規劃任務步驟、調用多種工具、識別錯誤并給出修正策略,具備完成
9、任務的能力。用戶與不同AI產品形態的互動以及第一輪交互結果示例 我上傳了一份 Excel,我上傳了一份 Excel,幫我分析一下里面的數據有什么趨勢或異常?幫我分析一下里面的數據有什么趨勢或異常?你想分析哪一列數據?你想分析哪一列數據?趨勢是指增長嗎?異常趨勢是指增長嗎?異常是指什么?是指什么?資料來源:西南證券 我上傳了一份 Excel,我上傳了一份 Excel,幫我分析一下里面的數據有什么趨勢或異常?幫我分析一下里面的數據有什么趨勢或異常?我上傳了一份 Excel,我上傳了一份 Excel,幫我分析一下里面的數據有什么趨勢或異常?幫我分析一下里面的數據有什么趨勢或異常?我已做出基礎統計和可
10、我已做出基礎統計和可視化圖表,你需要繼續視化圖表,你需要繼續深入哪個部分嗎?深入哪個部分嗎?我已檢查和分析數據、生成多種圖表和文字總我已檢查和分析數據、生成多種圖表和文字總結。但是可能異常值過多,需要幫你進一步清結。但是可能異常值過多,需要幫你進一步清洗數據嗎?洗數據嗎?用戶與傳統聊天機器人的交互結果 用戶與傳統聊天機器人的交互結果 用戶與推理者產品的交互結果 用戶與推理者產品的交互結果 用戶與智能體產品的交互結果 用戶與智能體產品的交互結果 1.1 AI等級:AI發展水平劃為五大等級,當前正從推理者轉向智能體 1.2 Agent等級:初階能夠使用工具,高階可自主完成長時任務 智能體(Agen
11、t)=大模型(LLM)+記憶(Memory)+主動規劃(Planning)+工具使用(Tool use)。大模型:在基于LLM的智能體中,LLM充當智能體的大腦。主動規劃:可以將大型任務分解為子任務,并規劃執行任務的流程,同時能夠對任務執行的過程進行思考和反思,從而決定是繼續執行任務,或判斷任務完結并終止運行。記憶:短期記憶指在執行任務的過程中的上下文,會在子任務的執行過程產生和暫存,在任務完結后被清空;長期記憶即可以長時間保留的信息,一般指外部知識庫,可用向量數據庫存儲或檢索。工具使用:為智能體配備工具API,如計算器/搜索工具/代碼執行器/數據庫查詢工具等,從而與物理世界實現交互,解決實際
12、問題。智能體公式:Agent=LLM+Memory+Planning+Tool use 資料來源:OpenAI官網,西南證券整理 5 自主決策能力是基礎,解決長時任務是關鍵。根據智能體“推理+記憶+使用工具+規劃”的四大核心能力來看,截至目前,聊天機器人產品逐步具備推理能力,副駕駛和工具型助手可以建立外部記憶,但仍然不具備使用工具和自主規劃的能力,只能根據用戶指令按步驟執行,不屬于能夠自主決策的智能體。根據CBInsights研究,具備一定自主決策能力的智能體可分為兩大等級。1)初級Agent:AI模型可以通過編排組合,把重復性高、需要一定靈活性的任務從人替換成數字員工,實現任務的自動化,在該
13、階段,Agent尚不具備完全開放的決策空間,自主決策范圍主要局限于任務流程和有限選項之中,決策行為將受到安全條件、訪問權限等限制,是有限決策的智能體。2)高級Agent:智能體不只是LLM calling的組合,而是能夠更自主、更主動地規劃,完成多步驟、長時任務,可以在多個選項之間做出自主選擇,不需要人工指示,實現高度自治。根據自主化程度劃分AI Agent等級 聊天機器人 聊天機器人 副駕駛助手 副駕駛助手 受限制的智能體 受限制的智能體 完全自主代理 完全自主代理 自主性擴展 自主性擴展 Chatbots Copilots&Asssistants Agents with guardrail
14、s Fully autonomous agents Chatbots Copilots&Asssistants Agents with guardrails Fully autonomous agents 推理能力推理能力 外部記憶外部記憶 使用工具使用工具 自主規劃自主規劃 推理能力推理能力 外部記憶外部記憶 使用工具使用工具 自主規劃自主規劃 推理能力推理能力 外部記憶外部記憶 使用工具使用工具 自主規劃自主規劃 推理能力推理能力 外部記憶外部記憶 使用工具使用工具 自主規劃Agent四大自主規劃Agent四大核心能力 核心能力 資料來源:CBInsights,西南證券整理 擁有一定程度的
15、自主決策能力的AI Agents 擁有一定程度的自主決策能力的AI Agents 6 1.2 Agent等級:初階能夠使用工具,高階可自主完成長時任務 資料來源:西南證券 1.3 AI產業鏈:AI Infra奏響主旋律,AI Agent拉開新畫布 7 AI Infra:核心算力、半導體產業鏈、硬件設備、電力能源為AI大模型的訓練與推理奠定硬件基礎。AI Agent:B端軟件、C端應用、端側AI及具身智能等環節在Agent應用上蓄勢待發。AI產業鏈示意圖 8 1.3 Agent產業鏈:智能體基建厚積薄發,商業化應用曙光乍現 資料來源:Z Research,西南證券整理 AI Agent產業鏈示意
16、圖 模型層 模型層 預訓練 預訓練(Pre-Train)(Pre-Train)Transformer架構下的scaling law 算力 算力 算法 算法 數據 數據 微調 微調(Fine-Tuning)(Fine-Tuning)參數高效微調PEFT監督微調SFT等強化學習 強化學習(Reinforce Learning)(Reinforce Learning)獎勵建模偏好優化算法等推理增強 推理增強(inference enhancement)(inference enhancement)思維連CoT優化檢索增強生成RAG等 模型層:Agent本質是大模型能力的工程化載體,大模型智能水平仍是
17、打造Agent的底層支撐,未來依舊需要通過預訓練、后訓練和測試時計算進行擴展。中間層:Agent產業鏈的中間層工具正加速構建,數據庫、身份治理、通信協作等成為重要議題。應用層:Agent應用形態隨著以上底層大模型和中間原生基礎設施的發展逐步從構想更加貼近現實。中間層中間層 數據層 數據層(Data Layer)(Data Layer)數據治理:數據治理:管理結構化/非結構化數據,提供高精度標注服務數據分析:數據分析:通過AI工具強化數據分析,表現為LLM驅動下更強的BI能力,數據分析門檻與難度降低模型工具鏈 模型工具鏈(MLOps)(MLOps)模型管理:模型管理:提供模型全生命周期管理,支持
18、從訓練到監控的自動化流水線自動化工具:自動化工具:超參數調優工具、托管成百上千個預訓練模型平臺等應用層應用層 副駕駛 副駕駛 (AI Copilot)(AI Copilot)增強人類能力的智能輔助系統 媒體應用 媒體應用(AI Media)(AI Media)通過AI技術實現內容生產、傳播優化、互動增強的下一代媒體形態,覆蓋游戲/社交/廣告等 智能體 智能體 (AI Agent)(AI Agent)自主決策+環境交互+目標驅動 1.3 Agent產業鏈:智能體基建厚積薄發,商業化應用曙光乍現 基礎設施加速發展推動新應用誕生,新應用積極引導基礎設施下一步健全方向。智能體生態正在經歷波浪式發展進程
19、,每一波創新應用的誕生,都會帶動基礎設施的迭代升級,底層技術的進步又會進一步催生出更智能的應用,如OpenAI的GPT系列(從GPT-1到GPT-4)和o系列(從o1到o3)模型、Anthropic的Claude模型(Sonnet-3迭代至3.7)、谷歌Gemini模型(從1.5Pro迭代至2.5Pro)。智能體中間層則陸續出現LangChain、Tool Calling、MCP和A2A等工具;應用層相繼出現Cursor、Claude Desktop、OpenAI Operator等。新應用對基礎設施提出更復雜的需求,基礎設施的進步又將反哺新的智能體應用,兩者相互塑造、共同演進,加速AI的商業
20、化落地。應用層應用層 2021年2月 Glean2021年2月 Glean2022年11月 ChatGPT2022年11月 ChatGPT2023年1月 Cursor2023年1月 Cursor2023年2月 RunwayML 2023年2月 RunwayML 中間層中間層 2022年10月 LangChain2022年10月 LangChain2022年11月 Llamalndex2022年11月 Llamalndex2023年6月 LLM Tool Calling2023年6月 LLM Tool Calling2023年10月 Modal Labs2023年10月 Modal Labs模型
21、層模型層 2023年3月 GPT-4 2023年3月 GPT-4 2024年2月 Gemini 1.5 Pro2024年2月 Gemini 1.5 Pro2024年3月 Claude Sonnet 32024年3月 Claude Sonnet 3應用層應用層 2024年1月 Custom GPTs2024年1月 Custom GPTs2024年10月 Claude Desktop2024年10月 Claude Desktop2024年10月 Bolt.new2024年10月 Bolt.new應用層應用層 2024年10月 Claude Computer Use2024年10月 Claude C
22、omputer Use2024年11月 Cline2024年11月 Cline2025年1月 OpenAl Operator2025年1月 OpenAl Operator2025年3月 Manus.Al2025年3月 Manus.Al應用層應用層未來關注:未來關注:電商電商旅行規劃旅行規劃生產力生產力營銷等營銷等中間層中間層 2024年1月 LangGraph2024年1月 LangGraph2024年6月 BrowserBase2024年6月 BrowserBase2024年11月 MCP(Model2024年11月 MCP(ModelContext Protocol)Context Pro
23、tocol)模型層模型層 2024年4月 Llama 32024年4月 Llama 32024年6月 Claude Sonnet 3.5 2024年6月 Claude Sonnet 3.5 2024年9月 OpenAI o12024年9月 OpenAI o1中間層中間層 2025年3月 Cisco ACP2025年3月 Cisco ACP2025年4月 Google A2A2025年4月 Google A2A2024年11月-2025年3月2024年11月-2025年3月MCP Server大量涌現MCP Server大量涌現模型層模型層 2025年1月 DeepSeek-R12025年1月
24、DeepSeek-R12025年2月 Claude Sonnet 3.72025年2月 Claude Sonnet 3.72025年3月 Gemini 2.5 Pro2025年3月 Gemini 2.5 Pro2025年4月 Llama 42025年4月 Llama 42025年4月 OpenAI o32025年4月 OpenAI o3中間層中間層未來關注:未來關注:安全集成安全集成MCP發現與信任MCP發現與信任模型層模型層未來關注:未來關注:OpenAI GPT 5 OpenAI GPT 5 Llama 4 BehemothLlama 4 Behemoth資料來源:Madrona,西南證券
25、整理 Agent基礎設施建設與應用協同演進 9 一、AI發展階段:從推理者轉向智能體,開始學會調用工具 目 錄 二、Agent模型層:底座智能水平提升,推理能力成為核心 三、Agent中間層:中間工具厚積薄發,開發者生態積極構建 四、Agent應用層:初代產品加速創收,商業化應用曙光乍現 五、相關標的及風險提示 10 11 GPT-1:1.17億參數;有一定的泛化能力 GPT-2:15億參數;生成能力提升 GPT-3:1750億參數;可完成大多數NLP任務GPT-3.5(Chat GPT):約1750億參數,強大的理解能力GPT-4:萬億參數;數據源擴充;增加訓練后處理和行為預測 GPT-4V
26、:具備視覺能力 GPT-4-Turbo:多模態能力提升;上下文更長、價格更低、性能更高 預訓練擴展階段 預訓練擴展階段 后訓練擴展階段 后訓練擴展階段 測試時擴展階段 測試時擴展階段 2018.062018.06 2019.02 2019.02 2020.05 2020.05 2022.11 2022.11 2023.03 2023.03 2023.09 2023.09 2023.11 2023.11 2024.05 2024.05 2024.09 2024.09 2024.12 2024.12 2025.01 2025.01 2025.02 2025.02 2025.04 2025.04 G
27、PT-4o:能夠同時處理多種輸入類型,提升響應速度和性能 OpenAI-o1模型完整版向用戶開放;下一代推理模型OpenAI-o3預覽 OpenAI-o1推理模型預覽版亮相OpenAI-o3-mini模型發布GPT4.5:截至目前最大LLM模型,世界知識豐富,情商更高 GPT-4.1:能夠處理復雜任務的模型 資料來源:OpenAI官網,西南證券整理 OpenAI旗下模型迭代進程梳理 擴展法則迎來范式轉變,推理模型迭代節奏加速。從OpenAI旗下AI模型迭代進程來看:2018年6月至2023年3月預訓練擴展階段:OpenAI大模型預訓練快速推進,在五年內從GPT-1迭代至GPT-4模型,模型基礎
28、能力2023年3月之后,預訓練擴展進程逐漸放緩,截至目前仍未推出下一代預訓練大模型GPT-5。2023年下半年至2024年5月后訓練擴展階段:基于微調技術開始打磨多模態、上下文等能力,提升特定指標性能。2024年9月至今測試時擴展階段:2024年9月OpenAI-o1模型預覽版亮相,標志正式進入推理模型時代;2025年4月17日,OpenAI推出完整版o3模型和o4-mini模型,截至目前,半年內已迭代多次,測試時擴展正加速發展。OpenAI-o3&o4mini模型發布 2.1 AI模型擴展法則:擴展法則迎來范式轉變,主次擴展曲線逐步切換 AI三大擴展法則對比 資料來源:英偉達CES大會,西南
29、證券整理 規模法則從訓練階段延伸至推理階段,推動計算需求持續提升。預訓練法則和后訓練法則均與模型的訓練階段有關,而測試時擴展法則與推理階段有關,深度推理有望對算力需求進一步增加。預訓練擴展法則(Pre-training Scaling Law):關注計算資源、模型大小和訓練數據三大要素,當三要素同時增加時,模型性能將同步提升,打造優質基座模型。后訓練擴展法則(Post-training Scaling Law):關注在預訓練完成后對模型的進一步優化和微調,可以針對特定任務進行改進,從而提升模型在特定領域的性能,有助于打造垂類模型。測試時擴展法則(Test-time Scaling Law):針
30、對在模型的實際推理或應用中,根據問題的復雜程度實時分配計算資源,面對復雜問題能夠進行分步驟、多階段推理,在多個解法中尋求最優解。定義指在訓練過程中,通過增加訓練數據、模型參數和計算資源來提升模型能力。模型在預訓練階段需要通過大量數據進行訓練、學習基礎知識。指在預訓練之后,利用強化學習、人工反饋等技術對模型進行進一步優化,后訓練通常涉及對模型的精細化調整,提高在特定任務上的表現。指在模型的實際應用中,模型根據需要動態分配計算資源來提升推理效率,更加關注模型如何在實時推理時優化自身的計算策略。特點 主要依賴大量的數據(多模態數據,如文本、圖像、視頻等)和計算資源。模型通過大規模數據集進行自我學習,
31、獲取廣泛的知識。是訓練過程中的初步階段,主要幫助模型建立基座能力。在模型初步訓練完成后,使用人類反饋或強化學習的方式幫助模型在特定任務上改進。強調通過模擬“自我提升”的方式逐步提升模型能力(如通過解決復雜的數學問題等)??梢钥醋魇恰坝柧毢蟮倪M步”或“微調”過程,幫助模型在特定領域變得更精通。重點是在實際使用中,通過調整計算資源的分配來提升決策過程的質量。模型可以在推理時進行“深度思考”,將問題拆解成多個步驟,逐步推理或產生多個解法,評估最優解。強調推理過程中的靈活性和高效性,目的是在實時環境中產生高質量的結果。模型OpenAI GPT系列模型:GPT-1至GPT-4GPT-4 turboOpe
32、nAI-o1至o3系列模型名稱預訓練擴展法則(Pre-training Scaling Law)后訓練擴展法則(Post-training Scaling Law)測試時擴展法則(Test-time Scaling Law)階段訓練(training)階段的scaling law訓練(training)階段的scaling law推理(reasoning)階段的scaling law2.1 AI模型擴展法則:擴展法則迎來范式轉變,主次擴展曲線逐步切換 12 模型性能提升路徑持續探索,主次增長曲線發生轉變。2020年1月和2022年3月,OpenAI和谷歌先后發布論文Scaling Laws f
33、or Neural Language Models和Training Compute-OptimalLarge Language Models,兩者認為預訓練階段的擴展法則是提升大語言模型性能的有效路徑。2024年8月谷歌發表論文Scaling LLM Test-Time Compute Optimally can be More Effectivethan Scaling Model Parameters,提出在測試時對大語言模型的計算進行最優擴展,可能比擴展模型參數來提升模型性能更有效。根據英偉達CES大會信息,除預訓練和后訓練擴展法則之外,測試時擴展法則同樣推動算力需求持續增長,以Ope
34、nAI-o系列模型為代表的推理模型通過測試時計算,帶動推理算力高增,Scaling Law持續有效。隨著模型性能提升曲線從訓練擴展轉向推理擴展,投資方向也隨之向推理側轉變。資料來源:英偉達CES大會,西南證券整理 資料來源:英偉達CES大會,西南證券整理 英偉達:擴展法則從一個擴展至三個 英偉達:擴展法則推動算力需求提升 2.1 AI模型擴展法則:擴展法則迎來范式轉變,主次擴展曲線逐步切換 13 資料來源:OpenAI Scaling Laws for Neural Language Models,西南證券整理 算力決定Transformer模型性能上限,模型參數與訓練數據比例影響模型最佳性能
35、。根據OpenAI和Google相關研究,模型性能隨著模型參數大小、訓練數據集大小、計算量的增加而提高。對于基于Transformer架構的大語言模型,模型性能三要素的關系為C6N*D,其中,N代表模型參數規模,D代表預訓練數據集大??;C代表預訓練算力資源。大語言模型若要獲得最佳性能,需同時擴展三大要素。當其中一個因素受限時,模型的智能表現可以隨著另外兩個因素的增加而變好,但邊際效應會逐步遞減。在給定預訓練計算量的情況下,可以確定最佳的參數量和數據集之比,從而確定模型的最佳能力。因此,在總計算量越多的情況下,模型能力的上限會越高。然而當前模型參數量與數據量的擴展比例尚存爭議,OpenAI在論文
36、中指出模型參數規模比數據集大小更重要,兩者比例在0.73:0.27時計算效率最優;谷歌論文則認為模型參數和數據大小同等重要,隨著預訓練計算資源的增加,模型參數量和訓練數據量應該等比例增長。預訓練擴展法則“算力+數據+模型”三要素 2.2 預訓練擴展:三要素影響模型性能,高質量數據成為瓶頸 14 15 GPT-1 GPT-2 GPT-3 GPT-4 相相似的似的模模型架型架構 構 億級:1.17 億參數十億級:15億參數 千億級:1750億參數 萬億級:17600億參數 模型模型參參數量數量不斷不斷增增加 加 OpenAI GPT系列模型參數規模持續增長 GPT-1 GPT-2 GPT-3 GP
37、T-4 相相似的似的模型模型架架構 構 4.8 GB(unfiltered)data 40 GB human-filtered data 570 GB data filtered from 45TB raw data Human demonstrations and annotations 數數據規據規模、模、質質量不量不斷增斷增長 長 OpenAI GPT系列模型訓練數據持續增長 OpenAI GPT系列模型持續擴展,高質量語料成為瓶頸。近年來,OpenAI GPT系列模型實現快速擴展,從2018年的GPT-1到2020年的GPT-3,模型參數量從1.17億增長至1750億,數據量從4.8G
38、B增加至570GB,數據質量從原始數據提升至過濾后的高質量數據。2023年3月,GPT-4模型再次實現擴展,參數量達到萬億級別,數據規模和質量進一步提升,模型性能實現再次躍升。然而GPT-4發布至今,已將近兩年,OpenAI仍未發布下一代GPT模型。由于模型能力的指數級增長離不開算力和數據資源的同步增加,目前OpenAI可能遇到數據增長跟不上模型性能提升訴求的問題,因此OpenAI在尋求更多預訓練數據的同時,逐步轉向結合Re-train、Post-train和Test-timecompute,或研究更高效的模型架構等方式,以解決數據瓶頸導致模型性能提升放緩的挑戰。資料來源:OpenAI官網,西
39、南證券整理 資料來源:OpenAI官網,西南證券整理 2.2 預訓練擴展:三要素影響模型性能,高質量數據成為瓶頸 16 2.3 后訓練擴展:微調技術持續創新,打造模型特定性格 資料來源:OpenAI官網,西南證券整理 后訓練擴展:在后訓練期間不斷自我改進,強化特定任務能力。后訓練是在預訓練之后,通過使用人工反饋、強化學習等方法來進一步提升模型響應能力。在后訓練階段,模型通常會根據反饋機制進行微調,相較于預訓練階段的全數據集訓練,后訓練的計算需求較低,不需要在龐大的訓練樣本上迭代,而是基于模型已經學習到的知識進行微調,根據反饋在后訓練期間不斷進行自我改進,選擇性地對某些任務或場景實現強化。微調技
40、術持續創新:OpenAI于2024年12月發布會推出o1強化微調、偏好微調等技術。1)強化微調(Reinforcement Fine-Tuning):通過結合強化學習和監督微調,針對特定領域打造專家模型。在強化微調技術下,開發人員只需利用少量訓練數據即可創建特定領域的專家模型,通過使用幾十到幾千個高質量數據,模型能夠通過強化學習自行探索和學習如何推理復雜任務。2)偏好微調(Preference Fine-Tuning):通過使用直接偏好優化(DPO)來比較模型響應對,教會模型區分偏好和非偏好輸出,有助于在語氣、風格和創造性等主觀任務上尤為有效。監督微調/強化微調/偏好微調方法對比 特點監督微調
41、強化微調偏好微調定義在已經預訓練的模型基礎上,使用標注好的數據集進行進一步的訓練。模型通過輸入-輸出對的方式學習,從而調整權重和參數。通過強化學習方法對預訓練模型進行進一步訓練。在強化微調中,模型與環境互動,基于執行的動作獲得獎勵或懲罰。在預訓練的基礎上,通過用戶反饋、偏好評分、針對性的主觀反饋來優化模型,使其符合特定的偏好或需求。訓練數據標注數據(輸入-輸出對)環境交互和人類反饋(獎勵信號)人類偏好反饋(選擇/評分/建議等)優化技術監督學習,通過最小化預測誤差優化強化學習,通過獎勵優化行為基于人類反饋/選擇或評分/偏好反饋優化輸出,符合用戶需求目標提高模型在特定任務上的準確性優化模型行為,便
42、其適應復雜環境優化模型輸出,便其符合用戶的個性化需求應用場景分類任務、生成任務、回歸任務、情題分析、機器翻譯等任務對話系統、游戲AI、對話系統個性化對話系統、個性化推薦等 打造模型特定性格,豐富垂類交互體驗。在預訓練環節,模型主要針對基礎能力進行提升;而在后訓練環節,模型專注打造自身特點和性格。根據OpenAI Day-2發布會,OpenAI通過演示生物醫學微調模型案例,微調出o1-mini finetune模型,用于分析發病癥狀、鑒定基因,最終微調后的o1-mini模型得分提高80%,超越o1正式版,在生物醫學方面專業性能提升明顯,垂類模型應用前景廣闊,B端科研領域有望受益。目前,OpenA
43、I的強化微調技術已對企業、大學和研究院開放申請測試通道,并將于2025年春季作為產品發布并向用戶開放。在OpenAI內部測試中,強化微調技術已在生物化學、安全、法律、醫療保健領域取得成功,未來有望助力泛科研實現突破性進展。此外,隨著后訓練技術的持續發展,垂類模型的打造有望更加專業和精細,也將要求產品經理能夠更準確地理解AI產品特性,提升模型的后訓練效率,實現用戶與垂類模型的交互體驗升級。17 資料來源:OpenAI官網,西南證券整理 資料來源:OpenAI官網,西南證券整理 OpenAI o1強化微調后專業性能提升 OpenAI利用強化微調技術創建模型 2.3 后訓練擴展:微調技術持續創新,打
44、造模型特定性格 OpenAI-o1模型性能隨測試時計算實現性能提升 資料來源:OpenAI官網,西南證券整理 2.4 測試時擴展:模型實現深度推理,Agent落地未來可期 大模型推理能力持續提升,奠定智能體規劃能力基礎。在數據瓶頸挑戰下,大模型廠商從訓練擴展轉向測試時計算,打造AI新擴展曲線。在此背景下,OpenAI推出推理模型,于2024年9月公開介紹OpenAI-o1模型;2025年12月向用戶開放完整版o1模型,并預告下一代OpenAI-o3模型;2025年4月推出完整版o3模型。在o系列推理模型中,OpenAI引入測試時計算(Test-timecompute),使模型能夠根據用戶提問調
45、節思考行為、分配計算資源、優化輸出結果、提升模型性能。2024年9月,OpenAI-o1推理模型的推出標志著測試時Scaling Law開啟;2025年4月,OpenAI-o3模型公開信息表示Scaling Law持續,AI模型仍在繼續擴展Train-time和Test-time,o3模型的訓練計算量是o1的10倍,其中,RL范式中的算法優化進一步推動模型性能提升。資料來源:OpenAI官網,西南證券整理 OpenAI-o3模型隨強化學習擴展實現性能提升 測試時計算 測試時計算 訓練時間計算 訓練時間計算 18 19 2.5 AI模型擴展循環:智能水平仍需提升,大模型擴展持續進行 預訓練奠定模
46、型內部智能上限,后訓練及測試時擴展釋放智能潛力。未來值得關注的大模型:Meta Llama-4模型:2025年4月5日,Meta推出Llama-4系列模型,其中,小模型Scout和中模型Maverick目前已對外發布,大模型Behemoth仍在訓練中。根據Meta公布,大模型Llama-4-Behemoth總參數接近2萬億,將成為Meta最大預訓練擴展模型,預計于未來數月內發布。OpenAI GPT-5模型:2025年2月28日,OpenAI推出GPT-4.5語言模型,并表示將于數月內發布GPT-5模型,GPT-5模型將成為下一代大模型,并有望整合o系列模型測試時擴展能力。AI Agent產業
47、鏈三大環節核心玩家 模型層 模型層 應用 應用 中間層 中間層 初創企業 初創企業 科技大廠主導 科技大廠主導 模型廠商主導 模型廠商主導 預訓練擴展 后訓練擴展 測試時擴展 大模型循環擴展提升智能水平 資料來源:Z Research,西南證券整理 資料來源:西南證券 GPT-4模型 GPT-4模型 GPT-4-turbo模型 GPT-4-turbo模型 ChatGPT-o1/o3模型 ChatGPT-o1/o3模型 GPT-4o模型 GPT-4o模型 GPT-5模型 GPT-5模型 一、AI發展階段:從推理者轉向智能體,開始學會調用工具 目 錄 二、Agent模型層:底座智能水平提升,推理能
48、力成為核心 三、Agent中間層:中間工具厚積薄發,開發者生態積極構建 四、Agent應用層:初代產品加速創收,商業化應用曙光乍現 五、相關標的及風險提示 20 21 3.1 MCP:定義工具接口標準,打造新一代上下文通信協議 資料來源:Z Research,西南證券整理 Anthropic MCP技術路線示意圖 傳統API技術路線示意圖 資料來源:Z Research,西南證券整理 MCP:鏈接模型上下文信息與智能工具,建立上下文協議行業標準。2024年11月,Anthropic發布Model Context Protocol(MCP),MCP是一種用于在AI系統中管理和交換模型上下文信息的
49、協議,旨在不同的AI模塊、系統或模型之間共享環境、狀態和上下文數據。自推出以來,MCP迅速成為AI原生應用的重要基礎設施,從結構框架層面來看,傳統API與MCP之間存在顯著差異:1)傳統API:基于經典的“客戶端服務端”架構,客戶端發起請求,服務器處理并返回響應,傳統API充當二者之間的中介,開發者通常需要分別集成多個服務接口,單獨處理認證、數據格式和通信協議,帶來較高的集成與維護成本,易出現響應機制不一致等問題。2)MCP:遵循“客戶端-服務器”架構,由MCP主機/MCP客戶端/MCP服務器三個核心組件組成,專為AI系統設計,通過標準化協議傳遞模型所需的上下文數據,使模型能夠高效調用工具,提
50、升AI模型的理解與執行能力。MCP 服務器端 MCP 客戶端 22 資料來源:Madrona,西南證券整理 MCP Server供給快速增加,開發者生態加速繁榮。根據Madrona信息,截至2025年3月28日,MCP Server發現平臺Smithery的服務器創建數量較2月同期實現3倍增長;截至2025年4月初,MCP Server的GitHub star數已突破2.5萬,曲線呈現加速上升趨勢;同時,MCP TypeScriptSDK也在快速增長,每周在npm上的下載量已接近70萬次,SDK下載量遠超服務器包,表明更多的人選擇自己搭建MCP服務器或者在自己的應用中支持MCP,開發者更傾向于
51、為未來的使用場景做準備,而非為現有用戶需求去部署MCP工具。從原始數據來看,受益于新服務器和開發工具的不斷涌現,MCP呈現爆炸式增長,供給側生態逐步繁榮。MCP協議自發布以來,海內外眾多企業陸續采用,應用場景不斷拓寬,MCP向AI工具集成行業標準加速邁進。資料來源:Madrona,西南證券整理 MCP Server的GitHub star數量 Smithery平臺上MCP服務器創建數量 3.1 MCP:定義工具接口標準,打造新一代上下文通信協議 2月14日 2月14日 MCP的Java MCP的Java SDK發布 1月27日 SDK發布 1月27日 MCP Python MCP Python
52、 SDK 1.2.1版SDK 1.2.1版本發布 本發布 3月27日 3月27日 OpenAI宣布其Agents OpenAI宣布其Agents SDK正式支持MCP SDK正式支持MCP 3月16日 3月16日 Microsoft Azure OpenAI服務整合MCP,發布企業級MCP解決方案 Microsoft Azure OpenAI服務整合MCP,發布企業級MCP解決方案 2月14日 2月14日 MCP的Java MCP的Java SDK發布 SDK發布 1月27日 1月27日 MCP Python MCP Python SDK 1.2.1版SDK 1.2.1版本發布 3月27日 本
53、發布 3月27日 OpenAI宣布其Agents OpenAI宣布其Agents SDK正式支持MCP SDK正式支持MCP 3月16日 3月16日 Microsoft Azure OpenAIMicrosoft Azure OpenAI服務整合MCP,發布企服務整合MCP,發布企業級MCP解決方案 業級MCP解決方案 23 3.2 A2A:開放智能體互聯通信,優化新一代智能體網絡協議 資料來源:谷歌官網,西南證券整理 谷歌A2A與MCP協同工作 谷歌A2A開放協議工作原理 資料來源:谷歌官網,西南證券整理 A2A:鏈接客戶端與遠程智能體通信,加速企業內部系統協同工作。2025年4月9日,谷歌
54、推出全新開放協議Agent2Agent(A2A),允許AI代理跨生態系統協作。A2A協議旨在讓不同來源、不同技術的AI智能體能夠安全高效地交換信息,并協同執行跨企業平臺或應用的復雜任務。A2A協議是對Anthropic上下文協議MCP的補充,MCP為智能體提供鏈接工具與上下文的標準,A2A則側重于智能體之間的交互與協作,幫助智能體之間的高效溝通。工作原理方面,A2A用于促進客戶端智能體和遠程智能體之間的通信,其中,用戶存在于協議中,主要的作用是用于認證和授權;客戶端智能體負責制定和傳達任務;遠程智能體則負責執行任務或采取行動。24 3.2 A2A:開放智能體互聯通信,優化新一代智能體網絡協議
55、資料來源:谷歌官網,西南證券整理 資料來源:谷歌官網,西南證券整理 谷歌A2A合作伙伴生態 谷歌A2A招聘應用示例 A2A:合作伙伴陣營日益壯大,專業知識強化企業內部智能體。根據谷歌官網展示的招聘軟件工程師案例,A2A協作能夠大幅簡化流程:在統一界面Agentspace中,HR可以指派客戶端智能體根據職位描述、地點和技能要求,尋找匹配候選人;客戶端智能體隨后會與其他遠程智能體進行交互,以獲取潛在候選人;HR收到推薦結果后,可以進一步指示客戶端智能體安排面試,從而簡化人才篩選流程;面試流程結束后,可以再啟用其他遠程智能體進行背調等行動,從而實現智能體的跨系統合作,幫助尋找合適的候選人。根據谷歌披
56、露信息,A2A的發布已得到包括Atlassian、Box、Cohere、Intuit、Langchain、埃森哲、BCG、Capgemini、Cognizant等在內的50多家技術合作伙伴和服務提供商的支持,生態系統日益壯多樣,合作伙伴的專業知識對塑造智能體的相互協作創造更大,企業內部智能體有望跨系統工作,釋放工作效率和創新潛力。HR指派客戶端智能體尋找匹配候選人 HR指派客戶端智能體尋找匹配候選人 遠程智能體獲取潛在候選人 遠程智能體獲取潛在候選人 HR指派客戶端智能體對候選人背調;另一遠程智能體實施背調并反饋結果 HR指派客戶端智能體對候選人背調;另一遠程智能體實施背調并反饋結果 技術&平
57、臺合作伙伴:提供構建和運行A2A智能體系統的技術與平臺。技術&平臺合作伙伴:提供構建和運行A2A智能體系統的技術與平臺。服務合作伙伴:將技術應用到具體的業務場景中。服務合作伙伴:將技術應用到具體的業務場景中。一、AI發展階段:從推理者轉向智能體,開始學會調用工具 目 錄 二、Agent模型層:底座智能水平提升,推理能力成為核心 三、Agent中間層:中間工具厚積薄發,開發者生態積極構建 四、Agent應用層:初代產品加速創收,商業化應用曙光乍現 五、相關標的及風險提示 25 4.1 Agent類別:把握“通用”與“垂類”兩大應用方向 資料來源:西南證券 資料來源:西南證券 橫向跨行業通用AI代
58、理(Horizontal AI Agent)垂類行業專業AI代理(Vertical AI Agent)同步打磨通用與專業能力,交叉滲透橫向與垂直市場。1)跨行業AI代理(Horizontal AI Agent):隨著AI技術的發展、以及基于過去通用SaaS產品的歷史經驗,當前已有眾多初創企業針對多種行業或領域打造AI通用智能體,如Sierra(客服代理)、Cursor(軟件開發智能體),可提供跨行業智能服務。2)垂類AI代理(Vertical AI Agent):針對某個具體行業或垂直市場提供專業智能體,如AI金融研究創企Boosted.ai、工業控制創企Composabl等,為特定客戶類別制
59、定個性化解決方案。當前,以上兩類智能體正加速發展,有望向各市場橫縱滲透。零售零售Agent金融金融Agent 醫療醫療Agent 工業工業Agent 零售&電商金融&保險 醫療&健康 工業&制造 Agent 其他行業 商家1 商家.機構1 機構.企業1 企業.廠家1 廠家.公司1 公司.S&M Agent Service Agent HR Agent Finance Agent Agent 零售電商金融保險 醫療健康 工業制造 其他行業 營銷銷售工作流 客戶服務工作流 HR管理工作流 財務管理工作流 企業內部工作流 26 資料來源:CBInsights,西南證券整理 資料來源:CBInsigh
60、ts,西南證券整理 4%6%24%14%40%31%20%40%13%9%0%20%40%60%80%100%針對橫向跨行業的 通用AI Agent 針對垂類行業的 專業AI Agent 已成熟 規?;?部署中 驗證中 新興期 149 65 35 13 0306090120150針對橫向跨行業的 通用AI Agent 針對垂類行業的 專業AI Agent 融資額(億美元)交易筆數(筆)2020-2025年2月AI Agent創企融資額及交易數 截至2025年2月通用和專業AI Agent成熟度份額 跨行業通用智能體發展相對成熟,垂類行業智能體逐漸興起。近年來,跨行業通用智能云引領創企風投活動,
61、根據CBInsights統計數據,2020年至2025年2月,該領域的AI Agent創企融資額及交易數均遠超垂類行業領域,融資額實現35億美元,交易達成149筆,垂類行業的創企融資額僅為13億美元,達成交易65起。在商業成熟度方面,跨行業通用應用在商業上更為成熟,超過2/3的市場正在部署或擴展AI解決方案,其中,客戶支持、軟件開發、銷售和通用企業工作流程等賽道較為活躍;而垂類智能體仍處于新興和驗證階段,預計未來垂直行業智能體將向部署階段推進。27 4.1 Agent類別:把握“通用”與“垂類”兩大應用方向 資料來源:CBInsights,西南證券整理 垂類行業 降低成本 提高效率 增強體驗
62、垂類行業 降低成本 提高效率 增強體驗 零售&電扇零售&電扇自動化產品目錄,合成虛擬人節省模特費用 基于LLM搜索提高轉化率 更智能、更相關的搜索,個性化頭像 金融&保險金融&保險 合成訓練數據提高金融模型準確性并確保合規,在非結構化索賠文件中識別模式以最小化損失 AI助手能夠大規模分析和合成財務數據,實現自動化承保決策 AI聊天機器人簡化日常財務任務,保險銷售過程中進行個性化互動 醫療&健康醫療&健康 AI藥物發現與設計縮短上市時間,自然語言處理支持臨床決策 自動化繁瑣任務,改善電子健康記錄文檔,去噪放射掃描 AI伴侶關注健康和心理健康,合成患者數據保護患者隱私 工業&制造工業&制造 自動化
63、質檢、預測性維護 智能調度系統提高生產效率,AI監控質量標準提升良品率 生產流程優化,實時故障預測與提醒 Vertical Agent賦能垂直業務 28 4.2 Agent賦能:把握“降低成本+提高效率+增強體驗”三項賦能 從AI智能體賦能作用來看,主要集中于“降低成本+提高效率+增強體驗”三大方向。其中,“降低成本”可以幫助企業提升盈利能力,“提高效率”有望加強企業經營競爭力,“增強體驗”則將提升用戶留存、擴大潛在市場規模,從而構建Agent的商業價值閉環。賦能垂直業務:深入行業場景,扮演專業助手。垂類行業智能體主要用于處理專業復雜任務,垂類行業涵蓋電商、金融、醫療、工業等領域,扮演行業專家
64、角色。在降低成本方面,Agent可以替代部分專業崗位中的重復性或規則明確的勞動,例如保單文件初審、醫學影像識別等,節省人力開銷;在提高效率方面,能夠幫助流程節點的自動執行、加速專業信息流轉;在增強體驗方面,聚焦提升客戶互動體驗,例如問診智能引導、客戶服務個性化推薦。相較于跨行業通用智能體,垂類行業智能體的部署門檻相對更高,但賦能程度更深,是企業實現數智化轉型的核心抓手。資料來源:CBInsights,西南證券整理 企業內部工作流企業內部工作流 降低成本 提高效率 增強體驗 降低成本 提高效率 增強體驗 營銷&銷售 營銷&銷售 自動化銷售流程,降低銷售人員成本 實時客戶洞察,提高轉化率 提供個性
65、化推薦與互動,提升客戶滿意度 客戶服務 客戶服務 減少人工客服數量和培訓成本 快速響應,多輪對話處理能力強 24/7在線,支持多語言,提升響應體驗 人力資源管理 人力資源管理 節省簡歷篩選和入職流程的人力資源 自動化招聘、自動化績效管理流程 提供個性化職業發展建議,提升員工滿意度 財務管理 財務管理 自動報賬、對賬,減少財務人員投入 實時報表生成,預測與預算更高效 更直觀的財務儀表板與智能分析,便于決策 軟件開發 軟件開發 自動生成代碼、測試用例,降低開發與測試成本 智能體輔助調試、代碼審查,加快交付周期 開發者獲得實時建議和代碼提示,優化開發體驗 網絡安全 網絡安全 自動監控與響應降低安全團
66、隊人力成本 實時檢測威脅并自動響應,降低入侵風險 安全團隊可通過智能助手快速定位并理解威脅來源 Horizontal Agent賦能企業工作流 29 賦能企業工作流:提升員工生產力,辦公提效是核心??缧袠I智能體主要面向企業內部工作流場景,要求普遍適用于各類崗位和部門,具備覆蓋面廣、上手快、易部署等特點,本質在于打造辦公提效工具、甚至形成AI辦公操作系統。在降低成本方面,Agent通過自動化通用事務,減少基礎人力資源投入;在提高效率方面,能壓縮日常事務所耗費的時間;在增強體驗上,為員工提供更高效、更流暢的協作環境,使工作節奏更輕盈,工作體驗更智能。4.2 Agent賦能:把握“降低成本+提高效率
67、+增強體驗”三項賦能 30 芯片領域的摩爾定律:每18-24個月,芯片中的晶體管數量翻倍,芯片算力性能增長、成本下降。Agent的“摩爾定律”:每7個月,AI能夠處理的任務長度翻倍,模型性能提升、成本下降。根據機構METR的研究Measuring AI Ability to Complete Long Tasks,2019年至2025年,AI在50%的可靠性標準下,完成的任務長度(以人類專業人士完成任務所需時間衡量)大約每7個月翻一番,若以該“摩爾定律”線性外推,到2029年AI或許能處理需1個月的復雜任務。2025年4月17日,OpenAI發布o3&o4-mini模型,且初步具備主動調用外部
68、工具的能力,在其官網演示的科研海報應用案例中,從耗時角度,o3模型可以在20s內完成人類研究員可能需數天完成的任務。4.3 Agent摩爾定律:處理任務長度每7月翻一倍,性能增長且成本下降 芯片中的晶體管數每18-24個月翻一倍 AI能夠處理的任務長度每7個月翻一倍 大模型發布時間 大模型發布時間 模型模型以以5050%的的可可靠靠性性完完成成的的任任務務長長度 度 資料來源:集成芯片與芯粒技術白皮書,西南證券整理 資料來源:Measuring AI Ability to Complete Long Tasks,西南證券整理 31 智能體處理任務長度正大幅提升,完成簡單任務已具性價比。根據機構
69、METR的研究MeasuringAI Ability to Complete Long Tasks,目前超過80%由智能體成功完成的任務中,AI的推理成本僅為人類專家的10%,其中,對于人類專家在30秒內完成的任務,使用AI的經濟優勢顯著,目前已可完成16個小時的軟件任務,但在完成長時序現實世界任務方面,人類在整個工作循環中仍然需要發揮較大作用和價值。在2025年4月17日OpenAI發布的o3和o4-mini模型中,o3和o4-mini在很多情況下比各自的前代o1與o3-mini更高效、更節省成本,在AME2025基準測試中,性價比遠超過前代模型。未來隨著AI技術持續發展,AI在復雜任務面前
70、有望同樣具備性價比,從而推動AI智能體進一步應用與滲透。AI完成簡單任務已具備經濟優勢 OpenAI-o系列模型性價比持續提升 資料來源:Measuring AI Ability to Complete Long Tasks,西南證券整理 資料來源:OpenAI官網,西南證券整理 4.3 Agent摩爾定律:處理任務長度每7月翻一倍,性能增長且成本下降 32 資料來源:Sacra,Tullopy,西南證券整理 4.4 Agent初代產品:產品ARR迅速增長,爆發潛力可期 智能體打造交互式應用,未來爆發潛力可期。智能體作為可交互的應用產品,能夠快速觸達用戶,付費滲透空間較大。根據Sacra數據,
71、Agent初代產品Cursor已成為年經常性收入(ARR)從0增長至1億美元最快的初創企業之一,耗時約12個月、于2024年底達成1億美元ARR里程碑,并于2025年3月ARR迅速達到2億美金。根據當前AI智能體創企公司及產品來看,布局領域主要集中于編碼、法律、招聘、客服、醫療等行業領域,商業模式持續探索,已出現基于結果(AI交付實際成果、任務完成率等指標)定價的AI應用產品,或根據資源消耗量收費,也可采用常見的SaaS產品訂閱方式對商業模式進行補充?;谥悄荏w產品爆發快、輕資產、強用戶觸達等特點,未來有望憑借更快的成長速度成為AI應用黑馬,建議后續關注ARR實現快速提升的AI公司及產品。AI
72、創企ARR增速及2024年估值情況 AI初創企業產品定位ARR增長速度2024年ARR($億)2024年估值2024年估值倍數CursorAI編程助手12個月內從0做到1億美元12525Lovable非程序員的AI軟件開發平臺2個月內從0做到1000萬美元0.07/Glean企業級AI搜索平臺21個月內從0做到1億美元1.14642CodeiumAI編程助手/0.1212.5104HarveyAI法律助手26個月內從0做到5000萬美元0.53060HebbiaAI驅動的金融/法律助手/0.13754Bolt.newAI驅動的網頁構建平臺2個月內從0做到2000萬美元0.25/MercorAI
73、驅動的招聘平臺2年內從0做到5000萬美元0.52.55DecagonAI驅動的客服代理/0.066.5108SierraAI驅動的客服軟件/0.245225CommureAI驅動的醫療軟件/0.4123033 4.5 Agent流量入口:AI入口尚處于早期階段,或將呈現中心化特點 互聯網 1.0 互聯網 1.0 互聯網 2.0 互聯網 2.0 互聯網3.0 互聯網3.0 產品入口產品入口互聯網時代 互聯網時代 技術邏輯 技術邏輯 商業模式 商業模式 權力結構 權力結構 門戶網站形成入口,入口中心化門戶網站形成入口,入口中心化特點明顯 特點明顯 1)初代流量邏輯,點擊率吸引1)初代流量邏輯,點
74、擊率吸引廣告;2)用戶作為數據源被商廣告;2)用戶作為數據源被商品化,不參與價值分配 品化,不參與價值分配 基于HTML靜態網頁,用戶僅能基于HTML靜態網頁,用戶僅能通過瀏覽器被動獲取信息,內容通過瀏覽器被動獲取信息,內容由專業開發者單向灌輸 由專業開發者單向灌輸 資料來源:Z Research,西南證券整理 搜索引擎形成入口,入口中心化特點明顯 搜索引擎形成入口,入口中心化特點明顯 1)搜索引擎競價排名;2)PC在家庭和個人用戶中廣泛普及1)搜索引擎競價排名;2)PC在家庭和個人用戶中廣泛普及1)動態網頁和數據庫驅動,用1)動態網頁和數據庫驅動,用戶既是消費者也是生產者;2)PC在家庭和個
75、人用戶中廣泛普及戶既是消費者也是生產者;2)PC在家庭和個人用戶中廣泛普及各垂類APP形成場景化生態(微 各垂類APP形成場景化生態(微 信社交/淘寶電商/美團本地生活信社交/淘寶電商/美團本地生活等),入口價值出現分散 等),入口價值出現分散 1)流量經濟;2)用戶行為數據1)流量經濟;2)用戶行為數據成為核心生產資料,通過精準推成為核心生產資料,通過精準推薦和增值服務變現 薦和增值服務變現 1)信息找人;2)智能手機滲透1)信息找人;2)智能手機滲透率攀升;3)區塊鏈實現數據確權與跨鏈互通 率攀升;3)區塊鏈實現數據確權與跨鏈互通 互聯網流量入口由中心化轉向多元化 互聯網流量入口從中心化轉
76、向分散化,AI時代入口可能處于早期收斂階段。1)互聯網1.0時期:門戶網站Yahoo、Sina成為信息獲取的主要入口,流量入口高度中心化;2)互聯網2.0時代:搜索引擎如百度、谷歌成為主流入口;3)互聯網3.0階段:隨著移動互聯網和智能終端的就是普及,以及各類垂類APP的崛起,逐漸打破過去流量入口的壟斷格局,呈現明顯多元化趨勢,入口價值逐漸向場景和服務轉移。類比互聯網時代來看,當前AI時代的入口尚處于早期階段,ChatGPT、DeepSeek等少數大模型產品主導用戶心智,呈現出類似于互聯網時代早期的門戶式中心化狀態。1990s 2000s 2014 1990s 2000s 2014 2022
77、2022 一、AI發展階段:從推理者轉向智能體,開始學會調用工具 目 錄 二、Agent模型層:底座智能水平提升,推理能力成為核心 三、Agent中間層:中間工具厚積薄發,開發者生態積極構建 四、Agent應用層:初代產品加速創收,商業化應用曙光乍現 五、相關標的及風險提示 34 35 相關標的 AI發展階段變化:從“推理者”到“智能體”AI發展階段變化:從“推理者”到“智能體”模型層 變化 模型層 變化 模型擴展法則從訓練轉向推理,主次曲線逐步切換 模型擴展法則從訓練轉向推理,主次曲線逐步切換 推理算力需求提升 推理算力需求提升 英偉達英偉達 博通博通中間層變化 中間層變化 以MCP、A2A
78、工具為代表的智能體中間層厚積薄發 以MCP、A2A工具為代表的智能體中間層厚積薄發 開發工具、數據層日漸豐富 開發工具、數據層日漸豐富 谷歌谷歌 SNOWSNOW應用層變化 應用層變化 初代智能體產品ARR呈現快速增長態勢 初代智能體產品ARR呈現快速增長態勢 商業化應用曙光乍現 商業化應用曙光乍現 CRMCRM SAPSAP ShopifyShopify云服務廠商 云服務廠商 云端算力/中間工具/應用均需要云廠商支持 云端算力/中間工具/應用均需要云廠商支持 重構云需求結構與增速 重構云需求結構與增速 亞馬遜亞馬遜 微軟微軟 谷歌谷歌層面 邏輯 受益方向 相關標的 AI技術進展不及預期;AI
79、商業化進展不及預期;投資回報不及預期等風險。風險提示 36 分析師:王湘杰 執業證號:S1250521120002 電話:0755-26671517 郵箱: 聯系人:尤品柯 郵箱: 西南證券研究院 分析師承諾分析師承諾 報告署名分析師具有中國證券業協會授予的證券投資咨詢執業資格并注冊為證券分析師,報告所采用的數據均來自合法合規渠道,分析邏輯基于分析師的職業理解,通過合理判斷得出結論,獨立、客觀地出具本報告。分析師承諾不曾因,不因,也將不會因本報告中的具體推薦意見或觀點而直接或間接獲取任何形式的補償。重要聲明重要聲明 西南證券股份有限公司(以下簡稱“本公司”)具有中國證券監督管理委員會核準的證券
80、投資咨詢業務資格。本公司與作者在自身所知情范圍內,與本報告中所評價或推薦的證券不存在法律法規要求披露或采取限制、靜默措施的利益沖突。證券期貨投資者適當性管理辦法于2017年7月1日起正式實施,本報告僅供本公司簽約客戶使用,若您并非本公司簽約客戶,為控制投資風險,請取消接收、訂閱或使用本報告中的任何信息。本公司也不會因接收人收到、閱讀或關注自媒體推送本報告中的內容而視其為客戶。本公司或關聯機構可能會持有報告中提到的公司所發行的證券并進行交易,還可能為這些公司提供或爭取提供投資銀行或財務顧問服務。本報告中的信息均來源于公開資料,本公司對這些信息的準確性、完整性或可靠性不作任何保證。本報告所載的資料
81、、意見及推測僅反映本公司于發布本報告當日的判斷,本報告所指的證券或投資標的的價格、價值及投資收入可升可跌,過往表現不應作為日后的表現依據。在不同時期,本公司可發出與本報告所載資料、意見及推測不一致的報告,本公司不保證本報告所含信息保持在最新狀態。同時,本公司對本報告所含信息可在不發出通知的情形下做出修改,投資者應當自行關注相應的更新或修改。本報告僅供參考之用,不構成出售或購買證券或其他投資標的要約或邀請。在任何情況下,本報告中的信息和意見均不構成對任何個人的投資建議。投資者應結合自己的投資目標和財務狀況自行判斷是否采用本報告所載內容和信息并自行承擔風險,本公司及雇員對投資者使用本報告及其內容而
82、造成的一切后果不承擔任何法律責任。本報告及附錄版權為西南證券所有,任何機構和個人不得以任何形式翻版、復制和發布。如引用須注明出處為“西南證券”,且不得對本報告及附錄進行有悖原意的引用、刪節和修改。未經授權刊載或者轉發本報告及附錄的,本公司將保留向其追究法律責任的權利。西南證券投資評級說明西南證券投資評級說明 報告中投資建議所涉及的評級分為公司評級和行業評級(另有說明的除外)。評級標準為報告發布日后6個月內的相對市場表現,即:以報告發布日后6個月內公司股價(或行業指數)相對同期相關證券市場代表性指數的漲跌幅作為基準。其中:A股市場以滬深300指數為基準,新三板市場以三板成指(針對協議轉讓標的)或
83、三板做市指數(針對做市轉讓標的)為基準;香港市場以恒生指數為基準;美國市場以納斯達克綜合指數或標普500指數為基準。公司 評級 買入:未來6個月內,個股相對同期相關證券市場代表性指數漲幅在20%以上 持有:未來6個月內,個股相對同期相關證券市場代表性指數漲幅介于10%與20%之間 中性:未來6個月內,個股相對同期相關證券市場代表性指數漲幅介于-10%與10%之間 回避:未來6個月內,個股相對同期相關證券市場代表性指數漲幅介于-20%與-10%之間 賣出:未來6個月內,個股相對同期相關證券市場代表性指數漲幅在-20%以下 行業 評級 強于大市:未來6個月內,行業整體回報高于同期相關證券市場代表性
84、指數5%以上 跟隨大市:未來6個月內,行業整體回報介于同期相關證券市場代表性指數-5%與5%之間 弱于大市:未來6個月內,行業整體回報低于同期相關證券市場代表性指數-5%以下 西南證券機構銷售團隊西南證券機構銷售團隊 區域區域 姓名姓名 職務職務 手手機機 郵箱郵箱 姓名姓名 職務職務 手手機機 郵箱郵箱 上上海海 蔣詩烽 總經理助理/銷售總監 18621310081 張玉梅 銷售經理 18957157330 崔露文 銷售副總監 15642960315 歐若詩 銷售經理 18223769969 李煜 資深銷售經理 18801732511 李嘉隆 銷售經理 15800507223 田婧雯 高級銷
85、售經理 18817337408 龔怡蕓 銷售經理 13524211935 汪藝 高級銷售經理 13127920536 蔣宇潔 銷售經理 15905851569 .c 北北京京 李楊 銷售總監 18601139362 張鑫 高級銷售經理 15981953220 張嵐 銷售副總監 18601241803 王一菲 高級銷售經理 18040060359 楊薇 資深銷售經理 15652285702 王宇飛 高級銷售經理 18500981866 姚航 資深銷售經理 15652026677 馬冰竹 銷售經理 13126590325 廣廣深深 鄭龑 廣深銷售負責人 18825189744 陳韻然 銷售經理 18208801355 龔之涵 高級銷售經理 15808001926 林哲睿 銷售經理 15602268757 楊舉 銷售經理 13668255142 西南證券研究院 西南證券研究西南證券研究院院 上海上海 深圳深圳 地址:上海市浦東新區陸家嘴21世紀大廈10樓 地址:深圳市福田區益田路6001號太平金融大廈22樓 郵編:200120 郵編:518038 北京北京 重慶重慶 地址:北京市西城區金融大街35號國際企業大廈A座8樓 地址:重慶市江北區金沙門路32號西南證券總部大樓21樓 郵編:100033 郵編:400025