《2025年AI Agent模型層、中間層、應用層發展現狀及商業化進程分析報告(35頁).pdf》由會員分享,可在線閱讀,更多相關《2025年AI Agent模型層、中間層、應用層發展現狀及商業化進程分析報告(35頁).pdf(35頁珍藏版)》請在三個皮匠報告上搜索。
1、2 0 2 5 年深度行業分析研究報告 一、AI發展階段:從推理者轉向智能體,開始學會調用工具 目 錄 二、Agent模型層:底座智能水平提升,推理能力成為核心 三、Agent中間層:中間工具厚積薄發,開發者生態積極構建 四、Agent應用層:初代產品創收加速,商業化應用曙光乍現 五、相關標的及風險提示 2 模型多維能力持續提升,AI從推理者轉向智能體。根據OpenAI對AI發展的理解和定義,AI水平可分為五大等級:一是聊天機器人(Chatbot),能夠用自然語言進行對話;二是推理者,基于推理模型,解決人類級別的智力問題;三是智能體(Agent),能夠代表用戶采取行動;四是創新者;五是組織。過
2、去,在ChatGPT等聊天機器人產品推出時,大模型通常采取一次性推理,用戶與聊天機器人的交互形式呈現為簡單的一問一答。而在推理模型的不斷發展之下,AI模型逐漸能夠與自己對話,實現內部思考,具備推理能力。當前,隨著大模型在交互/認知/泛化/自主等多維度能力持續提升,AI正從推理者轉向智能體,逐步具備采取行動及處理任務的能力,智能體產品加速推進。1.1 AI等級:AI發展水平劃為五大等級,當前正從推理者轉向智能體 AI發展水平劃分為五大等級 資料來源:Bloomberg reporting,OpenAI,西南證券整理 聊天機器人 聊天機器人 推理者 推理者 智能體 智能體 創新者 創新者 組織 組
3、織 具備語言對話能力的人工智能具備語言對話能力的人工智能 具備解決人類水平問題的能力具備解決人類水平問題的能力 能夠采取行動的系統能夠采取行動的系統 能夠幫助發明創新的人工智能能夠幫助發明創新的人工智能 能夠完成組織工作的人工智能能夠完成組織工作的人工智能AI等級 AI等級 交互能力 交互能力 認知能力 認知能力 泛化能力 泛化能力 多領域泛化 多領域泛化 處理事實 處理事實 簡單式一問一答 簡單式一問一答 自主能力 自主能力 依賴人類指令按步驟執行命令 依賴人類指令按步驟執行命令 3 系統中協同運作 系統中協同運作 上下文深入交流 上下文深入交流 環境中動態交互 環境中動態交互 創新性思考
4、創新性思考 鏈式推理 鏈式推理 局限于特定領域任務 局限于特定領域任務 跨領域整合 跨領域整合 設定目標自主完成復雜任務 設定目標自主完成復雜任務 定義 定義 用戶:給出任務目標用戶:給出任務目標 AI:通過使用工具并進行規劃,直接完成任務,甚至具備修正能力AI:通過使用工具并進行規劃,直接完成任務,甚至具備修正能力 用戶:給出明顯指令用戶:給出明顯指令 AI:具備一定的理解力和工具使用能力,但仍需用戶逐步確認AI:具備一定的理解力和工具使用能力,但仍需用戶逐步確認 用戶:給出明確且具體的每一步指令用戶:給出明確且具體的每一步指令 AI:根據一個指令產生一個動作AI:根據一個指令產生一個動作4
5、 AI產品目前處于中間過渡形態,智能體有望革新交互效率。過去,傳統聊天機器人只能執行明確指令,用戶需要逐次下達任務指令,AI模型根據一個指令進行一個動作;當前,中間形態的AI產品已初步具備目標理解和推理能力,可以根據用戶的模糊需求主動采取一部分行動,但仍然需要依賴用戶反饋進行下一步操作;未來,真正的AI智能體將能夠根據最終目標自主規劃任務步驟、調用多種工具、識別錯誤并給出修正策略,具備完成任務的能力。用戶與不同AI產品形態的互動以及第一輪交互結果示例 我上傳了一份 Excel,我上傳了一份 Excel,幫我分析一下里面的數據有什么趨勢或異常?幫我分析一下里面的數據有什么趨勢或異常?你想分析哪一
6、列數據?你想分析哪一列數據?趨勢是指增長嗎?異常趨勢是指增長嗎?異常是指什么?是指什么?資料來源:西南證券 我上傳了一份 Excel,我上傳了一份 Excel,幫我分析一下里面的數據有什么趨勢或異常?幫我分析一下里面的數據有什么趨勢或異常?我上傳了一份 Excel,我上傳了一份 Excel,幫我分析一下里面的數據有什么趨勢或異常?幫我分析一下里面的數據有什么趨勢或異常?我已做出基礎統計和可我已做出基礎統計和可視化圖表,你需要繼續視化圖表,你需要繼續深入哪個部分嗎?深入哪個部分嗎?我已檢查和分析數據、生成多種圖表和文字總我已檢查和分析數據、生成多種圖表和文字總結。但是可能異常值過多,需要幫你進一
7、步清結。但是可能異常值過多,需要幫你進一步清洗數據嗎?洗數據嗎?用戶與傳統聊天機器人的交互結果 用戶與傳統聊天機器人的交互結果 用戶與推理者產品的交互結果 用戶與推理者產品的交互結果 用戶與智能體產品的交互結果 用戶與智能體產品的交互結果 1.1 AI等級:AI發展水平劃為五大等級,當前正從推理者轉向智能體 1.2 Agent等級:初階能夠使用工具,高階可自主完成長時任務 智能體(Agent)=大模型(LLM)+記憶(Memory)+主動規劃(Planning)+工具使用(Tool use)。大模型:在基于LLM的智能體中,LLM充當智能體的大腦。主動規劃:可以將大型任務分解為子任務,并規劃執
8、行任務的流程,同時能夠對任務執行的過程進行思考和反思,從而決定是繼續執行任務,或判斷任務完結并終止運行。記憶:短期記憶指在執行任務的過程中的上下文,會在子任務的執行過程產生和暫存,在任務完結后被清空;長期記憶即可以長時間保留的信息,一般指外部知識庫,可用向量數據庫存儲或檢索。工具使用:為智能體配備工具API,如計算器/搜索工具/代碼執行器/數據庫查詢工具等,從而與物理世界實現交互,解決實際問題。智能體公式:Agent=LLM+Memory+Planning+Tool use 資料來源:OpenAI官網,西南證券整理 5 自主決策能力是基礎,解決長時任務是關鍵。根據智能體“推理+記憶+使用工具+
9、規劃”的四大核心能力來看,截至目前,聊天機器人產品逐步具備推理能力,副駕駛和工具型助手可以建立外部記憶,但仍然不具備使用工具和自主規劃的能力,只能根據用戶指令按步驟執行,不屬于能夠自主決策的智能體。根據CBInsights研究,具備一定自主決策能力的智能體可分為兩大等級。1)初級Agent:AI模型可以通過編排組合,把重復性高、需要一定靈活性的任務從人替換成數字員工,實現任務的自動化,在該階段,Agent尚不具備完全開放的決策空間,自主決策范圍主要局限于任務流程和有限選項之中,決策行為將受到安全條件、訪問權限等限制,是有限決策的智能體。2)高級Agent:智能體不只是LLM calling的組
10、合,而是能夠更自主、更主動地規劃,完成多步驟、長時任務,可以在多個選項之間做出自主選擇,不需要人工指示,實現高度自治。根據自主化程度劃分AI Agent等級 聊天機器人 聊天機器人 副駕駛助手 副駕駛助手 受限制的智能體 受限制的智能體 完全自主代理 完全自主代理 自主性擴展 自主性擴展 Chatbots Copilots&Asssistants Agents with guardrails Fully autonomous agents Chatbots Copilots&Asssistants Agents with guardrails Fully autonomous agents 推
11、理能力推理能力 外部記憶外部記憶 使用工具使用工具 自主規劃自主規劃 推理能力推理能力 外部記憶外部記憶 使用工具使用工具 自主規劃自主規劃 推理能力推理能力 外部記憶外部記憶 使用工具使用工具 自主規劃自主規劃 推理能力推理能力 外部記憶外部記憶 使用工具使用工具 自主規劃Agent四大自主規劃Agent四大核心能力 核心能力 資料來源:CBInsights,西南證券整理 擁有一定程度的自主決策能力的AI Agents 擁有一定程度的自主決策能力的AI Agents 6 1.2 Agent等級:初階能夠使用工具,高階可自主完成長時任務 資料來源:西南證券 1.3 AI產業鏈:AI Infra
12、奏響主旋律,AI Agent拉開新畫布 7 AI Infra:核心算力、半導體產業鏈、硬件設備、電力能源為AI大模型的訓練與推理奠定硬件基礎。AI Agent:B端軟件、C端應用、端側AI及具身智能等環節在Agent應用上蓄勢待發。AI產業鏈示意圖 8 1.3 Agent產業鏈:智能體基建厚積薄發,商業化應用曙光乍現 資料來源:Z Research,西南證券整理 AI Agent產業鏈示意圖 模型層 模型層 預訓練 預訓練(Pre-Train)(Pre-Train)Transformer架構下的scaling law 算力 算力 算法 算法 數據 數據 微調 微調(Fine-Tuning)(F
13、ine-Tuning)參數高效微調PEFT監督微調SFT等強化學習 強化學習(Reinforce Learning)(Reinforce Learning)獎勵建模偏好優化算法等推理增強 推理增強(inference enhancement)(inference enhancement)思維連CoT優化檢索增強生成RAG等 模型層:Agent本質是大模型能力的工程化載體,大模型智能水平仍是打造Agent的底層支撐,未來依舊需要通過預訓練、后訓練和測試時計算進行擴展。中間層:Agent產業鏈的中間層工具正加速構建,數據庫、身份治理、通信協作等成為重要議題。應用層:Agent應用形態隨著以上底層大
14、模型和中間原生基礎設施的發展逐步從構想更加貼近現實。中間層中間層 數據層 數據層(Data Layer)(Data Layer)數據治理:數據治理:管理結構化/非結構化數據,提供高精度標注服務數據分析:數據分析:通過AI工具強化數據分析,表現為LLM驅動下更強的BI能力,數據分析門檻與難度降低模型工具鏈 模型工具鏈(MLOps)(MLOps)模型管理:模型管理:提供模型全生命周期管理,支持從訓練到監控的自動化流水線自動化工具:自動化工具:超參數調優工具、托管成百上千個預訓練模型平臺等應用層應用層 副駕駛 副駕駛 (AI Copilot)(AI Copilot)增強人類能力的智能輔助系統 媒體應
15、用 媒體應用(AI Media)(AI Media)通過AI技術實現內容生產、傳播優化、互動增強的下一代媒體形態,覆蓋游戲/社交/廣告等 智能體 智能體 (AI Agent)(AI Agent)自主決策+環境交互+目標驅動 1.3 Agent產業鏈:智能體基建厚積薄發,商業化應用曙光乍現 基礎設施加速發展推動新應用誕生,新應用積極引導基礎設施下一步健全方向。智能體生態正在經歷波浪式發展進程,每一波創新應用的誕生,都會帶動基礎設施的迭代升級,底層技術的進步又會進一步催生出更智能的應用,如OpenAI的GPT系列(從GPT-1到GPT-4)和o系列(從o1到o3)模型、Anthropic的Clau
16、de模型(Sonnet-3迭代至3.7)、谷歌Gemini模型(從1.5Pro迭代至2.5Pro)。智能體中間層則陸續出現LangChain、Tool Calling、MCP和A2A等工具;應用層相繼出現Cursor、Claude Desktop、OpenAI Operator等。新應用對基礎設施提出更復雜的需求,基礎設施的進步又將反哺新的智能體應用,兩者相互塑造、共同演進,加速AI的商業化落地。應用層應用層 2021年2月 Glean2021年2月 Glean2022年11月 ChatGPT2022年11月 ChatGPT2023年1月 Cursor2023年1月 Cursor2023年2月
17、 RunwayML 2023年2月 RunwayML 中間層中間層 2022年10月 LangChain2022年10月 LangChain2022年11月 Llamalndex2022年11月 Llamalndex2023年6月 LLM Tool Calling2023年6月 LLM Tool Calling2023年10月 Modal Labs2023年10月 Modal Labs模型層模型層 2023年3月 GPT-4 2023年3月 GPT-4 2024年2月 Gemini 1.5 Pro2024年2月 Gemini 1.5 Pro2024年3月 Claude Sonnet 32024
18、年3月 Claude Sonnet 3應用層應用層 2024年1月 Custom GPTs2024年1月 Custom GPTs2024年10月 Claude Desktop2024年10月 Claude Desktop2024年10月 Bolt.new2024年10月 Bolt.new應用層應用層 2024年10月 Claude Computer Use2024年10月 Claude Computer Use2024年11月 Cline2024年11月 Cline2025年1月 OpenAl Operator2025年1月 OpenAl Operator2025年3月 Manus.Al202
19、5年3月 Manus.Al應用層應用層未來關注:未來關注:電商電商旅行規劃旅行規劃生產力生產力營銷等營銷等中間層中間層 2024年1月 LangGraph2024年1月 LangGraph2024年6月 BrowserBase2024年6月 BrowserBase2024年11月 MCP(Model2024年11月 MCP(ModelContext Protocol)Context Protocol)模型層模型層 2024年4月 Llama 32024年4月 Llama 32024年6月 Claude Sonnet 3.5 2024年6月 Claude Sonnet 3.5 2024年9月 O
20、penAI o12024年9月 OpenAI o1中間層中間層 2025年3月 Cisco ACP2025年3月 Cisco ACP2025年4月 Google A2A2025年4月 Google A2A2024年11月-2025年3月2024年11月-2025年3月MCP Server大量涌現MCP Server大量涌現模型層模型層 2025年1月 DeepSeek-R12025年1月 DeepSeek-R12025年2月 Claude Sonnet 3.72025年2月 Claude Sonnet 3.72025年3月 Gemini 2.5 Pro2025年3月 Gemini 2.5 Pr
21、o2025年4月 Llama 42025年4月 Llama 42025年4月 OpenAI o32025年4月 OpenAI o3中間層中間層未來關注:未來關注:安全集成安全集成MCP發現與信任MCP發現與信任模型層模型層未來關注:未來關注:OpenAI GPT 5 OpenAI GPT 5 Llama 4 BehemothLlama 4 Behemoth資料來源:Madrona,西南證券整理 Agent基礎設施建設與應用協同演進 9 本報告來源于三個皮匠報告站(),由用戶Id:879635下載,文檔Id:630730,下載日期:2025-04-27 一、AI發展階段:從推理者轉向智能體,開始
22、學會調用工具 目 錄 二、Agent模型層:底座智能水平提升,推理能力成為核心 三、Agent中間層:中間工具厚積薄發,開發者生態積極構建 四、Agent應用層:初代產品加速創收,商業化應用曙光乍現 五、相關標的及風險提示 10 11 GPT-1:1.17億參數;有一定的泛化能力 GPT-2:15億參數;生成能力提升 GPT-3:1750億參數;可完成大多數NLP任務GPT-3.5(Chat GPT):約1750億參數,強大的理解能力GPT-4:萬億參數;數據源擴充;增加訓練后處理和行為預測 GPT-4V:具備視覺能力 GPT-4-Turbo:多模態能力提升;上下文更長、價格更低、性能更高 預
23、訓練擴展階段 預訓練擴展階段 后訓練擴展階段 后訓練擴展階段 測試時擴展階段 測試時擴展階段 2018.062018.06 2019.02 2019.02 2020.05 2020.05 2022.11 2022.11 2023.03 2023.03 2023.09 2023.09 2023.11 2023.11 2024.05 2024.05 2024.09 2024.09 2024.12 2024.12 2025.01 2025.01 2025.02 2025.02 2025.04 2025.04 GPT-4o:能夠同時處理多種輸入類型,提升響應速度和性能 OpenAI-o1模型完整版向用
24、戶開放;下一代推理模型OpenAI-o3預覽 OpenAI-o1推理模型預覽版亮相OpenAI-o3-mini模型發布GPT4.5:截至目前最大LLM模型,世界知識豐富,情商更高 GPT-4.1:能夠處理復雜任務的模型 資料來源:OpenAI官網,西南證券整理 OpenAI旗下模型迭代進程梳理 擴展法則迎來范式轉變,推理模型迭代節奏加速。從OpenAI旗下AI模型迭代進程來看:2018年6月至2023年3月預訓練擴展階段:OpenAI大模型預訓練快速推進,在五年內從GPT-1迭代至GPT-4模型,模型基礎能力2023年3月之后,預訓練擴展進程逐漸放緩,截至目前仍未推出下一代預訓練大模型GPT-
25、5。2023年下半年至2024年5月后訓練擴展階段:基于微調技術開始打磨多模態、上下文等能力,提升特定指標性能。2024年9月至今測試時擴展階段:2024年9月OpenAI-o1模型預覽版亮相,標志正式進入推理模型時代;2025年4月17日,OpenAI推出完整版o3模型和o4-mini模型,截至目前,半年內已迭代多次,測試時擴展正加速發展。OpenAI-o3&o4mini模型發布 2.1 AI模型擴展法則:擴展法則迎來范式轉變,主次擴展曲線逐步切換 AI三大擴展法則對比 資料來源:英偉達CES大會,西南證券整理 規模法則從訓練階段延伸至推理階段,推動計算需求持續提升。預訓練法則和后訓練法則均
26、與模型的訓練階段有關,而測試時擴展法則與推理階段有關,深度推理有望對算力需求進一步增加。預訓練擴展法則(Pre-training Scaling Law):關注計算資源、模型大小和訓練數據三大要素,當三要素同時增加時,模型性能將同步提升,打造優質基座模型。后訓練擴展法則(Post-training Scaling Law):關注在預訓練完成后對模型的進一步優化和微調,可以針對特定任務進行改進,從而提升模型在特定領域的性能,有助于打造垂類模型。測試時擴展法則(Test-time Scaling Law):針對在模型的實際推理或應用中,根據問題的復雜程度實時分配計算資源,面對復雜問題能夠進行分步驟
27、、多階段推理,在多個解法中尋求最優解。定義指在訓練過程中,通過增加訓練數據、模型參數和計算資源來提升模型能力。模型在預訓練階段需要通過大量數據進行訓練、學習基礎知識。指在預訓練之后,利用強化學習、人工反饋等技術對模型進行進一步優化,后訓練通常涉及對模型的精細化調整,提高在特定任務上的表現。指在模型的實際應用中,模型根據需要動態分配計算資源來提升推理效率,更加關注模型如何在實時推理時優化自身的計算策略。特點 主要依賴大量的數據(多模態數據,如文本、圖像、視頻等)和計算資源。模型通過大規模數據集進行自我學習,獲取廣泛的知識。是訓練過程中的初步階段,主要幫助模型建立基座能力。在模型初步訓練完成后,使
28、用人類反饋或強化學習的方式幫助模型在特定任務上改進。強調通過模擬“自我提升”的方式逐步提升模型能力(如通過解決復雜的數學問題等)??梢钥醋魇恰坝柧毢蟮倪M步”或“微調”過程,幫助模型在特定領域變得更精通。重點是在實際使用中,通過調整計算資源的分配來提升決策過程的質量。模型可以在推理時進行“深度思考”,將問題拆解成多個步驟,逐步推理或產生多個解法,評估最優解。強調推理過程中的靈活性和高效性,目的是在實時環境中產生高質量的結果。模型OpenAI GPT系列模型:GPT-1至GPT-4GPT-4 turboOpenAI-o1至o3系列模型名稱預訓練擴展法則(Pre-training Scaling L
29、aw)后訓練擴展法則(Post-training Scaling Law)測試時擴展法則(Test-time Scaling Law)階段訓練(training)階段的scaling law訓練(training)階段的scaling law推理(reasoning)階段的scaling law2.1 AI模型擴展法則:擴展法則迎來范式轉變,主次擴展曲線逐步切換 12 模型性能提升路徑持續探索,主次增長曲線發生轉變。2020年1月和2022年3月,OpenAI和谷歌先后發布論文Scaling Laws for Neural Language Models和Training Compute-Op
30、timalLarge Language Models,兩者認為預訓練階段的擴展法則是提升大語言模型性能的有效路徑。2024年8月谷歌發表論文Scaling LLM Test-Time Compute Optimally can be More Effectivethan Scaling Model Parameters,提出在測試時對大語言模型的計算進行最優擴展,可能比擴展模型參數來提升模型性能更有效。根據英偉達CES大會信息,除預訓練和后訓練擴展法則之外,測試時擴展法則同樣推動算力需求持續增長,以OpenAI-o系列模型為代表的推理模型通過測試時計算,帶動推理算力高增,Scaling Law
31、持續有效。隨著模型性能提升曲線從訓練擴展轉向推理擴展,投資方向也隨之向推理側轉變。資料來源:英偉達CES大會,西南證券整理 資料來源:英偉達CES大會,西南證券整理 英偉達:擴展法則從一個擴展至三個 英偉達:擴展法則推動算力需求提升 2.1 AI模型擴展法則:擴展法則迎來范式轉變,主次擴展曲線逐步切換 13 資料來源:OpenAI Scaling Laws for Neural Language Models,西南證券整理 算力決定Transformer模型性能上限,模型參數與訓練數據比例影響模型最佳性能。根據OpenAI和Google相關研究,模型性能隨著模型參數大小、訓練數據集大小、計算量
32、的增加而提高。對于基于Transformer架構的大語言模型,模型性能三要素的關系為C6N*D,其中,N代表模型參數規模,D代表預訓練數據集大??;C代表預訓練算力資源。大語言模型若要獲得最佳性能,需同時擴展三大要素。當其中一個因素受限時,模型的智能表現可以隨著另外兩個因素的增加而變好,但邊際效應會逐步遞減。在給定預訓練計算量的情況下,可以確定最佳的參數量和數據集之比,從而確定模型的最佳能力。因此,在總計算量越多的情況下,模型能力的上限會越高。然而當前模型參數量與數據量的擴展比例尚存爭議,OpenAI在論文中指出模型參數規模比數據集大小更重要,兩者比例在0.73:0.27時計算效率最優;谷歌論文
33、則認為模型參數和數據大小同等重要,隨著預訓練計算資源的增加,模型參數量和訓練數據量應該等比例增長。預訓練擴展法則“算力+數據+模型”三要素 2.2 預訓練擴展:三要素影響模型性能,高質量數據成為瓶頸 14 15 GPT-1 GPT-2 GPT-3 GPT-4 相相似的似的模模型架型架構 構 億級:1.17 億參數十億級:15億參數 千億級:1750億參數 萬億級:17600億參數 模型模型參參數量數量不斷不斷增增加 加 OpenAI GPT系列模型參數規模持續增長 GPT-1 GPT-2 GPT-3 GPT-4 相相似的似的模型模型架架構 構 4.8 GB(unfiltered)data 40
34、 GB human-filtered data 570 GB data filtered from 45TB raw data Human demonstrations and annotations 數數據規據規模、模、質質量不量不斷增斷增長 長 OpenAI GPT系列模型訓練數據持續增長 OpenAI GPT系列模型持續擴展,高質量語料成為瓶頸。近年來,OpenAI GPT系列模型實現快速擴展,從2018年的GPT-1到2020年的GPT-3,模型參數量從1.17億增長至1750億,數據量從4.8GB增加至570GB,數據質量從原始數據提升至過濾后的高質量數據。2023年3月,GPT-4
35、模型再次實現擴展,參數量達到萬億級別,數據規模和質量進一步提升,模型性能實現再次躍升。然而GPT-4發布至今,已將近兩年,OpenAI仍未發布下一代GPT模型。由于模型能力的指數級增長離不開算力和數據資源的同步增加,目前OpenAI可能遇到數據增長跟不上模型性能提升訴求的問題,因此OpenAI在尋求更多預訓練數據的同時,逐步轉向結合Re-train、Post-train和Test-timecompute,或研究更高效的模型架構等方式,以解決數據瓶頸導致模型性能提升放緩的挑戰。資料來源:OpenAI官網,西南證券整理 資料來源:OpenAI官網,西南證券整理 2.2 預訓練擴展:三要素影響模型性
36、能,高質量數據成為瓶頸 16 2.3 后訓練擴展:微調技術持續創新,打造模型特定性格 資料來源:OpenAI官網,西南證券整理 后訓練擴展:在后訓練期間不斷自我改進,強化特定任務能力。后訓練是在預訓練之后,通過使用人工反饋、強化學習等方法來進一步提升模型響應能力。在后訓練階段,模型通常會根據反饋機制進行微調,相較于預訓練階段的全數據集訓練,后訓練的計算需求較低,不需要在龐大的訓練樣本上迭代,而是基于模型已經學習到的知識進行微調,根據反饋在后訓練期間不斷進行自我改進,選擇性地對某些任務或場景實現強化。微調技術持續創新:OpenAI于2024年12月發布會推出o1強化微調、偏好微調等技術。1)強化
37、微調(Reinforcement Fine-Tuning):通過結合強化學習和監督微調,針對特定領域打造專家模型。在強化微調技術下,開發人員只需利用少量訓練數據即可創建特定領域的專家模型,通過使用幾十到幾千個高質量數據,模型能夠通過強化學習自行探索和學習如何推理復雜任務。2)偏好微調(Preference Fine-Tuning):通過使用直接偏好優化(DPO)來比較模型響應對,教會模型區分偏好和非偏好輸出,有助于在語氣、風格和創造性等主觀任務上尤為有效。監督微調/強化微調/偏好微調方法對比 特點監督微調強化微調偏好微調定義在已經預訓練的模型基礎上,使用標注好的數據集進行進一步的訓練。模型通過
38、輸入-輸出對的方式學習,從而調整權重和參數。通過強化學習方法對預訓練模型進行進一步訓練。在強化微調中,模型與環境互動,基于執行的動作獲得獎勵或懲罰。在預訓練的基礎上,通過用戶反饋、偏好評分、針對性的主觀反饋來優化模型,使其符合特定的偏好或需求。訓練數據標注數據(輸入-輸出對)環境交互和人類反饋(獎勵信號)人類偏好反饋(選擇/評分/建議等)優化技術監督學習,通過最小化預測誤差優化強化學習,通過獎勵優化行為基于人類反饋/選擇或評分/偏好反饋優化輸出,符合用戶需求目標提高模型在特定任務上的準確性優化模型行為,便其適應復雜環境優化模型輸出,便其符合用戶的個性化需求應用場景分類任務、生成任務、回歸任務、
39、情題分析、機器翻譯等任務對話系統、游戲AI、對話系統個性化對話系統、個性化推薦等 打造模型特定性格,豐富垂類交互體驗。在預訓練環節,模型主要針對基礎能力進行提升;而在后訓練環節,模型專注打造自身特點和性格。根據OpenAI Day-2發布會,OpenAI通過演示生物醫學微調模型案例,微調出o1-mini finetune模型,用于分析發病癥狀、鑒定基因,最終微調后的o1-mini模型得分提高80%,超越o1正式版,在生物醫學方面專業性能提升明顯,垂類模型應用前景廣闊,B端科研領域有望受益。目前,OpenAI的強化微調技術已對企業、大學和研究院開放申請測試通道,并將于2025年春季作為產品發布并
40、向用戶開放。在OpenAI內部測試中,強化微調技術已在生物化學、安全、法律、醫療保健領域取得成功,未來有望助力泛科研實現突破性進展。此外,隨著后訓練技術的持續發展,垂類模型的打造有望更加專業和精細,也將要求產品經理能夠更準確地理解AI產品特性,提升模型的后訓練效率,實現用戶與垂類模型的交互體驗升級。17 資料來源:OpenAI官網,西南證券整理 資料來源:OpenAI官網,西南證券整理 OpenAI o1強化微調后專業性能提升 OpenAI利用強化微調技術創建模型 2.3 后訓練擴展:微調技術持續創新,打造模型特定性格 OpenAI-o1模型性能隨測試時計算實現性能提升 資料來源:OpenAI
41、官網,西南證券整理 2.4 測試時擴展:模型實現深度推理,Agent落地未來可期 大模型推理能力持續提升,奠定智能體規劃能力基礎。在數據瓶頸挑戰下,大模型廠商從訓練擴展轉向測試時計算,打造AI新擴展曲線。在此背景下,OpenAI推出推理模型,于2024年9月公開介紹OpenAI-o1模型;2025年12月向用戶開放完整版o1模型,并預告下一代OpenAI-o3模型;2025年4月推出完整版o3模型。在o系列推理模型中,OpenAI引入測試時計算(Test-timecompute),使模型能夠根據用戶提問調節思考行為、分配計算資源、優化輸出結果、提升模型性能。2024年9月,OpenAI-o1推
42、理模型的推出標志著測試時Scaling Law開啟;2025年4月,OpenAI-o3模型公開信息表示Scaling Law持續,AI模型仍在繼續擴展Train-time和Test-time,o3模型的訓練計算量是o1的10倍,其中,RL范式中的算法優化進一步推動模型性能提升。資料來源:OpenAI官網,西南證券整理 OpenAI-o3模型隨強化學習擴展實現性能提升 測試時計算 測試時計算 訓練時間計算 訓練時間計算 18 19 2.5 AI模型擴展循環:智能水平仍需提升,大模型擴展持續進行 預訓練奠定模型內部智能上限,后訓練及測試時擴展釋放智能潛力。未來值得關注的大模型:Meta Llama
43、-4模型:2025年4月5日,Meta推出Llama-4系列模型,其中,小模型Scout和中模型Maverick目前已對外發布,大模型Behemoth仍在訓練中。根據Meta公布,大模型Llama-4-Behemoth總參數接近2萬億,將成為Meta最大預訓練擴展模型,預計于未來數月內發布。OpenAI GPT-5模型:2025年2月28日,OpenAI推出GPT-4.5語言模型,并表示將于數月內發布GPT-5模型,GPT-5模型將成為下一代大模型,并有望整合o系列模型測試時擴展能力。AI Agent產業鏈三大環節核心玩家 模型層 模型層 應用 應用 中間層 中間層 初創企業 初創企業 科技大
44、廠主導 科技大廠主導 模型廠商主導 模型廠商主導 預訓練擴展 后訓練擴展 測試時擴展 大模型循環擴展提升智能水平 資料來源:Z Research,西南證券整理 資料來源:西南證券 GPT-4模型 GPT-4模型 GPT-4-turbo模型 GPT-4-turbo模型 ChatGPT-o1/o3模型 ChatGPT-o1/o3模型 GPT-4o模型 GPT-4o模型 GPT-5模型 GPT-5模型 一、AI發展階段:從推理者轉向智能體,開始學會調用工具 目 錄 二、Agent模型層:底座智能水平提升,推理能力成為核心 三、Agent中間層:中間工具厚積薄發,開發者生態積極構建 四、Agent應用
45、層:初代產品加速創收,商業化應用曙光乍現 五、相關標的及風險提示 20 21 3.1 MCP:定義工具接口標準,打造新一代上下文通信協議 資料來源:Z Research,西南證券整理 Anthropic MCP技術路線示意圖 傳統API技術路線示意圖 資料來源:Z Research,西南證券整理 MCP:鏈接模型上下文信息與智能工具,建立上下文協議行業標準。2024年11月,Anthropic發布Model Context Protocol(MCP),MCP是一種用于在AI系統中管理和交換模型上下文信息的協議,旨在不同的AI模塊、系統或模型之間共享環境、狀態和上下文數據。自推出以來,MCP迅速
46、成為AI原生應用的重要基礎設施,從結構框架層面來看,傳統API與MCP之間存在顯著差異:1)傳統API:基于經典的“客戶端服務端”架構,客戶端發起請求,服務器處理并返回響應,傳統API充當二者之間的中介,開發者通常需要分別集成多個服務接口,單獨處理認證、數據格式和通信協議,帶來較高的集成與維護成本,易出現響應機制不一致等問題。2)MCP:遵循“客戶端-服務器”架構,由MCP主機/MCP客戶端/MCP服務器三個核心組件組成,專為AI系統設計,通過標準化協議傳遞模型所需的上下文數據,使模型能夠高效調用工具,提升AI模型的理解與執行能力。MCP 服務器端 MCP 客戶端 22 資料來源:Madron
47、a,西南證券整理 MCP Server供給快速增加,開發者生態加速繁榮。根據Madrona信息,截至2025年3月28日,MCP Server發現平臺Smithery的服務器創建數量較2月同期實現3倍增長;截至2025年4月初,MCP Server的GitHub star數已突破2.5萬,曲線呈現加速上升趨勢;同時,MCP TypeScriptSDK也在快速增長,每周在npm上的下載量已接近70萬次,SDK下載量遠超服務器包,表明更多的人選擇自己搭建MCP服務器或者在自己的應用中支持MCP,開發者更傾向于為未來的使用場景做準備,而非為現有用戶需求去部署MCP工具。從原始數據來看,受益于新服務器
48、和開發工具的不斷涌現,MCP呈現爆炸式增長,供給側生態逐步繁榮。MCP協議自發布以來,海內外眾多企業陸續采用,應用場景不斷拓寬,MCP向AI工具集成行業標準加速邁進。資料來源:Madrona,西南證券整理 MCP Server的GitHub star數量 Smithery平臺上MCP服務器創建數量 3.1 MCP:定義工具接口標準,打造新一代上下文通信協議 2月14日 2月14日 MCP的Java MCP的Java SDK發布 1月27日 SDK發布 1月27日 MCP Python MCP Python SDK 1.2.1版SDK 1.2.1版本發布 本發布 3月27日 3月27日 Open
49、AI宣布其Agents OpenAI宣布其Agents SDK正式支持MCP SDK正式支持MCP 3月16日 3月16日 Microsoft Azure OpenAI服務整合MCP,發布企業級MCP解決方案 Microsoft Azure OpenAI服務整合MCP,發布企業級MCP解決方案 2月14日 2月14日 MCP的Java MCP的Java SDK發布 SDK發布 1月27日 1月27日 MCP Python MCP Python SDK 1.2.1版SDK 1.2.1版本發布 3月27日 本發布 3月27日 OpenAI宣布其Agents OpenAI宣布其Agents SDK正
50、式支持MCP SDK正式支持MCP 3月16日 3月16日 Microsoft Azure OpenAIMicrosoft Azure OpenAI服務整合MCP,發布企服務整合MCP,發布企業級MCP解決方案 業級MCP解決方案 23 3.2 A2A:開放智能體互聯通信,優化新一代智能體網絡協議 資料來源:谷歌官網,西南證券整理 谷歌A2A與MCP協同工作 谷歌A2A開放協議工作原理 資料來源:谷歌官網,西南證券整理 A2A:鏈接客戶端與遠程智能體通信,加速企業內部系統協同工作。2025年4月9日,谷歌推出全新開放協議Agent2Agent(A2A),允許AI代理跨生態系統協作。A2A協議旨
51、在讓不同來源、不同技術的AI智能體能夠安全高效地交換信息,并協同執行跨企業平臺或應用的復雜任務。A2A協議是對Anthropic上下文協議MCP的補充,MCP為智能體提供鏈接工具與上下文的標準,A2A則側重于智能體之間的交互與協作,幫助智能體之間的高效溝通。工作原理方面,A2A用于促進客戶端智能體和遠程智能體之間的通信,其中,用戶存在于協議中,主要的作用是用于認證和授權;客戶端智能體負責制定和傳達任務;遠程智能體則負責執行任務或采取行動。24 3.2 A2A:開放智能體互聯通信,優化新一代智能體網絡協議 資料來源:谷歌官網,西南證券整理 資料來源:谷歌官網,西南證券整理 谷歌A2A合作伙伴生態
52、 谷歌A2A招聘應用示例 A2A:合作伙伴陣營日益壯大,專業知識強化企業內部智能體。根據谷歌官網展示的招聘軟件工程師案例,A2A協作能夠大幅簡化流程:在統一界面Agentspace中,HR可以指派客戶端智能體根據職位描述、地點和技能要求,尋找匹配候選人;客戶端智能體隨后會與其他遠程智能體進行交互,以獲取潛在候選人;HR收到推薦結果后,可以進一步指示客戶端智能體安排面試,從而簡化人才篩選流程;面試流程結束后,可以再啟用其他遠程智能體進行背調等行動,從而實現智能體的跨系統合作,幫助尋找合適的候選人。根據谷歌披露信息,A2A的發布已得到包括Atlassian、Box、Cohere、Intuit、La
53、ngchain、埃森哲、BCG、Capgemini、Cognizant等在內的50多家技術合作伙伴和服務提供商的支持,生態系統日益壯多樣,合作伙伴的專業知識對塑造智能體的相互協作創造更大,企業內部智能體有望跨系統工作,釋放工作效率和創新潛力。HR指派客戶端智能體尋找匹配候選人 HR指派客戶端智能體尋找匹配候選人 遠程智能體獲取潛在候選人 遠程智能體獲取潛在候選人 HR指派客戶端智能體對候選人背調;另一遠程智能體實施背調并反饋結果 HR指派客戶端智能體對候選人背調;另一遠程智能體實施背調并反饋結果 技術&平臺合作伙伴:提供構建和運行A2A智能體系統的技術與平臺。技術&平臺合作伙伴:提供構建和運行
54、A2A智能體系統的技術與平臺。服務合作伙伴:將技術應用到具體的業務場景中。服務合作伙伴:將技術應用到具體的業務場景中。一、AI發展階段:從推理者轉向智能體,開始學會調用工具 目 錄 二、Agent模型層:底座智能水平提升,推理能力成為核心 三、Agent中間層:中間工具厚積薄發,開發者生態積極構建 四、Agent應用層:初代產品加速創收,商業化應用曙光乍現 五、相關標的及風險提示 25 4.1 Agent類別:把握“通用”與“垂類”兩大應用方向 資料來源:西南證券 資料來源:西南證券 橫向跨行業通用AI代理(Horizontal AI Agent)垂類行業專業AI代理(Vertical AI
55、Agent)同步打磨通用與專業能力,交叉滲透橫向與垂直市場。1)跨行業AI代理(Horizontal AI Agent):隨著AI技術的發展、以及基于過去通用SaaS產品的歷史經驗,當前已有眾多初創企業針對多種行業或領域打造AI通用智能體,如Sierra(客服代理)、Cursor(軟件開發智能體),可提供跨行業智能服務。2)垂類AI代理(Vertical AI Agent):針對某個具體行業或垂直市場提供專業智能體,如AI金融研究創企Boosted.ai、工業控制創企Composabl等,為特定客戶類別制定個性化解決方案。當前,以上兩類智能體正加速發展,有望向各市場橫縱滲透。零售零售Agent
56、金融金融Agent 醫療醫療Agent 工業工業Agent 零售&電商金融&保險 醫療&健康 工業&制造 Agent 其他行業 商家1 商家.機構1 機構.企業1 企業.廠家1 廠家.公司1 公司.S&M Agent Service Agent HR Agent Finance Agent Agent 零售電商金融保險 醫療健康 工業制造 其他行業 營銷銷售工作流 客戶服務工作流 HR管理工作流 財務管理工作流 企業內部工作流 26 資料來源:CBInsights,西南證券整理 資料來源:CBInsights,西南證券整理 4%6%24%14%40%31%20%40%13%9%0%20%40%
57、60%80%100%針對橫向跨行業的 通用AI Agent 針對垂類行業的 專業AI Agent 已成熟 規?;?部署中 驗證中 新興期 149 65 35 13 0306090120150針對橫向跨行業的 通用AI Agent 針對垂類行業的 專業AI Agent 融資額(億美元)交易筆數(筆)2020-2025年2月AI Agent創企融資額及交易數 截至2025年2月通用和專業AI Agent成熟度份額 跨行業通用智能體發展相對成熟,垂類行業智能體逐漸興起。近年來,跨行業通用智能云引領創企風投活動,根據CBInsights統計數據,2020年至2025年2月,該領域的AI Agent創企
58、融資額及交易數均遠超垂類行業領域,融資額實現35億美元,交易達成149筆,垂類行業的創企融資額僅為13億美元,達成交易65起。在商業成熟度方面,跨行業通用應用在商業上更為成熟,超過2/3的市場正在部署或擴展AI解決方案,其中,客戶支持、軟件開發、銷售和通用企業工作流程等賽道較為活躍;而垂類智能體仍處于新興和驗證階段,預計未來垂直行業智能體將向部署階段推進。27 4.1 Agent類別:把握“通用”與“垂類”兩大應用方向 資料來源:CBInsights,西南證券整理 垂類行業 降低成本 提高效率 增強體驗 垂類行業 降低成本 提高效率 增強體驗 零售&電扇零售&電扇自動化產品目錄,合成虛擬人節省
59、模特費用 基于LLM搜索提高轉化率 更智能、更相關的搜索,個性化頭像 金融&保險金融&保險 合成訓練數據提高金融模型準確性并確保合規,在非結構化索賠文件中識別模式以最小化損失 AI助手能夠大規模分析和合成財務數據,實現自動化承保決策 AI聊天機器人簡化日常財務任務,保險銷售過程中進行個性化互動 醫療&健康醫療&健康 AI藥物發現與設計縮短上市時間,自然語言處理支持臨床決策 自動化繁瑣任務,改善電子健康記錄文檔,去噪放射掃描 AI伴侶關注健康和心理健康,合成患者數據保護患者隱私 工業&制造工業&制造 自動化質檢、預測性維護 智能調度系統提高生產效率,AI監控質量標準提升良品率 生產流程優化,實時
60、故障預測與提醒 Vertical Agent賦能垂直業務 28 4.2 Agent賦能:把握“降低成本+提高效率+增強體驗”三項賦能 從AI智能體賦能作用來看,主要集中于“降低成本+提高效率+增強體驗”三大方向。其中,“降低成本”可以幫助企業提升盈利能力,“提高效率”有望加強企業經營競爭力,“增強體驗”則將提升用戶留存、擴大潛在市場規模,從而構建Agent的商業價值閉環。賦能垂直業務:深入行業場景,扮演專業助手。垂類行業智能體主要用于處理專業復雜任務,垂類行業涵蓋電商、金融、醫療、工業等領域,扮演行業專家角色。在降低成本方面,Agent可以替代部分專業崗位中的重復性或規則明確的勞動,例如保單文
61、件初審、醫學影像識別等,節省人力開銷;在提高效率方面,能夠幫助流程節點的自動執行、加速專業信息流轉;在增強體驗方面,聚焦提升客戶互動體驗,例如問診智能引導、客戶服務個性化推薦。相較于跨行業通用智能體,垂類行業智能體的部署門檻相對更高,但賦能程度更深,是企業實現數智化轉型的核心抓手。資料來源:CBInsights,西南證券整理 企業內部工作流企業內部工作流 降低成本 提高效率 增強體驗 降低成本 提高效率 增強體驗 營銷&銷售 營銷&銷售 自動化銷售流程,降低銷售人員成本 實時客戶洞察,提高轉化率 提供個性化推薦與互動,提升客戶滿意度 客戶服務 客戶服務 減少人工客服數量和培訓成本 快速響應,多
62、輪對話處理能力強 24/7在線,支持多語言,提升響應體驗 人力資源管理 人力資源管理 節省簡歷篩選和入職流程的人力資源 自動化招聘、自動化績效管理流程 提供個性化職業發展建議,提升員工滿意度 財務管理 財務管理 自動報賬、對賬,減少財務人員投入 實時報表生成,預測與預算更高效 更直觀的財務儀表板與智能分析,便于決策 軟件開發 軟件開發 自動生成代碼、測試用例,降低開發與測試成本 智能體輔助調試、代碼審查,加快交付周期 開發者獲得實時建議和代碼提示,優化開發體驗 網絡安全 網絡安全 自動監控與響應降低安全團隊人力成本 實時檢測威脅并自動響應,降低入侵風險 安全團隊可通過智能助手快速定位并理解威脅
63、來源 Horizontal Agent賦能企業工作流 29 賦能企業工作流:提升員工生產力,辦公提效是核心??缧袠I智能體主要面向企業內部工作流場景,要求普遍適用于各類崗位和部門,具備覆蓋面廣、上手快、易部署等特點,本質在于打造辦公提效工具、甚至形成AI辦公操作系統。在降低成本方面,Agent通過自動化通用事務,減少基礎人力資源投入;在提高效率方面,能壓縮日常事務所耗費的時間;在增強體驗上,為員工提供更高效、更流暢的協作環境,使工作節奏更輕盈,工作體驗更智能。4.2 Agent賦能:把握“降低成本+提高效率+增強體驗”三項賦能 30 芯片領域的摩爾定律:每18-24個月,芯片中的晶體管數量翻倍,
64、芯片算力性能增長、成本下降。Agent的“摩爾定律”:每7個月,AI能夠處理的任務長度翻倍,模型性能提升、成本下降。根據機構METR的研究Measuring AI Ability to Complete Long Tasks,2019年至2025年,AI在50%的可靠性標準下,完成的任務長度(以人類專業人士完成任務所需時間衡量)大約每7個月翻一番,若以該“摩爾定律”線性外推,到2029年AI或許能處理需1個月的復雜任務。2025年4月17日,OpenAI發布o3&o4-mini模型,且初步具備主動調用外部工具的能力,在其官網演示的科研海報應用案例中,從耗時角度,o3模型可以在20s內完成人類研
65、究員可能需數天完成的任務。4.3 Agent摩爾定律:處理任務長度每7月翻一倍,性能增長且成本下降 芯片中的晶體管數每18-24個月翻一倍 AI能夠處理的任務長度每7個月翻一倍 大模型發布時間 大模型發布時間 模型模型以以5050%的的可可靠靠性性完完成成的的任任務務長長度 度 資料來源:集成芯片與芯粒技術白皮書,西南證券整理 資料來源:Measuring AI Ability to Complete Long Tasks,西南證券整理 31 智能體處理任務長度正大幅提升,完成簡單任務已具性價比。根據機構METR的研究MeasuringAI Ability to Complete Long T
66、asks,目前超過80%由智能體成功完成的任務中,AI的推理成本僅為人類專家的10%,其中,對于人類專家在30秒內完成的任務,使用AI的經濟優勢顯著,目前已可完成16個小時的軟件任務,但在完成長時序現實世界任務方面,人類在整個工作循環中仍然需要發揮較大作用和價值。在2025年4月17日OpenAI發布的o3和o4-mini模型中,o3和o4-mini在很多情況下比各自的前代o1與o3-mini更高效、更節省成本,在AME2025基準測試中,性價比遠超過前代模型。未來隨著AI技術持續發展,AI在復雜任務面前有望同樣具備性價比,從而推動AI智能體進一步應用與滲透。AI完成簡單任務已具備經濟優勢 O
67、penAI-o系列模型性價比持續提升 資料來源:Measuring AI Ability to Complete Long Tasks,西南證券整理 資料來源:OpenAI官網,西南證券整理 4.3 Agent摩爾定律:處理任務長度每7月翻一倍,性能增長且成本下降 32 資料來源:Sacra,Tullopy,西南證券整理 4.4 Agent初代產品:產品ARR迅速增長,爆發潛力可期 智能體打造交互式應用,未來爆發潛力可期。智能體作為可交互的應用產品,能夠快速觸達用戶,付費滲透空間較大。根據Sacra數據,Agent初代產品Cursor已成為年經常性收入(ARR)從0增長至1億美元最快的初創企業
68、之一,耗時約12個月、于2024年底達成1億美元ARR里程碑,并于2025年3月ARR迅速達到2億美金。根據當前AI智能體創企公司及產品來看,布局領域主要集中于編碼、法律、招聘、客服、醫療等行業領域,商業模式持續探索,已出現基于結果(AI交付實際成果、任務完成率等指標)定價的AI應用產品,或根據資源消耗量收費,也可采用常見的SaaS產品訂閱方式對商業模式進行補充?;谥悄荏w產品爆發快、輕資產、強用戶觸達等特點,未來有望憑借更快的成長速度成為AI應用黑馬,建議后續關注ARR實現快速提升的AI公司及產品。AI創企ARR增速及2024年估值情況 AI初創企業產品定位ARR增長速度2024年ARR($
69、億)2024年估值2024年估值倍數CursorAI編程助手12個月內從0做到1億美元12525Lovable非程序員的AI軟件開發平臺2個月內從0做到1000萬美元0.07/Glean企業級AI搜索平臺21個月內從0做到1億美元1.14642CodeiumAI編程助手/0.1212.5104HarveyAI法律助手26個月內從0做到5000萬美元0.53060HebbiaAI驅動的金融/法律助手/0.13754Bolt.newAI驅動的網頁構建平臺2個月內從0做到2000萬美元0.25/MercorAI驅動的招聘平臺2年內從0做到5000萬美元0.52.55DecagonAI驅動的客服代理/
70、0.066.5108SierraAI驅動的客服軟件/0.245225CommureAI驅動的醫療軟件/0.4123033 4.5 Agent流量入口:AI入口尚處于早期階段,或將呈現中心化特點 互聯網 1.0 互聯網 1.0 互聯網 2.0 互聯網 2.0 互聯網3.0 互聯網3.0 產品入口產品入口互聯網時代 互聯網時代 技術邏輯 技術邏輯 商業模式 商業模式 權力結構 權力結構 門戶網站形成入口,入口中心化門戶網站形成入口,入口中心化特點明顯 特點明顯 1)初代流量邏輯,點擊率吸引1)初代流量邏輯,點擊率吸引廣告;2)用戶作為數據源被商廣告;2)用戶作為數據源被商品化,不參與價值分配 品化
71、,不參與價值分配 基于HTML靜態網頁,用戶僅能基于HTML靜態網頁,用戶僅能通過瀏覽器被動獲取信息,內容通過瀏覽器被動獲取信息,內容由專業開發者單向灌輸 由專業開發者單向灌輸 資料來源:Z Research,西南證券整理 搜索引擎形成入口,入口中心化特點明顯 搜索引擎形成入口,入口中心化特點明顯 1)搜索引擎競價排名;2)PC在家庭和個人用戶中廣泛普及1)搜索引擎競價排名;2)PC在家庭和個人用戶中廣泛普及1)動態網頁和數據庫驅動,用1)動態網頁和數據庫驅動,用戶既是消費者也是生產者;2)PC在家庭和個人用戶中廣泛普及戶既是消費者也是生產者;2)PC在家庭和個人用戶中廣泛普及各垂類APP形成
72、場景化生態(微 各垂類APP形成場景化生態(微 信社交/淘寶電商/美團本地生活信社交/淘寶電商/美團本地生活等),入口價值出現分散 等),入口價值出現分散 1)流量經濟;2)用戶行為數據1)流量經濟;2)用戶行為數據成為核心生產資料,通過精準推成為核心生產資料,通過精準推薦和增值服務變現 薦和增值服務變現 1)信息找人;2)智能手機滲透1)信息找人;2)智能手機滲透率攀升;3)區塊鏈實現數據確權與跨鏈互通 率攀升;3)區塊鏈實現數據確權與跨鏈互通 互聯網流量入口由中心化轉向多元化 互聯網流量入口從中心化轉向分散化,AI時代入口可能處于早期收斂階段。1)互聯網1.0時期:門戶網站Yahoo、Si
73、na成為信息獲取的主要入口,流量入口高度中心化;2)互聯網2.0時代:搜索引擎如百度、谷歌成為主流入口;3)互聯網3.0階段:隨著移動互聯網和智能終端的就是普及,以及各類垂類APP的崛起,逐漸打破過去流量入口的壟斷格局,呈現明顯多元化趨勢,入口價值逐漸向場景和服務轉移。類比互聯網時代來看,當前AI時代的入口尚處于早期階段,ChatGPT、DeepSeek等少數大模型產品主導用戶心智,呈現出類似于互聯網時代早期的門戶式中心化狀態。1990s 2000s 2014 1990s 2000s 2014 2022 2022 一、AI發展階段:從推理者轉向智能體,開始學會調用工具 目 錄 二、Agent模
74、型層:底座智能水平提升,推理能力成為核心 三、Agent中間層:中間工具厚積薄發,開發者生態積極構建 四、Agent應用層:初代產品加速創收,商業化應用曙光乍現 五、相關標的及風險提示 34 35 相關標的 AI發展階段變化:從“推理者”到“智能體”AI發展階段變化:從“推理者”到“智能體”模型層 變化 模型層 變化 模型擴展法則從訓練轉向推理,主次曲線逐步切換 模型擴展法則從訓練轉向推理,主次曲線逐步切換 推理算力需求提升 推理算力需求提升 英偉達英偉達 博通博通中間層變化 中間層變化 以MCP、A2A工具為代表的智能體中間層厚積薄發 以MCP、A2A工具為代表的智能體中間層厚積薄發 開發工具、數據層日漸豐富 開發工具、數據層日漸豐富 谷歌谷歌 SNOWSNOW應用層變化 應用層變化 初代智能體產品ARR呈現快速增長態勢 初代智能體產品ARR呈現快速增長態勢 商業化應用曙光乍現 商業化應用曙光乍現 CRMCRM SAPSAP ShopifyShopify云服務廠商 云服務廠商 云端算力/中間工具/應用均需要云廠商支持 云端算力/中間工具/應用均需要云廠商支持 重構云需求結構與增速 重構云需求結構與增速 亞馬遜亞馬遜 微軟微軟 谷歌谷歌層面 邏輯 受益方向 相關標的