《2024智能體AIAgent應用場景未來展望及潛在標的分析報告(31頁).pdf》由會員分享,可在線閱讀,更多相關《2024智能體AIAgent應用場景未來展望及潛在標的分析報告(31頁).pdf(31頁珍藏版)》請在三個皮匠報告上搜索。
1、 2024 年深度行業分析研究報告目目錄錄1.原理解析:思維鏈鑄就智能體,多體交互拓展應用.61.1Agent 模式架構解析.61.2單智能體 vs 多智能體.71.3 Prompt 提示詞的藝術.82.應用場景:賦能兩類實體領域,成本與效益的博弈.82.1自動化類:微軟智能體 AutoGen.92.2 情感需求類:陪伴型智能體.112.3 效能討論:成本與價值間的博弈.123.未來展望:人工智能發展迅猛,智能體商業化落地.133.1 海內外政策推動人工智能發展加速.133.2 算力規模高增,企業對 AIGC 的投入意愿強.153.3 多模態智能體有望實現大規模商業化.173.4 全球智能體市
2、場增速加快.184.潛在標的:Agent 企業千帆競發,垂類應用引人期待.194.1 LeewayHertz:提供多領域解決方案.194.2 Markovate:提供多模態智能體解決方案.214.3 Replika:情感類智能體熱度不減.24.4 CharacterAl:自研大模型,打造智能體社區.234.5 星火智能體:布局智能體平臺,發布垂類智能體.244.6 SkyAgents:自研模型降低成本自研模型降低成本.254.7 商湯:聯合清華、上海人工智能實驗室打造GITM.264.8 字節跳動:豆包聊天助手.274.9 騰騰 訊訊:AppAgent.285.投資建議.316.風險提示.32
3、圖目錄圖目錄圖1人類與 AI 的交互模式.6圖2AI Agent 智能體工作原理.7圖3單智能體強化學習原理圖.7圖4多智能體強化學習原理圖.7圖5CrewAI 整體框架.8圖6AutoGen 運作模式圖解.9圖7Agent 交流模式展示.10圖8AutoGen 實驗數據對比.11圖9林間聊愈室產品介紹.12圖 10OpenAI 不同模型 tokens 消耗價目表.12圖 1 1單次運行 Agent 對 Tokens 的消耗.13圖 1 2單次運行 Agent的實際成本.13圖1 3 中國人工智能市場規模預測.14圖1 4全球人工智能市場規模預測.14圖1 5美國增強型人工智能研發投資2015
4、-2030.15圖1 6 美國及其 AI盟 友.15圖1 7中國智能算力規模及預測.16圖 1 8企業 AIAgent 使用情況.16圖1 9專注于橫向應用的 AI 代理初創企業率先獲得融資.17圖2 0 多模態大模型發展.18圖 2 1全球自主人工智能和智能體市場規模.18圖2 2中國前五大人工智能市場應用.19圖 2 3LeewayHertz 公司發展歷程與合作公司.19圖 2 4LeewayHertz 的智能體產品架構.20圖 2 5LeewayHertz 為私募股權提供的 AI Agent解決方案.20圖 2 6Character.ai 智能體架構.21圖 2 7ShopSpot 用戶
5、界面展示.21圖 2 8ShopSpot 庫存管理系統.21圖 2 9ShopSpot 多模態智能體圖片識別功能展示.22圖 3 0Replika 付費模式.22圖 3 1截止2024年8月Replika 各年齡段用戶占比.23圖 3 2截止2024年8月Replika 用戶全球分布.23圖 3 3Character.AI 用戶界面.23圖 3 4Character.ai 2024年7月每日訪問量.24圖 3 5Character.AI 各年齡段用戶占比.24圖 3 6Character.AI用戶全球分布.24圖 3 7科大訊飛星火智能體介紹.25圖 3 8部分星火AI 智能體展示.25圖 3
6、 9天工大模型能力展示.26圖 4 0天工Agent計費模式.26圖 4 1RL架構對比GITM 創新架構.27圖 4 2解鎖科技樹的成功率(藍色是GITM).27圖 4 3各模型完成任務成功率對比.27圖 4 4豆包智能體的對話界面.28圖 4 5騰 訊AppAgent展示軟件操作.29圖 4 6AppAgent 的 App 探索學習階段.30圖 4 7AppAgent 的實際部署階段.31表目錄表目錄表1AI Agent 類型盤點以及具體應用.9表2國內政策推動人工智能發展.13表3海外政策推動人工智能發展.151.1.原理解析:思維鏈鑄就智能體,多體交互拓展應用原理解析:思維鏈鑄就智能體
7、,多體交互拓展應用早在上世紀50年代,阿蘭圖靈把“高度智能有機體”擴展到了人工智能。如今隨著大模型的快速發展,這個概念又被重新拾起。大模型成為了智能體目前最完美的載體,有望完成從概念到實際應用的蛻變。用戶在Agent(智能體)模式中給Al 設置目標和身份,并提供 Prompt(提示詞)。AI自主拆分任務、使用工具、完成工作,用戶僅負責設立目標、提供工具資源和監督結果。OpenAI 定義的智能體具有長期和短期記憶、自主規劃、工具使用和自動執行任務的能力,能提高工作效率和用戶體驗。另外,智能體也分為單智能體和多智能體。單智能體通過試錯學習在單一環境中行動,追求最大獎勵,多用于簡易任務。多智能體在博
8、弈環境中行動,追求長期累積獎勵,多用于復雜測試。1.1Agent1.1Agent模式架構解析模式架構解析Agent有效減少人類工作總量,人與AI協作才是最終形態。人類與AI交互可大致分為三種模式。Embedding模式中大模型可以填補一些信息缺失,完成少量子任務,例如總結信息等等。用戶最終會整合挑選AI提供的信息,并自主完成任務。Copilot 模式則更加智能化,Al 可根據用戶設定的流程去執行任務。例如讓AI根據寫一段稿件或者根據需求編程,但其對Prompt 的要求也更高。在AI完成流程后,用戶需要對內容結果進行調整并自主結束工作。Agent 智能體模式的AI參與度更高,但也不是完全由AI代
9、理。用戶需要給AI設計一個目標和身份,以及需要使用的工具。配上更為復雜的Prompt,AI能自主進行任務拆分,使用工具并結束任務。用戶只負責設立目標、提供資源、監督結果。圖圖1 1 人類與人類與AIAI的交互模式的交互模式Agents模式AI人類完成絕大部分工作人類設立任務目標其中某(幾)個流程Al完成初稿其中某(幾)個任務AI提供信息或建議人類修改調整確認人類自主結束工作資料來源:騰訊研究院,海通證券研究所任務拆分工具選擇進度控制A自主結束工Embedding模式人類自主結束工作Copilot模式設立目標提供資源監督結果AI完成絕大部分工作人類設立任務目標入類和AI協作工作Al全權代理人類人
10、類AIAI以 LLMLLM 為核心,四模塊鑄造AI Agent。從 OpenAl 的定義來看,智能體以大語言模型為核心,其擁有長期和短期記憶、自主規劃能力、能自動化執行復雜任務、能夠使用工具等四個特點。1)記憶模塊:智能體像人類一樣,能留存學到的知識以及交互習慣等,這樣的機制能讓智能體在處理重復工作時調用以前的經驗,從而避免用戶進行大量重復交互。短期記憶適用于所有上下文的學習,類似平常我們與ChatGPT溝通的模式;長期記憶則保留知識和交互回憶,例如智能體在特定行業積累的大量數據和經驗,則能提供更專業、更具深度和個性化的回答,提升用戶體驗。2)規劃模塊:將復雜任務分解成子目標并逐一解決,完成任
11、務后進行反思總結。例如反思自己大量輸出重復內容或在單一子目標耗時過長等問題,將經驗存入長期記憶以規避類似錯誤。3)工具模塊:智能體可利用工具來彌補自身短板,通過調用外部API來實現功能拓展。例如調用連接互聯網的API去搜索實時信息。4)行動模塊:智能體會形成完整的計劃流程。例如先讀取以前工作的經驗和記憶,之后規劃子目標并使用相應工具去處理問題,最后輸出給用戶并完成反思。圖圖2 2 AIAI AgentAgent智能體工作原理智能體工作原理日 歷()計算器()代碼解釋器()搜 索()更 多.短期記憶工具智能體長期記憶記憶智能體規劃行動交互協作智能體反射自我反思思維鏈子目標拆解資料來源:騰訊研究院
12、,海通證券研究所1 1.2 2單智能體單智能體 vsvs多多 智智 能能 體體單智能體與多智能體各具優勢,適配于不同垂直領域。單智能體的強化學習原理是基于馬爾可夫決策來完成的,簡單來說可以分為狀態集S、行動集A、獎 勵R,下一 時刻的狀態和獎勵只與上一時刻的行動有關,與更早之前的狀態無關。其模型原理就是讓智能體用試錯的方式來學習,若某個策略能得到獎賞,則智能體產生該行為的策略就會加強。其目的就是在單一環境中行動,盡可能得到最大的獎勵。應用領域目前也較為廣泛,例如賽車游戲中連續動作的訓練:控制方向盤、油門、剎車等動作,可由DDPG、A3C、PPO 算法來決策。一些離散動作的訓練例如圍棋智能體 A
13、lphaGo,可通過Q-Learning 等算法決策。多智能體的決策不僅與自身行動相關,還與系統內其他智能體的行動所關聯。一個多智能體系統中會有兩個以上的智能體,他們一般存在著合作或競爭關系。這樣模型稱為馬爾科夫博弈,其狀態轉換符合馬爾可夫決策,關系符合博弈。在多智能體模型中每個智能體的目標是找到最優策略來使它在任意狀態下獲得最大的長期累積獎勵。由于其模型更為復雜,干擾因素較多等原因,目前多智能體模型商業化產品較少。圖圖 3 3 單單 智智 能能 體體 強強 化化 學學 習習 原原 理理 圖圖Agent智能體行動A環境狀態s獎勵R資料來源:CSDN,海通證券研究所圖圖 4 4 多多 智智 能能
14、 體體 強強 化化 學學 習習 原原 理理 圖圖環境狀態8料勸Agent 1狀態 s獎勵 R2狀態s獎勵RAgent2Agent n獎勵 R1行動An資料來源:CSDN,海通證券研究所CrewAI 是世界領先的多智能體框架之一,在多智能體領域用于協調角色扮演型自主AI智能體。通過促進協作智能,CrewAI使智能體能夠無縫協作并處理復雜任務。在編寫程序時,用戶需要賦予每一位 Agent 角色、任務、以及背景故事。圖圖5 5 CrewAI整體框架整體框架CrewProcesses definehow-How tasks will be assigned to Agents.How agents i
15、nteract with each other.-Howagentsperformtheirtasks.ProcessTasks can override agentthat should be used an資料來源:CrewAI,CSDN,海通證券研究所Agents have the inertabitityof reachout toanothertodelegateaskguestns.alsothaeasepc0ificagents will work together:AgentAgentAgentTaskTask1.3Prompt提示詞的藝術提示詞的藝術Prompt 是一種基于自
16、然語言處理的交互方式,它通過機器對自然語言的解析,實現用戶與機器之間的溝通??梢岳斫鉃槭且欢谓o定的文本或語句,用于啟動和引導機器學習模型生成類型、主題或格式的輸出。在自然語言處理領域中,Prompt 通常由一個問題或任務描述組成,例如“幫我寫一篇有關人工智能的文章”,“幫我編寫一段可以整理數據的程序”等等。一個優秀的 Prompt 應該包含1)明確目標:能夠定義任務,以及想要達到的效果;2)具體指導:給予模型明確的指導和約束,舉一些例子或明確回復邊界;3)簡潔明了:使用簡練、清晰的語言表達Prompt;4)迭代優化:一次 Prompt 輸出可能達不到想要的結果,用戶需要根據智能體的回答來改變提
17、示詞,持續調整優化。2.2.應用場景:賦能兩類實體領域,成本與效益的博弈應用場景:賦能兩類實體領域,成本與效益的博弈AI Agent目前的應用大多都在概念層面,但隨著大模型競爭加快、政策鼓勵研發投入、更多企業參與AI研究等因素,應用層面的AI Agent推進速度加快。智能體大致可以分為六類,根據他們被設計出的特點,可以作用在不同的應用領域上。不同類別的智能體給予應用層面上更多研發方向,像目前關注度較高的自動駕駛技術、智能電網控制、能源管理等都能被垂類智能體覆蓋。結合多模態大模型,自動化和情感需求類智能體已落地。但商業化智能體仍需考慮成本問題,由于智能體之間的交互過程可能出現錯誤循環且輸出結果不
18、一定符合需求,tokens 成本遠高于普通LLMs。表表1 1 AIAI AgentAgent類型盤點以及具體應用類型盤點以及具體應用AlAl AgentAgent類型類型具體描述具體描述應用領域應用領域基于效能的Agent基于目標的Agent基于模型的Agent分層Agent機器人Agent多Agent系統基于效用的Agent在具有多種潛在結果的復雜決策環境中表現出色-比如平衡不同風險以做出投資決策,或者 金融交易、價格追蹤系統、智權衡價格與成本?;谀繕说腁gent會評估和規劃行動,以實現它們的目標。與其他類型的智能Agent不同的是,它們能夠將前瞻性和戰略規劃結合起來,朝著特定的結果前進
19、。能電網控制掃地機器人、項目管理軟件、電子游戲適用于并非總是可見或可預測的信息時。這個模型會根據環境中傳入的數據不斷更新,因此人工智能Agent可以對環境中未見的部分進行推斷,并預測未來的狀況。自動駕駛技術、自動灌溉、智能家居分層Agent類似于復雜的組織結構,具有不同的決策層次。系統中的不同Agent擁有不同的專業領域,這使它們在處理復雜的多步驟任務時更加高效??罩薪煌ü苤葡到y、自主倉儲機器人增加了性能元素,這些人工智能Agent的實體通常配備有攝像頭或觸摸傳感器等傳感器。這種Agent在危險或重復性很高的任務中尤其有用-讓人工智能Agent來完成這些任務可能更有效率,也更符合成本效益。生產
20、線機器人、手術機器人、農業機器人、服務機器人每個Agent都是半自主運行的,但其設計目的是與其他Agent互動,形成一個動態的生態系統,從個體行為中產交通管理系統、用于能源管理生集體行為。對于這種Agent程序來說,協作是關鍵。的智能電網、供應鏈與物流2.12.1自動化類:微軟智能體自動化類:微軟智能體 AutoGenAutoGen微軟研發的AutoGen是一種多智能體溝通的模型,這些智能體通過對話完成任務。實驗發現這種多智能體溝通模式可以有效提高AI 解決問題的準確性以及成果的完整性。使用AutoGen,開發者可以靈活定義智能體交互行為。微軟的研究證明了該框架在包括解決數學、編碼、問題解答、
21、運籌學、在線決策、娛樂等問題上的有效性。AutoGen需要兩個以上的智能體形成交流模式,其中智能體可以由大語言模型LLMs、人類、工具來扮演。當一個需求被提出,智能體會開始靈活交流,他可以是多個智能體向需求人匯報的模式(HierarchicalChat)或者是像研討會一樣隨意討論(JointChat)。在官方給出的示例中,智能體之間的溝通確實減少了人工交互,其有能力自己修復出現的問題并給出滿意的答案。圖圖6A u t o G e n運運 作作 模模 式式 圖圖 解解ConversableagentsMonthMulti-AgentConversationsGot it!Here is theO
22、utput:%JointchatHierarchicalchatSorry!Pleasefirstpip install yfinanceand then executethe codeError packageyfinanceishotinstalledPlotachartofMETAandTESLAstock price changeYTD.Execute thefollowing code.No,please plot%revised code.Installingchange!Output:MonthAgentCustomizationFlexible Conversation Pat
23、ternsExampleAgent Chat資料來源:Enabling Next-GenLLMApplicationsvia Multi-AgentConversation,CSDN,海通證券研究所資料來源:botpress,海通證券研究所在AutoGen智能體程序中,人類充當需求發起者,智能體通過不斷使用工具并在相互交流中解決陸續出現的問題從而得到最終答案。在智能體交流過程中,人類可隨時介入其中,若用戶對最終結果不滿意,可以重新提出需求,智能體就會繼續優化答案。圖圖 7 7A A g g e e n n t t 交交 流流 模模 式式 展展 示示TheResulting Automated
24、Agent Chat:Conversation-DrlvenPlot a chart of META andTESLA stock price change YTD.receivegenerate_replygenerate_replyBthon工 具sendConversation-CentricComputationError:package yfinance is notinstalledAoent自己解決問題,0人工介入Sorry!PleasefirstpipinstallyfinanceandthenexecuteExecutethefollowingcode.generate_re
25、plyreceive人縣供需Control Flowend資料來源:Enabling Next-GenLLM Applications via Multi-Agent Conversation,CSDN,海通證券研究所AutoGen在四項實戰應用的表現測試中均勝過單一大語言模型,實驗發現智能體能增加AI完成任務的成功率以及模型的穩定性。1)數學計算:分別測試了AI在完成整個數學題庫和隨機120 道題目的表現,AutoGen 的成功率遠超各類語言模型。2)數據庫檢索問答:先建立一個RAG數據庫,然后對智能體進行問答測試,看其能否追蹤到正確的答案。其F1-scoreF1-score越高,說明模型更
26、穩定;RecallRecall體現了分類模型對樣本的識別能 力。Recall越高,說明模型對樣本的識別能力越強。從數據看出純 AutoGen 模型的表現略高于其他組合。3)ALFWorld(AdaptiveLearningFrameworkWorld)研究:ALFWorld是專門用于研究和開發智能體的仿真環境,在其虛擬世界中,包含了各種場景、任務和智能體需要完成的挑戰。ALFWorldALFWorld 實驗發現3個智能體的成功率高于2個智能體,說明隨著交互的智能體變多,智能體間互相糾錯的能力有所提升。但對于AutoGen 的實驗也提到多智能體可能會導致錯誤循環(智能體之間反饋錯誤但一直無法解決
27、),這也是降低成功率的因素之一。一。4)4)OptiGuide:是專門設計來通過自然語言處理,解讀和指導復雜供應鏈優化決策。在用不同語言模型運行OptiGuide的時,發現多智能體協作模式的成績顯著高于單智能體。其中多GPTGPT4 4智能體協作運行 OptiGuide時,F1-score 和 Recall 分別能達到96%96%和 9 8%。ProgramExecutionuserid:93117,docid:175129,date:2024-09-20,userid:93117,docid:175815,date:2024-09-24,1圖圖8A u t o G e n實實 驗驗 數數 據
28、據 對對 比比MethodsMetrics(b)A2:Q&Atasks(w/GPT-3.5).Metrics(c)A3:Performance on ALFWorld.(d)A4:Performance on OptiGuide.資料來源:Enabling Next-Gen LLM Applications via Multi-Agent Conversation,海通證券研究所2.22.2情感需求類:陪伴型智能體情感需求類:陪伴型智能體智能體另一大應用領域就是提供擬人情感陪伴類服務。陪伴類的智能體擁有長期記憶,讓用戶與其聊天中產生熟悉且親切的感覺。隨著大模型不斷迭代,陪伴類智能體更加立體,能
29、提供更高的情緒價值。目前國內情緒消費類市場潛力較大,在如今緊湊的生活節奏之下,國民孤獨感增加,而陪伴類智能體或受益于這樣的大環境。根據GIA(GlobalIndustry Analysts)的研究,Denny Yin提出該行業規模預計到2024年增長到1000億美元,到2026年增長到2000億美元。情感溝通類智能體上線,收獲大量用戶好評。在大模型出現之前,一些利用心理學CBT 溝通技術的產品已經在市面上廣泛存在,例如Weobot、wysa 等。隨著大模型的發展和迭代,智能體已經能被打造成心理咨詢師或塔羅師的角色。用戶通過傾訴生活中的煩惱,并在與智能體溝通中尋求情緒宣泄。目前一款治愈系的軟件“
30、林間聊愈室”上線后獲得了大量好評,App Store評分4.7,多數用戶給出了五星好評。其中產品使用小動物的角色設定降低了用戶的戒備心,加上治愈的畫風和場景設計,打造獨特的用戶體驗。(a)A1:PerformanceonMATH(w/GPT-4).Methods圖圖9 9林間聊愈室產品介紹林間聊愈室產品介紹資料來源:App Store,海通證券研究所2.32.3效能討論:成本與價值間的博弈效能討論:成本與價值間的博弈打造智能體并不是0成本,大語言模型的token 消耗就是最直觀的成本展示。由于智能體的運行機制內包含反思和深度學習,這使得其在token 消耗方面比傳統大語言模型高。相比于單智能體
31、,多智能體又多了一層交互端的消耗,當多個智能體討論且進入錯誤循環中,無效成本將會顯著提升。所以在效能方面,對智能體進行成本討論以及優化策略十分重要。在商用智能體中,更先進的大語言模型代表更好的用戶體驗,但隨之而來的是極速上升的成本。目前GPT4的價格是GPT3.5turbo的十倍,而且由于智能體之間交互的特性,在輸出過程中往往伴隨著更高的token 消耗。若最終輸出的長度超出模型token限制,則不得不調用更高版本的模型例如GPT4-32K,成本又是GPT4的兩倍。圖圖1010 OpenAI 不同模型不同模型tokens消耗價目表消耗價目表Modelgpt-4oModelgpt-3.5-tur
32、bo-0125資料來源:OpenAl,海通證券研究所PricingUS$0.0050/1K input tokensUS$0.0150/1Koutput tokensPricingUS$0.00050/1KinputtokensUS$0.00150/1Koutputtokens在實際測試中,使用搭載GPT4 的智能體模型查找新聞并進行總結梳理。這部分的單次消耗是42000個 tokens,成本是1.5美元。在實際應用中,假設一天需要統計的股票新聞大約有120家公司,則成本為35.8美元,按照匯率1:7.14折合人民幣255.5元。而且智能體并不是完美的,在運行過程中出現幻覺或錯誤循環也是常事。
33、例如智能體在找不到合適新聞的時候會進行大量重復的內容輸出,人工介入糾錯又會增加一定成本。圖圖1111單次運行單次運行AgentAgent 對對 TokensTokens 的消耗的消耗圖圖1212單次運行單次運行Agent 的實際成本的實際成本Tokens60K16Jul ContexttokensGeneratedtokens0-01Ju41,59941,599 tokens33,591 tokens8,008tokens31JulGPT-4$216 JulDefaultProjectS07Jul13Jui$1.4919Jul$1.4925JuiJul資料來源:OpenAI,海通證券研究所資料
34、來源:OpenAI,海通證券研究所商業化智能體在成本和最終產品中會有一定博弈,若將智能體運用到股票交易等對精準度需求極高的行業中,產品或引入更多智能體進行協作以提高模型的穩定性,則成本上升。如果運行成本高于其創造的價值時,該智能體模型就失去了商業化的能力。目前多數智能體應用僅停留在測試階段,市場中的用戶需要更理性的看待智能體商業發中能帶來的效益。3 3.未未來來展展望望:人人工工智智能能發發展展迅迅猛猛,智智能能體體商商業業化化落落地地未來多方面推動人工智能發展,應用級別智能體有望快速落地。國內各地相繼出臺關于人工智能的發展政策,推動其為重要的研究方向。預計2026年國內人工智能市場規模超過2
35、60億美元,全球人工智能市場規模2025年超6萬億美元。海外以美國為例,相關政策出臺時間較早,人工智能領域發展更加成熟,許多智能體應用已在服務各類企業。并且美國有意與人工智能強國組成戰略伙伴,共同發展AI科技。多模態大模型利用異構數據提升應用效率,促進AI Agent發展。將智能體賦能于圖片+語音的多模態大模型中,可以減少使用工具和交互的過程,使智能體完成更多復雜任務,解決跨行業、跨領域的問題。智能體發展能推動政府、金融、制造、能源、醫療、零售等行業的智能化應用向多模態和跨模態轉變。3.13.1 海內外政策推動人工智能發展加速海內外政策推動人工智能發展加速多地陸續出臺關于人工智能發展的指導文件
36、,2024年政府與企業的投入資金有望迎來大幅增長。國務院在2024政府工作報告中提出,要開展“人工智能+”行動,實施數字化轉型。智能體作為人工智能應用領域的重要研究方向,相信眾多企業和研究部門會開展更多研究工作。另外,像上海、杭州、廣東、北京等省市也出臺了相關政策,其中杭州市推出“算力券”約2.5億用于支持本地的算力發展。廣東省也將算力作為重點發展方向,預測2025年的人工智能核心產業規模超過3000億元。表表2 2國內政策推動人工智能發展國內政策推動人工智能發展政府機構政府機構上海市經濟和信息化委員會、上海市發展和改革委員會等五部門國務院文件名稱文件名稱發布時間發布時間具具體內容體內容實施大
37、模型創新扶持計劃。支持引進高水平創新企業,支持本市創新主體打造具有國際競爭力的大模型,鼓勵形成數據飛輪,加速模型迭代,對取得重大成果的予以專項獎勵。實施大模型示范應用推進計劃。重點支持在智能制造、生物醫藥、集成電路、智能化教育教學、科技金融、設計創意、自動駕駛、機器人、數字政府等領域構建示范應用場景,打造標桿性大模型產品和服務。深化大數據、人工智能等研發應用,開展“人工智能+”行動,打造具有國際2024政府工作報告2024年3月競爭力的數字產業集群。實施制造業數字化轉型行動,加快工業互聯網規?;瘧?,推進服務業數字化,建設智慧城市、數字鄉村上海市推動人工智能大模型創新發展若干措施(2023-2
38、025年)2023年10月$0.530K杭州市人民政府廣東省人民政府辦公廳關于支持人工智能全產業鏈高質量發展的補充意見(征求意見稿)廣東省關于人工智能賦能千行百業的若干措施2024年5月2024年6月1)支持算力技術攻關。鼓勵企業開展算力關鍵技術研發攻關,市級科技研發計劃給予專項支持。鼓勵企業承擔國家、省重點研發任務,加速形成重大科研成果,對符合政策規定的項目按國家、省實際到賬資助經費的25%給予資助,資助金額最高不超過500萬元。2)加大融資貼息支持。對納入政府統一布局的算力基礎設施建設項目(總投資規模不低于5000萬元)3)擴容算力券發放。每年設立“算力券”總額提升至2.5億元,新增算力券
39、支持企業購買符合杭州市規劃布局的智算中心以及納入算力撮合的合作伙伴所供給的智能算力。到2025年,全省算力規模超過40EFLOPS,人工智能核心產業規模超過3000億元。到2027年,全省人工智能產業底座進一步夯實,算力規模超過60EFLOPS,全國領先的算法體系和算力網絡體系基本形成;智能終端產品供給豐富,在手機、計算機、家居、機器人等8大門類,打造100款以上大規模使用的智能終端產品,人工智能核心產業規模超過4400億元;聚焦制造、教育、養老等領域,打造500個以上應用場景,各行各業勞動生產率顯著提升。資料來源:上海市經濟和信息化委員會,國務院,杭州市人民政府,廣東省人民政府,中國政府網,
40、新華社,海通證券研究所中國人工智能市場份額穩定增長,未來AI 實體項目增多利好智能體發展。根據IDC預測,國內人工智能市場規模預計在2026年達到264.4億美元,2021年到2026年期間的CAGR 超20%。根據增長率計算,從2022年開始,每年市場規模會保持20%左右的穩定增長態勢。根據澎湃新聞援引德勤統計,未來2025年世界人工智能市場規模將超過6萬億美元,2017年-2025年期間復合增長率將超30%。AI高速發展中或利好更多實體企業,專門提供智能體產品服務的廠商規模也將快速擴張。圖圖1313中國人工智能市場規模預測中國人工智能市場規模預測300264.42 2.1%p0.6%20%
41、180.115%122.410%100500202120222023E市場份額(左億美元)資料來源:IDC,海通證券研究所圖圖1414全球人工智能市場規模預測全球人工智能市場規模預測6.45.7364.483.53.042.431.91.180.6910201720182019E2020E2021E2022E2023E2024E市場規模(左萬億美元)一yoy(右資料來源:德勤,澎湃新聞,海通證券研究所美國相關政策落地較早,人工智能發展已成規模。在2021年3月,大模型還未進入公眾視野時,美國人工智能國家安全委員會已經發布了對該領域未來發展的規劃。文件中寫到了美國堅定在人工智能領域的投入,且規定
42、了研發投入資金的比重。另外,在2023年5月,美國白宮發布國家人工智能研發戰略計劃,對之前提出的8項重點戰略目標進行了優化和完善,同時強調了人工智能領域國際交流的重要性。另外,文件還80%70%60%50%40%30%20%10%0%250200150一yoy(右%)5%0%54322025E2024E20.5%21.7%2025E2026E17.9%219.2103.8147.525%75對比了2020年發布計劃中的各項指標與實際指標差距,并針對細分領域加強研發投入。表表3 3海外政策推動人工智能發展海外政策推動人工智能發展政府機構政府機構美國人工智能國家安全委員會美國白宮文件名稱文件名稱N
43、SCAI最終報告國家人工智能研發戰略計發布時間發布時間2021年3月2023年5月具體內容具體內容美國國家人工智能安全委員會(NSCAI)的任務是向總統和國會提出建議,以“推進人工智能、機器學習發展以全面解決美國國家安全和國防需求的相關技術?!痹谠O立本委員會時,2019財年約翰 S 麥凱恩國防授權法案第1051節指示NSCAI從國家競爭力的角度審視人工智能及其維持技術優勢的手段、國際合作和競爭力的趨勢、促進基礎和先進研究投資的方式、勞動力和培訓、軍事使用的潛在風險、倫理問題、建立數據標準和激勵數據共享,以及人工智能的未來發展等方方面面。該計劃是對2016、2019年版國家人工智能研發戰略計劃的
44、再次更新,重申了之前的8項戰略目標并對各戰略的具體優先事項進行了調整和完善,同時增加了新的第9項戰略以強調國際合作。此外,該報告還提出要評估聯邦機構對2020年國家人工智能倡議法案(NAlIA)和國家人工智能研發戰略計劃的實施情況。資料來源:清華大學人工智能國際治理研究院,安全內參,海通證券研究所美國增強型人工智能投資研發保持高增速,AI 戰略聯盟強大。2024年美國在該方面的投入預計為15億美元,NSCAI 希望在2025年把這一數字提高到80億美元,增幅高達433%。且在2025年之后,保持每年投入增長80億美元的趨勢。最高預計在2030年投入高達350億美元。美國強調了AI 盟友的概念,
45、與澳大利亞、加拿大、英國、日本等國家構建人工智能戰略伙伴關系,未來將會吸引更多AI強國加入聯盟當中。圖圖1515美國增強型人工智能研發投資美國增強型人工智能研發投資2015-20302015-2030SohenedAIRAD50170資料來源:清華大學人工智能國際治理研究院,海通證券研究所tment.FY2015-2030圖圖 1 1 6 6 美美 國國 及及 其其 A A I I 盟盟 友友資料來源:清華大學人工智能國際治理研究院,海通證券研究所3.23.2算力規模高增,企業對算力規模高增,企業對 AIGC的投入意愿強的投入意愿強2021年中國的智能算力規模為155.2 EFLOPS(每秒百
46、億億次浮點運算)。據IDC預測,規模將在2026年達到ZFLOPS 級別(每秒十萬億億次浮點計算)。預計在2021-2026年期間,智能算力增長的CAGR 為52.3%。隨著算力規模的大幅增長,將會帶動AI技術快速發展。根據中國信通院的測算,每在算力中投入1元,將帶動3-4元的經濟產出。在智能體發展中,更強的算力能支持更復雜的模型計算并且給予其更快的響應速度。當大模型能快速迭代,AI Agent將會有更強力的基座,相同運行模式下或能顯著提升F1-score和 Recall水平。圖圖1717中國智能算力規模及預測中國智能算力規模及預測140012001000800600400200031.720
47、19752020427268155.2202120222023EFLOPS(左 百 億 億 次/秒)922.8640.720242025yoy(右%)1271.42026160.0%140.0%120.0%100.0%80.0%60.0%40.0%20.0%0.0%資 料 來 源:新 華 網、經 濟 日報、國 家 自 然 科 學 基金 委 員 會,IDC 與 浪潮 信 息 2 0 2 2-2 0 2 3 中 國人 工 智 能 計 算 力 發展評 估報告 ,海通 證 券 研究 所根據IDC 統計,2023年已有34%的企業在 AI 中的投入已見成效,AI 能力正在穩步發展。AIAgent目前多為
48、企業自研,僅有少部分企業將Agent 融入真正工作中,若AI Agent能在未來用低成本撬動高效益,則會引起越來越多的企業重視。定制化AIAI AgentAgent或成為一片藍海市場,擁有成熟技術和一攬子解決方案的企業能占據大量市場份額。圖圖1 8企企 業業A IA g e n t使使 用用 情情 況況圖 1 3 企 業AIAgent的 應 用 情 況實 現 了AIAgent常 態 化,AIAgent已經參與到企業招聘、銷售、人事等各項業務流程中AIAgent已經成熟運用于某 一 具體業務流程 已經在某項工作中進行了AIAgent試 點正在制定AIAgent應 用 計 劃不了解或尚未考慮來源:
49、IDC,2023資 料 來 源:IDC與釘釘2024 AIGC應 用 層 十 大 趨 勢 白 皮 書 ,海 通 證 券 研 究 所風險投資青睞的智能體初創企業聚焦于橫向應用領域,廣泛涉及銷售、客戶支持及企業級與常規生產力工作流程優化。當前市場上專注于垂直行業特定應用的初創公司仍屬少數,大部分代理技術開發的新興企業主要面向企業客戶,而非個人消費者。這些Agent 初創公司希望用技術取代SDR、軟件工程師、合規分析專家、客戶服務專員等多個職位的職能。這一趨勢的影響力將極為廣泛且深遠,不僅限于日常工作中對公司員工的增加或取代,更會改變公司面向外界客戶的交互形象,或使企業的運營方式與客戶體驗發生改變。
50、圖圖1919專注于橫向應用的專注于橫向應用的 AI代理初創企業率先獲得融資代理初創企業率先獲得融資Al agent startups focusing on horizontal applications takefunding leadDlsclosed equlty funding&deals since2022(asof 7/29/2024)$1,548MHorizontal70 deok$220MVertical9dealNote fcudes OpnAL ncudes tondng to companies dnvtloping sgents withvaying degees af
51、 atonomyCBINSIGHTS資料來源:點滴科技資訊公眾號,海通證券研究所3 3.3.3多模態智能體有望實現大規模商業化多模態智能體有望實現大規模商業化多模態大模型能利用大量異構的數據資源提升應用的效率和能力上限,同時也利好AIAgent發展。多模態的概念或能提高智能體的工作效率,例如將其賦能于一個能形成圖片+語音的多模態大模型中,單個智能體能完成更多復雜的任務,有效的減少智能體數量和任務中的交互次數。多模態智能體有望解決跨行業、跨領域的復雜問題和各類長尾場景。目前,研究開發的核心領域已經包括多模態信息識別與理解技術以及群體智能技術,這些將有望加速人工智能從感知向認知的轉變。這些技術成果
52、還能夠解決其他單項技術領域(如自然語言處理和計算機視覺)所面臨的瓶頸問題,例如視覺領域的盲區和遮擋問題。此外,自動駕駛的激光點云、時空感知與測繪信息等更多類型的模態數據也將被整合到大模型中。未來,政府、金融、制造、能源、醫療、零售等多個行業的智能化應用將逐步轉向多模態和跨模態的形式。圖圖 2 2 0 0 多多 模模 態態 大大 模模 型型 發發 展展金融金融政府政府制造制造能源能源醫療醫療零售零售風險評估和信貸審查:通風險評估和信貸審查:通 公共服務自動化:為公共服務自動化:為公生產流程生產流程優化:分析優化:分析能源消費預測:預測末能源消費預測:預測末診斷輔助:分析醫療圖診斷輔助:分析醫療圖
53、庫存管理和預測:預庫存管理和預測:預測過分析文本和數值數據來 眾提供信息查詢、辦事眾提供信息查詢、辦事工廠數據以優化生產來的能源需求和消費模像和患者數據以協助醫像和患者數據以協助醫產品的銷售趨勢和庫存產品的銷售趨勢和庫存預測客戶的信用風險預測客戶的信用風險指南等服務指南等服務效率式生診斷需求需求自動化客服:自動化客服:為用戶提供 政策模擬與預測:預測政策模擬與預測:預測產品設計輔助:基于設備維護預測:預測能藥物研發:預測新藥物個性化推薦:基于用戶即時的財務咨詢和支持即時的財務咨詢和支持政策實施后的社會和經政策實施后的社會和經市場和用戶反饋生成源設備何時需要維護或的效果和副作用的購買歷史和喜好為
54、其濟影響濟影響新的產品設計建議更換推薦產品投資策略優化投資策略優化:分析大量 數據分析和可視化:自數據分析和可視化:自供應鏈管理:預測供能源存儲和分發優化:治療建議生成:基于患客戶服務自動化:為客數據,為投資者生成投資動生成關于公共問題的應鏈中的潛在問題或基于數據分析來優化能者的歷史和病情生成治戶提供自動化的購物咨戶提供自動化的購物咨建議或預測市場走勢建議或預測市場走勢報告和可視化內容延遲源的存儲和分發療建議詢和支持欺詐檢測:通過分析交易 輿情分析:分析公眾對模式和行為來識別可疑的 政府政策和行動的態度交易交易和反應設備維護預測:預測設備何時需要維護或更換可再生能源管理:預測和優化太陽能和風能
55、的產出患者監控和預警:實時分析患者的生理數據以預警其健康狀況市場趨勢預測:分析市場數據以預測未來的零售趨勢報告自動生成:為管理層報告自動生成:為管理層 智能監控和安全:通過智能監控和安全:通過質量控制自動化:通環境監測:通過分析視醫療文獻自動生成和分虛擬試衣和產品展示:或監管機構自動生成財務或監管機構自動生成財務 分析視頻和音頻數據來過分析圖片和視頻數頻、圖片和傳感器數據析:自動生成或分析醫使用AR和VR技術為用戶和業務報告和業務報告提高公共場所的安全提高公共場所的安全據自動檢測產品缺陷來監測環境和設備狀況學研究報告和文獻提供虛擬的產品體驗模態:文本圖片語音視頻數值數據資料來源:IDC 與釘釘
56、2024 AIGC 應用層十大趨勢白皮書,海通證券研究所3 3.4 4 全全 球球 智智 能能 體體 市市 場場 增增 速速 加加 快快根據marketsandmarkets 的數據顯示,2019年全球自主智能體(AutonomousAgent)市場份額為3.45億美元,預計2024年將達到29.92億美元,期間CAGR為54%。機構預測2023年全球自主人工智能和自主智能體的市場規模在2028年能達到285億美元,期間 CAGR為43%。智能體的需求增長迅速,企業希望用到最先進的Al 科技來實現快速創收,未來智能體軟件公司有很高發展潛力。圖圖2121 全球自主人工智能和智能體市場規模全球自主
57、人工智能和智能體市場規模AUTONOMOUSAIANDAUTONOMOUSAGENTSMARKEIGLOBALFORECASTT2028(USDBILLION)28.5CAGR OF43.0%TheglobalAutonomousAandAutonomousAgentsMarketisexpectedtobeworthUSD 28.5billionby2028,growing at a CAGR of43.0%duringtheforecastperod資料來源:marketsandmarkets,s,海通證券研究所202220232026Noth Anerico WEuope Asa Pac
58、ifeMode East嘉AMico Latin Ameico4.83.29各行業用戶正積極探索生成式 Al 的應用場景,開發數字化產品和服務,挖掘數據要素的潛在價值,并嘗試智能化商業模式。根據 IDC的數據,軟件和信息服務、銀行以及通訊行業在人工智能方面的投資最為突出,預計到2027年,這三大行業的投資占比分別為23.8%、9.7%和9.4%。IDC 的調查顯示,近一半(43%)的受訪組織正在研究生成式Al 的潛在應用,其中2023年有55%的金融機構和電信公司投資了生成式AI技術。這些技術正在幫助金融和電信行業提升反犯罪和監控能力,提供個性化的投資建議,并減少人工成本。圖圖2222中國前五
59、大人工智能市場應用中國前五大人工智能市場應用中國前五大人工智能市場應用場景占比預測,中國前五大人工智能市場應用場景占比預測,20202424智能基礎設施調配智能基礎設施調配增強的智能客服增強的智能客服銷售流程推薦和增強銷售流程推薦和增強智能業務創新和自動化增強的公共安全和應急響應 其他資料來源:IDC,海通證券研究所4.4.潛在標的:潛在標的:Agent 企業千帆競發,垂類應用引人期待企業千帆競發,垂類應用引人期待4.1 LeewayHertz:提供多領域解決方案提供多領域解決方案LeewayHertz 公司在人工智能Agent開發方面取得了長足進步,以創建定制化人工智能解決方案的專長而聞名。
60、目前已在醫療保健、金融和物流等多個領域成功實施了人工智能智能體應用。他們致力于提供量身定制的人工智能解決方案,這使LeewayHertz站在了智能體應用的最前沿。其中公司持續與各類行業的頭部企業達成協作,提供各類數字解決方案,商業模式較為成熟。圖圖2 3L e e w a y H e r t z公公 司司 發發 展展 歷歷 程程 與與 合合 作作 公公 司司Alexaoce占batONHAWAllRearsonSIEMENSMINASCAR80+Digit2019PaG*NorthShore45+Digitions20232024TRACERX85F3MHERSHEYS2008-2018Nan
61、oWallKxiNESS202020222021100+150+125+90+9HT資料來源:LeewayHertz 官網,海通證券研究所行 業 研20其公司的智能體業務旨在通過自動化任務和簡化流程來提高運營效率,從而擴大業務成果。公司使用 AutoGen Studio、Vertex AI Agent生成器和 crewAI 等一流工具,根據業務需求量身打造以任務為中心、高性能且可靠的 AI Agent。利 用 LLM 的高級功能和全面的技能庫,LeewayHertz的人工智能Agent 在研究、分析、代碼生成、審查、審計、在線搜索和細分等各種任務中表現出色。圖圖2424 LeewayHertz
62、LeewayHertz的智能體產品架構的智能體產品架構資料來源:LeewayHertz 公司官網AI Agent產品界面,海通證券研究所公司提供了一系列AI Agent產品解決方案,例如私募股權智能體。這些智能體是能夠分析和解釋復雜數據的智能助手,幫助私募股權公司:1)獲得洞見:AI 智能體可以在大型數據集中發現隱藏的模式和趨勢,幫助私募股權公司識別有前途的投資機會或潛在風險。2)做出更好的決策:AI 智能體生成的洞見使得投資決策更加知情和數據驅動。3)提高效率:通過自動化重復性任務,AI 智能體讓人類分析師可以專注于更高價值的活動,如建立關系和戰略規劃。智能體通過戰略決策進行推理并行動,提升
63、私募股權公司的投資成果和運營效率。公司為私募股權打造智能體的架構分為三個層面。首先智能體捕獲和處理與私募股權相關的各種輸入,包括財務數據、市場趨勢、投資者情緒和監管更新。它可以處理文本、數字和圖形格式的輸入,以便為戰略決策和行動提供信息。其次,認知功能(大腦)內又包含了:a)角色定義:確定 Agent 在私募股權操作中的角色,使任務與投資策略和客戶目標保持一致。b)記憶:存儲和檢索過去的投資決策、市場行為和客戶互動,促進自適應學習和知情決策。c)知識:存儲私募股權操作中關鍵的領域特定信息,如財務分析、風險評估模型和監管框架。d)規劃:根據當前市場狀況、投資組合目標和監管要求制定投資策略和運營計
64、劃。最后執行層面中,智能體使用預測分析、投資組合管理軟件和合規自動化工具來執行計劃策略。這確保了投資策略的精確實施、投資組合表現的優化以及私募股權操作中對監管標準的遵守。圖圖2525 LeewayHertz 為私募股權提供的為私募股權提供的AIAgent解決方案解決方案TextAudioImageUTInfoAIAgentforPrivateEquityoryBRAKnowledgeingnfoSeaACTION(Agent plckstools basedon資 料 來 源:LeewayHertz公 司 官 網Insight界 面,海 通 證 券 研 究 所4.24.2 Markovate:
65、Markovate:提供多模態智能體解決方案提供多模態智能體解決方案Markovate公司為企業開發人工智能Agent,以提高業務流程、決策和運營效率。這些智能體是先進的數字助理,可自動執行任務、分析數據和提供見解,并與企業系統無縫集成。Markovate使用 AutoGenStudio、Vertex AI 和 GPT-4o 等工具定制智能體,以滿足特定的業務需求。圖圖2626 Character.aiCharacter.ai 智能體架構智能體架構CmorAIVrtoxA資料來源:Markovate公司官網,海通證券研究所Markovate打造了一款由智能體集成驅動的虛擬助理零售庫存管理解決方
66、案ShopSpot。結 合AI 智能體提供了徹底改變零售業的庫存管理的方案,通過整合先進的機器學習和神經網絡,它可以提供精確的需求預測和庫存水平優化,有效地應對現代零售業的挑戰。在整個解決方案中包含了幾個重要模塊:1)聊天機器人和智能體:使用大量的客戶互動數據對這些智能體模型進行訓練,確保智能體能夠提供準確和有用的回復,從而提高用戶參與度和效率,開發能夠理解和響應各種庫存相關查詢的人工智能模型。2)動態數據可視化:結合了先進的圖形工具,設計了動態數據可視化功能,用戶能通過熱圖和散點圖等可視化工具來直觀地探索和理解復雜的庫存數據。3)聚類分析:設計聚類分析功能涉及創建算法,根據購買模式和行為的相
67、似性對產品或客戶進行分組,為不同的細分市場量身定制庫存策略。圖圖2828 ShopSpot 庫存管理系統庫存管理系統資料來源:Markovate公司官網,海通證券研究所多模態智能體通過結合圖像識別系統,分析產品圖像、貨架狀況和倉庫環境,有助于快速評估庫存水平、識別損壞情況并有效地進行產品分類。資料來源:Markovate公司官網,海通證券研究所圖圖2727 ShopSpotShopSpot 用戶界面展示用戶界面展示Use圖圖2929 ShopSpotShopSpot 多模態智能體圖片多模態智能體圖片識別功能展示識別功能展示資料來源:Markovate公司官網,海通證券研究所4.34.3Repl
68、ikaReplika:情感類智能體熱度不減情感類智能體熱度不減Replika 是一款陪伴類智能體,她的創始人將自己與朋友大約8000條聊天記錄輸入谷歌的神經網絡,創建了一個 AI 智能體,讓用戶獲得更加擬人的交流體驗。創始人表示約有40%的用戶用這款智能體創造戀人角色。2017年3月Replika 首次公測,吸引了10萬名用戶參與,同年9月正式面向大眾,在不到一年的時間里,積累了250萬用戶。截止到2023年1月,Replika 的產品全球流水可以達到200萬美元/月,在安卓系統已累計1000萬次下載,用戶平均每天會與其中的智能體聊天70條左右,花費時間2-3小時。目前用戶滿意度為92%,有超
69、過一半的人愿意為后續產品付費。其付費模式分為按月付款(19.99美元),按年付款(69.96美元),以及終身會員(299.99美元)。開通Replika Pro之后可以解鎖更高版本的語言模型、無限的語音消息、圖片生成等。圖圖3030 Replika付費模式付費模式Unlock Replika PROGet access to the advanced model,unlimited voicemessages,imagegeneration,activities,andmore.Save70%1month12 monthsbilledannually$19.99$5.83/mo資料來源:Rep
70、lika用戶注冊界面,海通證券研究所Lifetimebilledonce$299.99Replika 吸引歐美中年男性居多。根據similarweb 截止2024年8月份的統計,Replika 男性用戶約占64.67%,女性用戶占35.33%。其中25-34歲的用戶群體居多,占比約28.49%。前五地區的用戶分別是美國、墨西哥、印度、英國、德國。圖圖3232截止截止20242024年年8 8月月RepRep likalika用戶全球分布用戶全球分布28.49%27.3%54.0%L5.6%5.6%3.8%3.8%0.00%25-3435-4445-5455-6465+資料來源:similarw
71、eb受眾人口板塊,海通證券研究所資料來源:similarweb 地理板塊,海通證券研究所4.4CharacterAI:自自研研大大 模模型型,打打造造智智能能體體社社區區Character.ai是一種神經語言模型聊天智能體,其較大特點是自主研發的Beta 語言模型。用戶可以創建智能體并根據參數塑造他們的個性,然后將創建好的智能體發布到社區中與其他用戶進行交互。另外,有些角色可以扮演助手模式,例如幫助你進行創意寫作或打造一個文字冒險游戲等。用戶不僅可以與單個智能體進行交流,還可以創建包含多智能體的群聊,這些智能體可以互相交談且用戶也能參與其中。2023年3月,Character.AI 完成了一筆
72、1.5億美元的融資,估值達到10億美元,由 a16z 領投。公司的創始人 NoamShazeer曾是谷歌首席軟件工程師,也是Transformer論文的作者之一。公司將這筆融資用于拓展模型的計算能力并提高其回答精度和推理能力。圖圖3333 Character.AI 用戶界面用戶界面For youcter選擇現有的選擇現有的智智能能 體體,由由其其他他用戶創用戶創建建wlanguagePracte nternewngWriteastoryAberLAnythgatot yicen助手類的智能體UsbaddyMo lon資料來源:Character.ai官網,海通證券研究所截止2024年7月,網站
73、月平均訪問量為2.15億,且其訪問量仍保持增長態勢。據2024年7月30日的報道數據,Character.AI 在已擁有1700萬的月度活躍用戶。截止2024年4月全球用戶達到2.33億人。網站目前的變現方式主要通過升級訂閱服務,每月收費9.9美元,功能包括不限制聊天次數、擁有更快的反饋速度。30.00%25.00%20.00%15.00%10.00%5.00%圖圖3131 截止截止20242024年年8 8月月ReplikaReplika各年齡段用戶占比各年齡段用戶占比美國墨西哥印度英國口德國 其其他自定義角色聲音,可以上傳錄音文件lon自定義你的智能體23.96%17.27%13.05%1
74、0.79%6.44%18-24圖圖3434CharacterCharacter.aiai20242024年年7 7月每日訪問量月每日訪問量character ai deepal.org notion.so huggingface.co215.2Mvs10.35M424.3M154.1M17.10M7400M7200M7.000M6 800M6.60 0M6400M01Jul03 Jul09Jul13Ju15Jul17Jut19Jul21Jul資料來源:similarweb訪問量板塊,海通證券研究所網站吸引年輕男生和女生,活躍用戶粘性較大。網站受眾人口的男女比率約為51%和49%,其中18-24
75、歲的用戶占比超過56%。前五地區的用戶分別是美國、印度尼西亞、墨西哥、菲律賓和印度。其中活躍用戶每天約進行240輪對話,平均時長在2個小時。目前網頁端的DAU/MAU比例為23%,APP端 DAU/MAU比例為41%。圖圖 3 3 6 6C C h h a a r r a a c c t t e e r r.A A I I 用用 戶戶 全全 球球 分分 布布23.39%48.32%12.71%5.90%4.58%5.10%0.00%18-2425-3435-4445-5455-64資料來源:similarweb受眾人口板塊,海通證券研究所公司通過自研模型減少成本,智能體研發技術先進。由于是自主
76、研發的模型,其高效的LLM 算法大大降低了成本,根據 foresight news援引海外獨角獸團隊測算,每個Query 的推理成本是 chatgpt 的5%以下。早在2023年2月份,Character.AI就使用了八位整型做計算,比16或32位浮點數效率有4倍-2倍的提升,這也歸功于創始人 NoamShazeer對AI技術的獨特理解。成本方面,根據foresightforesight newsnews援引海外獨角獸團隊測算character每次交互的成本為0.000027美元,一個 MAU的單月成本可以控制在不到0.1 美元4 4.5 5星星火火智智能能體體:布布局局智智能能體體平平臺臺,
77、發發布布垂垂類類智智能能體體星火智能體平臺目前由三大核心模塊組成,分別是智能體、任務鏈和知識庫。智能體模塊事先配備了預先設置,能夠自主規劃并調用工具執行任務。任務鏈是為智能體提供執行任務所需要的各類工具,能快速鏈接企業內部的知識、IT 系統和外部信源。知識庫模塊能讓用戶更快捷的查詢垂類知識,讓智能體更好的解決專業類知識,支撐其高效運行60.00%50.00%40.00%30.00%20.00%美國印度尼西亞口墨西哥菲律賓口印度 口其口其他他資料來源:similarweb地理板塊,海通證券研究所圖圖3535 CharacterCharacter.AIAI 各年齡段用戶占比各年齡段用戶占比23 J
78、ul25Ju27Jul29 Jul 31Jul10.00%22.72%65+全全部部清清56.08%11.45%4.84%2.13%2.77%圖圖 3 3 7 7 科科 大大 訊訊 飛飛 星星 火火 智智 能能 體體 介介 紹紹16000+智能體深入垂直場景解決剛需問題,讓每一個場景,都能找到開箱即用的大模型應用結結構構化化創創建建聚焦場景人物,結構化助手指令;通過角色設定和對話模塊,基于自然語言快速創建助手。輕應用輕應用開發開發面向不同垂直場景,具有更優的使用體驗和獨立的交互方式。目前已接入智文,曉醫智作,語伴等多個專業輕應用。流流程程圖圖式式編編排排基于豐富的工具集,快速配置各類節點,可視
79、化拖拽操作,實現復雜功能,提高效率。資料來源:星火智能體,海通證券研究所2024年6月,科大訊飛發布了星火大模型V4.0及相關落地應用。在去年11月份,訊飛星火 App 的用戶已經累計開發了3.7萬+的個性化Al 助手,可以滿足職場、營銷、創作等多場景需求。目前App已經累計在安卓市場下載1.31億次,在國內通用大模型App 中排名第一。另外,訊飛星火首批上線面向特定場景打造專屬助手。例如垂類智能體“訊飛曉醫”,其覆蓋了1600種常見疾病,2800種藥物以及6000種醫學檢驗,其滿足了用戶的一些醫療建議需求。圖圖3838部分星火部分星火AIAI 智能體展示智能體展示智能體中心智能體中心主主動思
80、考與執行任務的智能助理工作臺我的推薦職場繪畫大師繪畫大師已通加輸入主題及要求,一鍵為你創作圖像文文 本本 擴擴 寫寫添加請輸入文本,我來幫你擴寫,比如“大語言-A 1596.6萬文章改寫助手文章改寫助手+源加文章改寫助手,對文本內容進行維改間色990.7萬 z0資料來源:星火智能體,海通證券研究所風險提示:大模型發展不及預期,智能體下游需求不足。4.6 SkyAgents:自研模型降低成本自研模型降低成本天工SkyAgents 是基于昆侖萬維天工大模型平臺打造的,其具有從感知到決策,從決策到執行的自主學習和獨立思考能力。用戶能夠通過自然語言創建一個或多個智能體,并將不同任務模塊化。通過操作系統
81、模塊,可以執行包括問題預設、指定回復、知識庫創建與檢索、意圖識別、文本提取和 http請求等任務。其中天工大模型的MoE架構能讓 AI 獲得更快的響應速度且面對復雜任務的處理能力更強。內容運營創作助手添加星火內容運營大師,致力于為內容運營工作A 1184.5萬 136*6064擴寫助手擴寫助手+酒加hello,我是你的擴寫助手,請輸入文本,我。exywu49寫作助手寫作助手請說出您要創作的文章的類型,以及文章的3893萬菌盛創作學習編程生活趣味營銷情感三文章潤色高級助手根據提供的文案,上下文結合進行潤色986.4萬 0189*5588文案大師文案大師輸入一個主題,為你生出一篇文章萬 131*9
82、138朋友圈文案朋友圈文案酒加請輸入要表達的關鍵詞,為你生成對虛的期-OQ 報素智能體。自建智能體SkyAgents智能體擁有成本優勢,tokens價格低于OpenAI。天工大模型3.0版本圖圖3939 天工大模型能力展示天工大模型能力展示能力展示能力展示靈活、多樣、可擴展性更強模型稀疏性使得在同等計算資源下能夠擴增加專家模型數量、調整權重配比,具有更強的可擴展性,構建更為靈活、多樣的新時代大模型資料來源:天工開放平臺官網,海通證券研究所0.01元/千tokens,2.0版本0.005元/千tokens,價格普遍比GPT40更加劃算,但天工3.0價格略貴于GPT3.5 turbo。若按照200
83、0個 input tokens,輸出1000個output tokens來計算,GPT4o花費0.175元(匯率按照1:7),GPT 3.5turbo花費0.028元,天工3.0模型花費0.030元,2.0模型花費0.015元。圖圖4040天工天工AgentAgent計費模式計費模式A g e n t 類天工3.0系列模型AI AgentA I 對 話 3 0AGI Sky-Chat-3.0APIAI對話2.0:AGI Sky-Chat Sass AP歡迎咨詢天工大模型天工大模型3.03.0 APIAPI在在2.02.0版本基礎上,提供了搜索增版本基礎上,提供了搜索增強模式,顯著提升信息檢索和
84、知識整合能力。強模式,顯著提升信息檢索和知識整合能力。結合最新搜索引攀技術,能夠快速找到相關信息并進行智能分析,提供更精準和豐富的回答。在復雜對話和深度內容創作中表現更佳,如廣告文案、小說寫作、知識類寫作和代碼生成等場景。AGISky-ChatAGISky-Chat SassAPISassAPI提供了更強大的提供了更強大的問答和文本生問答和文本生成能力,非常適合復雜的對話交互和深度內容創作設計的場景。特別適用于需要高知識量、強推理能力和創造力的場景,例如廣告文案、小說寫作、知識類寫作和代碼生成等。0.0100.010元元/千千tokenstokens搜索增強:開啟搜素增搜索增強:開啟搜素增強模
85、式使更多tokens消耗,當中調用搜索次數限耗,當中調用搜索次數限時免費時免費SkyChat-MogaVerse0.010元/千tokens0.005元/千/tokens資料來源:天工開放平臺產品定價,海通證券研究所4.74.7商湯:聯合清華、上海人工智能實驗室打造商湯:聯合清華、上海人工智能實驗室打造GITM商湯、清華大學和上海人工智能實驗室等機構的研究者們提出了一種名為 Ghost inthe Minecraft(GITM)的 通 才 AI 智能體。GITM能夠在我的世界中表現優異,顯著減少訓練時間和資源。這一突破標志著通用人工智能(AGI)研究的重大進展,AGI的目標是開發能夠在開放世界
86、環境中進行感知、理解和交互的智能體。GITM通過自主學習,解鎖了我的世界主世界的262 個物品,相較于之前智能體僅解鎖的78個物品大幅提升。此外,GITMGITM在“獲取鉆石”任務上的成功率從 OpenAI提出的 VPT方法的20%提升至67.5%。GITM訓練僅需一個 CPU節點兩天完成,訓練步數比之前方法減少了萬分之一,大大低于 OpenAI 和 DeepMind提出的其他方法所需的 GPU天數。此項研究為機器人和自動駕駛等產業帶來了巨大的潛力和突破。應應對對復復雜雜任任務務能能力力更更強強集成了多個專家模型,針對不同的數據分布和構建模式進行搭建,從而提升在各個細分領域的專業能力。在處理復
87、雜任務多模態任務時有顯著性能提升速速度度更更快快、效效率率更更高高:MoE 模型的推理計算過程中只有少數特定專家模型被激活,呈現出極高的稀疏性,從而提高了推理計算效率,讓用戶獲得更快的A響應速度。圖圖 4 4 1 1R R L L 架架 構構 對對 比比 G G I I T T M M 創創 新新 架架 構構RL-basedmethodgoalobseRLAgenGhost Inthe Minecraft(GITM)aclion isLLMDecomposefeedbackstructuredactionsEnvironmentkeyboarda moousesub-goaltreeLLMPl
88、annergoal資料來源:機器之心,海通證券研究所傳統 RL智能體在shang h將復雜任務映射到底層鍵盤鼠標操作時面臨困難,而GITM采用大型語言模型(LLM)作為核心,打破了這一傳統架構。GITM由由 LLMDecomposer、LLM Planner和 LLM Interface三部分組成,逐步將復雜任務分解為子任務、結構化動作,直至最底層的鍵盤鼠標操作。LLMDecomposer利用外部知識將復雜任務分解為簡單子任務;LLM Planner為每個子任務規劃結構化動作,并根據反饋信息調整規劃,不斷總結成功經驗;LLMInterface通過鍵盤鼠標操作執行結構化動作,并在與環境交互中獲取
89、觀察信息。圖圖4242解鎖科技樹的成功率解鎖科技樹的成功率(藍色是藍色是GITM)erv3印資料來源:XizhouZhuGhostinthe Minecraft,海通證券研究所圖圖 4 4 3 3 各各 模模 型型 完完 成成 任任 務務 成成 功功 率率 對對 比比MethodSuccessRate(%)DreamerV3DEPSVPTOur GITM50.03.00.010090.080.073.310.00.6100.0100.0100.085.020.0100.0100.0100.095.067.5100.0100.0100.095.067.5資料來源:機器之心,海通證券研究所GITM
90、 在我的世界主世界中實現了100%的任務覆蓋率,成功解鎖了完整的科技樹,而此前所有智能體總和只能覆蓋30%。在備受關注的“獲取鉆石”任務上,GITM 的成功率達到67.5%,比目前最佳成績(OpenAIVPT)的20%提高了47.5%。GITM的訓練效率也顯著提升,所需環境交互步數僅為已有方法的萬分之一,單個CPU 節點訓練2天即可完成,相比之前OpenAIVPT所需的6480個GPU天或DeepMindDreamerV3所需的17個GPU 天,取得了巨大的進步風險提示;智能體商業化不成熟,智能體下游需求不足。4.84.8字節跳動:豆包聊天助手字節跳動:豆包聊天助手在中國的AI聊天機器人競爭中
91、,字節跳動已搶占先機。其最新推出的AI對話服務豆包在下載量和活躍用戶數上均超越了百度的文心一言。根據華爾街見聞援引互聯網分析公司SensorTower的數據,自去年8月推出至今年4月,豆包在iOS 系統上的下載量近900萬次,領先于文心一言的800萬次。在月活躍用戶數方面,豆包在iOS 端也已超過400萬用戶,顯著高于文心一言。相比之下,OpenAl 的 ChatGPTApp在美國的月活躍用戶數量為670萬。根據2024年5月的數據顯示,豆包PC、iOS 平臺月活躍用戶總數已達到 26 00 萬。圖圖4444豆包智能體的對話界面豆包智能體的對話界面豆包+新 對 話你好,我是豆包準備好了嗎?我隨
92、時可以開始哦!你可以嘗試下面的示例AIAI 搜搜 索索d蘋果為何將部分產能從印騎共享單車比坐地鐵還PDFPDF問問 答答發布版IntoO大模型測評報告操告性記段7M2017的以,大模技境力和豐田又陷造假門,7款車型涉案,有什么影響登錄登錄資料來源:字節跳動豆包,海通證券研究所相比市面上的收費大模型,豆包有價格優勢。目前普通用戶可以免費使用豆包,其大模型的API 定價也相對較低。按 Tokens實際使用量計算費用的“后付費”模式下,豆包通用模型-pro 和豆包通用模型-lite 的 3 2k 及以下窗口版本,模型限流為10KRPM和 8 0 0KTPM(以 RPM和 TPM其中之一達到上限為準)
93、。相比之下,國內其他主流模型的 TPM限額多在100K 到 3 0 0K 之 間,RPM則在60到120區間,輕量級模型的 RPM限額相對較高,但僅在300到500之間。字節跳動宣布企業市場定價為0.0008元/千 Tokens(約1500多個漢字),比行業標準便宜99.3%。風險提示:智能體商業化不成熟,智能體下游需求不足4.94.9騰訊:騰訊:AppAgentAppAgent 通過模仿人類行為,完成與智能手機的交互。騰訊的AppAgentAppAgent的智能Agent 能力可以用于操作任何 App,它在50個復雜手機任務上展示了強大的能力。根據 Chi Zhang等人的論文AppAgen
94、t:Multimodal Agents as SmartphoneUsersAppAgent 介紹,這項技術通過引入一種基于大型語言模型(LLMs)LLMs)的多模態智能 Agent(Agent)框架,使智能體能夠操作智能手機應用程序。與傳統的智能助手如 Siri不同,AppAgent 并不依賴系統后端訪問,而是通過模擬人類的點擊和滑動操作,直接與手機應用的圖形用戶界面(GUI)互動。這種獨特的方法不僅提高了安全性和隱私性,還確保了智能體能夠適應應用界面的變化和更新。AIAI 解讀奧運賽事解讀奧運賽事口最近對話 關于豆包O 換一換圖像生成圖像生成D9圖圖4545 騰訊騰訊 AppAgent展示
95、軟件操作展示軟件操作SendanTelegramghtronshotshowsaphotoedtingapasmntphorewthaninaeded on the sThought To compl ete this tak.i should adjut the nomusing the slidoAction:swipe(23,rght,medum)資料來源:騰訊云,海通證券研究所AppAgent 的實驗環境基于命令行界面(CLI),使 Agent 能夠與安卓系統上的智能手機應用進行交互。Agent 接收兩種關鍵輸入:實時屏幕截圖展示應用界面,以及詳細描述交互元素的 XML文件。為了提升A
96、gent 識別和交互這些元素的能力,每個元素都被賦予了一個唯一標識符。標識符要么來源于 XML文件中的資源 ID(如果提供),要么通過結合元素的類名、大小和內容來構建。這些元素的標識符以半透明數字形式覆蓋在屏幕截圖上,幫助Agent 在不需指定精確位置的情況下準確互動,從而提高控制手機的精確度。動作空間模擬了人類與智能手機的常見交互方式,包括點擊和滑動。設計了四個基本功能:點擊(Tap)、長 按(Long Press)、滑 動(Swipe)和文本輸入(Text),以及兩個系統級功能:返回(Back)和退出(Exit)。這些預定義動作旨在簡化Agent 的交互流程,并減少對精確屏幕坐標的依賴,解
97、決了語言模型在準確預測中可能遇到的挑戰。nshot dsplays a thopping appwith a variety of headsets liateght To complete this task,I shoul add theedheadsetshopping anttap(14)The image shows a screenshalarm applcatonTocomolkta ths tak Ithould dhable thepping onIGmailYouTubeEMUutthratenrch musicwdeoredutionleleaturetap(17圖圖4
98、6A p p A g e n t的的A p p探探 索索 學學 習習 階階 段段Exploration PhaseTapSwipe“Swiping this Ul element allows theuser to adjust the colortemperature of theimage.DocforAppthe color settings to adjust thecolor of theimage.資料來源:騰訊云,海通證券研究所AppAgentAppAgent 框架的核心是探索階段。Agent 通過自主交互或觀察人類演示來學習應用程序的功能和特性。在自主交互模式下,Agent 被
99、分配一個任務并開始與 UI 元素進行自主互動。Agent嘗試不同的動作,并觀察應用界面的變化以理解其工作原理。Agent通過分析每個動作前后的屏幕截圖,了解 UI 元素的功能和特定動作的效果。所有這些信息都會被記錄成文檔,詳細記錄下不同元素所執行動作的效果。如果某個 UI 元素被多次操作,Agent會根據之前的文檔和當前的觀察來更新信息,以提高認知質量。AppAgent專注重要操作,提高探索效率。如果當前 UI 頁面與應用的主要任務無關(如廣告頁面),Agent 會停止進一步探索,并使用 Android 系統的返回功能返回到前一個 UI 頁面。這種目標導向的探索方法,相比隨機探索,確保Agen
100、t專注于對應用有效操作至關重要的元素。Agent 還利用語言模型對用戶界面的現有知識來提高探索效率,直到完成分配的任務。在觀察人類演示進行探索的方式中,Agent 通過觀察人類用戶的操作來學習應用的復雜功能。這種方式尤其有效,對于那些難以通過自主交互發現的功能。Agent記錄人類使用的元素和動作,這種策略縮小了探索空間,并阻止Agent與無關的應用頁面進行交互,從而比自主交互更為高效和有條理。圖圖4 7A p p A g e n t的的 實實 際際 部部 署署 階階 段段遍DeploymentPhase:“beautifythisphotoforme”0Observe,Think,Act,an
101、dSummarize資料來源:騰訊云,海通證券研究所在經過探索階段的訓練后,AppAgent 已準備好執行復雜任務。在部署階段,Agent采用逐步方法操作,每一步包括獲取當前用戶界面的屏幕截圖和動態生成的文檔,詳細描述了界面元素的功能及動作效果。首先,Agent 對當前用戶界面進行觀察,并闡述其關于任務和觀察結果的思考過程。然后,Agent 通過調用可用函數執行動作。每次動作后,AgentAgent 總結交互歷史和當前步驟中采取的動作。這些信息被整合進下一個提示中,為Agent 提供了一種記憶形式。這種細致的方法提高了Agent 動作的可靠性和可解釋性,從而促進了更明智的決策。部署階段持續進行,直到Agent 確定任務已經完成,此時它可以通過執行退出(Exit)動作結束過程。AppAgent 采用了多模態大型語言模型 GPT-4,能夠處理圖像和文本輸入,解釋并互動應用中的視覺及文本信息。通過簡化動作空間設計,AppAgent大幅提升了準確性和效率,避免了生成精確 xy 坐標的需求,這一直是傳統語言模型的難點。在成功率、獎勵和平均步驟數等關鍵性能指標上,AppAgent 表現優異。即使任務步驟失敗,它仍能根據最終狀態獲得獎勵,顯示出強大的適應性和韌性。風險提示:智能體商業化不成熟,智能體下游需求不足。