《2024海外AI大模型發展現狀及海外應用梳理分析報告.pdf》由會員分享,可在線閱讀,更多相關《2024海外AI大模型發展現狀及海外應用梳理分析報告.pdf(28頁珍藏版)》請在三個皮匠報告上搜索。
1、2023 年深度行業分析研究報告 目錄目錄 1.1.模型層:大語言模型加深場景結合,多模態持續迭代模型層:大語言模型加深場景結合,多模態持續迭代 .5 5 1.1 大語言模型:開、閉源共存以滿足不同應用開發需求.6 1.2 多模態模型:技術持續演進,混合多模態有望催生現象級應用.9 2.2.應用層:文本編輯類最成熟,國內有望復制海外路徑應用層:文本編輯類最成熟,國內有望復制海外路徑 .1111 2.1 應用分類:文本編輯類數量最多、訪問量最高.11 2.2 海內外應用對比:整體差距較大,國內有望復制海外發展路徑.14 3.3.海外應用梳理:模型能力決定體量下限,場景適配度決定上限海外應用梳理:
2、模型能力決定體量下限,場景適配度決定上限 .1616 3.1 文本編輯類應用:聊天機器人最成熟,虛擬角色和教育潛力最大.17 3.2 圖像類應用:編輯強于生成,加深與 B 端場景融合方能實現增長.25 3.3 音視頻/游戲類應用:場景上限最高,模型能力仍處探索期.27 圖表目錄圖表目錄 圖 1:AI 大模型發展歷程.5 圖 2:AI 產業“基礎設施+模型+應用”三層級.6 圖 3:開源和閉源模型的發展歷程.6 圖 4:閉源和開源模型在基準測試中的得分對比.7 圖 5:OPENAI 大模型 API 的發布及更新情況.7 圖 6:OPENAI 模型 API 的價格.8 圖 7:開源和閉源模型在五樣
3、本 MMLU 語言理解基準測試中的得分對比.9 圖 8:多模態模型的發展歷程.10 圖 9:OPENAI GPT-4O 演示.11 圖 10:谷歌 PROJECT ASTRA 演示.11 圖 11:按生成內容形式劃分全球訪問量前 100 的網頁版 AI 應用.12 圖 12:AIGC 技術的成熟應用進程時間表.13 圖 13:4 月全球訪問量前 100 的各類 AI 應用占比(%).13 圖 14:4 月全球訪問量前 100 的各類 AI 應用訪問量(萬).13 圖 15:4 月海內外前十 AI 產品訪問量總和(萬)對比.14 圖 16:4 月海內外首位 AI 產品訪問量總和(萬)對比.14
4、圖 17:2024 年 2-4 月海內外訪問量前十的 AI 產品訪問量總和(萬)對比.15 圖 18:進入 4 月全球訪問量增速前 50 的國內 AI 應用.15 圖 19:4 月訪問量及增速表現亮眼的國內 AI 應用.16 圖 20:4 月全球訪問量超千萬的海外 AI 應用的細分類目.16 圖 21:文本編輯類訪問量超千萬應用的訪問量總和(億).17 圖 22:聊天機器人應用.17 圖 23:搜索引擎應用.18 圖 24:虛擬角色應用.19 圖 25:4 月全球人均使用時長前 30 中的虛擬角色應用.19 圖 26:翻譯工具應用.20 圖 27:寫作工具應用.20 圖 28:內容檢測應用.2
5、1 圖 29:生產力應用.22 圖 30:教育應用.23 圖 31:電商購物應用.23 圖 32:營銷工具應用.24 圖 33:圖像生成&編輯應用.25 圖 34:PPT 工具應用.26 圖 35:音頻生成應用.27 圖 36:視頻編輯應用.28 圖 37:游戲生成應用.29 1.1.模型層模型層:大語言模型大語言模型加深加深場景結合,多模態場景結合,多模態持續持續迭代迭代 谷歌谷歌B BERTERT開啟開啟大模型時代,大模型時代,ChatGPTChatGPT推升推升發展熱潮發展熱潮。1956年,達特茅斯研討會正式提出人工智能,標志著人工智能學科誕生。此后60余年,專家系統、深度學習等關鍵技術
6、不斷成熟,為大模型發展奠定基礎?;仡櫞竽P桶l展歷程,可分為以下三個階段:1 1)大模型)大模型開端開端:2018年,谷歌發布3億參數規模的自然語言處理模型BERT,標志著人工智能正式進入大模型時代。2 2)大模型探索:)大模型探索:2020年,GPT-3發布,模型參數規模大幅提升至1750億。隨后,谷歌、微軟和英偉達相繼推出自然語言理解或生成模型,對大模型技術的探索持續推進。3 3)大模型熱潮:)大模型熱潮:2022年底,基于迭代后的GPT-3.5模型構建的ChatGPT發布,引起市場廣泛關注,AI迎來新一輪發展熱潮。此后,OpenAI的GPT-4、谷歌的Gemini 1.5 Pro、Anth
7、ropic的Claude 3相繼推出,不斷提高大模型能力邊界。圖 1:AI大模型發展歷程 資料來源:AI 大模型發展綜述,太平洋證券研究院 模型層模型層持續持續迭代迭代,帶動下游應用帶動下游應用層層發展發展。類比于軟件行業,基于服務器、操作系統等硬件和系統,開發針對不同下游場景的軟件,AI產業可分為以下三個層級:1 1)基)基礎設施層:礎設施層:由計算硬件GPU和TPU、為AI計算提供專用算力的智算平臺、以及各類AI工具,如模型微調、數據標注等組成,三者共同構成了AI上層建筑的底層設施;2 2)模型)模型層:層:依托于大量訓練數據、算力資源構建的AI模型層由閉源模型和開源模型組成。兩者相輔相成
8、,共同推動AI應用發展;3 3)應用層:)應用層:AI時代的應用基于底層大模型構建。根據大模型的不同,應用層可分為基于第三方模型構建的應用和基于自建大模型構建的垂直應用兩大類。圖 2:AI產業“基礎設施+模型+應用”三層級 資料來源:生成式 AI 現狀 2023,太平洋證券研究院 1.11.1 大語言大語言模型:模型:開開、閉源共存以滿足不同閉源共存以滿足不同應用應用開發需求開發需求 雙線競爭下,閉源模型和開源模型齊頭并進。雙線競爭下,閉源模型和開源模型齊頭并進。與軟件開發和分發類似,基于代碼開發的AI大模型也面臨著閉源或開源模型源代碼和訓練數據的選擇。2022年5月,Meta宣布開源擁有17
9、50億參數的大語言模型OPT,大模型由此開啟了閉源和開源的雙線競爭。隨著模型能力的不斷迭代與突破,目前閉源大模型以OpenAI的GPT-4、谷歌的Gemini 1.5 pro、以及Anthropic的Claude 3為代表;開源大模型以谷歌的Gemma、Meta的LLaMA 3、以及Mistral的Mistral 8x7B為代表。圖 3:開源和閉源模型的發展歷程 資料來源:ChatGPTs One-year anniversary:Are Open-Source Large Language Models Catching up?,太平洋證券研究院 閉源模型閉源模型:能力優于開源,:能力優于開
10、源,是是模型模型基礎能力上限持續突破的主陣地?;A能力上限持續突破的主陣地。2023年3月,OpenAI發布最新大模型GPT-4,其不僅具備對圖文輸入生成應答文字等多模態能力,還-谷歌發布Gemini 1.0及更新后的Gemini 1.5 Pro,把上下文窗口容量再次提升。進入2024年,Anthropic發布最新大模型Claude 3,其在模型理解能力(MMLU)、推理能力(GPQA)等再次實現突破,得分超過GPT-4和Gemini 1.0 Ultra,成為目前能力最強的大模型。出于商業競爭、安全等因素的考量,這些模型仍均為閉源模型。對比它們與開源模型在基準測試中的得分,閉源模型表現明顯更為
11、突出。頭部大模型公司正憑借科研實力、人才、算力資源等優勢,成為推動模型基礎能力持續實現突破的主要力量。圖 4:閉源和開源模型在基準測試中的得分對比 公司公司 模型模型 MTMT-BenchBench AlpacaEvalAlpacaEval-2.02.0 Open LLM LeaderboardOpen LLM Leaderboard 閉源 OpenAI GPT-3.5-turbo 8.39 14.13 70.21 GPT-4 8.99 23.58 85.36 開源 Meta LLaMA 2-70B-chat 6.86 13.87-HuggingFace Zephyr-7B 7.34 10.9
12、9 52.15 Mistral Mistral-8x7B 8.30 18.26 68.42 資料來源:ChatGPTs One-year anniversary:Are Open-Source Large Language Models Catching up?,太平洋證券研究院 基于閉源模型的應用通過基于閉源模型的應用通過APIAPI實現實現,同時同時APIAPI能力提升、價格下降。能力提升、價格下降?;陂]源模型的應用開發通過連接閉源模型API的形式實現。API接口允許用戶將模型功能集成到自己的應用程序或服務中,實現數據的輸入輸出和模型功能的調用。隨著模型不斷更新迭代,模型API的能力也正
13、持續進化。以OpenAI為例,其大模型API已完成多次更新,并支持微調功能,逐步為用戶提供能力更強、更易用的API服務。其中,最新的GPT-4o API實現速度提高2倍,價格便宜50%,調用模型的速率限制較GPT-4-Turbo提高5倍。價格方面,GPT API價格呈現隨模型能力提升而下降的趨勢,最新的GPT-4o API輸入和輸出百萬tokens的價格分別為5、15美元,僅為GPT-4 API的16.7%和25%。圖 5:OpenAI大模型 API 的發布及更新情況 時間時間 事件事件 內容內容 2020.9.18 API 發布 發布用于訪問 OpenAI 開發的 AI 模型的 API,其提
14、供了一個通用的文本輸入、文本輸出接口,既簡單易用,又足夠靈活。2022.11.18 API 更新 1)完成了多項改進,包括提供更符合人類指令的指令系列模型、用于更真實的問題解答的專用端點,以及幫助開發人員減少濫用的免費內容過濾器。2)為了讓開發人員更快速、安全的完成部署,提供了一系列開發工具。3)更新了使用指南,以清晰的闡述 API 能夠生成的內容。4)引入了內容審計,以確保模型調用未被用于違法和有害的用途。2023.06.13 API 更新 1)Chat Completions API 具備新的函數調用功能,實現 GPT 模型能力與外部工具和 API 相連接的新方法。2)降低調用模型的價格。
15、2023.07.06 GPT-4 API 發布 1)向此前已成功付費的開發人員開放具有 8K 上下文的 GPT-4 API 訪問權。計劃2)因與 Chat Completions API 具有相同的功能,此前旨在讓開發者基于指令實現提示詞重新編輯的 Edits API 被棄用。2023.08.22 支持 GPT-3.5 微調的 API 發布 發布 GPT-3.5 的微調 API,以幫助開發者運行有監督的微調,從而讓 GPT-3.5 的模型能力在開發用例中表現得更好。2024.01.25 API 管理平臺發布 推出 API 使用情況和 API 密鑰管理平臺,以幫助開發者更好的管理 API 密鑰,
16、以及更清楚地了解開發應用的使用情況。2024.04.04 支持微調的 API 更新 1)更新后的支持微調的 API 能力包括在每個訓練周期內自動生成一個完整的微調模型檢查點,以減少后續重新訓練的需要;計算整個驗證數據集的損失和準確性等指標,從而更好地了解模型質量等。2)推出輔助微調產品。該產品利用了支持微調的 API 以外的技術,以最大限度的幫助開發者提高開發用例的模型性能。2024.05.13 GPT-4o API 即將發布 即將向部分合作伙伴開放 GPT-4o 模型 API,其速度提高 2 倍,價格便宜 50%,調用模型的速率限制較 GPT-4-Turbo 提高了 5 倍。資料來源:Ope
17、nAI 官網,太平洋證券研究院 圖 6:OpenAI模型 API 的價格 模型模型 輸入(美元輸入(美元/百萬百萬 tokenstokens)輸出(美元輸出(美元/百萬百萬 tokenstokens)GPT-4 30 60 GPT-4-Turbo 10 30 GPT-4o 5 15 資料來源:OpenAI 官網,太平洋證券研究院 開源模型開源模型:與閉源與閉源模型模型差距縮小差距縮小,基于基于開源模型開源模型的應用的應用通過通過finefine-tuningtuning實現實現。類比于互聯網時代開源操作系統Linux和安卓在大量開發人員貢獻代碼、報告錯誤等社區共建中實現發展,人工智能時代開源模
18、型也正在社區群策群力、共同開發的支持下,實現模型能力的逐步提升。根據ARK基金統計的開源和閉源模型在五樣本MMLU語言理解基準測試中的得分對比,開源模型與閉源模型的測試得分差距正不斷縮小。在應用開發層面,以LLaMA為例,通過繼續預訓練和指令微調的方式,應用開發者能利用自有數據對開源模型進行微調,從而獲得與應用更匹配的底層大模型。圖 7:開源和閉源模型在五樣本MMLU語言理解基準測試中的得分對比 資料來源:ARK,太平洋證券研究院 基于對閉源模型和開源模型的分析和思考,總結未來兩者發展的兩個趨勢:趨勢趨勢一一:閉源模型能力:閉源模型能力或將或將長期優于開源模型。長期優于開源模型。閉源模型能力或
19、將長期優于開源模型。雖然開源模型與閉源模型的能力差距正在不斷縮小,但通過對比開源軟件和開源大模型之間的異同,我們認為,大模型能力的提升仍存在如訓練數據的規模和質量、算力資源等開源社區無法突破的壁壘。并且,出于商業、倫理道德安全等因素的考慮,閉源模型不會將能力最強的大模型進行開源。因此,閉源模型能力或將長期優于開源模型。趨勢趨勢二二:開閉源共存以滿足不同需求,開閉源共存以滿足不同需求,基于成本和安全基于成本和安全等進行等進行選擇。選擇。連接閉源模型開放API的方式,具備調用便利、無需進行大模型本地化部署和維護的優勢;而基于開源模型,并利用數據進行微調的方式,則為專業化、定制化模型或應用的開發提供
20、了支持,兩者共存以滿足不同的開發需求。我們認為,模型或應用開發者在調用大模型能力時會基于成本及安全等因素,在開閉源模型中進行選擇。在成本方面,在成本方面,目前調用閉源模型API的費用根據使用量收取,隨著使用量的增加必然會出現調用成本與模型部署和維護成本之間的權衡。當應用調用閉源模型成本大于模型開發和維護成本時,基于開源模型開發擁有更優的成本收益比。在安全方面,在安全方面,對于數據不能輕易泄漏的場景,如公司商業決策等,利用開源模型在私域進行本地化部署是更安全的選擇。1.21.2 多模態模型多模態模型:技術持續演進,技術持續演進,混合多模態有望催生混合多模態有望催生現象級現象級應用應用 ??缒B數
21、據融合、人類認知能力模擬等研究的加深,多模態大模型不斷發展。2021年初,OpenAI率先發布文生圖模型DALLE,由此拉開多模態模型序幕。此后,文生圖領域相繼出現谷歌Imagen、Midjourney、Stable Diffusion等模型,不斷推升文生圖模型能力。在音樂領域,文生音樂模型Suno V3高質量的音樂創作能力讓文生音樂開始受到市場關注。在視頻領域,Runaway Gen-2、Pika等不斷提高生成視頻質量,此后OpenAI Sora不僅將視頻長度提升至60秒,還讓視頻具備了3D一致性。此外,谷歌推出創新性的AI生成式交互環境Genie,實現由單張圖像提示生成交互式視頻。多模態模
22、型正在頭部AI公司與細分賽道領先者的共同推動下持續突破,技術愈發成熟。圖 8:多模態模型的發展歷程 資料來源:太平洋證券研究院整理 混合多模態混合多模態實時交互實時交互變革人機交互方式變革人機交互方式,有望催生強交互性場景應用有望催生強交互性場景應用。隨著圖像、音頻、視頻多模態技術的不斷發展,OpenAI發布集成文本、圖片、語音、視頻的全能混合多模態模型GPT-4o,谷歌發布實時多模態AI助手Project Astra。這兩個產品均實現了跨模態的實時推理,能將文本、圖像、語音、視頻的任意組合作為輸入,生成文本、圖像、語音、視頻的任意組合輸出,具備實時語音及視頻交互的能力,與人和世界交互的方式一
23、致。我們認為,混合多模態的實時交互改變了用戶與機器交互的方式,有望在強交互性場景中催生現象級應用。userid:93117,docid:163817,date:2024-06-04,圖 9:OpenAI GPT-4o 演示 圖 10:谷歌 Project Astra 演示 資料來源:OpenAI 官網,太平洋證券研究院 資料來源:谷歌官網,太平洋證券研究院 2.2.應用層:應用層:文本編輯文本編輯類類最成熟,最成熟,國內有望復制海外路徑國內有望復制海外路徑 2.12.1 應用分類:應用分類:文本文本編輯編輯類類數量最多數量最多、訪問量訪問量最最高高 全球訪問量前全球訪問量前1 100 00 A
24、IAI應用可分為應用可分為文本文本編輯編輯、代碼、代碼編程編程、圖像、音視頻、圖像、音視頻/游戲四大游戲四大類類。按照生成內容形式的不同,4月全球訪問量前100網頁版AI應用可劃分為基于大語言模型的文本編輯類和代碼編程類應用,以及基于多模態模型的圖像類和音視頻/游戲類應用。對四大分類涉及的24個細分類目進行統計:文本編輯類應用涉及的領域最廣,包括聊天機器人、搜索引擎、虛擬角色、翻譯工具等14個細分類目;代碼編程類、圖像類和音視頻/游戲類應用則分別包括2、4、4個細分類目。圖 11:按生成內容形式劃分全球訪問量前100的網頁版AI應用 基于大語言模型基于大語言模型 基于多模態模型基于多模態模型
25、文本編輯文本編輯類類 代碼編程代碼編程類類 圖像圖像類類 音視頻音視頻/游戲游戲類類 聊天機器人 代碼助手 圖像生成&編輯 音頻生成 搜索引擎 網頁搭建 圖像生成 視頻生成 虛擬角色 圖像編輯 視頻編輯 翻譯工具 PPT 工具 游戲生成 寫作工具 內容檢測 生產力 ChatPDF 教育 金融 電商購物 營銷工具 法律助手 旅游計劃 資料來源:太平洋證券研究院整理 四大類應用中四大類應用中文本文本編輯編輯類類技術技術最成熟,最成熟,音視頻音視頻/游戲類游戲類技術技術發展潛力最大。發展潛力最大。應用層基于模型層進行開發,因此在技術層面模型的成熟程度就決定了應用的成熟程度。具體來看,基于此前自然語言
26、處理等相關技術積累、文本數據獲取和處理難度相對較低等因素,AI文本生成技術最早發展起來。從1966年世界上第一個聊天機器人Eliza誕生,到2022年ChatGPT發布,近60年的發展讓AI文字生成技術及應用的成熟度最高。同時,隨著模型架構、多模態數據處理等技術的不斷突破,圖像、音視頻等跨模態內容的生成技術及應用嶄露頭角。但因發展時間相對較短,其在技術路徑探索上仍存在較大發展潛力。我們認為,大模型作為支撐AI應用發展的底層技術,模型能力決定了應用體量的下限,模型能力與應用場景的適配度決定了應用體量的上限。圖 12:AIGC技術的成熟應用進程時間表 資料來源:紅杉資本,太平洋證券研究院 四大類應
27、用中四大類應用中文本編輯類文本編輯類數量數量最多、最多、訪問量訪問量最最高高,圖像類,圖像類次之次之。底層大模型的技術差距造成了應用智能程度、用戶體驗等的不同,從而使得目前不同分類應用的數量和訪問量呈現出明顯的不同。在四大類應用中,文本編輯類應用數據表現突出:從應用數量來看,4月訪問量排名前100的應用數量最多,占比達58%,訪問量過億的8個應用有7個為文本編輯類;從訪問量來看,文本編輯類應用訪問量總和達60.4億,顯著高于其他分類。此外,圖像類應用成為多模態技術演進中最先發展起來的類目,4月訪問量排名前100的應用數量占比達23%,訪問量總和達9.16億,僅次于文本編輯類。圖 13:4月全球
28、訪問量前100的各類AI應用占比(%)圖 14:4月全球訪問量前100的各類AI應用訪問量(萬)文本編輯類58%圖像類23%音視頻/游戲類11%其他6%代碼編程類2%60403719899158913907 2.22.2 海內外應用海內外應用對比對比:整體整體差距較大差距較大,國內有望復制海外發展路徑國內有望復制海外發展路徑 海海內內外外前前十十應用應用訪問量存在訪問量存在約約4 46 6倍差距倍差距,國內尚未出現國內尚未出現超超級級應用應用。目前海內外AI應用仍存在較大差距。從進入全球訪問量前100的應用數量來看,海外共94個應用入榜,而國內僅有Kimi、百度文心一言等6款應用入榜;從訪問量
29、來看,海外前十AI產品的訪問量共計55.02億,而國內僅1.20億,兩者存在約46倍的差距。此外,海外訪問量第一的應用ChatGPT訪問量達18.6億,而國內訪問量第一的應用Kimi訪問量僅2004萬,兩者存在約93倍的差距(在國內AI產品榜中排名第一的為百度文庫AI功能,但因其為在百度文庫網頁上新的AI功能,訪問量或包含未使用AI功能的訪問,因此本文選取Kimi的訪問量進行對比)。圖 15:4月海內外前十 AI產品訪問量總和(萬)對比 圖 16:4月海內外首位 AI產品訪問量總和(萬)對比 資料來源:AI 產品榜,太平洋證券研究院 資料來源:AI 產品榜,太平洋證券研究院 國內應用持續國內應
30、用持續縮小與海外縮小與海外應用應用的差距的差距,頭部頭部應用應用高速增長高速增長。對比2024年2-4月海內外排名前十的AI產品訪問量總和,兩者差距從2月的163倍逐漸縮小至4月的46倍。并且,根據4月訪問量增速全球前50網頁版AI產品榜單,有8個國內應用入榜,且其中7個應用為國內訪問量前十應用,表明國內頭部應用正高速增長。我們認為,國內AI應用正隨底層大模型持續追趕海外主流大模型不斷發展,多個頭部應用增速表現亮眼,靜待超級應用出現。55018712007海外國內4646倍倍1860002004ChatGPTKimi9393倍倍圖 17:2024年2-4月海內外訪問量前十的AI產品訪問量總和(
31、萬)對比 資料來源:AI 產品榜,太平洋證券研究院 圖 18:進入4月全球訪問量增速前50的國內AI應用 全球全球增速排名增速排名 國內國內訪問量排名訪問量排名 名稱名稱 增速(增速(%)4 4 月訪問量(萬)月訪問量(萬)1 4 360AI 搜索 1303.09 1188 3 7 天工 AI(昆侖萬維)122.58 408 11 2 Kimi(Moonshot)60.20 2004 14 5 秘塔 AI 搜索 54.56 1086 18 16 liblib.art 51.26 207 35 6 阿里通義千問 33.33 690 37 8 AiPPT.cn 32.46 353 42 10 抖音
32、豆包 27.11 345 資料來源:AI 產品榜,太平洋證券研究院 國內頭部應用集中于文本編輯類,國內頭部應用集中于文本編輯類,國內有望復制海外發展路徑國內有望復制海外發展路徑。從應用分類來看,目前訪問量及增速表現亮眼的國內頭部應用主要集中于文本編輯類,且有一個圖像類應用AiPPT.cn入列,與海外應用的發展類似。展望未來,國內AI應用有望復制海外應用的發展路徑。文本編輯類應用率先發展,圖像類應用次之,且文本編輯類有望最先出現超級應用。48779853602755018729935699120072月3月4月海外國內163163倍倍9494倍倍4646倍倍圖 19:4月訪問量及增速表現亮眼的國
33、內AI應用 國內訪問量排名國內訪問量排名 二級分類二級分類 三級分類三級分類 名稱名稱 4 4 月訪問量(萬)月訪問量(萬)增速(增速(%)全球增速排名全球增速排名 1 文本編輯類 寫作工具 百度文庫 AI 功能 3896-5.46-2 聊天機器人 Kimi(Moonshot)2004 60.20 11 3 聊天機器人 百度文心一言 1691 13.91-4 搜索引擎 360AI 搜索 1188 1303.09 1 5 搜索引擎 秘塔 AI 搜索 1086 54.56 14 6 聊天機器人 阿里通義千問 690 33.33 35 7 聊天機器人 天工 AI(昆侖萬維)408 122.58 3
34、8 圖像類 PPT 工具 AiPPT.cn 353 32.46 37 9 其他 模型訓練 火山方舟 346 3.56-10 文本編輯類 聊天機器人 抖音豆包 345 27.11 42 資料來源:AI 產品榜,太平洋證券研究院 3.3.海外應用梳理:海外應用梳理:模型能力決定模型能力決定體量體量下限,場景適配度決下限,場景適配度決定上限定上限 四大類應用中有四大類應用中有1 18 8個細分類目個細分類目的的5 54 4個海外個海外應用訪問量超千萬。應用訪問量超千萬。根據上文的文本編輯類、代碼編程類、圖像類和音視頻/游戲類AI應用分類,對AI產品榜統計的4月全球前100網頁版AI產品進行細分,可分
35、成24個細分類目。在此基礎上,篩選出訪問量超千萬的海外應用,得到共18個細分類目、54個應用?;谶@些細分應用對目前AI應用的發展情況進行分析。圖 20:4月全球訪問量超千萬的海外AI應用的細分類目 基于大語言模型基于大語言模型 基于多模態模型基于多模態模型 文本編輯文本編輯類類 代碼編程代碼編程類類 圖像圖像類類 音視頻音視頻/游戲游戲類類 聊天機器人 網頁搭建 圖像生成&編輯 音頻生成 搜索引擎 圖像生成 視頻編輯 虛擬角色 圖像編輯 游戲生成 翻譯工具 PPT 工具 寫作工具 內容檢測 生產力 教育 電商購物 營銷工具 資料來源:AI 產品榜,太平洋證券研究院 3.13.1 文本編輯類應
36、用:文本編輯類應用:聊天機器人最成熟,虛擬角色聊天機器人最成熟,虛擬角色和教育和教育潛力最大潛力最大 1 1)聊天機器人聊天機器人:訪問量最高,訪問量最高,加強加強與場景結合度有望提高與場景結合度有望提高體量體量上限。上限。聊天機器人是訪問量超千萬的文本編輯類應用中訪問量總和最高的細分應用,共24.5億。4月訪問量超千萬的聊天機器人應用共5個,其中OpenAI的ChatGPT和谷歌的Gemini訪問量過億,ChatGPT更是以18.6億的訪問量位列第一。聊天機器人應用是大語言模型能力的展示窗口,因此均為原生AI應用。并且,得益于大語言模型的持續迭代,聊天機器人應用的底層大模型能力較強,應用體量
37、的下限較高。但因沒有與具體場景相結合,應用體量上限受到一定的限制,頭部應用訪問量增速出現了一定程度的放緩。這類應用要提高規模天花板,則需提升與具體場景的結合度。以OpenAI為例,其推出GPT-4o提高了易用性;并且用戶可通過GPT-4o訪問應用商店GPTs,調用為特定用例定制的智能助手。對比國內,聊天機器人頭部應用Kimi、百度文心一言的訪問量均為千萬級別,與海外頭部產品均仍存在百倍差距,具備較大的增長空間。展望未來,隨著國內大模型持續追趕海外主流大模型,這類應用有望最先出現超級產品。圖 22:聊天機器人應用 名稱名稱 4 4 月訪問量(萬)月訪問量(萬)變化變化 to B/to Cto B
38、/to C AIAI 原生應用原生應用 簡介簡介 ChatGPT 186000 2.20%to B&to C 是 ChatGPT 是 OpenAI 在 2022 年 11 月底推出的基于 GPT-3.5 大語言模型的聊天機器人,目前其模型已迭代至 GPT-4?;?GPT-4 的強大能力,ChatGPT 具備自然語言對話、代碼生成、語言翻譯等功能。圖 21:文本編輯類訪問量超千萬應用的訪問量總和(億)資料來源:AI 產品榜,太平洋證券研究院 24.516.43.573.222.772.542.451.370.970.28Gemini 42749-4.54%to B&to C 是 Gemini
39、聊天機器人是 Google AI 開發的大型語言模型聊天機器人?;趶姶蟮恼Z言理解能力和文本生成能力,以及豐富的知識庫,其具備聊天、問答、翻譯等功能。Claude 6731 21.70%to B&to C 是 Claude 是 Anthropic 推出的基于 Claude3 大語言模型的聊天機器人。其擁有強大的自然語言理解能力和生成能力,具備處理數據類型靈活,實際運用場景廣泛的特點。Poe 4961-4.10%to C 是 Poe 是海外版知乎 Quora 推出的 AI 聊天機器人應用,在 Poe 上可與 ChatGPT、GPT-4、Claude-3-Opus、DALLE 3 等數百萬機器人進
40、行交談。Google Bard 3401-25.05%to B&to C 是 Google Bard 是基于谷歌對話應用語言模型LaMDA 的輕量級版本聊天機器人。隨著谷歌Gemini 模型的推出,Google Bard 已于 2024 年2 月正式更名為 Gemini。資料來源:AI 產品榜,公司官網,太平洋證券研究院 2 2)搜索引擎:搜索引擎:AIAI賦能傳統搜索是大勢所趨,賦能傳統搜索是大勢所趨,AIAI原生搜索引擎原生搜索引擎有望重塑有望重塑原有原有格局。格局。4月訪問量超千萬的搜索引擎應用共3個,其中New Bing以15.5億位列第一,作為非原生AI應用,其高訪問量反映出傳統搜索
41、引擎利用AI技術賦能原有搜索服務取得進展。Perplexity以7353萬訪問量位列第二,作為原生AI搜索引擎,其高訪問量反映出AI搜索引擎通過解決傳統搜索引擎羅列搜索結果、無法準確定位最佳答案的痛點,實現規模增長。我們認為,進入AI時代,傳統搜索引擎利用AI技術賦能原有服務將是大勢所趨,同時原生AI搜索引擎有望重塑傳統搜索引擎格局,實現較高的市場規模。與海外應用發展類似,國內也有望出現表現亮眼的AI原生搜索引擎,重構現有市場格局。圖 23:搜索引擎應用 名稱名稱 4 4 月訪問量(萬)月訪問量(萬)變化變化 to B/to Cto B/to C AIAI 原生應用原生應用 簡介簡介 New
42、Bing 155000 5.82%to B&to C 否 New Bing 是微軟基于 OpenAI 的 GPT-4 大型語言模型開發的新一代 AI 搜索引擎。具備強大的多模態對話、實時獲取最新信息、智能搜索和信息整合、來源引用和事實核查、瀏覽器集成和插件擴展等功能。Perplexity 7353 15.33%to C 是 Perplexity 是一款基于 GPT-3.5 開發的對話式 AI搜索引擎。與傳統關鍵詞搜索機制不同,其可理解用戶輸入的自然語言查詢,并以摘要和引用的形式輸出最相關的搜索答案。You 1163 12.65%to C 是 You 是由前 Salesforce 首席科學家 R
43、ich Socher 和Bryan McCann 于 2020 年創立的 AI 搜索引擎。具備AI 驅動搜索、按資料來源組織搜索結果、無廣告、注重用戶隱私等特點。資料來源:AI 產品榜,公司官網,太平洋證券研究院 3 3)虛擬角色虛擬角色:場景場景容錯率高容錯率高且體量上限且體量上限高,高,現已快速起量現已快速起量,未來,未來情感陪伴場景情感陪伴場景潛潛力最大力最大。4月訪問量超千萬的虛擬角色應用共4個,其中頭部應用Character AI的訪問量超2.6億,在全球訪問量前100產品中位列第6。值得注意的是,虛擬角色應用的使用時長在所有細分類目中的表現最為亮眼。根據4月全球人均使用時長前30榜
44、單,虛擬角色應用有8個上榜,占比超25%。排名最高的為SpicyChat,人均使用時長近20分鐘。我們認為,AI原生虛擬角色應用的高訪問量和人均使用時長一方面表明情感陪伴這一市場需求存在,技術與場景的適配度較高,應用體量上限較高;另一方面表明目前應用的設計和成熟度能滿足用戶需求、實現一定的用戶積累,應用體量下限較高。并且,未來隨著混合多模態技術逐漸成熟,人機實時交互還將有望持續提升應用體量下限。圖 24:虛擬角色應用 名稱名稱 4 4 月訪問量(萬)月訪問量(萬)變化變化 to B/to Cto B/to C AIAI 原生應用原生應用 簡介簡介 Character Al 26772 10.9
45、7%to C 是 Character.Al 是由谷歌 LaMDA 前開發者創立的虛擬角色聊天機器人,其允許用戶創建、訓練和自定義 AI 聊天機器人,具備能夠生成類似于人類文本響應并參與上下文的對話,用戶可以定制AI 伴侶的特點。JanitorAl 5008 46.73%to C 是 Janitor AI 是一個提供虛擬 AI 角色聊天的在線平臺。其允許用戶從各種預設角色中進行選擇,也可以根據自己的喜好創建自定義角色,并與這些角色進行各種類型的對話,包括角色扮演、聊天、提問等。SpicyChat Al 2162 21.05%to C 是 SpicyChat AI 是一個提供虛擬 AI 角色聊天互
46、動的在線平臺。用戶可與平臺提供的或自定義的虛擬 AI 角色進行對話互動。其具備免費、易用、無限制對話、保護用戶隱私等特點。CrushOn.AI 1792-17.14%to C 是 Crushon AI 是一個在線虛擬 AI 角色聊天平臺。其允許用戶根據自己的偏好定制原創角色,并與各種 AI 虛擬角色伴侶,包括名人、動漫角色、YouTubers 等,進行角色扮演和聊天,推動了虛擬伴侶關系和成人內容的界限。資料來源:AI 產品榜,公司官網,太平洋證券研究院 圖 25:4月全球人均使用時長前30中的虛擬角色應用 排名排名 名稱名稱 4 4 月人均使用時長月人均使用時長 9 SpicyChat AI
47、00:19:04 10 JanitorAI 00:18:01 13 CrushOn 00:16:38 14 Character AI 00:16:30 16 Chub.ai 00:15:51 18 PepHop 00:15:06 22 Charstar 00:13:44 26 Joyland 00:12:37 資料來源:AI 產品榜,太平洋證券研究院 4 4)翻譯工具:翻譯工具:功能單一,較難實現大規模用戶積累。功能單一,較難實現大規模用戶積累。4月訪問量超千萬的翻譯工具應用僅有1個,為本身就積累了一定的用戶基礎、非原生的翻譯工具DeepL,訪問量達2.77億。我們認為,目前聊天機器人已具備多
48、語言翻譯功能,未來翻譯功能更可能作為子功能集成在多功能應用中,只聚焦單一功能的翻譯工具較難實現大規模用戶積累,市場規模有限。圖 26:翻譯工具應用 名稱名稱 4 4 月訪問量(萬)月訪問量(萬)變化變化 to B/to Cto B/to C AIAI 原生應用原生應用 簡介簡介 DeepL 27711 0.51%to B&to C 否 DeepL 是一款基于 AI 技術的翻譯應用。其提供文本、語音、圖像和文件的多語言翻譯服務,支持 30 多種語言的翻譯。此外還提供了 Deep Write 寫作助手功能,輔助用戶改善寫作內容。資料來源:AI 產品榜,公司官網,太平洋證券研究院 5 5)寫作工具:
49、寫作工具:頭部應用功能類似,關注內容創作應用起量。頭部應用功能類似,關注內容創作應用起量。4月訪問量超千萬的寫作工具應用共4個,均為已有一定用戶基礎的非原生AI應用,Notion AI訪問量最高,達1.71億。從功能來看,目前訪問量破千萬的4個寫作工具應用功能類似,均集中于寫作內容的改寫、潤色等,模型能力能較好的支持功能實現,但市場規??臻g有限。展望未來,寫作生成與需要大量內容產出的場景相結合,如內容營銷、媒體出版等,有望提升寫作工具應用體量上限。關注提供內容創作功能的寫作工具起量,如訪問量位列LanguageTool之后、聚焦于故事生成的NovelAI,其4月訪問量達667萬。圖 27:寫作
50、工具應用 名稱名稱 4 4 月訪問量(萬)月訪問量(萬)變化變化 to B/to Cto B/to C AIAI 原生應用原生應用 簡介簡介 Notion Al 17112-1.84%to B&to C 否 Notion AI 是 Notion 公司發布的利用大語言模型和數據收集的寫作生成 AI。其擁有自動整理筆記、改正錯別字、列出文章重點、翻譯、制作表格等功能;具備方便用戶進行高效管理數據和任務等特點。Grammarly 7477-3.32%to B&to C 否 Grammerly 一款利用 AI 技術提供英語寫作輔助的應用。其能幫助用戶檢查文本中的語法、拼寫、標點符號和風格錯誤,并提供改
51、進建議。此外,其還能幫助用戶調整語氣、聲調,并為個人、職業寫作選擇合適的用詞。Quillbot Paraphraser 6522 2.24%to C 否 Quillbot Paraphraser 是一個在線改寫工具。其利用 AI 技術幫助用戶改寫文本,以提高原創性和清晰度;其可對句子、段落、文章或論文進行改寫,提供多種改寫選項,以滿足用戶的不同需求。LanguageTool 1127 1.94%to C 否 LanguageTool 是一款基于 AI 的多功能寫作助手,它能識別并糾正文本中的各種錯誤,包括但不限于拼寫、語法、用詞選擇等;具備改寫句子能進行全面的寫作分析,幫助用戶改進語言風格。它
52、支持超過 30 種語言,包括英語、西班牙語、德語、法語、荷蘭語和葡萄牙語等。資料來源:AI 產品榜,公司官網,太平洋證券研究院 6 6)內容檢測:內容檢測:應用需求或將隨生成式應用需求或將隨生成式AIAI普及實現增長。普及實現增長。4月訪問量超千萬的內容檢測應用共2個,訪問量較高的為非原生AI應用、在線抄襲檢測和學術誠信服務平臺Turnitin,達1722萬。從功能來看,內容檢測應用用于檢測抄襲、區分人類編寫內容和AI生成內容。主要面向B端用戶,如學校、學術機構等,也可為C端用戶提供服務。我們認為,內容檢測應用的需求或將隨生成式AI逐漸普及實現增長。圖 28:內容檢測應用 名稱名稱 4 4 月
53、訪問量(萬)月訪問量(萬)變化變化 to B/to Cto B/to C AIAI 原生應用原生應用 簡介簡介 Turnitin 1722 15.30%to B&to C 否 Turnitin 是一個在線抄襲檢測和學術誠信服務平臺,它提供了一系列的工具和功能,幫助教育機構確保學生作業的原創性。其 AI 功能,特別是其 AI寫作檢測功能,旨在幫助教育工作者識別學生提交的作業中是否使用了 AI 寫作工具。GPTZero 1118 11.07%to B&to C 是 GPTZero 一款專業的 AI 文本內容檢測工具,可幫助用戶區分人類編寫的文本和 AI 生成的文本。資料來源:AI 產品榜,公司官網
54、,太平洋證券研究院 7 7)生產力:生產力:聚焦于提升工作流效率,聚焦于提升工作流效率,瀏覽器插件表現突出。瀏覽器插件表現突出。4月訪問量超千萬的生產力應用共8個,應用功能各不相同,但均聚焦于提升個人或團隊的工作流效率。其中,訪問量排名第一的是集成在Figma白板工具FigJam中的AI助手Jambot,但其并非原生AI工具,訪問量統計或包含未使用AI助手的訪問。排名第二的是提供瀏覽器拓展功能的Liner,訪問量達6623萬,是第三名的2倍。并且,同為提供瀏覽器拓展功能的MaxAI.me,4月訪問量達1198萬,增速達219.07%,在全球訪問量增速前50 AI產品榜中排名第2。我們認為,AI
55、瀏覽器插件是生產力應用中最具潛力的應用。其能將聊天機器人、內容總結、翻譯等功能集成到現有的搜索場景中,提高用戶使用AI工具的易用性;并且,能基于現有瀏覽器大規模的用戶體量實現用戶積累。技術與場景的結合度較高,具備較高的應用體量上限。圖 29:生產力應用 名稱名稱 4 4 月訪問量(萬)月訪問量(萬)變化變化 to B/to Cto B/to C AIAI 原生應用原生應用 簡介簡介 Jambot 9157 1.53%to B&to C 否 Jambot 是由 Figma 推出的一款集成到其在線白板工具 FigJam 中的 AI 助手。其基于ChatGPT API 構建,旨在通過 AI 增強設計
56、師的工作流程和創造力,以提高他們的工作效率。其擁有創建視覺思維導圖、總結筆記、文本重構等功能。Liner 6623-6.36%to C 是 Liner 是由韓國初創公司推出的一款基于ChatGPT、專注于提高工作效率和優化流程的AI 工具,具備快速生成文章摘要、與 PDF 文檔互動、輔助寫作,與 GPT-4 模型聊天等功能。此外,該工具還提供了瀏覽器擴展,可在用戶瀏覽網頁時提供信息提取、自動摘要等即時幫助。Feedly 3212 2.81%to C 否 Feedly 是一款幫助用戶解決信息過載問題的AI 工具。通過讀取和分析文章,它可以為用戶減少閱讀時間,讓用戶專注于真正重要的話題和趨勢。Mi
57、ro 3133 4.37%to B&to C 否 Miro 是一款集成了 AI 功能的數字協作白板平臺,旨在幫助團隊在設計、項目管理、教育等多個領域提高工作效率和創造力。其具備自動化內容結構、內容識別、提供智能建議等功能。MaxAI.me 1198 219.07%to C 是 MaxAI.me 是一款旨在提高工作速度和效率的瀏覽器擴展程序,其利用 ChatGPT、Bard、Bing Chat 和 Claude 的功能來提高在線工作效率,讓用戶能在任何網站上完成簡單的重復性任務,包括使用 AI 進行寫作、一鍵總結視頻摘要等。Zapier 1079 4.04%to B&to C 否 Zapier
58、AI 是自動化集成平臺 Zapier 推出的AI 工具,旨在通過 AI 簡化自動化任務的構建。用戶只需描述想要自動化的內容,Al 工具便會自動創建步驟、編寫代碼并構建應用。DeepAl 1062 3.92%to B&to C 是 DeepAI 是集合了 AI 工具和資源的平臺,平臺擁有聊天機器人、圖像生成和編輯、虛擬角色生成、視頻生成等 AI 工具。WolframAlpha 1004 5.53%to B&to C 是 WolframAlpha 是一個計算智能引擎,為用戶提供從數學解題到科學研究、歷史事實和日常生活問題的專業級解答和分析。其能理解自然語言查詢,快速提供精確的計算結果和信息,使其成
59、為學生、教育工作者、科研人員、專業工程師和日常用戶尋求知識和解決問題的理想工具。資料來源:AI 產品榜,公司官網,太平洋證券研究院 8 8)教育:教育:場景容錯率低場景容錯率低但但體量上限體量上限高,高,未來未來有望隨有望隨模型能力模型能力提升及交互方式演進提升及交互方式演進實現增長。實現增長。4月訪問量超千萬的教育應用共3個,排名首位的為集成在卡片式學習應用Quizlet中的AI導師Q-Chat,訪問量達1.47億。原生AI教育應用也獲得了較高的訪問量,21位。我們認為,教育場景較低的容錯率意味著其對模型能力有著較高的要求,因此模型能力無法滿足低容錯率要求成為目前限制教育應用實現大規模增長的
60、關鍵因素。而教育場景的強交互性與大語言模型適配度高,因此教育應用擁有較高的規模上限。展望未來,隨著模型能力、AI生成內容準確性提升,以及用戶與AI應用交互方式從文本對話過渡到語音、視頻交互,教育場景下的AI應用訪問量有望實現增長。圖 30:教育應用 名稱名稱 4 4 月訪問量(萬)月訪問量(萬)變化變化 to B/to Cto B/to C AIAI 原生應用原生應用 簡介簡介 Q-Chat 14654 6.94%to C 否 Q-Chat 是 Quizlet 推出的以 OpenAl ChatGPT API 為基礎的完全自適應式的 AI 導師。其不僅僅是一個基本的聊天機器人,還具備幫助用戶理解
61、材料、指引學習語言,提供學習指導的功能。CheggMate 5130 4.36%to C 是 CheggMate 是一個先進的 AI 教育平臺。其提供的功能包括利用 AI 技術,分析學生的學習風格、優劣勢等以提供個性化的學習方案;為家庭作業問題提供詳細的分步解決方案;實時的家庭作業指導和支持等。Khanmigo 4736 1.56%to C 是 Khanmigo 是 KhanAcademy 推出的全球領先的免費網上教育平臺。具有可使用對話式 AI 聊天機器人與學生互動,個性化輔導,提供游戲化挑戰和活動,為教師提供有關學生學習進展的洞察的功能。資料來源:AI 產品榜,公司官網,太平洋證券研究院
62、9 9)電商購物:電商購物:集成于現有購物網站,集成于現有購物網站,較難較難脫離平臺獨立發展脫離平臺獨立發展。4月訪問量超千萬的電商購物應用僅有1個,為集成在Shopify開發的購物網站Shop內的AI購物助手,訪問量達9735萬。但因其為非原生AI應用,網頁訪問量統計值并非僅包含對Shop AI的使用。我們認為,電商購物場景中的AI應用主要提供智能導購、智能客服的功能,極大可能主要以集成在現有購物網站的形式存在,市場規??臻g較小。圖 31:電商購物應用 名稱名稱 4 4 月訪問量(萬)月訪問量(萬)變化變化 to B/to Cto B/to C AIAI 原生應用原生應用 簡介簡介 Shop
63、 AI 9735-0.59%to C 否 Shop AI 是由 Shopify 開發的購物網站 Shop 內的 AI 購物助手,其能為用戶提供個性化的購物支持,幫助客戶快速準確的找到想要購買的商品。資料來源:AI 產品榜,公司官網,太平洋證券研究院 1 10 0)營銷工具:營銷工具:技術與場景適配度高,有望技術與場景適配度高,有望革新數字革新數字營銷營銷工作流程工作流程。4月訪問量超千萬的營銷工具應用共4個,其中3個均為非原生AI應用,這一方面表明數字營銷領域內的應用正在積極利用AI技術賦能原有業務開展,另一方面說明營銷場景應用的發展需要具備一定的行業經驗積累。我們認為,數字營銷業務以數據驅動
64、、客戶具有高度實現降本增效。營銷場景與技術的高適配度有望革新數字營銷業務工作流程,營銷工具應用具備較高的應用體量上限。并且,數字營銷領域內的公司積累了一定的數據、客戶資源,具備開發AI營銷工具的優勢。未來關注由營銷公司開發的AI營銷工具起量。圖 32:營銷工具應用 名稱名稱 4 4 月訪問量(萬)月訪問量(萬)變化變化 to B/to Cto B/to C AIAI 原生應用原生應用 簡介簡介 Salesforce Al 8792 1.62%to B 否 Salesforce AI 是 Salesforce 旗下的一系列AI 產品和功能,旨在幫助企業利用 AI 來提高效率、洞察力和決策能力。其
65、包括基于 AI 的分析平臺,可幫助企業從數據中獲取洞察力;聊天機器人,可幫助企業自動化客戶服務和支持;基于 AI 的營銷平臺,幫助企業個性化營銷活動并提高投資回報率;基于 AI 的銷售平臺,幫助銷售人員提高效率并達成更多交易。Beacons Al 2.0 2276 0.29%to C 是 Beacons AI 2.0 是一個專為內容創作者設計的由 AI 驅動的一體化平臺。其提供了 AI 網站構建器、AI 電子郵件營銷、AI 廣告助手、AI內容生成、AI 聊天機器人的功能,旨在幫助內容創作者建立品牌、發展粉絲群等。Mailchimp 1539-6.38%to B&to C 否 Mailchimp
66、 是一個基于云的營銷自動化和電子郵件營銷平臺,提供集郵件發送、自動化營銷、數據分析等功能。其利用 AI 分析客戶的購買歷史和瀏覽行為,為他們推薦他們可能感興趣的產品;識別客戶的行為模式,向他們發送個性化的營銷活動;預測客戶行為,幫助企業更好的規劃營銷活動并提高客戶留存。Systeme.io 1067 21.68%to B&to C 否 Systeme.io 是一個全能在線營銷平臺,集成了營銷漏斗構建、電子郵件營銷、在線課程創建、會員管理、營銷自動化等功能。并且提供生成高轉化率的銷售文案和廣告素材、圖片、視頻等 AI 工具,幫助用戶提高營銷和銷售效率。資料來源:AI 產品榜,公司官網,太平洋證券
67、研究院 總結:總結:應用成熟多樣,應用成熟多樣,模型能力與場景適配度提升有望促進垂類場景應用發展模型能力與場景適配度提升有望促進垂類場景應用發展。目前訪問量最高的是聊天機器人應用,其次是搜索引擎應用。未來這兩類應用有望隨模型能力提升,實現用戶規模的線性增長。其次,因模型能力與場景適配度高,虛擬角色和教育應用體量上限較高;但因兩者的場景容錯率不同,使得目前的訪問量表現不同。容錯率高的虛擬角色應用受益于模型能力迭代已快速起量,而容錯率低的教育應用則有望在未來隨模型能力提升及交互方式演進實現增長。最后,翻譯工具、電商購物、營銷工具應用主要以集成于具體場景或應用的形式存在,獨立應用的體量較小。我們認為
68、,隨著國內大模型持續追趕海外主流大模型,國內AI應用有望復制海外AI應用發展路徑,最先在文本編輯類應用中取得突破。其中,聊天機器人、搜索引擎及虛擬角色應用有望最先實現訪問量的大幅增長。3.23.2 圖像類應用:圖像類應用:編輯強于生成,編輯強于生成,加深與加深與 B B 端場景融合端場景融合方能方能實現增長實現增長 1 1)圖像:圖像:多數應用集成圖像生成和編輯功能,多數應用集成圖像生成和編輯功能,僅僅提提供圖像生成供圖像生成功能的應用功能的應用體量仍體量仍較小較小。4月訪問量超千萬的圖像應用共11個,其中8個應用同時包含圖像生成和圖像編輯功能,為用戶提供從生成圖片到對圖片進行更換背景、風格轉
69、化等編輯工作的AI輔助。平面內容設計平臺Canva集成了DaLLE、Stable Diffusion等第三方模型,為用戶提供多樣化AI功能,4月訪問量超6億,在圖像應用中斷層第一,在全球產品中位列第3。2個應用僅提供圖像生成功能,它們聚焦于某一細分領域,Yodayo聚焦動漫風格的圖片生成、AI Time Machine聚焦于生成不同歷史時期和主題的人物頭像。我們認為,目前圖像應用訪問量不高,整體處在1000-2000萬水平,未來有望通過加深與B端場景融合實現規模增長。圖 33:圖像生成&編輯應用 分類分類 名稱名稱 4 4 月訪問月訪問量(萬)量(萬)變化變化 to B/to Cto B/to
70、 C AIAI 原生應用原生應用 簡介簡介 圖像生成&編輯 Canva 61297 3.45%to B&to C 否 Canva 是一個可用于創建社交媒體圖形、演示文稿、海報、文檔和其他視覺內容的平面設計平臺。其 AI 圖像生成器 Text to Image 基于 Stable Diffusion 文生圖模型,可將用戶輸入的文本提示轉換成視覺圖像。其提供的功能包括 AI 圖片生成、AI 背景去除、AI 魔術摳圖、為圖像添加動畫效果等。Leonardo.AI 1757-8.81%to B&to C 是 Leonardo.AI 是一個由 Stable Diffusion 驅動的高質量圖片生成平臺,
71、其深度集成了Stable Diffusion 的各種插件,以幫助用戶生成圖像,具備 OpenPose 姿勢參考、局部重繪、prompt 提示等功能。此外,還提供畫布編輯器等功能。Midjourney 1744-8.02%to C 是 Midjourney 是一個基于 AI 技術的圖像生成工具,能根據用戶輸入的文本提示詞或圖片生成高質量的圖像。提供圖像拓展、背景替換、圖像移除等功能。其最新版本 V6 在圖像質量、語義理解、圖像放大等方面進行了改進,提高了模型對細節的捕捉能力。Cutout Pro 1646 2.31%to B&to C 是 Cutout Pro 是一個提供 AI 圖像和視頻處理功
72、能的平臺,旨在簡化圖像和視頻的編輯和設計過程。其提供包括 AI 背景移除、照片增強和放大、AI 驅動的編輯工具等。Fotor 1505-1.04%to C 否 Fotor 是一款圖片編輯和平面設計應用,可利用 AI 來增強照片、創建設計和拼貼畫。其提供的功能包括 AI 文生圖、一鍵增強、智能美膚、背景移除、畫質修復、AI 設計模板、AI拼圖工具等。Photoroom 1287 9.94%to B&to C 是 Photoroom 由法國巴黎初創公司發布的一款AI 在線照片編輯平臺,旨在幫助個人和商業用戶提高照片專業程度,特別是在電商行業和內容創作領域。其提供的功能包括 AI 文生圖、快速去除背
73、景、AI 生成背景、調整圖片Pixlr 1239-3.97%to B&to C 否 Pixlr 一款基于云的圖像編輯和設計工具,旨在利用 AI 技術簡化圖片編輯過程,并提供多種功能來幫助用戶創建設計作品。其提供的功能包括 AI 圖像生成器,AI 背景去除、AI圖像填充、AI 圖像擴展、AI 人像編輯、AI 風格遷移等。SeaArt 1026-7.40%to C 是 SeaArt 是一個 AI 圖片生成和編輯工具,它允許用戶通過輸入文本提示詞來生成高質量的圖片。并且,還提供多種圖片風格和預設供用戶選擇,以及多種可用于微調圖像的高級編輯工具。圖像生成 Yodayo 1711 11.44%to C
74、是 Yodayo 是一個專為虛擬 YouTuber(VTuber)和動漫愛好者設計的 AI 藝術平臺。其 AI 功能能根據文字或圖片自動生成高質量的動漫風格藝術作品。此外,該平臺還設置了動漫虛擬角色聊天功能,并且為動漫迷提供了探索、分享和與其他動漫愛好者交流的空間。Al Time Machine 1131-9.01%to C 是 AI Time Machine 是一款由 MyHeritage 開發的基于 AI 技術的虛擬頭像生成工具。通過對上傳照片進行分析,識別照片人物面部特征,可生成適配各種歷史時期或主題的人物頭像。圖像編輯 Remove.bg 6015 0.20%to B&to C 否 R
75、emove.bg 是一款基于 AI 技術的自動去除圖片背景在線工具。其能檢測圖像中的物體邊緣,并自動去除背景,以獲得透明背景或替換為新背景的圖片。此外,還支持編輯背景、調整圖片大小、添加文本等功能。資料來源:AI 產品榜,公司官網,太平洋證券研究院 2 2)PPTPPT工具:工具:旨在提高效率、輔助設計,市場規??臻g旨在提高效率、輔助設計,市場規??臻g較為較為有限。有限。4月訪問量超千萬的PPT工具應用共3個,均為旨在提高制作效率及提供AI輔助設計的非原生AI應用,訪問量在1000-2000萬之間。我們認為,PPT工具應用市場規??臻g較低,與圖像應用類似,模型能力提升是其訪問量進一步增長的關鍵
76、。對比國內,目前國內PPT工具應用訪問量最高的為AiPPT.cn 353萬,位列國內AI產品訪問量第8,仍與海外產品存在3-6倍的差距,具備一定的增長空間。圖 34:PPT工具應用 名稱名稱 4 4 月訪問量(萬)月訪問量(萬)變化變化 to B/to Cto B/to C AIAI 原生應用原生應用 簡介簡介 prezi 2004 5.82%to B&to C 否 Prezi 是一款基于云端的演示文稿制作工具,通過利用 AI 技術來增強演示文稿并使其更具吸引力。其提供智能模版、AI 輔助設計、演講者教練幫助用戶練習演講、實時分析以幫助用戶了解觀眾對 PPT 的反應等功能。Gamma 1431
77、 25.35%to C 否 Gamma 是一款由 AI 驅動的演示文稿制作工作,旨在幫助用戶快速創建易于實時討論或異步共享的演示文稿,包括 PPT、網頁、博客等格式。其具備制作模板多樣,AI 自動化,內容模塊化等特點。SlidesGo 1234 7.82%to C 否 SlidesGo 是一款專注于演示文稿設計的在線平臺,提供了大量 PPT 模板和幻燈片設計元素,幫助用戶快速創建專業演示文稿。具備快速生成、在線編輯演示文稿等功能。資料來源:AI 產品榜,公司官網,太平洋證券研究院 總結:總結:編輯強于生成,編輯強于生成,模型能力模型能力提升是關鍵。提升是關鍵。目前多數圖像應用都集成了圖像生成和
78、圖像編輯功能,而受限于多模態模型能力,圖像編輯功能強于圖像生成功能。并且,目前圖像應用的訪問量在1000-2000萬之間,仍處于低位,未來有望通過加深與B端場景融合實現規模增長。3.33.3 音視頻音視頻/游戲類應用:游戲類應用:場景上限最高,場景上限最高,模型能力仍模型能力仍處探索期處探索期 1 1)音音頻頻生成:生成:多模態領域首個多模態領域首個UGCUGC應用應用表現亮眼,表現亮眼,面向面向B B端具備更大市場空間端具備更大市場空間。4月訪問量超千萬的音頻生成應用共2個,包括音樂生成應用及語音生成應用。其中,音樂生成應用Suno V3因可根據文本生成高度逼真、風格多樣的音樂備受市場關注,
79、4月訪問量達3176萬,在全球前100AI應用中排名第26;語音生成應用Eleven Labs具備文本轉語音、生成克隆聲音等功能,4月訪問量達2017萬,在全球前100AI應用中排名第32。我們認為,作為多模態領域的首個UGC應用,Suno V3收獲了超3000萬的訪問量,為目前多模態應用最高。這表明UGC應用可釋放用戶內容品類創新潛力,吸引大量用戶加入,為未來多模態應用發展的重要方向之一。但受限于音樂應用的商業模式,音樂生成應用的市場規?;蜉^為有限。而可面向B端客戶提供服務的語音生成應用具備更大的市場空間。圖 35:音頻生成應用 名稱名稱 4 4 月訪問量(萬)月訪問量(萬)變化變化 to
80、B/to Cto B/to C AIAI 原生應用原生應用 簡介簡介 Suno Al 3176 38.04%to C 是 Suno AI 是一款強大的 AI 音樂生成器。它可以將文本轉化為高度逼真的音樂和語音,支持多種音樂風格,如電影、RAP、翻唱等,并提供了多語言和不同性別的聲音選擇。目前其 V3 版本是首個能生成廣播質量音樂的模型,該版本在音頻質量、音樂風格的多樣性、對提示詞的遵從性等方面都有顯著提升。Eleven Labs 2017 0.40%to B&to C 是 Eleven Labs 是一個提供創建和編輯 AI 生成音頻內容的平臺。其允許用戶創建高質量的 AI 語音,用于文本轉語音
81、和角色 AI 生成,并且還提供即時和專業的聲音克隆服務,以 20 多種語言在數百種新聲音和現有聲音中生成語音的功能。資料來源:AI 產品榜,公司官網,太平洋證券研究院 2 2)視頻編輯視頻編輯&生成生成:革新視頻制作流程,未來有望出現現象級視頻革新視頻制作流程,未來有望出現現象級視頻UGCUGC應用應用。視頻應用包括視頻生成和編輯應用。其中,視頻生成領域已有多個模型發布,如Runaway Gen-2、Pika、Sora等,但受限于模型能力,尚未有訪問量超千萬的應用出現。視頻編輯應用方面,表現強于生成,目前訪問量超千萬的2個視頻應用均為視頻編輯應用。除了為C端用戶提供更方便快捷的視頻編輯工具外,
82、這2個應用還面向B端客戶提供便于團隊協作的編輯功能,進一步擴大市場規模。我們認為,未來隨著模型能力提升,視頻應用有望革新視頻制作流程,提升制作效率,釋放創作者創作潛力。并且,降低IP內容升維門檻,實現IP內容資產價值重估。此外,面向C端用戶的UGC應用是視頻領域出現現象級應用的重要方向。視頻UGC應用有望釋放用戶內容創新潛力,在一定規模的用戶基礎上,實現優質視頻創作與分享、吸引更多用戶進入應用的正向循環。圖 36:視頻編輯應用 名稱名稱 4 4 月訪問量(萬)月訪問量(萬)變化變化 to B/to Cto B/to C AIAI 原生應用原生應用 簡介簡介 Loom 1888-0.79%to
83、B&to C 否 Loom 是一個具有 AI 功能的視頻錄制和共享平臺,允許用戶錄制屏幕和攝像頭畫面,并將其分享給他人。其 AI 功能可實現自動為視頻添加字幕,生成視頻摘要,識別視頻中的亮點并標記等。Veed.io 1335 7.98%to B&to C 否 Veed.io 是一個在線 AI 視頻編輯工具。其具備自動為視頻添加字幕,使用文本轉語音功能生成畫外音,為視頻添加特效、轉場、音樂音效,為視頻內容進行翻譯,為視頻創建并添加虛擬人物等功能。具有操作簡單、支持多層軌道編輯等特點。資料來源:AI 產品榜,公司官網,太平洋證券研究院 3 3)游戲生成:游戲生成:實時視頻生成實現有望撬動更大市場實
84、時視頻生成實現有望撬動更大市場,游戲,游戲UGCUGC應用應用釋放玩家創作釋放玩家創作潛力潛力。目前游戲生成應用的底層模型能力仍處在探索期,尚未出現表現亮眼的相關應用。4月訪問量超千萬的僅有非原生AI應用,由游戲引擎公司Unity開發的實時3D互動內容創作和運營平臺。展望未來,隨著2D、3D內容生成模型能力的逐漸提升,游戲生成應用有望革新游戲開發。并且,更成熟的實時視頻生成技術能讓視頻內容的觀眾變成視頻內容的一部分成為可能,讓游戲玩家親自參與到游戲進程中,收獲沉浸式的游戲體驗。因此,AI技術賦能游戲開發有望提高制作效率、創新玩法設計,玩家體驗升級有望進一步挖掘潛在游戲用戶,撬動更大的市場。此外
85、,游戲UGC應用有望成為C端游戲玩家共創游戲生態的重要入口。通過構建支持UGC的工具和環境,吸引大量玩家通過游戲生成應用自定義游戲內容資產,釋放游戲玩家內容創作潛力。圖 37:游戲生成應用 名稱名稱 4 4 月訪問量(萬)月訪問量(萬)變化變化 to B/to Cto B/to C AIAI 原生應用原生應用 簡介簡介 Unity 1214-0.98%to B&to C 否 Unity 是游戲引擎公司 Unity 開發的實時 3D 互動內容創作和運營平臺。其 Unity Muse AI 輔助創作平臺,能讓用戶通過輸入簡單的文本提示詞,實現快速開發游戲。其中的 Muse Chat 能利用 AI
86、搜索幫助用戶在 Unity文檔、培訓資源和支持內容中快速找到所需信息,以加快開發速度并解決問題。其 Unity Sentis 允許開發者在游戲構建中嵌入神經網絡,使得 AI 模型能夠在任何運行 Unity 的設備上運行。資料來源:AI 產品榜,公司官網,太平洋證券研究院 總結:總結:場景天花板高,未來場景天花板高,未來AIAI+UGCUGC視頻和游戲將是視頻和游戲將是C C端端應用應用的重要方向的重要方向。音視頻、游戲作為更高維度的內容形式,對應的場景天花板最高:根據共研研究院數據,2023年全球在線音頻市場規模有望增長至943億元;根據貝哲斯咨詢數據,2023年全球數字視頻內容市場規模達1.
87、15萬億元;根據伽馬數據,2023年全球游戲市場規模達1.18萬億元。但因多模態模型能力仍處在探索期,目前各類應用體量仍較低:音樂應用呈現一家獨大的格局。視頻生成應用因生成視頻質量不穩定、時長限制等因素,用戶訪問量仍未出現大規模增長。游戲生成則尚未出現表現亮眼的應用。我們認為,隨著多模態模型能力的提升,應用有望在兩個方面實現快速起量:一方面,賦能內容制作環節。如在視頻行業有望大幅降低內容生成門檻,推動內容資產價值重估,讓專業創作者能夠專注于內容創意本身。另一方面,推出面向C端用戶的UGC應用。在擁有一定用戶規模的前提下,釋放用戶內容創新潛力,實現內容制作和分享、吸引更多用戶進入應用的正向循環。展望未來,我們認為多模態現象級應用將在面向C端用戶的AI+UGC視頻和UGC游戲中誕生。