當前位置：首頁 > 報告詳情

海外科技行業專題報告：OpenAI引領多模態升級AIGC產業迎新革命-231014（21頁）.pdf

上傳人： X*** 編號：143017 2023-10-16 PDF PDF DOCX DOCX DOCX 21頁 2.14MB 打包全文圖表打包全文圖表

下載：

該報告所屬合集： 2025年ChatGPT/OpenAI報告合集

打包下載報告合集

文檔加載中……請稍候！
如果長時間未打開，您也可以點擊刷新試試。

下載報告到電腦，查找使用更方便

VIP專享文檔

書簽

分享

收藏

已收藏

版權投訴

/21

立即下載

word格式文檔無特別注明外均可編輯修改，預覽文件經過壓縮，下載原文更清晰！

三個皮匠報告文庫所有資源均是客戶上傳分享，僅供網友學習交流，未經上傳用戶書面授權，請勿作商用。

《海外科技行業專題報告：OpenAI引領多模態升級AIGC產業迎新革命-231014（21頁）.pdf》由會員分享，可在線閱讀，更多相關《海外科技行業專題報告：OpenAI引領多模態升級AIGC產業迎新革命-231014（21頁）.pdf（21頁珍藏版）》請在三個皮匠報告上搜索。

1、國泰君安證券股票研究信息科技增持評級：2023.10.14OpenAI引領多模態升級，AIGC產業迎新革命-一海外科技行業專題報告海外行業專題（香港）交易數據梁昭普（分析師）行業主要上市公司市值（億港元）0755-239766663騰訊控股29.231網易ji2767j.c5.277快手2.761證書編號S0880523010002市值合計37.269本報告導讀：OpenAI多模態全面升級，生成式AI由模型層向應用層發力，重構應用層推動AIGC產業革命。感謝秦和平對本報告的貢獻摘要：投資建議：OpenAI多模態升級引領大模型競賽，重構內客創作與交互推動AIGC產業全面爆發，推薦標的騰訊控股（0

2、700.HK）、網易-相關報告S（9999.HK）、快手-W（1024.HK）、呼理咪理-W（9626.HK）、愛奇藝（IQ.0）、云音樂（9899.HK）、心動公司（2400.HK）OpenAI多模態全面升級，構架全新交互體驗。OpenAI先后宣布推出最新文生圖模型“DallE3”及多模態模型“GPT-4V”，并將在未來兩周時間里向ChatGPTPlus和Enterprisc用戶開放，語音功能結合語音識別、轉錄及音頻生成實現語音雙向對話，圖生文功能升級支持多證券研究報告圖像處理及聚焦分析，較其他模型實現簡化Prompt精準成像，此外DallE3內容審核機制全面優化，多項緩解措施實現內容風險顯

3、著壓降。隨著Win11集成Copilot功能升級、Bing增加對DallE3模型支持，Copilot訂閱有望更好落地，AI大模型商業化空間將逐步展現。全球多模態競爭激烈，大模型能力加速革新。OpenAI深耕多模態領域多時，GPT-4V、DallE3、Gobi、CLIP等引領競賽，GoogleGemini已內部開放且算力將達到GPT-45倍，海外Meta、StabilityAI等及國內百度集團、阿里巴巴、騰訊等科技巨頭爭相布局，多模態發展趨勢明確，大模型能力持續選代下及生成式AI產業空間將加速打開。多模態推動應用層爆發，AIGC產業迎來革命。Dealroom數據顯示過去5年全球生成式AI投資總額

4、逾220億美元，其中模型制造商、應用程序占比分別達到21%、8%；國內方面，艾瑞咨詢數據顯示2023年應用層融資占比達到14.4%，其中AIGC跨模態、多模態融資占比達到42.4%、16.4%，隨著大模型生態培育、底層算力基礎設施完善及應用生態構建下2030年中國AIGC產業規模有望達到1.14萬億。我們認為，多模態模型能力將全面革新應用層，一方面通過內容理解和內容生成重塑內容生產方式，推動UGC、PGC邁向AIGC內容時代，量子位預計2023年AIGC直接內容生產仍是AIGC最大市場，游戲、視頻、視頻、音樂等內容生產形式已開始變革，創作效率及內容品質雙雙提升；另一方面，通過重構交互形式構建全

5、新內容形態并帶來全新應用場景，NewBimg重構搜索體驗展現商業化潛力，騰訊混元接入50+業務和產品取得初步效果，AIGC產業鏈全面爆發可期。風險提示：AI技術發展未及預期；AI投融資熱度消退；AI應用創新未及預期；AI應用用戶接受度未及預期。請務必閱讀正文之后的免責條款部分#page#國泰君安證券海外行業專題目錄1，OpenAI多模態全面升級，構建全新交互體驗全球多模態競爭白熱化，大模型能力加速革新.多模態推動應用層爆發，AIGC產業迎來革命.3.4.投資建議.185.風險提示.18請務必閱讀正文之后的免責條款部分2of21#page#page#國泰君安證券海外行業專題圖2ChatGPT語音

6、輸入顯示界面圖3ChatGPT完成語音轉錄后用戶可以下載語音ls lkeIdo數據來源：AIGC開放社區，OpenAI官網數據來源：OpenAI官網支持多圖像處理及聚焦分析，圖生文應用場景再拓寬。本次更新后，圖生文功能全面升級并具備以下特點：1）支持多張圖像處理：用戶可以同時將一張或多張相關圖像上傳至ChatGPT，ChatGPT能夠同時理解和處理多個圖像的信息并綜合分析；2）具備聚焦理解能力：用戶可以畫筆工具圈出圖中要點，幫助ChatGPT理解自身需求，獲得更加精確的反饋；3）多模態理解能力：基于GPT-3.5及GPT-4的多模態技術支持，ChatGPT可以全面識別并綜合分析圖像中的文本及圖

7、案，包括照片、截圖、文本及圖案等等，提供更具體的指導和建議，進而擴大其應用場景和實用性。在OpenAI官方應用案例中，用戶使用繪圖工具固選自行車的特定零件后，ChatGPT綜合用戶的多輪提問及圖片列示了調低自行車座椅的詳細操作步驟，并且幫助用戶在工具箱中挑選了合適的工具。圖4ChatGPT結合DALLE3基于圖片對話圖5DALLE3提供繪圖工具強調特定部分Retake數據來源：OpenAI官網數據未源：OpenAI官網請務必閱讀正文之后的免責條款部分4of21#page#國泰君安證券海外行業專題圖6ChatGPT根據用戶輸入圖片反饋圖7ChatGPT根據多個圖片同時推理反饋數據來源：OpenA

8、I官網數據未源：0penAI官網簡化Prompt精準成像，創作全新交互體驗?，F階段，不論是閉源的Midjourney還是開源的StableDiffusion，用戶都需要向系統提交清晰且完整的Prompt才能得到自己想要的圖片。隨著DALLE3融入ChatGPT后，ChatGPT將成為文生圖提示詞工程師，通過自身多回合對話的能力輔助用戶通過自然語言表達自身需求并與DALLE3溝通，最終生成圖片，從而更加精準地控制DALLE3生成的圖片效果。從實測效果來看，DALLE3能夠更加精準地理解用戶要求，較DALLE2、Midjourney、SDXL等均有更加的成像效果，同時還能夠在圖片中標注文字、完善故

9、事插畫、生成貼紙等等，創造了全新的交互體驗，有望推動內容產業鏈的創作效率進一步提升。圖9ChatGPT結合DALLE3快速生成不同風格的圖8結合ChatGPT后DALLE3能夠在圖像中標圖像注文字數據來源：OpenAI官網數據未源：OpenAI官網請務必閱讀正文之后的免責條款部分5of21#page#國泰君安證券海外行業專題圖10Midjourney和DALLE3成像效果對比圖11SDXL和DALLE3成像效果對比數據來源：Midjoumey，OpenAI官網，新智元數據來源：StableDifiusionXL，OpenAI官網，新智元內容審核機制持續優化，多項緩解措施壓降內容風險。另一方面，

10、根據DALLE3技術報告，在ChatGPT的審核系統PromptTransformations檢測的基礎上，DALLE3圖生文功能增加了多項緩解措施，以提升其安全性及可靠性，降低生成式內容潛在風險。語音功能方面，新的語音技術能夠僅通過幾秒鐘的真實語音創造出通真的合成聲音，為不法分子合成詐騙、詳榜、色情的虛假信息或盜用他人身份提供了可乘之機，因此OpenAI目前僅在“語音聊天”該特定場景中推出這項功能。圖像功能方面侵犯知識產權以及倫理挑戰仍是AIGC共同面臨的重大挑戰，因此DALLE3增加了敏感內容拒絕、提示輸入分類器、屏蔽列表、提示改寫、因像輸出分類器等，檢查并組織違規內容生成。以圖像輸出分類

11、器為例，DALLE3通過內置圖像輸出分類器對查詢請求及輸出內容進行了限制，一旦分類器被激活，將在輸出之前阻止生成：1）暴力、優恨、成人等內容的圖像；2）偏見、歧視、丑化公眾人物的圖片；3）文化偏見的圖像；4）虛假新聞、名人、公眾人物圖像；5）在世藝術家風格相似的圖像；6）化學、生物學、物理學等存在謂誤圖像。根據OpenAI報告所示，DALLE3能夠把這種提示沒有要求但生成裸體、或是令人反感的圖像風險降低到了0.7%，未來將進一步加強圖像水印、研發標記等領域，進一步確保版權內容及其他內容得以保護。圖12DALLE3圖像輸出分類器實現圖像去性化圖13DALLE3圖像輸出分類器今圖像風格更保守數據未

12、源：DALLE3SystemCard數據未源：DALLE3SystemCard注：左圖為DALLE3發布前效果，右圖為DALLE3發布后效果請務必閱讀正文之后的免責條款部分6of21#page#國泰君安證券海外行業專題圖14DALLE3發布前會生成虛假公眾人物圖像圖15DALLE3對化學、生物學等進行勘誤數據來源：DALLE 3 System Card數據未源：DALLE3SystemCardWin11集成Copilot多功能升級，DALLE3融合Bimg釋放商業化價值。根據微軟官網，9月26日，CopilotA助手正式集成至Windows11免費更新，為商業客戶提供150多項AI輔助功能，涵

13、蓋畫圖、照片、剪貼板等應用程序，計劃于11月1日面向企業客戶全面推出Microsoft365Copilot，定價為30美元每月每用戶。相較于目前微軟長期提供的Microsoft365BusinessStandard、Premium、E3、E5四類SaaS服務，Copilot定價為每月每用戶30美元，推動Microsoft原四類單位服務價格提升240%、136%、83%、53%，Copilot通過簡化辦公流程、提升辦公效率等價值創造打開大模型應用商業化價值。圖16Win11更新后畫圖板能夠實現文生圖圖17Copilot推動Microsoft365ARPU顯著提升Copilot訂閱費用/$每月每用

14、戶100+53%80%88+70+136%60+240%50403020Microsoft 365Microsoft365Micr3BusinessBusinessStandardPremiun數據來源：微軟官網數據來源：微軟官網與此同時，10月3日，微軟宣布Bimg將增加對OpenAI最新DALLE3模型的支持，用戶可以通過微軟圖像創作器及BingChat聊天界面兩種途徑使用最新的DALLE3模型，能夠根據用戶的搜索歷史更輕松地通過自然語言提示生成逼真且個性化的答案，此外Bimg搜索引攀還將提供全新的人工智能購物體驗。DALLE3推動C端及B端用戶交互體驗全面升級，有助Copilot及整體訂

15、閱價格更好地落地，繼而進一步打開AI大模型商業化空間。請務必閱讀正文之后的免責條款部分7of21#page#國泰君安證券海外行業專題圖18MicrosoftCopilot產品線對比Microsoft Copilot commercial SKU line-upCopilotinBing ChatMicrosoft365WindowsEnterpriseCopilotMicrosoft Copilot UxVBingChat(LLM+Web）Commercial Data ProtectionMicrosof365 EnterpriseSecurity PrvacyandComplianceMi

16、crosoft365ChatMicrosoft365Apps數據來源：微軟官網2.全球多模態競爭白熱化，大模型能力加速革新OpenAI深耕多模態領域，GPT4V、DALLE3、Gobi等引領市場?；仡橭penAI沿草，OpenAI成立于2015年，成立初期重點研究機器學習和自然語言處理領域；2018年6月，OpenA推出預訓練模型GPT-1，雖已具備強大語言生成能力，但規模和效果還有待改進，模型參數由一代的1.5億增至15億；2020年5月，OpenAI正式公布GPT-3的研究成果，其參數高達1750億，成為當時全球最大的預訓練模型，直至2022年4月GPT-4問世，實現多模態發展，而且支持圖

17、像、文本輸入輸出，并支持多國語言，回答準確性顯著提高，2023年9月，OpenAI宣布推出多模態模型GPT-4V，新增了語音、圖像交互功能，并即將向ChatGPTPlus和Entcrprise用戶推出。與此同時，文生圖大模型DALLE系列不斷升級換代，2021年1月，OpenAI推出DALLE模型，時隔三個月后，升級版DALL-E2出現，生成圖像分辨率是DALLE的四倍；2023年9月21日，最新的DALLE3版本官宣集成ChatGPT，并將于10月3日向Big用戶開放。OpenAI另一類大模型為2021年1月發布的CLIP，類似于GPT-2和GPT-3的”zero-shot”，能有效地從自然

18、語言監督中學習視覺概念，應用于任何視覺分類基準。此外，根據TheInformation，OpenAI應對模型競賽不斷加碼，積極籌備專注于多模態大模型的Gobi，進一步實現多模態發展。多模態大模型技術壁壘更高、可拓展性更強，為OpenAI大模型的重點發展方向，亦為AI大模型廠商未來的爭奪焦點，而GPT4V的發布進一步印證了OpenAI多模態領線的決心，大模型參數能力升與多模態發展下，大模型能力有望迎來更快速的提升。表10penAI深耕多模態領城多時時間事件作為AI研究實驗室，由馬斯克、YC總裁阿爾特受、PayPal聯合創始人彼得常爾等硅谷科技大亨創立2015/12/122016/4/27發布Op

19、enAIGym的公測版本，這是一個加強OpenAI研究領域的平臺請務必閱讀正文之后的免責條款部分8of21#page#國泰君安證券海外行業專題2016/12/5發布Universe，這是一個用于開發和測試AI的平臺、游戲和其他應用程序OpenAI推出第一代GPT。將Transformer與無監督的預訓練技術相結合，其取得的效果好于當時的已知算2018/6/11法。2019/2/14OpenAI推出了GPT2。GPT-2模型有15億參數，基于800萬網頁數據訓練2019/4/25發布MuseNet，可以用多達10種不同的樂器和任何流派創作4分鐘的音樂作品2019/7/22低軟投資OpcnA110

20、億美無，雙方將揭于合作為AZUTC云端千臺服務開發人工智能技術2019/11/515億參數的完整版本的GPT-2預訓練結果發布。2020/5/28OpenAI正式公布了GPT-3相關的研究結果，其參數高達1750億，這也是當時全球最大的預訓練模型。2020/6/17OpenAI發布了ImageCPT模型，將GPT的成功引入計算機視覺領域。2020/9/22微軟與OpenAI合作，獨家獲取了GPT-3語言模型的使用許可OpenAI發布CLIP，它能有效地從自然語言監督中學習視覺概念。CLIP可以應用于任何視覺分類基準，只需2021/1/5提供委識別的視覺類別的名稱，類似于CPT-2和GPT-3的

21、zero-shot能力圖1d0V2021/1/5生成圖像。2022/1/27OpenAI發布了InstructGPT。這是比GPT3更好的遵循用戶意圖的語言模型，同時也讓它們更真實。2022/4/8發布DALLE22022/5/24OpenAI新版本的GPT-3和Codex發布，新增了編輯和插入新內容的能力。2022/11/30OpenAI發布AI聊天機器人平臺ChatGPT2023/1/23OpenAI宣布與微軟深度合作，并完成了百億規模的融資OpenAI發布了定價每月20美元ChatGPTPIUS付費版，實現高峰時段免排隊、快遞響應以及優先獲得新功2023/2/1能和改進等。2023/2/

22、21ChatGPT，AZUTe的OpenAI服務將允許開發者訪問AI模型OpenAI發布GPT-4大模型，不僅實現多模態，而且支持圖像、文本輸入輸出，擁有強大的識圖能力，文字數量全面提升，并支持多國語言，回答準確性顯著提高，比ChatGPT更聰明。隨后，微軟空布在Office套2023/3/14件、必應技索等產品中接入GPT-4技術。隨后，OpenAI宜布增加新功能，支持插件和必應搜索，實現“聯網”功能。2023/3/24OpenAI宣布ChatGPT支持第三方插件，解除了其無法聯網的限制。2023/3/30AutoGPT降低用戶使用GPT4門檻將自然語言任務拆解調用GPT4的API。低較宣布

23、開放基于CPT-4技術的新Bing搜索引學，用戶只需登錄微軟賬戶使可以在移動設備、Edge瀏覽2023/5/4器、搜索引李首頁中使用Bigg聊天。OponAI公司宜布完成收購了一家數字產品初創企業Global1lluminalion，并將整個因隊納入度下，新成員2023/8/16們參與包括ChatGPT在內的核心產品開發。而這是OpenAI公司成立八年未的首次公開收購。2023/8/22GPT-3.5Turbo微調版本已推出OpenAI發布最新AI繪畫模型DALLE3，全面集成ChatGPT，并大幅提升了AI效果，預計下個月起可以通2023/9/21過ChatGPT對話框直接得到圖像反饋202

24、3/9/25Enterprise用戶推出。語音輸入輸出允許用戶通過語音與ChatCPT進行交互，圖像輸入輸出則能讓用戶通過上傳圖片獲取相關信息2023/10/3微軟宣布DALL-E3模型面向所有BingChat用戶開放數據來源：OpcnAI官網，微軟官方Blog，智東西，36負，界面新聞，新智元，國泰君安證券研究請務必閱讀正文之后的免責條款部分9of21#page#國泰君安證券海外行業專題圖19大模型參數達到一定規模后更多能力會逐步“涌現”-LaMDAChinchillaGPT-3一PaLM-Random-Gophe（A）Mod.arithmetic（B）IPAtransliterate（C）

25、 Word unscramble（D）Persian QA0500偽方臺8崗送出BLEU1010區010221024101810201022102410181020102210241018 10201018 1020（E)TruthfQA（F）Grounded mappings（G）Multi-taskNLU（H）Wordinconte70707070606060388303%3%402010101021102410241020102210201022102010221020全球AI龍頭競爭白熱化，多模態發展趨勢明確。海外方面，AI龍頭廠商谷歌于2023年5月宣布PaLM2大模型，并稱其在部分

26、任務上超越GPT-4，同時谷歌的研究重心正轉向開發支持文字、圖片、語音等多模態大模型Gemimi，并已于2023年9月向部分公司開放使用及測試權限，SemiAnalysis預估Gemii算力將達到GPT-4的5倍，未來有望集成到GoogleCouldWrtexAI等服務中。此外，海外企業英偉達的Megatron-Turing，Stability AI 的 Stable Diffusion.Meta 的 ImageBind、SAM、DINOv2也在多模態模型領域表現不俗。國內方面，百度集團的文心一言是國內首個對標ChatGPT的大語言模型，不僅能依據用戶指令進行文學創作，還具備商業文案創作、數理

27、推算、中文理解、多模態生成的能力；阿里巴巴達摩院的M6項目擁有10萬億參數，應用于跨模態探索、文案擺寫、圖片設計等工作，并于4月率先發布大語言模型“通義千問”；騰訊9月正式發布自研“混元”大模型，其具備強大的中文創作能力、復雜語境下的邏輯推理能力、以及可靠的任務執行能力。整體來看，海內外科技龍頭企業紛紛加碼多模態大模型布局，多模態發展趨勢明確，有望加速大模型能力釋放及商業化空間打開。表2全球科技龍頭加速多模態大模型布局地城廠商大模型推出時間參數研發進展將Transformer與無監督的預訓練技術相結GPT-12018/6/111.5億合OpenAI（微海外能夠生成更加連貫、內容更加豐富的文本，

28、軟）2019/2/14GPT-215億并且在多個NLP任務上取得了令人喝目的成績請務必閱讀正文之后的免責條款部分10of21#page#國泰君安證券海外行業專題“零樣本學習”能力，適用于多種多樣的任CPT-32020/5/281750億務，例如文本生成、翻譯、問題回答等融合了教師指導、增強監督、多任務訓練等預計擁有超GPT-42023/3/14技術，在對話交互、常識推理、大規模知識100萬億獲取等方面都取得顯著提高被訓練成使用文本-圖像對的數據集，從文本DALLB2021/1/5120億描述中生成圖像DALL-E2是DALL-E的升級版，生成的圖像2022/4/8DALLE235億分辨率是DA

29、LL-E的四倍DALLE32023/9/21120億全面集成ChatGPT，并大幅提升了AI效果在語言類模型PaLM（5400億參毀）和視覺類模型ViT（220億參數）的基礎上開發的，不a-NTed2023/3/65620億僅具備通用化語言能力，還能執行視覺問答、感知推理、機器操作等復雜的任務谷歌4種不同參多語言處理、數理、代碼、高級推理等能力數規模版得到提升，PaLM2分Gccko、Otter、Bison、PaLN-22023/5/11本，參數規模未公布模的Gecko支持在移動設備運行在一系列廣泛的自然語言任務中表現出了突Megatron英偉達2021/11/95300億出的準確性，包括閱讀

30、理解、常識推理和自Turing然語言推理Stable2022/81Stability AIAI繪畫生成工具Diffusion實現感官大一統，允許引學理解和連接不同的信息形式，包括文本、圖像、音頻、深2023/5/9lmageBind度、熱數據和運動傳感器，無需對每種可能的模態組合進行訓練Meta突破了分制界限，極大地促進了計算機視覺SA2023/4/12基礎模型的發展基于上一代DINOV1打造的視覺大模型，使用DINOV22023/4/17自監督學習來實現與該領線中使用的標準方法相匹配或超越結果國內首個對標ChaLCPT的大模型，可根據文2023/3/12600億文心一言字生成國像和視頻百度T

31、itan在60多個MLP任務中取得了SOTAERNIW3.02021/122600億成果，包括機器閱讀理解、文本分類和語義Titan相似性等應用于路模態探索、文案換寫、圖片設計等2021/10/110萬億阿里巴巴M6國內工作具備強大的中文創作能力，復雜語境下的邏輯騰訊混元2023/9/8萬化推理能力，以及可靠的任務執行能力華為云盤古系列3.02023/7/7千億面向行業的人工智能大模型系列已經推出了機器翻譯平臺、金融NLP、AIGC潤舟孟子2023/3/1410億智能創作等多個企業級解決方案及對外開放服務請務必閱讀正文之后的免責條款部分11of21#page#國泰君安證券海外行業專題“源1.0

32、”將面向學術研究單位和產業實踐浪湖信息源1.02023/9/282457億用戶進行開源、開放、共享，降低巨量模型研究和應用的門檻不僅在知識掌握、閱讀理解、數學推理、多語翻譯等多個測試任務上表現優秀，而且縣書生2021/9/20100億備很強的綜合能力，因而在綜合性考試中表（InternLM）商湯科技現突出，在多項中文考試中取得超越ChatGPT的成績秒畫結合文本輸入進行圖像內容的創作生成，支2023/4/10SenseMirage持更多樣化的風格選擇基于StableDiffusion優化的AI繪畫模天工巧繪昆念萬維2022/12/1型，支持輸入中英文文本，可生成多種現代SkyPaint藝術風格

33、的高質量圖像數據來源：OpenAI官網，湖湃新閉，機器之心Pro，金融界，國泰君安證券研究3.多模態推動應用層爆發，AIGC產業迎來革命生成式AI投資熱潮席卷全球，大模型布局成熟垂直應用層發力。過去5年內生成式AI投資熱潮席卷全球，Dealrooms數據顯示全球生成式AI投資總額超過220億美元，其中美國融資總額達到190億美元，89%的融資流向美國初創公司，VC向OpenAI投入了近120億美元引爆生成式AI熱湖。從投資趨勢來看，目前模型制造商融資占生成式AI融資總額的63%，而應用程序、基礎設施占比分別達到21%、8%，以OpenAI為首的模型廠商遙遙領先、部分垂直領域模型廠商亦獲得了一定

34、資金，而應用層有眾多初創公司陸續獲得融資，包括基于專有模型的應用程序和基于第三方模型的應用程序，應用領戰覆蓋文本、圖像、視頻、音頻、代碼、3D資產等等，隨著大模型層加速發展下應用層投融資亦開始提速。相似地，根據紅杉資本，掌門人RoelofBotha表示過去12個月有60%投資流向了AI初創公司，其中更多聚焦于AI應用層投資，AI應用層在日趨成熟的模型能力和豐厚的投融資基礎上加速發展，深入不同應用場景的更多創新殺手級應用有望逐步拼露頭角。圖20全球生成式人工智能風險投資額全面爆發圖21全球生成式AI模型層、應用層投資領先global generative AI VC investment （s

35、bn）模型制造商應用程序基礎設施“具有專有模型的應用程序中中數據未源：DealroomCo，國泰君安證券研究數據來源：DealroomCo，國泰君安證券研究注：2023年數據找至2023年7月10日請務必閱讀正文之后的免責條款部分12of21#page#國泰君安證券海外行業專題國內AIGC投融資火熱，應用層成為投資熱點。國內方面，國內生成式AI投融資同樣火熱，艾瑞咨詢及IT桔子數據顯示，2021年至2023年7月期間AIGC賽道共發生280筆投融資，涵蓋模型層、應用層、工具層、算力層，共中2021-2023年間應用層融資分別占比21.2%、23.0%、14.4%，應用層三年累計占比為58.6%

36、，而模型層的三年總占比僅為4.7%，文本、影音、語音項目占比相當，多模態應用為投資機構看好；投資輪次上，70%以上的投資項目仍處于A輪及更早期階段，可見國內AIGC投融資同樣火熱，模型層或受制于算力和芯片時熱度未及國外，而早期的應用層多模態為當前的投資焦點。圖22生成式AI圖譜體現AI應用多模態化圖232021-2023年國內AIGC應用層投資熱度領先2021年融資熱度分布2022年融資熱度分布2023年融資熱度分布70.00%160.00%14.40%50.00%40.80次30.00%20.00%10.00%0.00數據來源：IT枯子，艾瑞咨詢，國泰君安證券研究數據來源：SequoiaCa

37、pital多模態發展加速AIGC產業擴張，2030年國內產業規模將達萬億。AIGO各模塊融資熱度方面，2021-2023年AIGC跨模態（數字人為主）融資熱度領先，占比為42.40%，多模態融資占比16.40%，兩者合計占比58.80%?？缒B、多模態占據融資規模的半壁江山，隨著跨模態和多模態模型在應用層的價值加速變現，有助于AIGC產業規模的快速擴張。根據艾瑞咨詢預測，2023年中國AIGC產業規模為143億元，隨著大模型生態培育、底層算力基建完善、完整服務生態有望逐步成形下，2030年中國AIGC產業規模有望達到11441億元，市場空間廣闊。圖242030年中國AIGC產業規模有望突破萬億

38、圖252021-2023年AIGC跨模態融資占比42.40%2021-2023年AIGC各模態融資熱度分布（%）中國AIGC產業規模（億元）代碼0.60%14000T500.00%12000多模態16.40%400.00810000跨模態（數字人為主）42.40%woo.oo88000600語音及音樂24.90%200.00%408影像24.90%100.00%2000文本22.60%0.00%創意如館名館商館0.88820.00%46.00次60.00%數據來源：艾瑞咨詢，國泰君安證券研究數據來源：艾瑞咨詢，國泰君安證券研究請務必閱讀正文之后的免責條款部分13of21#page#國泰君安證券

39、海外行業專題多模態模型能力革新應用層，UGC及PGC內容生產邁向AIGC?；诙嗄B大模型在內容生成、內容理解、內容推理等能力，有望通過重塑內容生產方式，繼而實現AIGC內容層的變革。按照內容類型劃分，傳統UGC內容相對平民化，制作周期較短、質量不高、周轉較快，通過流量運營，保持內容供給并實現用戶變現，生產關鍵在于提升內容制作效率并保持一定內容質量；傳統PGC或PUGC內容相對專業化，制作周期較長、品質較高、周轉較慢，通過訂閱付費或廣告變現，生產關鍵在于提升內容品質的同時保持一定產出效率。圖26內容創作模式的四個發展階段圖27人與生成式AI在生成圖片的成本時間對比人生成式AI成本￥300￥0.

40、2回部5小時（1分鐘專業制作數據來源：創客貼數據來源：騰訊研究院隨著多模態大模型能力的成熟，對于UGC內容而言，大模型的內容理解及內容生成能力能夠進一步降低多模態內容的制作門檻，同時提升多模態內容的產出效率，繼而實現更豐富、更高質量的UGC內容供給，UGC內容平臺、內容生產方及用戶均會受益，創客貼數據顯示人+AI較人在生成同一段代碼時間減少55%、完成圖片模型時間由5小時縮減至1分鐘內；對于PGC內容而言，多模態大模型能夠變革人機交互形式，優化PGC內容開發及制作流程，優化PGC內容制作效率并提升PGC內容品質，PGC內容制作方、PGC內容平臺、用戶均能享受到更充沛的精品內容，UGC及PGC產

41、業鏈均將迎來全面升級，邁向全新AIGC內容大時代。圖28生成式AI將提升PGC及UGC內容創作效率并激發創意0-209站20%-70970-90%90%-100%3A自主生成內容，并自動進行、發布全過建議、修改、審核、人工指導AI生成，人工進程，無需人工參與含有部分A能力的各類工具行內容審閱和修改，或人輔助人工生成工指導A進行修改人工生成計算機根據既有內容和模板生成UGCPGCAIGC數據來源：艾瑞咨詢請務必閱讀正文之后的免責條款部分14of21#page#國泰君安證券海外行業專題圖292023-2027年AIGC應用領域內容生產仍為最大市場，生產可直接消費內容占比40%+2027年2023年

42、用于提供打包內容或解決用于提供打包內容或解決方室2296生產可直接消費內容生產可直接消費內作為內容生產輔48%作為內容生產輔助4096259179結合底層系生產含有附加價值的內容結合底層系統，生產含有附加價值的內容1392596生產可直接消費內容結合底層系統，生產含有附加價值的內容作為內容生產輔助工具用于提供打包內容或解決方案數據來源：Insights，量子位圖30預計2030年我國AIGC對多個行業發生變革影響100電子商務（50,80，300）06內容資訊（50,75,170）線上游戲70影視傳媒辦公軟件（60，70，130）群射結（55，70，240）內容資訊線上游戲（60,60,90）

43、電子商務50辦公軟件訓練數據在線教育（40,40，70）社交軟件在線教育練數折（70,40,90）中交軟件（20，20,50）1010203040506070行業對AICG接受度數據未源：Isights，量子位注：固圖大小為預計2023年對應賽道相對市場規模，括號內為行業AIGC接受度、AIGC行業可變革程度、預計相對市場規模游戲、視頻、影視、音樂等生產變革已現，重構內容交互有望推動內容產業全面爆發。應用進展上，多模態模型的內容理解和內容能力已對多個內容產業鏈的內容生產方式及生產效率產生影響，Insights及量子位分析2023年AIGC應用市場中生產可直接消費內容、生產含有附加值的內容市場規

44、模占比分別為48%、13%影視傳媒和內容資訊領域目前變革程度最高，未來AIGC重構下電商、影視傳媒、內容資訊、辦公軟請務必閱讀正文之后的免青條秋部分15of21#page#國泰君安證券海外行業專題件等領域2023年市場規模有望領先。具體來看，以代表性內容賽道及UGC/PUGC/PGC內容廠商為例1）游戲：AI創作工具已深度應用于游戲研運各個環節當中，涵蓋游戲研發、游戲發行、游戲運營中，其中游戲研發的策劃、程序、美術等多環節產能提升和激發創意，游戲發行和運營中實現優化玩家體驗，以龍頭廠商網易為例，網易自研AI技術已應用于游戲工業化全流程，AI技術對關鍵環節的工作效率提升高達90%，旗艦產品蛋仔派

45、對AI輔助地圖創作功能使用率突破300萬、每周新增UGC地圖數量達到百萬級；2）視頻/影視：AI工具深度介入視頻/影視產業的策劃、開發、制作、宣發等四大環節，影視內容制作效率顯著提升推動視頻平臺內容供給豐富，以視頻龍頭愛奇藝為例，內容策劃環節通過ChatGPT類應用3分鐘內匯總一版評審意見，開發環節通過AI幾分鐘快速生成3千字-1萬字劇本，制作環節制片人通過AIGC工具生成角色示意圖，宣發環節通過ChatGPT批量產出宣發海報，實現影視內容從制作到宣發環節的質變；3）音樂：AI工具與音樂創作形成良好融合，人機共創提升創作效率開激發新的創意，以云音樂為例，網易云音樂推出BEATSOUL激靈bea

46、t交易平臺、靈感充電站、網易天音等音樂輔助創作工具，同時開放AI歌手音樂創作工具“云音樂&XStudio”，用戶通過輸入曲譜和歌詞3秒內即可生成婉美專業歌手水準的AI演唱干聲并能調整優化演唱效果，今用戶能夠更容易參與到音樂創作中并激發更多音樂內容創意。圖31AI輔助UGC編輯器大幅降低地圖制作門檻圖32AINPC游戲玩法帶來全新的玩家交互體驗wwsa8成R8電話588888數據來源：蛋仔派對數據未源；逆水寒手游圖33AI音樂伴侶陪伴聽歌、分享話題及生成歌單圖34XStudio3秒內生成專業歌手水準的AI干聲的小D子88商男氣口數據來源：QQ音樂數據來源：網易云音樂請務必閱讀正文之后的免責條款部

47、分16of21#page#國泰君安證券海外行業專題展望未未，一方面多模態模型能力通過改變內容生產方式豐富AIGC內容供給，另一方面多模態模型能力衍生大量AI生產工具有望重構人機交互形式，通過全新的多模態交互體驗構建全新的應用形態，帶來大量新的應用場景。以NewBing為例，其集成了ChatGPT版搜索引擎改變了搜索引學的內容呈現方式，通過更豐富、更實時、更可靠的用戶搜索體驗，NewBing獲取了更多的流量并展現商業化潛力。未來，多模態模型能力有望注意重構各個內容領域的交互體驗和應用形態，為AIGC內容產業打開全新的成長空間，內容產業鏈全面爆發可期，游戲、視頻、影視、音樂、社交等領域均將受益。圖

48、35AI驅動數字人與非交互類數字人交互形式對比非交互1識別感知智能分析人物語生成人物語音生成人物動畫生成人物動面生成數據來源：創客貼圖36騰訊混元大模型接入超過50個業務和產品并取得初步效果S騰訊全面擁抱大模型中騰訊云Tencent騰訊數據來源：騰訊云請務必閱讀正文之后的免責條款部分17of21#page#國泰君安證券海外行業專題4.投資建議OpenAI引領多模態大模型競賽，重構內容創作與交互推動AIGC全面爆發。OpenAIDalE3與GPT-4V升級帶來全新交互體驗，全球AI龍頭廠商紛紛發力多模態推動大模型能力全面革新，而全球生成式AI投融資熱湖由大模型向應用層加碼，國內應用層投資火熱AI

49、GC產業規?？蛇_萬億，多模態模型能力改變內容生產方式推動UGC及PGC邁向AIGC，未來將進一步重構內容交互體驗重塑AIGC產業鏈，優質AIGC內容龍頭企業有望通過卡位優勢享受新一輪內容產業紅利，推薦標的騰訊控股（0700.HK）、網易-S（9999.HK）、快手-W（1024.HK）、畔理畔理-W（9626.HK）、愛奇藝（IQ.0）、云音樂（9899.HK）、心動公司（2400.HK）。表3重點公司估值表凈利潤（億元）Ba總市值評級證券代碼證券簡稱（億港元/億美元）2023E2022A202382024B2022A2024B0700.日K29.2311156148116841318增持騰訊

50、控股165.277223299304169999.HK網易-S1616增持1024.HK2,761-5876155346快手-W增持8tt9626.日K-67-34畔唱畔唱一W-9增持一61S20122400.HK心動公司3增持17830-1199899.HK云音樂69增持332皖81Q.04510增持愛奇藝7總市值拔至2023/10/13）5.風險提示AI技術發展未及預期；AI投融資熱度消退；AI應用創新未及預期；AI應用用戶接受度未及預期。請務必閱讀正文之后的免責條款部分18of21#page#國泰君安證券海外行業專題國泰君安海外科技團隊介紹深耕全球互聯網，輻射海外大科技，全面覆蓋社交、游

51、戲、電商、互聯網金融、互聯網服務、AI及硬科技、美股等領域，致力于結合產業視角與買方視角做差異化研究。秦和平執業證書編號：S0880123010042海外科技領域負責人、首席研究員梁昭晉執業證書編號：S0880523010002海外科技分析師李奇執業證書編號：S0880523060001海外科技分析師請務必閱讀正文之后的免責條款部分19of21#page#國泰君安證券海外行業專題本公司具有中國證監會核準的證券投資咨詢業務資格分析師聲明作者具有中國證券業協會授予的證券投資咨詢執業資格或相當的專業勝任能力，保證報告所采用的數據均來自合規渠道，分析邏輯基于作者的職業理解，本報告清晰準確地反映了作者的

52、研究觀點，力求獨立、客觀和公正，結論不受任何第三方的授意或影響，特此聲明。免責聲明本報告僅限中國大陸地區發行，僅供國泰君安證券股份有限公司（以下簡稱“本公司”）的客戶使用。本公司不會因接收人收到本報告而視其為本公司的當然客戶。本報告僅在相關法律許可的情況下發放，并僅為提供信息而發放，概不構成任何廣告。本報告的信息來源于已公開的資料，本公司對該等信息的準確性、完整性或可靠性不作任何保證。本報告所載的資料、意見及推測僅反映本公司于發布本報告當日的判斷，本報告所指的證券或投資標的的價格、價值及投資收入可升可跌。過往表現不應作為日后的表現依據。在不同時期，本公司可發出與本報告所載資料、意見及推測不一致

53、的報告。本公司不保證本報告所含信息保持在最新狀態。同時，本公司對本報告所含信息可在不發出通知的情形下做出修改，投資者應當自行關注相應的更新或修改。本報告中所指的投資及服務可能不適合個別客戶，不構成客戶私人咨詢建議。在任何情況下，本報告中的信息或所表述的意見資收益，也不對任何人因使用本報告中的任何內容所引致的任何損失負任何責任。投資者務必注意，其據此做出的任何投資決策與本公司、本公司員工或者關聯機構無關。本公司利用信息隔離墻控制內部一個或多個領域、部門或關聯機構之間的信息流動。因此，投資者應注意，在法律許可的情況下，本公司及其所屬關聯機構可能會持有報告中提到的公司所發行的證券或期權并進行證券或期

54、權交易，也可能為這些公品開屏衛工“血“關置變是務專群提到的公司的董事。市場有風險，投資需謹慎。投資者不應將本報告作為作出投資決策的唯一參考因素，亦不應認為本報告可以取代自己的判斷。在決定投資前，如有需要，投資者務必向專業人士咨詢并謹慎決策。本報告版權僅為本公司所有，未經書面許可，任何機構和個人不得以任何形式翻版、復制、發表或引用。如征得本公司同意進行引用、刊發的，需在允許的范圍內使用，并注明出處為“國泰君安證券研究”，且不得對本報告進行任何有性原意的引用、刪節和修改。若本公司以外的其他機構（以下簡稱“該機構”）發送本報告，則由該機構獨自為此發送行為負責。通過此途徑獲得本報告的投資者應自行聯系該

55、機構以要求獲悉更詳細信息或進而交易本報告中提及的證券。本報告不構成本公司向該機構之客戶提供的投資建議，本公司、本公司員工或者關聯機構亦不為該機構之客戶因使用本報告或報告所載內容引起的任何損失承擔任何責任。評級說明評級說明增持相對香港恒生指數漲幅15%以上1.投資建議的比較標準投資評級分為股票評級和行業評級。謹慎增持相對香港恒生指數漲幅介于5%15%之間以報告發布后的12個月內的市場表現為股票投資評級中性相對香港恒生指數漲幅介于-5%5%之間比較標準，報告發布日后的12個月內的公司股價（或行業指數）的漲跌幅相對同減持相對香港恒生指數下跌5%以上期的香港恒生指數指數漲跌幅為基準。增持明顯強于香港恒

56、生指數2.投資建議的比較標準報告發布日后的12個月內的公司股價（或中性行業投資評級基本與香港恒生指數持平行業指數）的漲跌幅相對同期的香港恒生減持明顯弱于香港恒生指數國泰君安證券研究所上海北京深圳地址上海市靜安區新閘路669號博華廠深圳市福田區益田路6003號榮超商北京市西城區金融大街甲9號場20層務中心B棟27層街中心南樓18層郵編200041518026100032電話（021）38676666（0755）23976888（010）83939888請務必閱讀正文之后的免責條款部分20of21#page#國泰君安證券海外行業專題附：海外當地市場指數美洲指數名稱歐洲指數名稱澳洲指數名稱亞洲指數名

57、稱滬深300標普500希臘雅典ASE澳大利亞標普200恒生指數加拿大S&P/TSX奧地利ATX新西蘭50日經225墨西哥BOLSA冰島ICEX韓國KOSPI巴西BOVESPA挪威OSEBX布拉格指數富時新加坡海峽時報臺灣加權西班牙IBEX35印度孟買SENSEX俄羅斯RTS印尼雅加達綜合富時意大利MIB越南胡志明波蘭WIG富時馬來西亞KLCI比利時BFX泰國SET英國富時100巴基斯坦卡拉奇德國DAX30斯里蘭卡科倫坡葡萄牙PSI20芬蘭赫爾辛基瑞士SMI法國CAC40英國富時250歐洲斯托克50OMX哥本哈根20瑞典OMXSPI愛爾蘭綜合荷蘭AEX富時AIM全股請務必閱讀正文之后的免責條款部分21of21#page#

相關圖表

本文主要內容概括如下： 1. OpenAI多模態全面升級，引領大模型競賽，重構內容創作與交互推動AIGC產業革命。 2. OpenAI先后宣布推出最新文生圖模型“Dall·E 3”及多模態模型“GPT-4V”，并將在未來兩周時間里向ChatGPT Plus和Enterprise用戶開放。 3. 語音功能結合語音識別、轉錄及音頻生成實現語音雙向對話，圖生文功能升級支持多圖像處理及聚焦分析，較其他模型實現簡化Prompt精準成像。 4. 隨著Win 11集成Copilot功能升級、Bing增加對Dall·E 3模型支持，Copilot訂閱有望更好落地，AI大模型商業化空間將逐步展現。 5. 全球多模態競爭激烈，大模型能力加速革新。OpenAI深耕多模態領域多時，GPT-4V、Dall·E 3、Gobi、CLIP等引領競賽，Google Gemini已內部開放且算力將達到GPT-4 5倍，海外Meta、Stability AI等及國內百度集團、阿里巴巴、騰訊等科技巨頭爭相布局，多模態發展趨勢明確，大模型能力持續迭代下及生成式AI產業空間將加速打開。 6. 多模態推動應用層爆發，AIGC產業迎來革命。Dealroom數據顯示過去5年全球生成式AI投資總額逾220億美元，其中模型制造商、應用程序占比分別達到21%、8%；國內方面，艾瑞咨詢數據顯示2023年應用層融資占比達到14.4%，其中AIGC跨模態、多模態融資占比達到42.4%、16.4%，隨著大模型生態培育、底層算力基礎設施完善及應用生態構建下2030年中國AIGC產業規模有望達到1.14萬億。

OpenAI多模態全面升級，如何重構內容創作與交互？全球多模態競爭激烈，大模型能力如何加速革新？多模態推動應用層爆發，AIGC產業將迎來哪些革命？

相關報告

聯系我們

0731-84720580
sgpjbg002
工作日 9:30 - 18:00

關于我們

侵權處理

關于我們

出版物經營許可證
工信部備案號：湘ICP備17000430號-2
公安備案號：湘公網安備43010402001071號

三個皮匠報告專業的行業報告下載站，每日更新，歡迎大家關注！

copyright@2008-2013 長沙景略智創信息技術有限公司版權所有
網站備案/許可證號：湘B2-20190120

客服

小程序

服務號

折疊

午夜网日韩中文字幕,日韩Av中文字幕久久,亚洲中文字幕在线一区二区,最新中文字幕在线视频网站