《計算機行業專題研究:ChatGPT研究框架(2023)生成式AI迎來拐點商用落地前景可期-230207(72頁).pdf》由會員分享,可在線閱讀,更多相關《計算機行業專題研究:ChatGPT研究框架(2023)生成式AI迎來拐點商用落地前景可期-230207(72頁).pdf(72頁珍藏版)》請在三個皮匠報告上搜索。
1、ChatGPT研究框架(2023)2023年02月07日 行業專題研究 誠信 責任 親和 專業 創新 2 ChatGPT生成式AI迎來拐點,商用落地前景可期 請參閱附注免責聲明 01 ChatGPT市場反應熱烈,國內外巨頭紛紛入場 據統計,ChatGPT日活躍用戶數的增速遠超Instagram,1月份平均每天有超過1300萬名獨立訪問者使用ChatGPT,是去年12月份的兩倍多;國內外科技巨頭都非常重視ChatGPT引發的科技浪潮,積極布局生成式AI,國內廠商(百度、騰訊等)也高度關注ChatGPT,積極探索前沿技術,相關深度應用也即將推出。02 03 04 摘要 ChatGPT經歷多類技術路
2、線演化,逐步成熟與完善 ChatGPT所能實現的人類意圖,來自于機器學習、神經網絡以及Transformer模型的多種技術模型積累。Transformer建模方法成熟以后,使用一套統一的工具來開發各種模態的基礎模型這種理念得以成熟,隨后GPT-1、GPT-2、GPT-3模型持續演化升級,最終孵化出ChatGPT文本對話應用。AIGC跨模態產業生態逐步成熟,商用落地未來可期 AIGC產業生態當前在文本、音頻、視頻等多模態交互功能上持續演化升級,奠定了多場景的商用基礎??缒B生成技術也有望成為真正實現認知和決策智能的轉折點。ChatGPT乘東風,商業架構日益清晰 隨著ChatGPT Plus發布,
3、商業化序幕已經拉開。ChatGPT在傳媒、影視、營銷、娛樂以及數實共生助力產業升級等領域均可產生極大助益,提升生產力曲線,多維度賦能虛擬經濟和實體經濟。mWlYoYtVgYdU9WdYrUdU8O8Q7NtRqQtRmPlOnNoMjMqRsR7NoOuNNZmMsQvPrQqO3 誠信 責任 親和 專業 創新 ChatGPT生成式AI迎來拐點,商用落地前景可期 請參閱附注免責聲明 目錄/CONTENTS 市場概況:ChatGPTAI平民化里程碑 01 技術路徑:基于人類反饋系統,ChatGPT助力跨模態AI生成應用 02 行業進程:AIGC多模態交互功能持續演化,奠定多場景商用基礎 03 商
4、業方向:多領域多功能應用密集落地,ChatGPT商用前景可期 03 4 誠信 責任 親和 專業 創新 ChatGPT生成式AI迎來拐點,商用落地前景可期 請參閱附注免責聲明 01 市場概況:ChatGPTAI平民化的里程碑 誠信 責任 親和 專業 創新 5 ChatGPT生成式AI迎來拐點,商用落地前景可期 請參閱附注免責聲明 OpenAI在成立之初便備受資本矚目,與微軟合作加速商業化進程 01 ChatGPT是由OpenAI 團隊研發創造,OpenAI是由創業家埃隆馬斯克、美國創業孵化器Y Combinator總裁阿爾特曼、全球在線支付平臺PayPal聯合創始人彼得蒂爾等人于2015年在舊金
5、山創立的一家非盈利的AI研究公司,擁有多位硅谷重量級人物的資金支持,啟動資金高達10億美金;OpenAI的創立目標是與其它機構合作進行AI的相關研究,并開放研究成果以促進AI技術的發展 2019年7月 2020年6月 2020年9月 OpenAI發展的里程碑 OpenAI宣布從”非盈利“性質過度到”封頂盈利“性質,利潤上限為任何投資的100倍(創立了OpenAI LP公司)微軟向OpenAI投資了10億美金,并獲得了OpenAI技術的商業化授權。從此,OpenAI的一些技術開始出現在微軟的產品和業務上 OpenAI發布了OpenAI API,這是OpenAI第一個商業化產品,OpenAI正式開
6、始了商業化運作 OpenAI授權微軟使用GPT-3模型,微軟成為全球首個享用GPT-3能力的公司 2019年3月 圖1:OpenAI發展勢頭強勁,商業化趨勢明顯 資料來源:OpenAI官網,國泰君安證券研究 誠信 責任 親和 專業 創新 6 ChatGPT生成式AI迎來拐點,商用落地前景可期 請參閱附注免責聲明 OpenAI 的ChatGPT是生成式人工智能技術(AIGC)浪潮的一部分 01 資料來源:中國信息通信研究院,國泰君安證券研究 AIGC發展特點 人工智能總體階段 早期萌芽階段(20世紀50年代-90年代中期)沉淀積累階段(20世紀90年代-21世紀10年代中期)快速發展階段(21世
7、紀10年代中期-至今)受限于技術水平,AIGC僅限于小范圍實驗 AIGC從實驗性向實用性轉變,受限于算法瓶頸,無法直接進行內容生成 深度學習算法不斷迭代,人工智能生成內容百花齊放 AIGC典型事件 1950年,艾倫圖靈提出著名的“圖靈測試”,給出判斷機器是否具有“智能”的方法 1966年,世界第一款可人機對話機器人“Eliza”問世 80年代中期,IBM創造語音控制打字機“Tangora”2012年,微軟展示語全自動同聲傳譯系統,可將英文語音自動翻譯成中文語音 2007年,世界上第一部完全由人工智能創作的小說1 The Road問世 2014年,Lan J.Goodfellow提出生成式對抗網
8、絡GAN 2018年,英偉達發布StyleGAN模型用于自動生成高質量圖片 2019年,DeepMind發布DVD-GAN模型用于生成連續性視頻 2022年,OpenAI發布ChatGPT模型用于生成自然能語言文本 圖2:隨著算法的不斷迭代,生成式人工智能技術(AIGC)不斷發展 誠信 責任 親和 專業 創新 7 ChatGPT生成式AI迎來拐點,商用落地前景可期 請參閱附注免責聲明 ChatGPT是在GPT基礎上進一步開發的自然語言處理模型 01 GPT模型是一種自然語言處理(NLP)模型,使用多層變換器(Transformer)來預測下一個單詞的概率分布,通過訓練在大型文本語料庫上學習到的
9、語言模式來生成自然語言文本 從 GPT-1 到 GPT-3 智能化程度不斷提升,ChatGPT 的到來也是 GPT-4 正式推出之前的序章 資料來源:CSDN,國泰君安證券研究 GPT-1(1.17億參數)GPT-1 有一定的泛化能力,能夠用于和監督任務無關的 NLP 任務中 2018 2019 2020 2022.01 GPT-2(15億參數)除了理解能力外,GPT-2 在生成方面表現出了強大的天賦:閱讀摘要、聊天、續寫、編故事,甚至可以生成假新聞、釣魚郵件或在線進行角色扮演 GPT-3(1750億參數)GPT-3 作為一個自監督模型,可以完成自然語言處理的絕大部分任務:將網頁描述轉換為相應
10、代碼、模仿人類敘事、創作定制詩歌、生成游戲劇本,甚至模仿已故的哲學家預測生命的真諦 InstructGPT InstructGPT是一個經過微調的新版 GPT-3,可以將有害的、不真實的和有偏差的輸出最小化 ChatGPT ChatGPT 是 InstructGPT 的衍生產品,它將人類的反饋納入訓練過程,更好地使模型輸出與用戶意圖保持一致 2022.12 圖3:ChatGPT由GPT-1到InstructGPT模型的不斷成熟而逐步形成 誠信 責任 親和 專業 創新 8 ChatGPT生成式AI迎來拐點,商用落地前景可期 請參閱附注免責聲明 ChatGPT發布后用戶數持續暴漲,市場影響力迅速提
11、升 01 根據UBS發布的研究報告顯示,ChatGPT在1月份的月活躍用戶數已達1億,成為史上用戶數增長最快的消費者應用 相比之下,TikTok花了九個月的時間月活躍用戶數才破億,而Instagram則花費了兩年半的時間,同時,根據Similar Web的披露信息,Spotify在四年半后僅積累了1億月活躍用戶 根據Similar Web的數據,1月份平均每天有超過1300萬名獨立訪問者使用ChatGPT,是去年12月份的兩倍多 資料來源:UBS,Similar Web,ARK Invest,第一財經,國泰君安證券研究 2個月 9個月 30個月 54個月 圖4:ChatGPT日活躍用戶數的增速
12、遠超Instagram 圖5:對比各大熱門平臺月活躍用戶數破億所需時長,ChatGPT的成長速度驚人 42個月 54個月 90個月 資料來源:第一財經,國泰君安證券研究 誠信 責任 親和 專業 創新 9 ChatGPT生成式AI迎來拐點,商用落地前景可期 請參閱附注免責聲明 ChatGPT已能覆蓋較多能力域 01 由于ChatGPT包含了更多主題的數據,能夠處理更多小眾主題。ChatGPT能力范圍可以覆蓋回答問題、撰寫文章、文本摘要、語言翻譯和生成計算機代碼等任務。資料來源:ChatGPT,國泰君安證券研究 用魯迅口吻寫一篇評價新冠疫情的散文 用Python寫一段CCI量化投資策略 寫一篇信創
13、產業的研究報告 用藏文、俄羅斯語、韓語和日文說一句話 用C+寫一段爬蟲代碼 圖6:ChatGPT的使用案例如下所示 代碼閱讀理解和Debug 誠信 責任 親和 專業 創新 10 ChatGPT生成式AI迎來拐點,商用落地前景可期 請參閱附注免責聲明 ChatGPT具備諸多先進性特征 01 ChatGPT嵌入了人類反饋強化學習以及人工監督微調,因而具備了理解上下文、連貫性等諸多先進特征,解鎖了海量應用場景 當前,ChatGPT所利用的數據集只截止到2021年。在對話中,ChatGPT會主動記憶先前的對話內容信息(上下文理解),用來輔助假設性的問題的回復,因而ChatGPT也可實現連續對話,提升了
14、交互模式下的用戶體驗。同時,ChatGPT也會屏蔽敏感信息,對于不能回答的內容也能給予相關建議。資料來源:知乎,國泰君安證券研究 圖7:ChatGPT提升的核心點如下所示 連續對話能力 用戶意圖有效捕捉 上下文理解 敢于質疑 承認不知道 提升準確度 ChatGPT 算法屏蔽 連續對話 人類意圖 誠信 責任 親和 專業 創新 11 ChatGPT生成式AI迎來拐點,商用落地前景可期 請參閱附注免責聲明 科技巨頭不斷下注AI行業,ChatGPT帶動新一輪AI發展浪潮 01 2023年初,微軟和谷歌均宣布裁員計劃,但都加大了在AI行業的投入 資料來源:UBS,財富,華爾街見聞,國泰君安證券研究 1月
15、18日,微軟宣布將于3月底前在全球裁員1萬人,約占公司員工總數的5%1月23日,微軟宣布對 ChatGPT 創建者 OpenAI 進行第三輪投資,將向OpenAI進行為期多年、金額達數十億美元的投資,以加速其在人工智能領域的技術突破 此外,微軟還計劃在未來幾周內發布其 Bing 搜索引擎的 GPT-4 版本,預計該版本將比 ChatGPT 模型更快、更強大 1月20日,谷歌母公司Alphabet宣布將裁員約1.2萬人,占公司員工總數的6%以上,同時公司CEO表示,公司將會進一步聚焦AI技術核心業務的研發投入 2月4日,谷歌注資3億美元投資ChatGPT競品Anthropic,和Open AI一
16、樣,Anthropic也在開發生成式人工智能 圖8:科技巨頭紛紛加大ChatGPT相關投入 誠信 責任 親和 專業 創新 12 ChatGPT生成式AI迎來拐點,商用落地前景可期 請參閱附注免責聲明 國內外科技巨頭積極布局生成式AI,部分公司已有成型產品 01 國內外科技巨頭都非常重視ChatGPT引發的科技浪潮,積極布局生成式AI 國外公司 公司名稱 相關布局 谷歌 面對ChatGPT構成的威脅,注資3億美元投資競品Anthropic 微軟 作為OpenAI的最大投資方,利用ChatGPT提高產品競爭力 亞馬遜 ChatGPT受到重點關注,已廣泛運用在各種工作職能中 國內公司 百度 預計在3
17、月份完成其ChatGPT產品文心一言(ERNIE Bot)的內測,并面向公眾開放 騰訊 目前已經公布一項人機對話專利,能夠實現機器與用戶之間自然且順暢的溝通 表1:國內外科技公司積極布局生成式AI 資料來源:各公司公告,國泰君安證券研究 誠信 責任 親和 專業 創新 13 ChatGPT生成式AI迎來拐點,商用落地前景可期 請參閱附注免責聲明 谷歌:面對ChatGPT構成的威脅,注資3億美元投資競品Anthropic 01 在ChatGPT發布后,谷歌CEO在公司內部發布了“紅色警報”(Code Red),敦促團隊解決ChatGPT對公司搜索引擎業務構成的威脅,同時批準了在谷歌搜索引擎中加入A
18、I聊天機器人的計劃 2月4日,谷歌注資3億美元投資ChatGPT競品Anthropic,谷歌將獲得約10%的股份,Anthropic計劃將次輪資金用于購買谷歌云計算部門的計算資源;Anthropic開發了一款名為Claude的智能聊天機器人,據稱可與ChatGPT相媲美(仍未發布)Anthropic和Open AI淵源頗深,其聯合創始人曾擔任OpenAI 研究副總裁 資料來源:騰訊新聞,國泰君安證券研究 圖9:Anthropic的聯合創始人曾擔任OpenAI 研究副總裁 圖10:聊天機器人Claude據稱可與ChatGPT相媲美 資料來源:新浪財經,國泰君安證券研究 誠信 責任 親和 專業 創
19、新 14 ChatGPT生成式AI迎來拐點,商用落地前景可期 請參閱附注免責聲明 微軟:OpenAI的最大投資方,開始利用ChatGPT提高產品競爭力 01 微軟將ChatGPT視為新一代技術革命,將ChatGPT整合進Bing搜索引擎、Office全家桶、Azure云服務、Teams程序等產品中 微軟近期宣布推出視頻會議及遠程協作平臺的高級付費版Microsoft Teams Premium,訂閱者可享用OpenAI GPT提供支持的大型語言模型技術,用AI自動生成會議筆記,此舉或對Zoom、谷歌會議等平臺形成巨大沖擊。資料來源:微軟官網,國泰君安證券研究 圖11:Microsoft Tea
20、ms Premium 使用 ChatGPT 做筆記,使遠程協作更高效 圖12:集成了ChatGPT的新版 Bing 曾短暫上線,搜索框類似一個聊天框 資料來源:Windows Central,國泰君安證券研究 誠信 責任 親和 專業 創新 15 ChatGPT生成式AI迎來拐點,商用落地前景可期 請參閱附注免責聲明 亞馬遜:ChatGPT受到重點關注,已廣泛運用在各種工作職能中 01 ChatGPT 已經被亞馬遜用于各種不同的工作職能中,包括回答面試問題、編寫軟件代碼和創建培訓文檔等 公司內部員工在 Slack 表示,亞馬遜Amazon Web Services(AWS)云部門已經成立了一個小
21、型工作組,以更好地了解人工智能對其業務的影響。資料來源:Business Insider,新浪科技,國泰君安證券研究 圖13:ChatGPT 已經被亞馬遜用于各種不同的工作職能中 資料來源:Encaptechno,國泰君安證券研究 圖14:亞馬遜AWS云部門的職能與人工智能聯系緊密 誠信 責任 親和 專業 創新 16 ChatGPT生成式AI迎來拐點,商用落地前景可期 請參閱附注免責聲明 美國新媒體巨頭Buzzfeed踩準ChatGPT風口,兩天內股價飆升3倍 01 1月29日,美國新媒體巨頭Buzzfeed宣布計劃采用ChatGPT協助內容創作,其股價一夜間暴漲近120%,兩天內飆升逾300
22、%,成交量突破4.38億股(其月平均成交量不足2500萬股)消息公布后同類型公司股票成交量也迎來歷史高峰:C3.ai本月成交量超過7200萬股,為自去年6月以來最多;語音AI軟件公司SoundHound AI的成交量約為6450萬股,幾乎是其月平均值的三倍 資料來源:騰訊新聞,國泰君安證券研究 圖16:Buzzfeed宣布計劃采用ChatGPT協助內容創作后,股票成交量暴漲 圖15:Buzzfeed宣布計劃采用ChatGPT協助內容創作后,股價一夜間暴漲近120%資料來源:澎湃新聞,國泰君安證券研究 誠信 責任 親和 專業 創新 17 ChatGPT生成式AI迎來拐點,商用落地前景可期 請參閱
23、附注免責聲明 Stability AI:Stable Diffusion大熱,Open AI在圖片生成AI大有可為 01 Stability AI有著與Open AI相同的創業理念:構建開源AI項目,促進AI發展,其成功證明Open AI在圖片生成領域同樣大有可為 公司的開源模型Stable Diffusion可以根據文字生成圖片,只需要幾秒鐘,就可以生成分辨率、清晰度高,同時不失真實性和藝術性的圖片。資料來源:網易新聞,國泰君安證券研究 圖17:用戶使用基于Stable Diffusion算法構建的工具創建了數百萬張圖像 圖18:Stability AI有著與Open AI相同的創業理念,其
24、成功證明Open AI在圖片生成領域同樣大有可為 資料來源:Stability AI官網,國泰君安證券研究 誠信 責任 親和 專業 創新 18 ChatGPT生成式AI迎來拐點,商用落地前景可期 請參閱附注免責聲明 Jasper:采用同類底層技術,進一步證明ChatGPT的巨大商業潛力 01 文案自動生成平臺Jasper,其技術底層是 OpenAI 的 GPT-3,在成立僅 18 個月后就達到了 15 億美元的高估值 IBM、Autodesk等巨頭公司均是Jasper的付費用戶,足以證明ChatGPT底層技術具備巨大的商業潛力。ChatGPT出現后,其技術領先性和受歡迎程度對Jasper形成了
25、強烈沖擊。資料來源:搜狐新聞,Jasper 官網,國泰君安證券研究 圖19:ChatGPT的出現,對采用同類底層技術的熱門公司Jasper形成強烈沖擊 圖20:相比ChatGPT的免費開源,Jasper需要付費使用 資料來源:Jasper 官網,國泰君安證券研究 誠信 責任 親和 專業 創新 19 ChatGPT生成式AI迎來拐點,商用落地前景可期 請參閱附注免責聲明 國內廠商(百度&騰訊):高度關注ChatGPT,積極探索前沿技術 01 百度:1月10日,百度宣布將升級百度搜索的“生成式搜索”能力,智能解答用戶的搜索提問;2月7日,百度宣布將在3月份完成其ChatGPT產品的內測,面向公眾開
26、放,該項目名字為文心一言(ERNIE Bot)百度指出,生成式AI和搜索引擎是互補關系而不是替代;據路透社報道,百度計劃于 3 月將類似 ChatGPT 的 AI 對話服務作為獨立應用推出,之后再逐步將其合并到搜索引擎中。騰訊:2月3日,騰訊公布一項人機對話專利,能夠實現機器與用戶之間自然且順暢的溝通 圖22:騰訊發布相關專利,積極涉足ChatGPT領域 資料來源:騰訊新聞,國泰君安證券研究 圖21:百度研發的ChatGPT產品“文心一言”將于3月份問世 資料來源:中國經濟網,國泰君安證券研究 誠信 責任 親和 專業 創新 20 ChatGPT生成式AI迎來拐點,商用落地前景可期 請參閱附注免
27、責聲明 AIGC創業公司大比拼,國外ChatGPT的優勢遙遙領先并有望延續 01 國內對比國外AIGC創業公司的相關產品,國外ChatGPT的優勢遙遙領先并有望延續 公司名稱 主要AIGC產品 產品領域 OpenAI GPT-3、ChatGPT 文本、圖片 Stability AI Stable Diffusion、Dreamstudio 圖片、音頻 Midjourney Midjourney 圖片 Jasper Jasper 文本 Copi.ai Copi.ai 文本 Copysmith Copysmith 文本 表2:國外創業公司涉及的AIGC產品領域十分豐富,相關應用日漸成熟 資料來源:
28、各公司官網,國泰君安證券研究 誠信 責任 親和 專業 創新 21 ChatGPT生成式AI迎來拐點,商用落地前景可期 請參閱附注免責聲明 AI 需要大量資金、人力投入和數據積累,國內市場中巨頭更具優勢 01 人工智能不僅需要巨大的投入,還需要龐大的用戶數據基礎,只有互聯網巨頭才有這個能力產出偉大的產品 國外是微軟、谷歌、亞馬遜,而國內則是百度、騰訊等互聯網巨頭最具潛力;相比國外巨頭,國內巨頭正投入大量資金和人力成本快速發展人工智能技術,在沒有硝煙的人工智能競賽中,中國企業也將異軍突起 資料來源:騰訊AI LAB官網,國泰君安證券研究 圖24:騰訊的AI 產品在游戲場景中不斷提升人機協作與內容生
29、成能力 圖23:百度構建了云智共生的生態,助力AI發展 資料來源:百度官網,國泰君安證券研究 22 誠信 責任 親和 專業 創新 ChatGPT生成式AI迎來拐點,商用落地前景可期 請參閱附注免責聲明 02 技術路徑:基于人類反饋系統,ChatGPT助力跨模態AI生成應用 誠信 責任 親和 專業 創新 23 ChatGPT生成式AI迎來拐點,商用落地前景可期 請參閱附注免責聲明 2022年 ChatGPT經歷多類技術路線演化,逐步成熟與完善 02 資料來源:真格基金,國泰君安證券研究 ChatGPT所能實現的人類意圖,來自于機器學習、神經網絡以及Transformer模型的多種技術模型積累 G
30、PT-1 GPT-2 GPT-3 Instruc-tGPT ChatGPT T5 BART M2m-100 BigBird BERT RoBERTa XLM ALBERT ELECTRA Transfo-rmer CNN RNN 神經網絡 Machine Learning 基于規則的少量數據處理 1950年開始 1980年開始 1990年開始;2006年獲得突破 2017年 2018年 2019年 2020年 基于模板和規則的前深度學習階段 根據一定范圍的數據進行參數分類 開始模仿人腦進行大量數據的標記和訓練 對人腦學習過程進行重點關注 進行海量數據學習訓練,人類的反饋信息成為模型學習的內容
31、圖25:ChatGPT經過多類技術積累,最終形成針對人類反饋信息學習的大規模預訓練語言模型 GAN 誠信 責任 親和 專業 創新 24 ChatGPT生成式AI迎來拐點,商用落地前景可期 請參閱附注免責聲明 資料來源:ChatGPT,國泰君安證券研究 ChatGPT模型在以往模型的基礎上有了多方面的顯著提升 02 更大的語料庫 ChatGPT使用了更大的語料庫,以更好地捕捉人類語言的復雜性。更高的準確性 ChatGPT的訓練效果比以往的大語言模型更好,因此它的準確性更高。更加通用的預訓練 ChatGPT的預訓練是通用的,因此它可以更好地適應各種不同的任務。更強的自我學習能力 ChatGPT具有
32、自我學習能力,可以在不斷接觸新語料的過程中持續提高自己的性能。圖26:ChatGPT是基于Transformer架構的語言模型,它在以往大語言模型(如ELMo和GPT-2)的基礎上有諸多性能提升 更高的計算能力 ChatGPT使用了更高的計算資源,以獲得更好的訓練效果。更高的適應性 ChatGPT具有較高的適應性,可以根據不同的場景和任務進行微調,以提高其在特定領域的效果。誠信 責任 親和 專業 創新 25 ChatGPT生成式AI迎來拐點,商用落地前景可期 請參閱附注免責聲明 Transformer的應用標志著基礎模型時代的開始 02 轉移學習(Transfer Learning)使基礎模型
33、成為可能 技術層面上,基礎模型通過轉移學習(Transfer Learning)(Thrun 1998)和規模(scale)得以實現。轉移學習的思想是將從一項任務中學習到的“知識”(例如,圖像中的對象識別)應用于另一項任務(例如,視頻中的活動識別)。在深度學習中,預訓練又是轉移學習的主要方法:在替代任務上訓練模型(通常只是達到目的的一種手段),然后通過微調來適應感興趣的下游任務。轉移學習(Transfer Learning)使基礎模型成為可能。大規?;?scale)使基礎模型更強大,因而GPT模型得以形成 大規模需要三個要素:(i)計算機硬件的改進例如,GPU吞吐量和內存在過去四年中增加了10
34、倍;(ii)Transformer模型架構的開發(Vaswani et al.2017),該架構利用硬件的并行性來訓練比以前更具表現力的模型;以及(iii)更多訓練數據的可用性?;赥ransformer的序列建模方法現在應用于文本、圖像、語音、表格數據、蛋白質序列、有機分子和強化學習等,這些例子的逐步形成使得使用一套統一的工具來開發各種模態的基礎模型這種理念得以成熟。例如,GPT-3(Brown et al.2020)與GPT-2的15億參數相比,GPT-3具有1750億個參數,允許上下文學習,在上下文學習中,只需向下游任務提供提示(任務的自然語言描述),語言模型就可以適應下游任務,這是產生
35、的一種新興屬性。資料來源:Attention Is All You Need 論文,國泰君安證券研究 誠信 責任 親和 專業 創新 26 ChatGPT生成式AI迎來拐點,商用落地前景可期 請參閱附注免責聲明 Transformer奠定了生成式AI領域的游戲規則 02 資料來源:Attention Is All You Need,Ashish Vaswani et.al 2017 Transformer擺脫了人工標注數據集的缺陷,模型在質量上更優、更易于并行化,所需訓練時間明顯更少 Transformer通過成功地將其應用于具有大量和有限訓練數據的分析,可以很好地推廣到其他任務 2017年,在
36、Ashish Vaswani et.al 的論文Attention Is All You Need中,考慮到主導序列轉導模型基于編碼器-解碼器配置中的復雜遞歸或卷積神經網絡,性能最好的模型被證明還是通過注意力機制(attention mechanism)連接編碼器和解碼器,因而Attention Is All You Need中提出了一種新的簡單架構Transformer,它完全基于注意力機制,完全不用重復和卷積,因而這些模型在質量上更優,同時更易于并行化,并且需要的訓練時間明顯更少。Transformer出現以后,迅速取代了RNN系列變種,躋身主流模型架構基礎。(RNN缺陷正在于流水線式的順
37、序計算)圖27:Transformer模型架構如下所示 誠信 責任 親和 專業 創新 27 ChatGPT生成式AI迎來拐點,商用落地前景可期 請參閱附注免責聲明 Transformer實現的不同技術場景對應的不同技術原理 02 資料來源:量子位智庫,國泰君安證券研究 Transformer架構可分為自回歸系列(例如GPT-3,偏好生成性任務)、雙向Transformer+Mask的自編碼系列(例如BERT,偏好自然語言理解)、Encoder-decoder架構(例如T5,使用雙向/單向attention,偏好條件文本生成)首先通過詞嵌入(Word Embedding)將字、詞、句進行區分,然
38、后基于特征評分、序列標注、分類模型等提取內容特征計算相關文本單元權重其次洗擇相應的文本單元子集組成摘要候洗集,完成內容選擇,最后針對字數要求等限定條件,對候選集的內容進行整理形成最終摘要,完成內容組織。其細分路徑又包含生成式文本摘要(AATS),即形成抽象認知并創造新詞靈活概括,和抽取式文本摘要(EATS),即直接抽取原始素材并拼接成簡單概要 摘要/標題生成 內容續寫(例如文章續寫)文本風格遷移 整段文本生成 產品特色 通過隨機Mask(即遮擋)數據庫文本中的詞語或語段,讓神經網絡自主學習復原被遮擋部分,從而擁有“猜測”缺失內容的能力,產出預訓練模型。再通過大規模預訓練模型理解上文或給定條件,
39、從概率層面推測最符合要求的輸出結果。其本質是借助超大規模的訓練參數猜測上下文的過程 主流思路是分離文本屬性及文本內容 隱式方法即使用某類無監督學習學習或強化學習模式將文本屬性及內容自動分離,常見的有生成對抗方式,即通過GAN實現目標屬性和文本量性完全由不同的編碼控制的狀態。對話式文本生成適用于智能客服等任務型和閑聊型機器人等非任務型人機交互場景,可分類為管道模式及端對端模式。結構性的文本生成,首先通過注意力機制、多層感知器等系統進行語句內容預選,對數值、時間等類型數據進行推理。增強數據間的結構信息。其次通過Transformer等模式結合上下文進行推導,生成最終文本。圖28:Transform
40、er典型技術場景下的原理介紹如下所述 誠信 責任 親和 專業 創新 28 ChatGPT生成式AI迎來拐點,商用落地前景可期 請參閱附注免責聲明 GPT-1:借助預訓練,進行無監督訓練和有監督微調 02 資料來源:Improving Language Understanding by Generative Pre-Training 論文,稀土掘金,國泰君安證券研究 GPT-1模型基于Transformer解除了順序關聯和依賴性的前提,采用生成式模型方式,重點考慮了從原始文本中有效學習的能力,這對于減輕自然語言處理(NLP)中對監督學習的依賴至關重要 GPT(Generative Pre-tra
41、ining Transformer)于2018年6月由OpenAI首次提出。GPT模型考慮到在自然語言理解中有大量不同的任務,盡管大量的未標記文本語料庫非常豐富,但用于學習這些特定任務的標記數據卻很少,這使得經過區分訓練的模型很難充分執行。同時,大多數深度學習方法需要大量手動標記的數據,這限制了它們在許多缺少注釋資源的領域的適用性。在考慮以上局限性的前提下,GPT論文中證明,通過對未標記文本的不同語料庫進行語言模型的生成性預訓練,然后對每個特定任務進行區分性微調,可以實現這些任務上的巨大收益。和之前方法不同,GPT在微調期間使用任務感知輸入轉換,以實現有效的傳輸,同時對模型架構的更改最小。圖2
42、9:GPT-1模型的核心手段是預訓練(Pre-training)無監督預訓練(Unsupervised pre-training)不需要標注數據集,即大規模自學階段,在保證AI算力充足的條件下,根據attention機制進行自學 有監督微調(Supervised fine-tunning)微調,用來修正模型理解力。即小規模指導過程,讓AI在小樣本數據下進行調整 結合形成了一種使用無監督預訓練和有監督微調相結合的語言理解任務的“半監督方法”誠信 責任 親和 專業 創新 29 ChatGPT生成式AI迎來拐點,商用落地前景可期 請參閱附注免責聲明 GPT-1:模型更簡化、計算加速,更適合自然語言生
43、成任務(NLG)02 資料來源:Improving Language Understanding by Generative Pre-Training 論文,稀土掘金,國泰君安證券研究 GPT相比于Transformer等 模型進行了顯著簡化 相比于Transformer,GPT訓練了一個12層僅decoder的解碼器(原Transformer模型中包含Encoder和Decoder兩部分)。相比于Google的BERT(Bidirectional Encoder Representations from Transformers,雙向編碼生成Transformer),GPT僅采用上文預測單詞
44、(BERT采用了基于上下文雙向的預測手段)。注:ChatGPT的表現更貼近人類意圖,部分因為一開始GPT是基于上文的預測,這更貼近人類的話語模式,因為人類言語無法基于將來的話來做分析。VS 圖30:GPT-1模型相比于Transformer模型有了顯著簡化 Transformer架構 GPT-1架構 GPT用于對不同任務進行微調的輸入轉換的示意圖 誠信 責任 親和 專業 創新 30 ChatGPT生成式AI迎來拐點,商用落地前景可期 請參閱附注免責聲明 GPT-2:采用多任務系統,基于GPT-1進行優化 02 資料來源:Language Models are Unsupervised Mult
45、itask Learners論文,國泰君安證券研究 GPT-2在GPT-1的基礎上進行諸多改進,實現執行任務多樣性,開始學習在不需要明確監督的情況下執行數量驚人的任務 在GPT-2階段,OpenAI去掉了GPT-1階段的有監督微調(fine-tuning),成為無監督模型。大模型GPT-2是一個1.5B參數的Transformer,在其相關論文中它在8個測試語言建模數據集中的7個數據集上實現了當時最先進的結果。模型中,Transfomer堆疊至48層。GPT-2的數據集增加到8 million的網頁、大小40GB的文本。GPT-2的核心抓手采用多任務模型(Multi-task)GPT-2要實現
46、的目標 GPTGPT-2 2調整優化的目的調整優化的目的是為了解決零次學習問題(zero-shot)(注:zero-shot問題,就是針對AI在面對不認識的事物時,也能進行推理)多任務模型的特點多任務模型的特點:跟傳統ML需要專門的標注數據集不同(從而訓練出專業AI),多任務模型不采用專門AI手段,而是在海量數據喂養訓練的基礎上,適配任何任務形式。轉向更通用的系統,使其可以執行許多任務,最終無需為每個任務手動創建和標記訓練數據集。機器學習系統通過使用大型數據集、高容量模型和監督學習的組合,在訓練任務方面表現出色,然而這些系統較為脆弱,對數據分布和任務規范的輕微變化非常敏感,因而使得AI表現更像
47、狹義專家,并非通才。GPT-2要解決和優化的問題 圖31:GPT-2通過調整原模型和采用多任務方式來讓AI更貼近“通才”水平 誠信 責任 親和 專業 創新 31 ChatGPT生成式AI迎來拐點,商用落地前景可期 請參閱附注免責聲明 GPT-2仍未解決應用中的諸多瓶頸 02 資料來源:Language Models are Few-Shot Learners論文,國泰君安證券研究 GPT-2聚焦在無監督、zero-shot(零次學習)上,然而GPT-2訓練結果也有不達預期之處,所存在的問題也亟待優化 在GPT-2階段,盡管體系結構是任務無關的,但仍然需要任務特定的數據集和任務特定的微調:要在所
48、需任務上實現強大的性能,通常需要對特定于該任務的數千到數十萬個示例的數據集進行微調。存在的問題02:預訓練加微調范式中,可能在這種范式下實現的泛化可能很差,因為該模型過于特定于訓練分布,并且在其之外無法很好地泛化。微調模型在特定基準上的性能,即使名義上是人類水平,也可能夸大基礎任務的實際性能。存在的問題03:因為人類學習大多數語言任務不需要大型受監督的數據集,當前NLP技術在概念上具有一定的局限性。存在的問題01:從實用的角度來看,每一項新任務都需要一個標記示例的大數據集,這限制了語言模型的適用性;對于其中的許多任務(從糾正語法到生成抽象概念的示例,再到評論一個短篇故事等等),很難收集一個大型
49、的監督訓練數據集,特別是當每個新任務都必須重復該過程時。問題問題 0202 問題問題0101 問題問題0303 GPT-2階段存在的問題點 圖32:GPT-2尚未解決諸多瓶頸問題 誠信 責任 親和 專業 創新 32 ChatGPT生成式AI迎來拐點,商用落地前景可期 請參閱附注免責聲明 GPT-3取得突破性進展,任務結果難以與人類作品區分開來 02 GPT-3對GPT-2追求無監督與零次學習的特征進行了改進 GPT-3利用了過濾前45TB的壓縮文本,在諸多NLP數據集中實現了強大性能 GPT-3是一個具有1750億個參數的自回歸語言模型,比之前的任何非稀疏語言模型多10倍。對于所有任務(在fe
50、w-shot設置下測試其性能),GPT-3都是在沒有任何梯度更新或微調的情況下應用的,僅通過與模型的文本交互來指定任務和few-shot演示。GPT-3在許多NLP數據集上都有很強的性能(包括翻譯、問題解答和完形填空任務),以及一些需要動態推理或領域適應的任務(如解譯單詞、在句子中使用一個新單詞或執行三位數算術)。GPT-3可以生成新聞文章樣本(已很難將其與人類撰寫的文章區分開來)。圖34:GPT-3相關研究顯示,few-shot(少量樣本)的綜合表現是在無監督模式下最優的 資料來源:Language Models are Few-Shot Learners,國泰君安證券研究 圖33:GPT-
51、3的模型參數在GPT-2的基礎上增加110多倍 資料來源:Language Models are Few-Shot Learners,國泰君安證券研究 誠信 責任 親和 專業 創新 33 ChatGPT生成式AI迎來拐點,商用落地前景可期 請參閱附注免責聲明 InstructGPT模型在GPT-3基礎上進一步強化 02 資料來源:Training language models to follow instructions with human feedback論文,稀土掘金,國泰君安證券研究 InstructGPT使用來自人類反饋的強化學習方案RLHF(reinforcement learn
52、ing from human feedback),通過對大語言模型進行微調,從而能夠在參數減少的情況下,實現優于GPT-3的功能 InstructGPT提出的背景:使語言模型更大并不意味著它們能夠更好地遵循用戶的意圖,例如大型語言模型可以生成不真實、有毒或對用戶毫無幫助的輸出,即這些模型與其用戶不一致。另外,GPT-3雖然選擇了少樣本學習(few-shot)和繼續堅持了GPT-2的無監督學習,但基于few-shot的效果,其稍遜于監督微調(fine-tuning)的方式?;谝陨媳尘?,OpenAI在GPT-3基礎上根據人類反饋的強化學習方案RHLF,訓練出獎勵模型(reward model)去
53、訓練學習模型(即:用AI訓練AI的思路)InstructGPT的訓練步驟為:對GPT-3監督微調訓練獎勵模型(reward model)增強學習優化SFT(第二、第三步可以迭代循環多次)圖35:InstructGPT訓練三步驟各自對應的數據集規模如下圖所示(labeler指的是OpenAI的標注人員,customer指GPT-3 API的用戶)誠信 責任 親和 專業 創新 34 ChatGPT生成式AI迎來拐點,商用落地前景可期 請參閱附注免責聲明 ChatGPT核心技術優勢:提升了理解人類思維的準確性 02 資料來源:Training language models to follow in
54、structions with human feedback論文,國泰君安證券研究 InstructGPT與ChatGPT屬于相同代際的模型,ChatGPT只是在InstructGPT的基礎上增加了Chat屬性,且開放了公眾測試 ChatGPT提升了理解人類思維的準確性的原因在于利用了基于人類反饋數據的系統進行模型訓練(注:根據官網介紹,GhatGPT也是基于InstructGPT構建,因而可以從InstructGPT來理解ChatGPT利用人類意圖來增強模型效果)圖36:基于人類反饋強化的核心訓練流程如下所示:步驟1:搜集說明數據,訓練監督策略 步驟2:搜集比較數據,訓練一個獎勵模型 步驟3
55、:搜集說明數據,使用增強學習優化模型 搜集說明數據(基于 prompt 訓練方式的數據集),訓練監督策略 Labeler(標記者)揭示期望的輸出行為 這個數據用來聯合監督學習,對GPT-3進行微調 對這個prompt訓練的數據集和若干模型的結果進行抽樣 Labeler(標記者)從最優到最差將輸出結果進行排序 這個數據用來訓練反饋模型 新的prompt從數據集中抽樣 借助模型生成輸出 反饋模型為輸出計算一個反饋結果 反饋結果用來優化策略 誠信 責任 親和 專業 創新 35 ChatGPT生成式AI迎來拐點,商用落地前景可期 請參閱附注免責聲明 ChatGPT得益于通用(基礎)模型所構建 AI 系
56、統的新范式 02 基礎模型(Foundation Model)在廣泛的應用中整合構建機器學習系統的方法,它為許多任務提供了強大的杠桿作用 基礎模型是在深度神經網絡和自我監督學習的基礎上演化而來?;A模型基于廣泛數據(通常使用大規模自我監督)訓練的任何模型,可以適應(例如微調)廣泛的下游任務,目前例子包括BERT(Devlin et al.)、GPT-3(Brown et al.2020)和CLIP(Radford et al.2021)。機器學習使學習算法同質化(例如,邏輯回歸),深度學習使模型架構同質化(如卷積神經網絡),而基礎模型使模型本身同質化(比如,GPT-3)。資料來源:On the
57、 Opportunities and Risks of Foundation Models 論文,國泰君安證券研究 圖37:人工智能的發展呈現同質化的過程 隨著機器學習的引入,任務是如何執行的(自動推斷)從例子中顯現出來 隨著深度學習,用于預測的高級特征出現 有了基礎模型,甚至出現了情境學習等高級功能 誠信 責任 親和 專業 創新 36 ChatGPT生成式AI迎來拐點,商用落地前景可期 請參閱附注免責聲明 ChatGPT以基礎模型為杠桿,可適用多類下游任務 02 ChatGPT采用了GPT3.5(InstructGPT)大規模預訓練模型,在自然語言理解和作品生成上取得極大性能提升 鑒于傳統N
58、LP技術的局限問題,基于大語言模型(LLM)有助于充分利用海量無標注文本預訓練,從而文本大模型在較小的數據集和零數據集場景下可以有較好的理解和生成能力?;诖竽P偷臒o標準文本書收集,ChatGPT得以在情感分析、信息鉆取、理解閱讀等文本場景中優勢突出。隨著訓練模型數據量的增加,數據種類逐步豐富,模型規模以及參數量的增加,會進一步促進模型語義理解能力以及抽象學習能力的極大提升,實現ChatGPT的數據飛輪效應(用更多數據可以訓練出更好的模型,吸引更多用戶,從而產生更多用戶數據用于訓練,形成良性循環)。研究發現,每增加參數都帶來了文本合成和/或下游NLP任務的改進,有證據表明,日志丟失與許多下游任
59、務密切相關,隨著規模的增長,日志丟失呈現平穩的改善趨勢。資料來源:On the Opportunities and Risks of Foundation Models 論文 圖38:基礎模型可以集中來自各種模態的所有數據的信息,然后這一模型可以適用于廣泛的下游任務 誠信 責任 親和 專業 創新 37 ChatGPT生成式AI迎來拐點,商用落地前景可期 請參閱附注免責聲明 ChatGPT大模型架構也是ML發展到第三階段的必然產物 02 ML中的計算歷史分為三個時代:前深度學習時代、深度學習時代和大規模時代,在大規模時代,訓練高級ML系統的需求快速增長 計算、數據和算法的進步是指導現代機器學習(
60、ML)進步的三個基本因素。在2010年之前,訓練計算的增長符合摩爾定律,大約每20個月翻一番。自2010年代早期深度學習(Deep Learning)問世以來,訓練計算的規模已經加快,大約每6個月翻一番。2015年末,隨著公司開發大規模ML模型,訓練計算需求增加10至100倍,出現了一種新趨勢訓練高級ML系統的需求快速增長。2015-2016年左右,出現了大規模模型的新趨勢。這一新趨勢始于2015年末的AlphaGo,并持續至今(GPT-3于2020年出現)。文章 研究結論 Amodei&Hernandez(2018)3.4 month doubling time between 2012 a
61、nd 2018 Sastry,G.,et.al(2019,November).2 year doubling period between 1959 and 2018 Lyzhov,A.(2021,April).2 year doubling period between 2018 and 2020 表3:ML相關計算規模呈現持續快速攀升趨勢 數據來源:compute trends across three eras of machine learning,Jaime Sevilla et.al 圖40:2010年至2022年間102個里程碑ML系統的訓練計算趨勢如下所示 數據來源:compu
62、te trends across three eras of machine learning,Jaime Sevilla et.al,國泰君安證券研究 38 誠信 責任 親和 專業 創新 ChatGPT生成式AI迎來拐點,商用落地前景可期 請參閱附注免責聲明 03 行業進程:AIGC多模態交互功能持續演化,奠定多場景商用基礎 誠信 責任 親和 專業 創新 39 ChatGPT生成式AI迎來拐點,商用落地前景可期 請參閱附注免責聲明 AIGC:利用人工智能產生內容,提升生產力曲線 03 代碼生成 文本問答 圖像生成 視頻生成 其他 AIGC AIGC:Artificial Intelligen
63、ce Generated Context,即可以利用人工智能技術自動產生內容,常見如代碼生成,文本問答等 ChatGPT 可與人類進行流暢的文本問答 Copilot 可自動編寫代碼 DALLE2 由文字描述生成圖像,如:An astronaut riding a hourse as a pencil drawing 資料來源:OpenAI官網,Copilot官網,Synthesia官網,國泰君安證券研究 Synthesia可將輸入文本合成不同述說風格的視頻 圖41:AIGC應用功能簡單如下圖所示 誠信 責任 親和 專業 創新 40 ChatGPT生成式AI迎來拐點,商用落地前景可期 請參閱附注
64、免責聲明 ChatGPT已成為AIGC功能矩陣中的重要板塊 03 ChatGPT是AIGC“數字內容智能編輯”功能中的重要組成部分,ChatGPT 模型的出現對于文字/語音模態的 AIGC 應用具有重要意義 隨著深度學習技術的快速突破以及數字內容的海量增長,AIGC領域相關技術打破了預定義規則的局限性,使得快速便捷且智慧地輸出多模態的數字內容成為可能。在技術創新以及多模態模型的持續突破下,AIGC根據功能和對象的不同,按順序可包括三種主要實用功能:數字內容孿生、數字內容的智能編輯、數字內容的智能創作。這三種功能相互嵌套與結合,可以讓AIGC產品具備超越人類的創作潛力。而ChatGPT正是AIG
65、C的數字內容智能編輯這一大功能領域中的重要組成部分。資料來源:Sam Altman,機器翻譯觀察(公眾號),國泰君安證券研究 模型托管、交易平臺模型托管、交易平臺 面向C端和B端的應用 OpenAI GPT DeepMind Gopher Google GlaM Azure 云計算平臺 Google Cloud AWS Ali cloud BERT EMLo 大型語言模型(LLM)Hugging Face Replicat LanguageX 中間層中間層 Startup 圖42:ChatGPT是AIGC的產品應用框架中大型語言模型的重要板塊 誠信 責任 親和 專業 創新 41 ChatGPT
66、生成式AI迎來拐點,商用落地前景可期 請參閱附注免責聲明 AIGC相關技術包含了三大前沿能力 03 資料來源:中國信通院,國泰君安證券研究 數字內容孿生能力構建現實世界-虛擬世界映射 孿生能力包括智能增強與轉譯技術,其中增強技術彌補內容數字化過程中的信息損失,轉譯技術在理解基礎上對內容進行多種形式呈現 數字編輯能力打通現實世界虛擬世界交互通道 編輯能力包括智能語義理解與屬性控制,語義理解幫助實現數字內容各屬性的分離解耦,屬性控制則在理解基礎上對屬性進行精確修改、編輯與二次生成,最終反饋于現實世界,形成孿生-反饋閉環 數字創作能力從數據理解走向數據創作 創作能力可分為基于模仿的創作與基于概念的創
67、作,前者基于對某一類作品數據分布進行創作,而后者從海量數據中學習抽象概念,并基于概念創作出現實世界不存在的內容 計算機視覺技術 自然語言處理技術 其他單模態技術 多模態技術 孿生能力 編輯能力 創作能力 智能增強 智能轉譯 語義理解 屬性控制 基于模仿創作 基于概念創作 三維重構 音頻修復 語音合成 視覺描述 摘要生成 數字人 智能作畫 短片創作 圖43:AIGC三大前沿技術能力架構如下圖所示 誠信 責任 親和 專業 創新 42 ChatGPT生成式AI迎來拐點,商用落地前景可期 請參閱附注免責聲明 快速發展階段 2010s-至今 IBM推出基于HMM架構的 語音控制打字機 Tangora,可
68、處理約20000個單詞 80年代中期 1957年 萊杰倫希勒 與 倫納德艾薩克森利用計算機完成世界首曲由計算機完成的音樂 依利亞克組曲(Illiac Suite)1966年 約瑟夫魏岑鮑姆與 肯尼斯科爾比 推出世界首款人機可對話機器人 Eliza 2007年 世界首部完全由人工智能創作的小說 1 The Road 微軟公開展示全自動同聲傳譯系統,可講英文語音自動轉化為中文語音 2012年 2014年 對抗生成網絡 GAN被提出,GAN網絡極大提高AI生成內容的逼真度 2017年 微軟人工智能“小冰”創作世界首部100%由人工智能創作詩集 陽光失了玻璃窗 2018年 英偉達發布StyleGAN,
69、其可以自動生成人眼難以分辨真假的高質量圖片,2019年 谷歌DeepMind提出DVD-GAN是用AI自動生成連續視頻 2021年 OpenAI提出DALLE2 輸入文字即可生成極高質量且風格多樣的圖片 早期萌芽階段 20世紀50年代-90年代中期 受限于科技水平,AIGC僅限于小范圍試驗 沉淀積累階段 1990s-2010s 由實驗性向實用性轉變 模型結構不斷創新,AIGC內容多樣性與逼真度不斷提高 AIGC行業發展經歷了三個主要時期 03 資料來源:中國通信研究院,國泰君安證券研究 AIGC發展經歷了早期萌芽、沉淀積累和2014年之后的快速發展階段 圖44:AIGC經歷了大致三個階段的演化
70、發展 誠信 責任 親和 專業 創新 43 ChatGPT生成式AI迎來拐點,商用落地前景可期 請參閱附注免責聲明 從分析式AI到生成式AI逐步演化,生成式AI賦予AIGC創新力 03 生成式AI起源于分析式AI,分析式AI發展過程中的技術積累為生成式AI的產生奠定基礎 分析式AI其學習的知識局限于數據本身;生成式AI在總結歸納數據知識的基礎上可生成數據中不存在的樣本 最新生成式AI技術如GAN,Diffusion等,催生多款AIGC產品如:OpenAI系列、DALLE2(Diffusion),Starry A.I.(基于GAN)等 資料來源:OpenAI官網,Starry A.I.官網,國泰君
71、安證券研究 分析式AI 利用機器學習技術學習數據分布,進行如分類,預測等任務。發展過程中誕生了卷積神經網絡,殘差深度網絡,Transformer網絡結構等 推薦系統:挖掘用戶與物品的關聯關系 人臉識別:根據輸入人臉信息進行身份判別 文字識別:根據文字圖片輸出文本 生成式AI 在學習歸納數據分布的基礎上,學習數據產生的模式,并創造數據中不存在的新樣本。在分析式AI技術基礎上誕生大型Transformer網絡,Diffusion等新模型 文字創作:通過提示文本生成完整文案 圖像生成:根據關鍵信息生成風格多樣圖片,如博客配圖,海報圖片等 代碼生成:根據上下文生成完整代碼 數據學習 數據學習+新數據生
72、成 圖45:AIGC是在分析式AI的基礎上,學習數據產生模式,實現新樣本內容的創造 誠信 責任 親和 專業 創新 44 ChatGPT生成式AI迎來拐點,商用落地前景可期 請參閱附注免責聲明 AIGC:學習范式更新奠定基礎,模型結構升級助力騰飛 03 深度變分自編碼器 對抗生成網路 卷積神經網絡模型 在視覺識別任務上表現遠超傳統機器學習算法,開啟深度學習序幕 通過將隱特征建模為可采樣的分布,首次穩定地生成從未觀測過的圖像,極大推動AI生成技術發展 通過生成器與判別起的不斷博弈學習,提高生成樣本的清晰度與逼真度,可以生成真假難辨的內容 擴散模型 擴散模型在GAN基礎上進一步提高樣本多樣性與逼真度
73、 Transformer結構 提高上下文建模能力,并行的結構加快訓練速度,使得構建超大規模模型成為可能 模型結構不斷升級 學習范式更新 基于規則的機器學習 基于預先定義的統計模型或規則完成任務,模型自身并不具有學習能力 基于損失函數 與梯度下降 通過損失函數與梯度下降更新模型參數,模型自身可對數據內容進行學習 人工智能技術推動AIGC行業不斷發展,其中學習范式的更新賦予AI模型主動學習能力,模型結構升級提升AI模型學習、歸納與創新能力 資料來源:中國通信研究院,國泰君安證券研究 圖46:AI模型的升級迭代為AIGC性能跨越式發展奠定基礎 誠信 責任 親和 專業 創新 45 ChatGPT生成式
74、AI迎來拐點,商用落地前景可期 請參閱附注免責聲明 AIGC產業鏈涵蓋了從硬件到多類終端應用的廣泛領域 03 資料來源:機器翻譯觀察(微信公眾號),國泰君安證券研究 AIGC關聯產業可分為應用層、模型層、云計算平臺與計算硬件層 計算硬件層結合云計算平臺為AIGC提供機器學習訓練與推理算力,其中GPU與TPU為硬件核心,主要參與廠商包括英偉達(GPU)與谷歌(TPU);云平臺參與廠商則包含AWS,GCP,Azure以及Coreweave;計算硬件層中云計算平臺廠商分布穩定,競爭出現于模型層面與應用層面。模型層面,閉源基礎模型提供商如OpenAI通過API向用戶提供服務,而開源基礎模型則通過在托管
75、平臺如Hugging Face、Replica公開模型權重。模型訓練其高計算力需求推動了模型層廠商與云計算廠商建立合作關系(如 OpenAI+Azure,GCP+DeepMind。模型層面閉源模型較為普遍,各廠商依靠模型建立技術壁壘 在應用層面,MidJourney,Runway等自主研發、持有模型;而Jasper,Github Copilot則通過調用閉源模型商提供的API或采用托管平臺共享的模型。計算硬件層 提供模型訓練與推理的加速芯片 如:GPU(英偉達),TPU(谷歌)閉源基礎模型 通過API開放大規模預訓練模型 如:Open AI的GPT-3 云計算平臺 為開發者提供云計算服務 如:
76、AWS,GCP,Azure,Coreweave 模型托管平臺 儲存與分享模型 如:Hugging Face,Replica 開源基礎模型 開放訓練完成的模型權重 如:Stable Diffusion(stability)應用 面向B2B、B2C應用,自身不持有模型 如:Jasper,Github Copilot 端到端應用 自身持有模型 如:Midjourney,Runway 模型層 應用層 圖47:AIGC市場框架可由基礎設施層、模型層、托管平臺以及應用層來進行劃分 誠信 責任 親和 專業 創新 46 ChatGPT生成式AI迎來拐點,商用落地前景可期 請參閱附注免責聲明 AIGC產業鏈上下
77、游玩家百花齊放 03 資料來源:中國信通院,國泰君安證券研究 數據供給方(業務數據聯通、素材數據收集等,如第三方營銷公司、版權圖庫方)數據拆分及標注 創作者生態 生物資產及內容素材提供 底層配合工具 渲染引擎、混音設備等 相關算法/模型研究機構 相關開源算法 嵌入/結合能力的業務平臺/業務生態 上游 下游 各類內容創作及分發平臺(基于AIGC激發PGC及UGC活力 第三方分發渠道 內容終端生產廠商 新聞媒體機構、金融機構 消費品廠商 AIGC內容檢測 第三方內容服務機構 如MCN、公關公司等 中游 內容設計 視覺設計、文案設計、結構設計等 內容制工具 音頻/視頻編輯工具、新聞采編、游戲制作 周
78、邊售賣 NFT個性化產品等 運營增效 智能客服、簡單決策等 自動實時交互 數據梳理 內外部數據分享及更新、數據分析及算法訓練 個性化市場營銷 廣告植入、品牌虛擬形象打造、各模態營銷內容生成 彩云小夢 賅推智能 智搜科技 秘塔科技-秘塔寫作貓 香儂慧語-火龍果寫作 黑狐科技-寫作狐 文字 詩云科技 圖像 視頻 音頻 靈動音科技 游戲 AIGC虛擬人 其他機構 垂直賽道初創公司 綜合賽道初創公司 AIGC上游主要包括數據供給方、算法機構、創作者生態以及底層配合工具等,中游主要是文字、圖像、音頻和視頻處理廠商,其中玩家眾多;下游主要是各類內容創作及分發平臺以及內容服務機構等。圖48:AIGC產業鏈上
79、下游參與者分類如下圖所示 誠信 責任 親和 專業 創新 47 ChatGPT生成式AI迎來拐點,商用落地前景可期 請參閱附注免責聲明 AIGC廠商之間的競爭在于模型層面競爭 03 資料來源:各公司官網,騰訊研究院,量子位,國泰君安證券研究 追根溯源,AIGC依賴于底層機器學習模型產生內容,因此模型為AIGC行業廠商真正競爭力所在 文本生成產品多依賴GPT系列模型,自己訓練的模型在圖像/視頻模態產品中較為普遍(圖像/視頻模態產品通常擁有自己訓練的模型,而不是如文本模態調用OpenAI提供的模型服務)比較而言,OpenAI依靠模型建立先發競爭優勢,技術到產品轉化相對亮眼 Open AI Stabi
80、lity AI Midjourney Meta GPT系列模型 ChatGPT,CLIP DALLE 2 Codex Midjourney Stable Diffusion Make-a-scene Make-a-video 模型 基于GPT-3:Snazzy AI,Copysmith,Copy.ai 基于Codex:Github Copliot 基于DALLE 2:DALLE 2 Dreamstudio 開源算法Stable Diffusion應用于DALLE 2,Diffusion等其他公司模型中 產品 圖49:AIGC模型產品之間存在激烈競爭 誠信 責任 親和 專業 創新 48 Chat
81、GPT生成式AI迎來拐點,商用落地前景可期 請參閱附注免責聲明 AIGC取長補短,有望成為主流內容生產模式 03 AIGC所屬內容生產生態的發展經歷了專家生產內容(PGC)、用戶生成內容(UGC)、AI輔助生產內容、AI生產內容(AIGC)四個階段,目前處于一、二階段為主,第三階段為輔的境況 AIGC克服PGC與UGC存在的 質量、產量 無法兼具的缺點,其有望成為未來主流的內容生產模式 資料來源:foresightnews.pro,中國信通院,國泰君安證券研究 PGC UGC AIGC 輔助 由專業團隊生產,內容質量高 內容生產門檻高,壟斷嚴重 生產周期長,難以滿足大規模生產需求 電視,電影,
82、游戲等 創作工具下放,用戶可自行生產內容,創作門檻、成本降低 內容生產參與者眾多,創作生態繁榮,個性化程度高 創作者參差不齊,內容質量不高 短視頻,社交媒體文章,播客等 AI技術學習的專業知識輔助內容生產環節,提高內容質量 AI技術實現自動化內容生產,減少創作耗時,提高內容生產規模天花板 人在關鍵環節依然需要輸入指令,沒有做到完全自主性 AI輔助文字創作,圖片創作等 AIGC 實現完全自主性 AI自主文字創作,圖片創作等 圖50:AIGC生態內容生產模式理論上會經歷四個發展階段 誠信 責任 親和 專業 創新 49 ChatGPT生成式AI迎來拐點,商用落地前景可期 請參閱附注免責聲明 AIGC
83、生成技術可按模態進行分類 03 AIGC 視頻 視頻畫質增強 視頻內容創作 視頻風格遷移 文本 文本創作 代碼生成 對話問答 圖像 圖片編輯 圖片生成 3D圖像生成 音頻 文本合成語音 語音克隆 音樂生成 跨模態 文字合成圖片 文字合成視頻 AIGC根據其內容模態不同可分為文本、視頻、圖像,音頻與跨模態生成 資料來源:各公司官網,中國通信研究院,國泰君安證券研究 圖51:AIGC應用功能簡單如下圖所示 誠信 責任 親和 專業 創新 50 ChatGPT生成式AI迎來拐點,商用落地前景可期 請參閱附注免責聲明 AIGC不同模態對應著各種生成技術及應用場景 03 AIGC不同模態對應的技術應用場景
84、也有著各自的細分品類 資料來源:量子位智庫,國泰君安證券研究 圖52:AIGC各技術應用場景對應的特征及細分品類如下圖所示 文本生成 分為非交互式文本和交互式文本 音頻生成 包括語音克隆、文本生成特定語音,音樂生成 視頻生成 視頻屬性編輯,視頻自動剪輯,視頻部分編輯 跨模態生成 文字生成圖像,文字生成視頻,圖像/視頻到文本 圖像生成 分為圖像編輯工具和圖像自主生成工具 策略生成 AI基于特定問題和場景,自主提出解決方案的過程。此類技術在游戲、自動駕駛、機器人控制等領域有極高 應用價值。GameAl 游戲本身為AI提供了最佳的研發場景,有大量數據和貼近實 際場景 虛擬人生成 指存在于非物理世界(
85、如圖片、視頻、直播、一體服務機、VR)中,并具有多重人類特征的綜合產物。AIGC各模態應用領域 誠信 責任 親和 專業 創新 51 ChatGPT生成式AI迎來拐點,商用落地前景可期 請參閱附注免責聲明 AIGC文本生成技術場景可分為交互式和非交互式 03 結構化寫作 基于結構化數據,在特定場景類型下生成結構化文本內容,如新聞,財報等簡訊寫作?,F有產品如:WordSmith,AX Semantics等 創作型(非結構化)寫作 相比結構化的文本,創作型文本具有更高的開放度與自由度,需要一定的創意與個性化,如社交媒體,營銷文案,博客文案等?,F有產品如:WriteSonic、Retresco等 閑聊
86、機器人 在一個上下文中進行文本交互,如客服問答,機器人聊天等?,F有產品如:小冰島等 非交互式文本 交互式文本 文本交互游戲 使用AI技術生成游戲內容,現有產品如AI Dungeon等 文本生成 AIGC非交互式文本生成技術中,結構化寫作其形式相對固定,生成難度較小,商業化應用較為廣泛;而創作型寫作開放性較大,在長文本生成中難度較大,仍需技術進一步發展 隨著通信互聯網技術發展,線上社交需求快速增長,如閑聊機器人等交互式文本產品將迎來快速發展 資料來源:量子位智庫,國泰君安證券研究 圖53:文本內容生產領域相關細分特征如下架構圖所述 誠信 責任 親和 專業 創新 52 ChatGPT生成式AI迎來
87、拐點,商用落地前景可期 請參閱附注免責聲明 圖54:文本生成技術商業化落地有比較優勢 AIGC文本生成技術商業化落地有望優勢先發 03 文本領域預訓練大模型技術成熟,文本領域細分垂類較多,產品數量居首位,模型數量發展超過其他模態技術 數字內容中,文字模態數據遠大于圖片/視頻/音頻等,發展前景相對較大 基于GPT-3的文字生成功能已嵌入如Writesonic、Conversion.ai、Copysmith等軟件中,商業化前景相對清晰 資料來源:量子位智庫,國泰君安證券研究 文本易于獲得 相較于其他模態數據,文本數據易于獲得且數量龐大,滿足大規模預訓練模型對數據量的需求 文本表達信息更為高效 相比
88、圖片,語音,視頻等模態,文本信息在存儲、處理、傳輸時占用資源少,而信息量不遜色于圖片等。在這種優勢文本將成為人機交互等領域的首選 大模型趨勢下文本預訓練實現難度小 文本數據其離散的性質使得相同模型架構下大模型訓練消耗資源低與圖片/視頻 BERT GPT UniLM ELMO word2vec XLNet T5 ALBERT ALBERT BART 圖55:AIGC文本模態技術(包括文本與代碼)商業化領跑視頻/圖像模態技術 資料來源:紅杉,國泰君安證券研究 誠信 責任 親和 專業 創新 53 ChatGPT生成式AI迎來拐點,商用落地前景可期 請參閱附注免責聲明 AIGC圖像生成技術隨著模型結構
89、的優化而明顯提升 03 圖像編輯工具 更改或復刻圖片風格,或根據提示更改圖片的其中一部分或在圖片中添加新的構成元素等 現有產品如:NightCafe、Metaphysics等 創意圖像生成 自由或按照一定風格產生圖像 現有產品如:Starry A.I.等 圖像自主生成 圖像生成 2D圖像生成3D模型 輸入2D圖像,由AI生成圖像中物體的3D模型 現有產品如:英偉達GANverse3D 功能性圖像生成 按照指定要求產生海報,logo等有一定格式限制的圖像 現有產品如:DeepDreamGenerator等 模型結構不斷進化提高了AIGC生產圖像的多樣性,但要求較高的功能實現還有待于技術的進一步提
90、升 “圖像編輯”難度低于“圖像生成”與“2D-3D”轉換,目前已存在多款產品支持“圖像編輯”,而對于“圖像生成”任務,由于圖片相較包含更多元素,其生成效果仍存在不穩定性,對于要求較高的功能類圖像生成仍需要技術上的提升。變分自編碼器 對抗生成網絡 Transformer網絡 擴散模型 圖57:模型結構進化不斷提高了圖像生成質量 圖56:圖像生成技術具體實現包括圖像編輯、2D-3D轉換以及自主生成 資料來源:量子位智庫,國泰君安證券研究 資料來源:量子位智庫,國泰君安證券研究 誠信 責任 親和 專業 創新 54 ChatGPT生成式AI迎來拐點,商用落地前景可期 請參閱附注免責聲明 AIGC音頻生
91、成技術正朝更富情感等人類特征演化 03 音頻生成細分技術 文本到語音任務已比較成熟,語音質量已達到自然的標準,未來將朝更富情感、富韻律的語音合成以及小樣本語音學習方向發展 音樂生成任務中仍需解決音樂數據難以標注的問題,數據標注其顆粒度大小影響音樂生成任務的可控性。若可控性得以解決,則可指定風格、情緒等因素的音樂生成任務有希望在影視、游戲等場景下的到大量應用。資料來源:量子位智庫,國泰君安證券研究 文本到語文本到語音合成音合成 音樂生成音樂生成 音樂音樂生成生成 輸入文字,輸出特定說話人的語音,主要應用于機器人,語音播報等任務 現有產品/廠商如:科大訊飛、思必馳、ReadSpeaker等 語音克
92、隆語音克隆 語音克隆語音克隆 給定一段目標語音,將輸入的語音或文字轉換為目標語音中說話人的語音,其可視為指定說話人的語音合成任務,主要應用于智能配音等場景 現有產品/廠商如:ResembleAI、Replica等 根據開頭旋律或文字描述等利用AI自動生成特定樂曲 現有產品/廠商如:AmperMusic、IBM Watson Music等 文本到語音合成文本到語音合成 圖58:AIGC音頻細分生成技術特點如下圖所示 誠信 責任 親和 專業 創新 55 ChatGPT生成式AI迎來拐點,商用落地前景可期 請參閱附注免責聲明 視頻生成 為AIGC應用生態中的高潛力場景 03 資料來源:量子位智庫,國
93、泰君安證券研究 視頻生成本質上與圖片生成類似,通過對視頻進行幀數級別的切割,實現對每一幀的處理 視頻生成過程包括三個階段:數據的提取、訓練和轉換,當前技術正在著重提升視頻修改精準度和實時性兩個維度。鑒于視頻本身的文本、圖像和音頻的綜合屬性,視頻生成也是跨模態生成領域的重要應用場景。圖59:視頻生成技術具體包括視頻屬性編輯、視頻自動剪輯、視頻部分編輯 視頻屬性編輯 視頻畫質修復,添加特定內容,視頻美顏等 其產品如:Runway ML、Wisecut等 視頻自動剪輯 利用AI技術檢測視頻片段,生成預告片,宣傳視頻等 其產品如:IBM Watson 視頻內容動態編輯 利用AI技術對視頻中的內容進行動
94、態編輯,更換演員面部等 其產品如:Faceswap,Deepfakes等 誠信 責任 親和 專業 創新 56 ChatGPT生成式AI迎來拐點,商用落地前景可期 請參閱附注免責聲明 跨模態生成技術是真正實現認知和決策智能的轉折點 03 資料來源:量子位智庫,Nova AI官網,國泰君安證券研究 現實世界的信息是文本、音頻、視覺、傳感器以及人類各種觸覺的綜合體系,要更為精準地模擬現實世界,就需要將各種模態能力之間打通,例如文字-圖像、文字-視頻等跨模態生成能力 大型預訓練模型的發展使得跨模態逐步成熟,“文本-圖像”生成正在快速落地,“文字-視頻”的實驗效果也已較為理想(視頻時長、清晰程度、邏輯等
95、還有較大提升空間)。圖60:跨模態生成 領域當前的主要功能類型如下所示 文字生成圖像 根據文字描述生成創意圖像 其產品如:Open AI的DALLE2等 文字生成視頻(拼接圖片素材生成視頻)其產品如:Lumen5等 文字生成視頻(以端到端的方式生成視頻)其產品如:CogView2等 圖片/視頻生成文字 用于視覺問答系統,自動字幕等 其產品如:Noval AI等 誠信 責任 親和 專業 創新 57 ChatGPT生成式AI迎來拐點,商用落地前景可期 請參閱附注免責聲明 AIGC改變數字內容生產模式 03 電商 傳媒 其他 娛樂 影視 新聞采編 新聞稿寫作 視頻剪輯 新聞傳播 商品虛擬化 虛擬主播
96、 購物會場虛擬化 教育 金融 醫療 工業 趣味音視頻合成 建立虛擬偶像 開發C端數字化身 劇本創作 拓展角色與創作空間 助力影片剪輯 AIGC AIGC作為新的內容生產模式,其具有內容多樣,可控性強與生產效率高的優點,符合傳媒,電商,影視,娛樂等行業對內容數字化程度高、內容多樣以及內容更新快的要求,AIGC在以上行業逐漸替代傳統內容生產模式的趨勢十分顯著 資料來源:中國信通院,國泰君安證券研究 圖61:AIGC對各大行業的影響維度如下圖所示 誠信 責任 親和 專業 創新 58 ChatGPT生成式AI迎來拐點,商用落地前景可期 請參閱附注免責聲明 AIGC滲透傳媒領域各個環節 03 新聞采編
97、新聞稿件寫作 視頻剪輯 新聞播報 AIGC技術逐漸滲透傳媒領域包括采集、編輯、傳播等環節,有助于加快內容生產效率,提高內容質量,擴寬內容影響力 資料來源:中國信通院,國泰君安證券研究 語音轉換文字:自動化錄音整理,保證新聞時效性,減少機械性重復勞動 結構性文本寫作:基于算法纂寫新聞稿,加速內容生產,提高內容準確度 視頻自動剪輯:從素材中快速生成視頻,減少人工剪輯勞動量,加快視頻發布 跨模態視頻生成文字:自動生成與視頻同步的字幕 視頻屬性編輯:視頻增強工具提高視頻清晰度,帶給觀眾更好體驗 跨模態視頻合成:從新聞稿合成主播播報視頻,提高了播報效率與準確度,帶給觀眾不一樣的播報體驗 圖62:AIGC
98、對傳媒領域的賦能如下圖所述 誠信 責任 親和 專業 創新 59 ChatGPT生成式AI迎來拐點,商用落地前景可期 請參閱附注免責聲明 AIGC化2D為3D,拓展電商展示維度 03 商品 3D模型 3D 虛擬會場 虛擬主播 基于不同角度的商品圖像,借助視覺生成算法生成商品3D模型,720 全方位展示商品,減少消費者選品與溝通時間 3D商品模型提供線上虛擬“試、穿、看、戴”,高度還原商品真實效果,減小訂單退換貨率 通過AI技術打造虛擬主播介紹商品信息并提供客服服務,可實現直播24小時不間斷,為客戶提供更靈活的觀看時間與更方便的購物服務 虛擬主播人設可控性強,因主播自身原因導致品牌受損的幾率小 虛
99、擬主播易于拉近品牌與年輕消費者的距離,同時構建元宇宙潮流下的品牌形象,為未來多元化的虛擬世界打下基礎 通過從2D圖像構建3D場景的AI技術,降低商家搭建3D線上購物空間的門檻與成本。商家可向消費者提供線上沉浸式購物體驗,可降低門店擴張成本,擴大品牌知名度 AIGC 2D圖像生成3D模型技術為傳統電商提供多維度的展示空間 虛擬合成主播為客戶提供更及時、可靠、親和的服務體驗 資料來源:中國信通院,國泰君安證券研究 圖63:AIGC對有助于為電商行業降本增效 誠信 責任 親和 專業 創新 60 ChatGPT生成式AI迎來拐點,商用落地前景可期 請參閱附注免責聲明 AIGC打破傳統娛樂體驗邊界 03
100、 趣味圖像或音視頻合成 打造虛擬偶像,釋放IP價值 AIGC+娛樂 開發C端用戶數字化身 為用戶提供趣味性AIGC應用,在圖像視頻方面如AI換臉,AI合影;音頻方面如語音變聲器等 1.通過粉絲創作詞曲,真人提供聲源,AI語音軟件合成歌曲的方式,實現偶像粉絲共創,增加粉絲黏性 2.AI合成音視頻及AI 3D建模等技術支撐虛擬偶像在多樣場景下進行內容變現 通過用戶的一張圖片,可自動化生成具有“我”個人特色的虛擬形象,可在未來作為用戶虛擬世界中的數字化身 AIGC技術打破物理邊界,使粉絲可與偶像親密互動,并形成新的發展點 AIGC為用戶打開虛擬世界入口,通過趣味方式體驗虛擬世界 圖64:AIGC在娛
101、樂領域也有諸多賦能點,有助于進一步提升產業空間 資料來源:中國信通院,國泰君安證券研究 誠信 責任 親和 專業 創新 61 ChatGPT生成式AI迎來拐點,商用落地前景可期 請參閱附注免責聲明 AIGC拓寬影視行業創意邊際 03 助力劇本創作 拍攝中 拓展角色和場景創作空間 賦能視頻剪輯,后期制作 利用AI技術分析學習海量劇本數據,并根據預設風格快速產生劇本,創作者再進行篩選與二次加工,可極大縮短劇本創作周期,并激發創作者創造力,激發創作靈感 1.減小演員自身局限對影視作品的影響,如通過AI“數字復活”已故演員或替換劣跡藝人;減小演員自身與角色的年齡差距并輔助拍攝高難度動作拍攝 2.通過AI
102、合成虛擬場景,將無法實拍的場景呈現出來,拓寬作品想象力邊界,給觀眾帶來更好作品體驗 1.利用AI技術可實現影視圖像修復,還原,提升清晰度等任務,提升畫面質量 2.快速生成電影預告片 3.利用AI技術加速2D影視內容到3D的轉制速度 資料來源:中國信通院,國泰君安證券研究 AIGC技術以其內容多樣性為作品內容帶來更多靈感 AIGC技術幫助拍攝突破物理限制,還原劇本效果,提高作品質量 圖65:AIGC在劇本創作、拍攝過程以及后期制作方面均有助益 誠信 責任 親和 專業 創新 62 ChatGPT生成式AI迎來拐點,商用落地前景可期 請參閱附注免責聲明 AIGC促進各行業轉型升級 03 教育 賦予教
103、育材料新活力 金 融 實現降本增效 醫療 賦能診療全過程 工業 提升產業效率與價值 利用AI技術使抽象,平面的課本具體化,立體化,使知識傳播更生動,趣味 實現金融資訊、產品介紹視頻內容的自動化生產,提升機構運營效率 塑造虛擬數字客服,完善金融服務 AIGC將工程設計中重復、耗時、低層次的任務自動化,縮短整體設計時間 將基于物理環境的數字幾何圖形快速轉化為實時3D模型,高效創建工廠,設備等數字孿生系統 改善醫學圖像質量,錄入電子病歷,減輕醫生工作壓力 輔助病人康復治療,如使用語音合成技術為失語者合成語言音頻等 資料來源:中國信通院,國泰君安證券研究 AIGC技術在各行業數字內容相關領域均有發揮空
104、間 圖66:AIGC在教育、金融、工業、醫療領域的應用優勢如下圖所示 63 誠信 責任 親和 專業 創新 ChatGPT生成式AI迎來拐點,商用落地前景可期 請參閱附注免責聲明 04 商業化:多領域多功能應用密集落地,ChatGPT商用前景可期 誠信 責任 親和 專業 創新 64 ChatGPT生成式AI迎來拐點,商用落地前景可期 請參閱附注免責聲明 ChatGPT試點訂閱計劃ChatGPT Plus發布,商業化序幕已經拉開 04 2023年2月2日,OpenAI發布ChatGPT試點訂閱計劃ChatGPT Plus,每月20美元 ChatGPT Plus訂閱者可獲得比免費版本更穩定、更快的服
105、務,及嘗試新功能和優化的優先權 資料來源:OpenAI官網,國泰君安證券研究 圖67:ChatGPT Plus處于OpenAI官網的醒目位置,凸顯商業化傾向 圖68:ChatGPT Plus訂閱者可獲得比免費版本更優質的服務 資料來源:OpenAI官網,國泰君安證券研究 誠信 責任 親和 專業 創新 65 ChatGPT生成式AI迎來拐點,商用落地前景可期 請參閱附注免責聲明 ChatGPT+傳媒:實現智能新聞寫作,提升新聞的時效性 04 ChatGPT可以幫助新聞媒體工作者智能生成報道,將部分勞動性的采編工作自動化,更快、更準、更智能地生成內容 資料來源:中國信息通信研究院,國泰君安證券研究
106、 2014年3月,美國洛杉磯時報網站的機器人記者Quakebot,在洛杉磯地震后僅3分鐘,就寫出相關信息并進行發布 美聯社使用的智能寫稿平臺Wordsmith 可 以 每 秒 寫 出2000篇報道 中國地震網的寫稿機器人在九寨溝地震發生后7秒內就完成了相關信息的編發 第一財經“DT稿王”一分鐘可寫出1680字 圖69:過往成功案例眾多,ChatGPT在傳媒領域的商業化大有可為 誠信 責任 親和 專業 創新 66 ChatGPT生成式AI迎來拐點,商用落地前景可期 請參閱附注免責聲明 ChatGPT+影視:拓寬創作素材,提升作品質量 04 ChatGPT可以根據大眾的興趣身定制影視內容,從而更有
107、可能吸引大眾的注意力,獲得更好的收視率、票房和口碑 ChatGPT可以為劇本創作提供新思路,創作者可根據ChatGPT的生成內容再進行篩選和二次加工,從而激發創作者的靈感,開拓創作思路,縮短創作周期。ChatGPT 有著降本增效的優勢,可以有效幫助影視制作團隊降低在內容創作上的成本,提高內容創作的效率,在更短的時間內制作出更高質量的影視內容 2016年,紐約大學利用人工智能編寫劇本Sunspring,經拍攝制作后入圍倫敦科幻電影48小時前十強 2020年,美國查普曼大學的學生利用OpenAI的GPT-3模型創作劇本并制作短片律師 國內海馬輕帆科技公司推出的“小說轉劇本”智能寫作功能,服務了包括
108、你好,李煥英流浪地球等爆款作品在內的劇集劇本30000多集、電影/網絡電影劇本8000多部、網絡小說超過500萬部 圖70:內容生成在影視領域運用廣泛,ChatGPT在影視領域的商業化大有可為 資料來源:中國信息通信研究院,國泰君安證券研究 案例1 案例2 案例3 誠信 責任 親和 專業 創新 67 ChatGPT生成式AI迎來拐點,商用落地前景可期 請參閱附注免責聲明 ChatGPT+營銷:打造虛擬客服,賦能產品銷售 04 ChatGPT 可以打造虛擬客服,助力產品營銷 全天候營銷 01 ChatGPT虛擬客服為客戶提供24小時不間斷的產品推薦介紹以及在線服務能力,同時降低了商戶的營銷成本,
109、促進營銷業績快速增長 02 ChatGPT虛擬客服比人工客服更穩定可靠,在人工客服有限并且素質不齊的情況下,虛擬客服展現的品牌形象和服務態度等由商戶掌控,比人工客服的可控性、安全性更強 03 塑造品牌形象 ChatGPT虛擬客服能快速了解客戶需求和痛點,拉近商戶與消費人群的距離,塑造跟隨科技潮流、年輕化的品牌形象 穩定可靠 圖71:利用ChatGPT打造的虛擬客服,具備無可比擬的營銷優勢 資料來源:國泰君安證券研究 誠信 責任 親和 專業 創新 68 ChatGPT生成式AI迎來拐點,商用落地前景可期 請參閱附注免責聲明 ChatGPT+娛樂:人機互動加強,激發用戶參與熱情 04 ChatGP
110、T可以成為線上的實時聊天對象,增加互動的趣味性和娛樂性 圖72:ChatGPT的對話具備趣味性和娛樂性 資料來源:ChatGPT,國泰君安證券研究 誠信 責任 親和 專業 創新 69 ChatGPT生成式AI迎來拐點,商用落地前景可期 請參閱附注免責聲明 ChatGPT+其他:促進數實共生,助力產業升級 04 ChatGPT+教育:賦予教育教材新活力,讓教育方式更個性化、更智能 ChatGPT+金融:幫助金融機構降本增效,讓金融服務更有溫度 ChatGPT+醫療:賦能醫療機構診療全過程 ChatGPT給教育工作者提供全新的教學工具,學生可以通過自主提問的方式快速查缺補漏,讓每個學生得到更個性化
111、、更智能的教育 ChatGPT+教育 ChatGPT+金融 ChatGPT+醫療 一方面,金融機構可以通過ChatGPT實現金融資訊、金融產品介紹內容的自動化生產,提升金融機構內容生產的效率;另一方面,可以通過ChatGPT塑造虛擬理財顧問,讓金融服務更有溫度 ChatGPT可以快速了解患者的病情并給出較合理的及時反饋,通過人性化的方式第一時間撫慰患者,從而舒緩患者的情緒,加速其康復;同時,讓醫者有更多的時間和精力集中在關鍵患者的關鍵治療環節 圖73:ChatGPT在教育、金融和醫療產業中也大有用武之地 資料來源:國泰君安證券研究 誠信 責任 親和 專業 創新 70 ChatGPT生成式AI迎
112、來拐點,商用落地前景可期 請參閱附注免責聲明 短期來看,ChatGPT的快速推廣阻力仍存 04 短期來看,ChatGPT仍存在諸多不足,亟待解決的問題主要有兩方面:合規性問題和技術性問題 資料來源:零壹財經,第一財經,國泰君安證券研究 SUCCESS 技術性問題 合規性問題 1.ChatGPT產生的答復是否產生相應的知識產權?2.ChatGPT進行數據挖掘和訓練的過程是否需要獲得相應的知識產權授權?3.ChatGPT是基于統計的語言模型,這一機制導致回答偏差會進而導致虛假信息傳播的法律風險,如何降低其虛假信息傳播風險?1.ChatGPT的回答可能過時,因為其數據庫內容只到2021年,對于涉及2
113、022年之后,或者在2022年有變動的問題無能為力 2.ChatGPT在專業較強的領域無法保證正確率,即使在雞兔同籠此類初級問題中仍然存在錯誤,并且英文回答和中文回答存在明顯差異化 3.ChatGPT對于不熟悉的問題會強行給出一定的答案,即使答案明顯錯誤,依然會堅持下去,直到明確戳破其掩飾的內容,會立馬道歉,但本質上會在不熟悉的領域造成誤導 圖74:合規性問題和技術性問題是當前ChatGPT主要面臨的挑戰 本公司具有中國證監會核準的證券投資咨詢業務資格 分析師聲明 作者具有中國證券業協會授予的證券投資咨詢執業資格或相當的專業勝任能力,保證報告所采用的數據均來自合規渠道,分析邏輯基于作者的職業理
114、解,本報告清晰準確地反映了作者的研究觀點,力求獨立、客觀和公正,結論不受任何第三方的授意或影響,特此聲明。免責聲明 本報告僅供國泰君安證券股份有限公司(以下簡稱“本公司”)的客戶使用。本公司不會因接收人收到本報告而視其為本公司的當然客戶。本報告僅在相關法律許可的情況下發放,并僅為提供信息而發放,概不構成任何廣告。本報告的信息來源于已公開的資料,本公司對該等信息的準確性、完整性或可靠性不作任何保證。本報告所載的資料、意見及推測僅反映本公司于發布本報告當日的判斷,本報告所指的證券或投資標的的價格、價值及投資收入可升可跌。過往表現不應作為日后的表現依據。在不同時期,本公司可發出與本報告所載資料、意見
115、及推測不一致的報告。本公司不保證本報告所含信息保持在最新狀態。同時,本公司對本報告所含信息可在不發出通知的情形下做出修改,投資者應當自行關注相應的更新或修改。本報告中所指的投資及服務可能不適合個別客戶,不構成客戶私人咨詢建議。在任何情況下,本報告中的信息或所表述的意見均不構成對任何人的投資建議。在任何情況下,本公司、本公司員工或者關聯機構不承諾投資者一定獲利,不與投資者分享投資收益,也不對任何人因使用本報告中的任何內容所引致的任何損失負任何責任。投資者務必注意,其據此做出的任何投資決策與本公司、本公司員工或者關聯機構無關。本公司利用信息隔離墻控制內部一個或多個領域、部門或關聯機構之間的信息流動
116、。因此,投資者應注意,在法律許可的情況下,本公司及其所屬關聯機構可能會持有報告中提到的公司所發行的證券或期權并進行證券或期權交易,也可能為這些公司提供或者爭取提供投資銀行、財務顧問或者金融產品等相關服務。在法律許可的情況下,本公司的員工可能擔任本報告所提到的公司的董事。市場有風險,投資需謹慎。投資者不應將本報告作為作出投資決策的唯一參考因素,亦不應認為本報告可以取代自己的判斷。在決定投資前,如有需要,投資者務必向專業人士咨詢并謹慎決策。本報告版權僅為本公司所有,未經書面許可,任何機構和個人不得以任何形式翻版、復制、發表或引用。如征得本公司同意進行引用、刊發的,需在允許的范圍內使用,并注明出處為
117、“國泰君安證券研究”,且不得對本報告進行任何有悖原意的引用、刪節和修改。若本公司以外的其他機構(以下簡稱“該機構”)發送本報告,則由該機構獨自為此發送行為負責。通過此途徑獲得本報告的投資者應自行聯系該機構以要求獲悉更詳細信息或進而交易本報告中提及的證券。本報告不構成本公司向該機構之客戶提供的投資建議,本公司、本公司員工或者關聯機構亦不為該機構之客戶因使用本報告或報告所載內容引起的任何損失承擔任何責任。免責聲明 北京地址:北京市西城區金融大街甲9郵編:200032電話:(010)83939888電話:(021)38676666上海深圳地址:深圳市福田區益田路6009號郵編:518026電話:(0755)23976888國泰君安證券研究所E-mail:地址:上海市靜安區新閘路669號郵編:200041