《AI繪畫行業研究報告:AI繪畫元年征途在星辰大海-221101(17頁).pdf》由會員分享,可在線閱讀,更多相關《AI繪畫行業研究報告:AI繪畫元年征途在星辰大海-221101(17頁).pdf(17頁珍藏版)》請在三個皮匠報告上搜索。
1、請務必閱讀正文之后的免責條款部分 摘要:AI 繪畫是 AIGC 的重要分支,跨模態生成是該項技術發展的關鍵節點。AIGC 是基于生成對抗網絡 GAN、大型預訓練模型等人工智能技術,通過已有數據尋找規律,并通過適當的泛化能力生成相關內容的技術,可以看做是繼 PGC、UGC 之后的內容產出方式,AI 繪圖屬于 AIGC 技術場景中的分支。目前在該項技術上保持領先的主要是 NVIDIA、Google 等國外大廠,跨文字和圖像的多模態內容生成技術的實現成為 AI 繪畫關鍵的發展節點。AI 繪畫作品獲獎成導火線,Diffusion 模型為當前主流。AI 繪畫作品 太空歌劇院在美國一場人類藝術比賽中獲第一
2、名成為近期 AI 繪畫受到高度關注的導火線,通過Midjourney 軟件生成的繪畫作品絲毫不輸藝術家的創作成果。而基于Diffusion模型設計的Disco Diffusion、Stable Diffusion、DALLE2等多款 AI 繪圖應用成為目前主流產品。同時Dream by Wombo等手機 App 的上架使得 AI繪畫從專業度較高的產品向大眾化應用轉變。商業化潛力尚待發掘,有望參與 10%-30%的圖像內容生成工作。當前 AI 繪畫的用戶付費意愿不強,60%的用戶從未在 AI 繪畫相關方面付費,在 C 端付費形式刺激度較低的情況下,未來 B 端或將成為 AI 繪畫軟件的核心客戶。
3、但同時,AI 繪畫也面臨版權問題,絕大多數原創作品的版權擁有者會介意 AI 提取自身作品的部分元素。從市場規模來看,未來五年或將有 10%-30%的圖片內容由 AI 參與生成,相應或將有 600 億以上的市場規模??缒B或更進一步,下一代互聯網望成 AI 繪畫關鍵著力點。以 VR 設備等新型硬件為入口的下一代互聯網,2D 向 3D 的轉換對于內容量的需求或成指數級上升,這其中 AI 將成為重要輔助。目前,GAN 模型和 NeRF 模型均已能實現單張 2D 圖像向3D 模型的生成,并且動態、場景、光影效果等 3D 圖像所需的要素均已有了明顯進步。在此基礎上,文字向 2D 圖像生成,進而向 3D
4、模型的生成或有望實現,該項技術不僅在游戲等行業能得到有效應用,對于下一代互聯網各種元素的構建亦有關鍵意義。因此,AI 繪畫或不是結果,而只是 AI 進程中的一塊重要拼圖,有望在技術更新的加持下實現更大的應用價值。風險提示:AI 繪畫相關技術發展不及預期,商業化拓展低于預期。作者 陳筱 021-38675863 陳俊希 021-38032025 相關報告 傳播文化業電商雙十一預售開啟,全球手游下載基本持平 2022.10.30 傳播文化業Q3 劇綜減量提質,文化綜藝崛起、古裝劇升溫 2022.10.23 傳播文化業Quest Pro 發布,全彩透視 MR功能突出 2022.10.15 傳播文化業
5、VR出貨量或加速,內容有望迎來拐點 2022.10.09 傳播文化業國慶檔觀影人數略低于預期,PICO 4 開啟大眾化之路 2022.10.08 AI 繪畫元年,征途在星辰大海 AI 繪畫行業研究報告 相關行業:傳播文化業 2022.11.01 行業專題 請務必閱讀正文之后的免責條款部分 2 of 17 目 錄 1.AI 繪畫橫空出世,新技術奠定跨模態成熟.3 1.1.AIGC 重要分支,有望率先落地.3 1.2.跨模態生成為主流,文字到圖像基本成熟.4 1.3.AI 繪畫作品獲人類美術比賽第一名,大規模應用或在朝夕.7 2.AI 繪畫元年,在下一代互聯網望大放異彩.9 2.1.AI 繪畫黎明
6、將至,商業化潛力仍待發掘.9 2.2.應用更新迭代,有望成為圖片內容生成重要輔助.12 2.3.AI 繪畫的星辰大海,文字轉 3D 箭在弦上.14 3.風險提示.16 VX9UiYjWfWgYmMWYkXpYaQbP6MpNnNtRnPkPrQmNjMrRoM8OpPuNuOnMsNvPpPoO 請務必閱讀正文之后的免責條款部分 3 of 17 1.AI 繪畫橫空出世,新技術奠定跨模態成熟 1.1.AIGC 重要分支,有望率先落地 AIGC 全稱 AI-Generated Content,是基于生成對抗網絡 GAN、大型預訓練模型等人工智能技術,通過已有數據尋找規律,并通過適當的泛化能力生成相
7、關內容的技術,AI 繪圖屬于 AIGC 技術場景中的分支。目前,AIGC 正在完成從簡單的降本增效向創造額外價值升級,跨文字和圖像的多模態內容成為關鍵的發展節點。并且,AIGC 已經成為 PGC和 UGC 之后新內容創作模式,具備較大的商業前景。圖 1:AI 繪圖屬于 AIGC 技術場景中的分支 資料來源:量子位,國泰君安證券研究 從 AIGC 的參與者來看,目前國外大廠及細分賽道龍頭公司已位居世界前列,國內部分公司也在奮起直追。例如 NVIDIA、Google、Amazon等公司通過自研或收購的方式已走在技術前沿,圖像、視頻等細分領域也有諸多小龍頭誕生。國內布局最多的賽道是 AI 寫作和語音
8、合成,圖 請務必閱讀正文之后的免責條款部分 4 of 17 像、視頻等領域的初創公司不斷增加。未來隨著國內 AIGC 技術不斷成熟,大公司收購可能為成為主流現象,將部分初創公司的先進技術結合進已然成熟的內容體系中,從而生成可供直接應用的消費形式,進而在多種場景中實現應用。圖 2:我國 AIGC 產業鏈基本形成 資料來源:量子位 1.2.跨模態生成為主流,文字到圖像基本成熟 AI 繪畫初代實現形式為 GAN(Generative Adversarial Nets,生成式對抗網絡),最初是圖像到圖像的生成過程。GAN 模型由生成器和判別器兩部分組成,生成器將抓取數據、產生新的生成數據,并將其混入原
9、始數據中送交判別器區分。這一過程將反復進行,直到判別器無法以超過 50%的準確度分辨出真實樣本。以 NVlabs 的 SPADE 為例,用戶提供草圖,由 GAN 將其轉化為真實的風景圖像。但在這類模型里,用 請務必閱讀正文之后的免責條款部分 5 of 17 戶無法通過文本影響生成結果。圖 3:初代 GAN 通過草圖生成真實畫像 資料來源:NVIDIA 升級后的模型加入 CLIP 的“指導”,可以實現跨模態的圖文生成,使用戶能以文字輔助 AI 作畫。例如 VQGAN+CLIP 或 StyleCILP,均是因為CLIP 打通文本和圖形域,使用戶輸入的文本和 GAN 生成的結果有了可比性,從而通過計
10、算二者的誤差來達到用戶真正想要的結果。圖 4:CLIP 和 GAN 通過基礎圖像加文字描述優化結果生成 資料來源:StyleCLIP 但 GAN 也有諸如訓練不穩定、生成樣本大量重復相似、圖像壓縮等問題需要解決。這也使得擴散模型 Diffusion model 快速崛起,甚至有望 請務必閱讀正文之后的免責條款部分 6 of 17 超過 GAN。Diffusion 其實是早于 GAN 被提出的,但因為 Diffusion依賴大模型實現,所以對大部分用戶的進入門檻較高,研究者也不多。直到 2021 年,因為 Disco Diffusion、DALLE2、Imagen AI 等,Diffusion
11、才開始被更多人了解。Diffusion 最初受到熱力學概念的啟發,擴散模型通過增加噪聲破壞訓練數據來學習,然后找出如何逆轉這種噪聲過程以恢復原始圖像。一旦經過訓練,擴散模型就可以應用這些去噪方法從隨機輸入中合成新穎的“干凈”數據。相比 GAN,Diffusion 模型在所需數據更少的情況下,圖像生成效果有明顯提升。圖 5:擴散模型原理 資料來源:量子位智庫 Diffusion 模型的代表是 Disco Diffusion,最初是搭載在 Google Colab 上,特點是擅長抽象畫面,但在具象生成和較多的描述語句上效果較差。后續出現的 DALLE2和 Imagen AI 對文本指令的還原度更高
12、,但前者技術上是 CLIP 模型和 Diffusion 模型的結合,后者是由純語言模型(T5-XXL)實現文字到圖像的轉換。請務必閱讀正文之后的免責條款部分 7 of 17 圖 6:在 Imagen AI 輸入“一只非??鞓返拿仔茇埓虬绯闪嗽趶N房里做面團的廚師的高對比度畫像,他身后的墻上還有一副畫了鮮花的畫”的文字后生成的圖像 圖 7:在 Imagen AI 輸入“帶著宇航員頭盔,在深夜眺望窗外的浣熊”的文字后生成的圖像 資料來源:量子位智庫 資料來源:量子位智庫 1.3.AI 繪畫作品獲人類美術比賽第一名,大規模應用或在朝夕 近期 AI 繪畫受到高度關注的導火線在于一副AI 繪畫作品 太空
13、歌劇院在以人類繪畫作品為主的美國科羅拉多州博覽會的美術比賽獲得第一名,從而引起對 AI 繪畫的爭議。該作品通過 Midjourney 生成,獲獎者在 AI 繪圖的基礎上對作品進行調整。Midjourney 上手難度很低,有較強的商業價值,近期經濟學人雜志也用 Midjourney 生成的圖片做了封面。前期 AI 繪畫生成,后期通過 PS 調整,作畫效率將會大大提升。通過太空歌劇院獲獎這一事件,AI 繪畫的大規模應用或已到黎明期。請務必閱讀正文之后的免責條款部分 8 of 17 圖 8:AI 繪畫太空歌劇院獲得美國科羅拉多州博覽會美術比賽的第一名 資料來源:游民星空 目前,AI 繪畫已不局限于
14、PC端,且對顯卡的要求也不再是創作的限制,在 iOS 和安卓系統均上線多款 AI 繪畫 App。其中,iOS App Store 最熱門的 AI 繪畫 App 為Dream by Wombo,截止 2022 年上半年,平臺用戶已創作出一千萬以上的畫作,該 App 的安卓版本在上架一個月的時間內,下載量超過一百萬次。圖 9:iOS 和安卓系統均有較多 AI 繪畫 App 上線 資料 來源:iOS App Store,小米應用商店 請務必閱讀正文之后的免責條款部分 9 of 17 Dream by Wombo 操作頁面可視化程度高,上手難度低,且 CLIP模型的隨機性能保證不會生成兩個相同的作品。
15、用戶在在平臺上輸入各種與風格、主題、氛圍有關的關鍵詞后,AI 就會根據這些關鍵詞在互聯網上搜索有關的資源素材,并將其糅合與拼接成一些符合要求的畫作,同時還有多種藝術風格可以選擇。CLIP 的加持使得同一關鍵詞會隨機生成不同圖像,這使得所有用戶都能創作出獨一無二的作品。圖 10:Dream by Wombo對于同一關鍵詞會隨機生成不同圖像 資料來源:Dream by Wombo 2.AI 繪畫元年,在下一代互聯網望大放異彩 2.1.AI 繪畫黎明將至,商業化潛力仍待發掘 我國 AI 繪畫用戶主要是集中在一二線城市中的年輕人,這類人群更樂意嘗試新事物。根據 6pen 的調研,國內 AI 繪畫用戶年
16、輕化特點明顯,46%的用戶為大學生和研究生,18%的用戶為初中生和高中生。而在地域方面,北京占 8.7%,深圳占 7.8%,南方城市占比較北方更高。請務必閱讀正文之后的免責條款部分 10 of 17 圖 11:年輕人更樂意嘗試 AI 繪畫 圖 12:AI 繪畫的用戶主要分布在一二線城市 資料來源:6pen 微信公眾號 資料來源:6pen 微信公眾號 而在用戶行業分布方面,美術設計類和互聯網工作為核心,這與 AI 繪畫的商業應用關系密切。根據 6pen 的調研,AI 繪畫的用戶近半數為美術設計類和互聯網行業,AI 繪畫能輔助設計類工作的進展,同時對游戲等互聯網行業有所助益,這幾類行業將是AI 繪
17、畫模型的核心商業受眾。在使用的具體方式上,接近 40%的用戶依靠在線服務,早起 AI 繪畫模型對顯卡的高要求導致部分配置無法較好的運行 AI 繪畫系統,但隨著Stable Diffusion、Midjourney 等新應用的上架,對電腦配置的要求將進一步降低。圖 13:美術和設計及互聯網行業從業人員使用 AI繪畫占比較高 圖 14:我國 AI 繪畫多是使用在線服務 資料來源:6pen 微信公眾號 資料來源:6pen 微信公眾號 請務必閱讀正文之后的免責條款部分 11 of 17 在 AI 繪畫商業化方面,用戶付費尚在摸索階段,B 端付費的可能性更高,且通過 AI 繪畫并不能獲取較高的收入。根據
18、 6pen 的調研,60%的用戶從未在 AI 繪畫產品上有過付費行為,剩下 40%的用戶中,付費超過 100 元占比僅 10%。目前 AI 繪畫的盈利方式較為單一,多為生成圖像的次數付費或者縮短生成時間付費等,在未大規模應用 AI 繪畫之前,C端用戶目的性較弱的前提下付費意愿不強,但如若B 端應用成熟,付費的可能性相對更高。此外,AI 繪畫用戶主要為了娛樂目的,只有極少的用戶能從中獲得收入。圖 15:AI 繪畫付費用戶占比相對較低 圖 16:AI 繪畫用戶主要為了娛樂目的 數據來源:6pen 微信公眾號,國泰君安證券研究 數據來源:6pen 微信公眾號,國泰君安證券研究 最后,在 AI 繪畫的
19、用戶認知層面,已經有相當一部分用戶認可 AI 繪畫對人類工作的助益,并且 2022 年更多用戶開始接觸 AI 繪畫,或成為AI 繪畫的元年。根據 6pen 的調研,雖然有 42%的用戶認為 AI 繪畫僅能滿足娛樂需求,但有 50%以上的用戶認為 AI 繪畫能替代一部分,甚至完全顛覆目前的工作方式。隨著多款低門檻的 AI 繪畫產品在 2022 年發布,多數用戶開始接觸 AI 繪畫,2022 年有望成為 AI 繪畫元年。60%16%14%10%從未付費10元以內10-100元100元以上92%4%2%2%純玩,沒有產生收入100元以下收入100-1000元1000元以上 請務必閱讀正文之后的免責條
20、款部分 12 of 17 圖 17:AI 繪畫未來或可以代替一部分工作 圖 18:50%的用戶在 2022H2 開始接觸 AI 繪畫 數據來源:6pen 微信公眾號,國泰君安證券研究 數據來源:6pen 微信公眾號,國泰君安證券研究 2.2.應用更新迭代,有望成為圖片內容生成重要輔助 具 體 到 AI 繪 畫產 品,Disco Diffusion、Stable Diffusion、Midjourney 位列前三。Disco Diffusion 作為成熟的 AI 繪畫應用,用戶基礎較好。Stable Diffusion 于 2022 年 8 月下旬發布,技術門檻和儲備顯卡成本均進一步下探,且有更
21、多的風格化,更簡易的訓練框架,迅速成為 AI 繪畫熱門應用。Midjourney 依靠 AI 繪畫作品獲得人類美術比賽一等獎而名聲大噪。圖 19:Disco Diffusion 在我國是用戶數最多的 AI 繪畫產品 資料來源:6pen 微信公眾號 42%38%4%9%7%單純娛樂需求可以影響或替代一部分工作可以基本替代大部分美術工作具有顛覆性不值一提50%27%23%2022年下半年2022年上半年2021年 請務必閱讀正文之后的免責條款部分 13 of 17 從藝術家的角度來看,對 AI 繪畫總體持保守態度,版權問題或成為AI繪畫產品需要解決的關鍵。根據 6pen 對藝術家的問卷調研,7%的
22、藝術家表示自己的作品風格已經被 AI 模型學習,更多的表示不能確定。但無論如何,超過 90%的原創藝術家表示會對 AI 使用自己的風格有所介懷,希望 AI 繪畫的相關作品能向版權付費或有所標注。目前仍有較多的 AI 繪畫模型是通過搜尋互聯網相關圖片元素來進行藝術創作,背后涉及的版權問題將成為 AI 繪畫發展亟待解決的重點。圖 20:已經有藝術家的作品被 AI 學習使用 圖 21:藝術家對 AI 繪畫持保守態度 數據來源:6pen 微信公眾號,國泰君安證券研究 數據來源:6pen 微信公眾號,國泰君安證券研究 在市場空間方面,未來五年或將有 10%-30%的圖片內容由 AI 參與生成,相應或將有
23、 600 億以上的市場規模。在 AI 繪畫技術持續快速發展的當下,更成熟易用的產品不斷推陳出新。在此基礎上,AI 繪畫已經能承擔圖像內容生成的輔助性工作,前期初稿的形成可以由 AI 提供,后期再由創作者進行調整,這將提高內容產出的效率。而根據 6pen 的預測,若未來五年 10%-30%的圖片在 AI 的幫助下誕生,則將創造超過600 億元的市場空間,而若考慮到下一代互聯網對內容需求的迅速提升,則可能創造更大的市場規模。7%26%67%已經被AI模型學習暫時還沒有不清楚是否被AI學習27%27%37%9%無論如何都不希望模型使用使用我的風格時需要展示我希望標注的信息使用我的風格時需要向我付費完
24、全不介意 請務必閱讀正文之后的免責條款部分 14 of 17 圖 22:未來五年或將有 10%-30%的圖片內容由 AI 參與生成 資料來源:6pen 微信公眾號 2.3.AI 繪畫的星辰大海,文字轉 3D 箭在弦上 借助 NeRF 神經輻射場模型,AI 繪畫正嘗試從 2D 向 3D 生成,這為VR 設備及下一代互聯網建設提供了重要幫助。3D 或是下一代互聯網的“標配”,但這也意味著內容量指數級上升,AI 將成為內容創作的核心輔助。從技術端來看,2020-2021 年 NVIDIA 推出的 GANverse3D 已經能夠生成可自定義的 3D 圖形,并能進一步形成視頻內容,但由于GAN 在對抗訓
25、練中會受限于樣本特征,該模型對于人類的生成尚不能有良好的解決方案。但 NeRF 模型利用深度學習完成了計算機圖形學中的 3D 渲染任務。對于 NeRF 模型的探索,動態 NeRF、全場景 NeRF、光影變化效果、接近實時生成等細分賽道均有產品推出,但關鍵節點或是基于單張 2D 請務必閱讀正文之后的免責條款部分 15 of 17 圖像生成 3D 模型,Google 于 2022 年推出的 PHORHUM 已具備類似能力。AI 繪畫在該方面的突破有望使用戶上傳2D 照片即能生成逼真的3D 形象,從而擁有在 VR 世界中的優秀“替身”。圖 23:通過 AI 將 2D 形象轉化為 3D 模型的技術已經
26、實現 資料來源:Google Research 更進一步的探索或是文字向 3D 模型的直接轉換,在 AI 的幫助下,僅需輸入幻想世界的文字,即能生成一個全新的 3D 空間。目前,文字向2D 圖像的跨模態生成已經成熟,隨著 2D 向 3D 模型轉換的發展,可以認為從文字出發有望創造 3D 世界。該項技術對于游戲等多行業或將有所助益,也能使得在 VR 等設備為入口的下一代互聯網實現內容數量和質量的重要突破。請務必閱讀正文之后的免責條款部分 16 of 17 3.風險提示(1)AI 繪畫相關技術發展不及預期。目前無論是 GAN 模型、Diffusion模型、CLIP 模型或是最新的 NeRF 模型均
27、有各自明顯短板,如若問題無法得到及時解決,則可能使得 AI 繪畫發展低于預期。(2)商業化拓展低于預期。AI 繪畫有能力成為內容創作的重要輔助,但若因版權等問題導致作品產出受限,則可能影響商業化拓展。請務必閱讀正文之后的免責條款部分 17 of 17 本公司具有中國證監會核準本公司具有中國證監會核準的證券投資的證券投資咨詢咨詢業務資格業務資格 分析師聲明分析師聲明 作者具有中國證券業協會授予的證券投資咨詢執業資格或相當的專業勝任能力,保證報告所采用的數據均來自合規渠道,分析邏輯基于作者的職業理解,本報告清晰準確地反映了作者的研究觀點,力求獨立、客觀和公正,結論不受任何第三方的授意或影響,特此聲
28、明。免責聲明免責聲明 本報告僅供國泰君安證券股份有限公司(以下簡稱“本公司”)的客戶使用。本公司不會因接收人收到本報告而視其為本公司的當然客戶。本報告僅在相關法律許可的情況下發放,并僅為提供信息而發放,概不構成任何廣告。本報告的信息來源于已公開的資料,本公司對該等信息的準確性、完整性或可靠性不作任何保證。本報告所載的資料、意見及推測僅反映本公司于發布本報告當日的判斷,本報告所指的證券或投資標的的價格、價值及投資收入可升可跌。過往表現不應作為日后的表現依據。在不同時期,本公司可發出與本報告所載資料、意見及推測不一致的報告。本公司不保證本報告所含信息保持在最新狀態。同時,本公司對本報告所含信息可在
29、不發出通知的情形下做出修改,投資者應當自行關注相應的更新或修改。本報告中所指的投資及服務可能不適合個別客戶,不構成客戶私人咨詢建議。在任何情況下,本報告中的信息或所表述的意見均不構成對任何人的投資建議。在任何情況下,本公司、本公司員工或者關聯機構不承諾投資者一定獲利,不與投資者分享投資收益,也不對任何人因使用本報告中的任何內容所引致的任何損失負任何責任。投資者務必注意,其據此做出的任何投資決策與本公司、本公司員工或者關聯機構無關。本公司利用信息隔離墻控制內部一個或多個領域、部門或關聯機構之間的信息流動。因此,投資者應注意,在法律許可的情況下,本公司及其所屬關聯機構可能會持有報告中提到的公司所發
30、行的證券或期權并進行證券或期權交易,也可能為這些公司提供或者爭取提供投資銀行、財務顧問或者金融產品等相關服務。在法律許可的情況下,本公司的員工可能擔任本報告所提到的公司的董事。市場有風險,投資需謹慎。投資者不應將本報告作為作出投資決策的唯一參考因素,亦不應認為本報告可以取代自己的判斷。在決定投資前,如有需要,投資者務必向專業人士咨詢并謹慎決策。本報告版權僅為本公司所有,未經書面許可,任何機構和個人不得以任何形式翻版、復制、發表或引用。如征得本公司同意進行引用、刊發的,需在允許的范圍內使用,并注明出處為“國泰君安證券研究”,且不得對本報告進行任何有悖原意的引用、刪節和修改。若本公司以外的其他機構
31、(以下簡稱“該機構”)發送本報告,則由該機構獨自為此發送行為負責。通過此途徑獲得本報告的投資者應自行聯系該機構以要求獲悉更詳細信息或進而交易本報告中提及的證券。本報告不構成本公司向該機構之客戶提供的投資建議,本公司、本公司員工或者關聯機構亦不為該機構之客戶因使用本報告或報告所載內容引起的任何損失承擔任何責任。國泰君安證券研究國泰君安證券研究所所 上海上海 深圳深圳 北京北京 地址 上海市靜安區新閘路 669 號博華廣場20 層 深圳市福田區益田路 6009 號新世界商務中心 34 層 北京市西城區金融大街甲 9 號 金融街中心南樓 18 層 郵編 200041 518026 100032 電話(021)38676666(0755)23976888(010)83939888 E-mail: