《互聯網傳媒行業AI產業前瞻系列報告(二):梳理全球AIGC數據版權規范哪些領域具備商業化潛力?-231225(15頁).pdf》由會員分享,可在線閱讀,更多相關《互聯網傳媒行業AI產業前瞻系列報告(二):梳理全球AIGC數據版權規范哪些領域具備商業化潛力?-231225(15頁).pdf(15頁珍藏版)》請在三個皮匠報告上搜索。
1、光大證券2023年12月25日行業研究梳理全球AIGC數據版權規范,哪些領域具備商業化潛力?-AI產業前暗系列報告(二)要點互聯網傳媒買入(維持)用于AI模型訓練的數據集有多種方式避免侵權,或直接補償版權持有人。專有數據:1)版權合作協議:Shutterstock、AxelSpringer等多家版權提作者供商與AI公司建立合作;2)API付費訪問:部分專業性強的數據提供商會分析師:付天姿對API訪問進行收費,23年Reddit、Twitter的API訪問由免費轉向付費。執業證書編號:S0930517040002開源數據:1)開放許可協議:包括CC、ODC、CDLA等;2)特定的數據抓021-5
2、2523692取策略:如遵守網站的Robot.txt文件;3)社區監督:提升數據集透明度。直接補償創作者:1)事前補償:技術難度低,但難以界定合理的補償額行業與滬深300指數對比圖度,如Shutterstock建立的貢獻者基金;2)事后補償:對AI生成內容進行湖源,定價合理但技術尚不成熟,如卡耐基梅隆大學發表的歸因模型算法。專用數據集:直接出售適用于模型訓練的數據集,或打包成MaaS服務。409209海外版權合作協議盈利模式穩定、商業化前景初步展現。AI生成內容或對版權提供商的傳統業務造成一定威協,版權提供商與AI公司的合作是互利共-20%贏。1)多媒體素材庫Shutterstock:通過出售
3、模型訓練素材創收,推出AI生成圖片專區,提供由OpenA支持的AI工具;2)出版商AxelSpringer:傳媒向OpenAI出售其出版物作為訓練素材,共同運用AI技術提升用戶體驗。從Shutterstock看版權庫與AI公司的合作:AIGC的利好整體強于利空。1)利好:Shutterstock的數據授權收入已較明顯體現在業績端,驅動估值相關研報修復和股價回升,2303出售模型訓練素材的收入占公司總收入的19.5%;谷歌正式發布Gen2)利空:23年以來Shutterstock傳統業務低迷更多受同業競爭影響,同類積極布局八)(2023-12-07)公司GettyImage業績穩健,AIGC對版
4、權庫行業的威協和替代尚不明顯美圖發布AI視覺大模型4.0版本,關注國內外模型訓練數據版權規定尚待完善,版權商股價有望得到密集催化。應用端落地情況AIGC行業跟蹤報告(三十六)(2023-12-06)22M12一篇論文顯示StableDiffusion以像素點級別復制名畫的細節。對探討AIGC視頻的核心痛點與未來超勢,AIGC的版權問題的爭議和相關法規主要可以分為兩類:1)AI生成內容的版Pika1.0能否帶來新變化?AIGC行權界定:美國不承認AI生成內容擁有著作權,而中國傾向于保護AI生成內業跟蹤報告(三十五)(2023-12-05)容的著作權;2)模型訓練數據的版權規定:美國、歐盟均明確要
5、求使用受探討GPTS背后的產業邏輯:拉開AIGC應用生態的唯幕AI產業前瞻系列報告版權保護的材料來訓練模型,而日本則認定訓練數據不受版權保護(一)(2023-11-20)投資建議:整體來看,國內外對于模型訓練數據的版權保護技術尚待成熟、GPT-4降價輻射AIGC應用產業鏈,定制化和Agent賦能使用體驗-一AIGC行業政策尚待完善,未來版權提供商股價有望得到密集催化。展望數據歸因技術跟蹤報告(三十三)(2023-11-08)的成熟使版權收入和AI生成內容量緊密掛鉤,隨著AIGC下游應用的商業潛美股AIGC應用端全產業鏈布局,商業化力釋放,有望持續帶動版權提供商的授權收入增量八)(2023-10
6、-14)AIGC發展對于版權商的利好多于利空,展望預期差驅動股價回升。建議關注微軟“AI+操作系統”初見維形,生態壁海外版權商:Adobe、Shutterstock、GettyImage、Elsevier、Thomson望是AIGC核心競爭力AIGC系列跟蹤報告(二十七)(2023-09-27)Reuters,以及注重數據版權保護的AI公司:微軟、谷歌、Meta2303美股互聯網巨頭財報:AIGC應用各看好國內模型訓練數據的版權保護繼續完善,帶動新聞媒體、影視等各類信自爭先,業績潛力尚待釋放一美國互聯網科技公司跟蹤專題報告(三)(2023-息媒介版權提供商的業績增長。建議關注:1)AI+出版:
7、中國出版、中國科08-05)傳;2)圖片版權庫:視覺中國;3)影視版權庫:捷成股份、華策影視。風險提示:AI技術研發和產品送代不及預期;AI行業競爭加劇風險;商業化進展不及預期風險;國內外政策風險-1敬請參閱最后一頁特別聲明證券研究報告#page#光大證券互聯網傳媒目錄1、模型訓練數據集如何保證版權合規性?1.1、專有數據:主要通過版權合作協議、API付費訪問等方式保障版權,商業空間廣1.1.1、版權合作協議:海外Shutterstock、AxelSpringer等多家版權提供商與AI公司建立合作.1.1.2、API付費訪問:23年以來Reddit、Twiter等網站的API訪問由免費轉向了付
8、費.1.2、開源數據:依靠開放許可協議、特定的數據抓取策略來保障版權,但仍存在侵權的隱患.61.3、直接補償創作者:海外先進技術識別AI生成內容的版權來源,建立基金會為創作者提供補貼.71.4、專用數據集:直接出售適用于AI和ML的數據集,或作為MaaS服務的一部分提升用戶體驗.72、版權合作協議:盈利模式穩定、海外商業化成效初步展現2.1、版權提供商與AI公司的合作是互利共贏.2.1.1、海外多媒體版權庫Shutterstock:出售模型訓練素材創收,通過基金會為創作者提供補償82.1.2、海外新聞出版商AxelSpringer:為OpenAI提供文本訓練數據,通過鏈接為創作者引流.92.2
9、、從Shutterstock看多媒體版權庫與AI公司的合作:AIGC的利好整體強于利空.12.2.1、Shuterstock的數據授權收入已較明顯體現在業績端,驅動估值修復和股價回升.13、國內外模型訓練數據版權規定尚待完善,版權商股價有望得到密集催化.4、投資建議.5、風險提示.敬請參閱最后一頁特別聲明證券研究報告#page#光大證券互聯網傳媒圖目錄5圖2:23MI2AxelSpringer與OpenAI建立合作的聲明圖3:23M6Reddit開始針對API訪問進行收費圖4:23M3Twitter推出DataAPI的定價方案.6圖5:開源數據集Wiki-links的部分授權聲明.圖7:卡耐基
10、梅隆大學開發的“評估文本到圖像模型的數據歸因“算法,可以追湖AI生成圖像的訓練數據來源7圖8:模型訓練數據集商店DataStock包含的行業數據.圖9:Azure提供開源數據集,與企業數據共同豐富訓練數據.圖10:Shutterstock圖片素材主頁,包含AI圖片生成工具圖11:Shutterstock擁有豐富的圖片版權資源.圖12:2023年1月1日-2023年12月14日納斯達克綜合指數、Shutterstock股價漲跌幅與ShutterstockPE-.10TTM變化超勢圖13:22Q1-23Q3Shuterstock傳統業務收入,計算機視覺數據收入和占總收入的比例(單位:百萬美元)11
11、圖14:21Q3-2303Shutterstock傳統業務(不包含計算機視覺數據收入)、GetyImage收入(單位:百萬美元).11圖15:22M12一篇論文顯示,StableDifiusion以像素點級別復制了名畫的細節、結構和繪畫風格12表目錄表1:模型訓練數據集保證版權合規性的具體方式和后續影響梳理,表2:國內外關于AI生成內容和模型訓練數據的版權規定與相關糾紛判決.12表3:國內外關于人工智能良性健康發展的方向性指導文件.13敬請參閱最后一頁特別聲明證券研究報告#page#光大證券互聯網傳媒1、模型訓練數據集如何保證版權合規性?在A模型的訓練過程中,數據收集、清洗和標注是重要的前置環
12、節。隨著基于大模型的AIGC應用逐漸推廣和商業化,模型訓練數據是否侵權需要納入考慮,用于模型訓練的數據可以分為專有數據、開源數據、專用數據集等類型。針對不同的數據類型有不同的方式來保證數據的版權,或通過直接補償創作者的方式,在很大程度上降低了訓練數據侵權的風險。隨著Al模型的不斷送代和性能提升,以及下游應用產業鏈的繁榮和相關規章制度的成熟,科技公司需要付出越來越多的成本來保證訓練數據的版權與合規性。表1:模型訓練數據集保證版權合規性的具體方式和后續影響梳理保護版權類型保護版權方式具體介紹后續影響版權合作協議雙向合作的方式獲得版權Springer等出版商受益專有數據API付費訪問等社交平臺受益來
13、部分免費訪問API的網站也開始收費開放許可協議(ODC)、社區數據許可協議(CDLA)等開源數據仍存在侵權隱患,部分公開網頁內容本身存在侵權A公司在抓取網頁數據時可以避開有版權保護的信息,特定的數據抓取策略行為網頁維護者也可以加強對于數據爬取的審核事前補償Shutterstock建立的貢獻者基金直接補償創作者針對性地做出補償,補償額度更合理,但技術尚不通過技術手段對訓練數據測源并進行對應的版權補償,事后補償成熟直接出售專用數據集的數據量較少出售能直接運用于AI和機器學習模型訓練的數據集訓練專用數據集Maas服務商提供特定的模型訓練集供客戶使用,客戶訓作為MaaS服務的一部分進行變現,商業化路徑
14、更綁定MaaS服務順暢1.1、專有數據:主要通過版權合作協議、API付費訪問等方式保障版權,商業空間廣闊AI公司將專有數據用于模型訓練,可以直接與版權方交涉,以保證訓練數據集的版權合規性。包含特定領域的高質量數據以及未公開授權的私有數據,通常需要付費,但對于進一步提升大模型性能、增強模型的細分垂類能力很十分重要。AI公司獲取專有數據的兩個主要方式是版權合作協議和API付費訪問。1.1.1、版權合作協議:海外Shutterstock、AxelSpringer等多家版權提供商與AI公司建立合作版權提供商的高質量語料對于模型性能提升十分重要,并且能降低數據清洗和標注的工作量。新聞版權商擁有豐富全面且
15、更新及時的信息,文學作品、藝術創作、影視作品中包含大量高質量的訓練素材;另外,部分素材庫本身就具備針對圖片、視頻、音樂等素材的標注,能大幅降低數據清洗和標注的工作量。多媒體版權庫Shuttertock與OpenAl、Meta、LG等公司建立合作,將其圖片、視頻、音頻等素材提供給合作伙伴用于模型訓練,并從中獲得收入;新聞出版社AxelSpringer與OpenAI合作,其新聞素材將用于豐富OpenAI的模型訓練數據集;以色列文生圖模型公司BriaAI與Gettylmages建立長期合作,采用GettyImages、Alamy、Envato等圖像版權庫的許可內容進行訓練。證券研究報告敬請參閱最后一
16、頁特別聲明4#page#光大證券室互聯網傳媒圖1:23M7Shutterstock與OpenAI加深合作的聲明圖2:23M12AxelSpringer與OpenAI建立合作的聲明shutterstrckOpenAlaxel springer-High-Quality TraiData13122023shutterstckbeneficial use of Alin journalism+資料:1.1.2、API付費訪問:23年以來Reddit、Twitter等網站的API訪問由免費轉向了付費通過API爬取網絡數據也是模型訓練數據的重要來源。隨著大語言模型在不同細分行業的應用越來越深入,對于專業
17、數據的需求也會水漲船高。部分含金量高、專業性強的數據提供商會針對API訪問進行收費。例如,金融領域的彭博API、新聞媒體領域的紐約時報API、虛數領域的ElsevierAPI、電商領域的亞馬遜API、谷歌地圖API等均需要付費使用。社交平臺、開源代碼平臺等非專業數據網站也逐步開始針對API訪問收費。23M4社交平臺Reddit和Twitter的API訪問從免費轉向了付費,背后原因可能是大模型訓練需求拉動下API調用量顯著提升,為兩家社交平臺帶來了較高的成本。開源代碼平臺StackOverflow宣布會向AI公司收取訓練數據費用。圖3:23M6Reddit開始針對API訪問進行收費圖4:23M3
18、Twitter推出DataAPI的定價方案KeydatesforourAPTermsandSevicesjuly1.2023.t30S貝usage資料來資料來源敬請參閱最后一頁特別聲明5證券研究報告#page#光大證券互聯網傳媒1.2、開源數據:依靠開放許可協議、特定的數據抓取策略來保障版權,但仍存在侵權的隱患AI公司將開源數據用于模型訓練,可以通過開放許可協議、特定數據抓取策略、手動篩查、社區監督等方式來保證版權合規性。開放許可協議是一種標準化授權方式,方便著作權持有人將數據授權給他人使用;抓取訓練數據時也可以采取精細化的策略,充分尊重網站的API政策;此外,模型廠商也可以提升訓練數據集的透
19、明度,通過手動篩查和社區監督等方式來保證版權合規性。1)開放許可協議:開源數據集的常見開放許可協議包括知識共享(CC)、開放數據共享(ODC)、社區數據許可協議(CDLA)等。知識共享協議提供六種選項:CCBY:需注明作者、允許改編、允許用于商業用途;CCBY-SA:需注明作者,改編作品必須在相同條款下共享;3CCBY-NC:需注明作者、允許改編、不允許用于商業用途;CCBY-NC-SA:需注明作者,僅允許非商業用途,改編作品必須在相同條款下共享;CCBY-ND:需注明作者,不允許改編;CCBY-NC-ND:需注明作者,僅允許非商業用途,不允許改編。2)特定的數據抓取策略:AI公司在抓取網頁數
20、據時可以采用特定策略避開有版權保護的信息,網頁維護者也可以加強對于數據爬取的審核。例如,網頁的Robot.txt文件規定了搜索引擎抓取工具可以訪問哪些網址,noindex則可以禁止將某個網頁編入索引,阻止抓取工具的訪問。3)社區監督:AI公司可以提升訓練數據集的透明度,鼓勵社區監督,若訓練數據的創作人主張侵權可以進行申訴。這種方法更適用于開源模型,而對于商業化的閉源模型,訓練數據集往往會作為開發商技術壁壘的一部分進行保密。整體來說,開源數據的獲取已發展出了一套完善的版權保護制度,但仍存在一定的侵權隱患。例如,部分公開網頁不具備完善的開放許可協議和針對API抓取的規定,甚至公開網頁中的內容可能本
21、身就存在侵權行為。圖5:開源數據集Wiki-links的部分授權聲明圖6:Robot.txt文件示例Underthefolowingcondition的含資料來源:谷歌搜索中心敬請參閱最后一頁特別聲明證券研究報告#page#光大證券互聯網傳媒1.3、直接補償創作者:海外先進技術識別AI生成內容的版權來源,建立基金會為創作者提供補貼通過直接補償創作者來保障版權的做法主要分為兩種:1)事前補償:版權人的作品在被采納為訓練數據時獲得補償;2)事后補償:通過特定技術追潮A生成內容的訓練數據源,并針對性地給予補償。事前補償的技術難度較低,但難以界定合理的補償額度。海外知名圖片版權庫Shutterstoc
22、k建立了貢獻者基金,當投稿人創作的內容被用于AI模型訓練時將獲得補償,并在后續使用模型生成內容時持續獲得補償。此類方法可以保證創作者獲得一定的報酬,但不同風格、不同質量的內容對模型訓練的貢獻各不相同,很難具體量化,會給補償定價帶來一定的難度。事后補償指通過技術手段對訓練數據潮源并進行對應的版權補償,定價更合理但技術難度尚不成熟。23M9卡耐基梅隆大學、AdobeResearch和加州大學伯克利分校合作開發了兩種算法,第一種算法可以阻止模型調用受版權保護的作品,第二種算法可以在模型用受版權保護的作品生成內容時為創作者提供補償,該算法也能提供一種選擇,讓藝術家隨時退出AI模型。另外,以色列文生圖模
23、型公司BriaAI于23M9開發了一種歸因模型,能夠計算數據源對AI生成內容的影響,從而對訓練數據的版權人提供定價更加合理的報酬。圖7:卡耐基梅隆大學開發的“評估文本到圖像模型的數據歸因”算法,可以追測A生成圖像的訓練數據來源燃自omngnMethod1.4、專用數據集:直接出售適用于AI和ML的數據集,或作為MaaS服務的一部分提升用戶體驗專用數據集指經過篩選和清洗、直接適用于模型訓練的數據集,需要數據集提供方履行數據確權義務。專用數據集為開發者進行機器學習和模型訓練相關研究提供強有力的支持,大多數為開源數據集,也有部分數據集被用來出售。對于云服務提供商,往往會將專用數據集打包成MaaS服務
24、的一部分提供給用戶,幫助用戶更好地訓練自己的定制化模型。1)直接出售數據集:此類數據集經過了前期的篩選、整理和注釋,由標記的示例或輸入輸出對組成,能直接運用于AI和機器學習模型訓練。付費方式包括一次性購買和訂閱制,具體價格受到數據量、準確度、覆蓋時間和地區等因素的影響。例如,數據集商店DataStock售賣高質量、結構化的網頁爬取數據集,涵蓋零售、醫療、旅行等多個領域;數據交易平臺Datarade劃分出了AI&ML訓練數據專區,供提供者和開發者進行數據集交易。-7-證券研究報告敬請參閱最后一頁特別聲明#page#室光大證券互聯網傳媒2)作為MaaS的一部分提供給用戶:微軟、亞馬遜、谷歌等云服務
25、提供商均提供幫助客戶進行AI模型訓練和應用程序開發的MaaS服務,包括自研和第三方AI模型調用接口、圍繞模型訓練技術細節的配套服務和指導等。對于定制化模型,數據集一般是客戶的個性化數據,但部分MaaS平臺也會提供特定的模型訓練數據集供客戶使用。例如,微軟Azure云平臺為客戶提供特選數據集,使用可公開獲取的數據制成,可在模型訓練過程中隨時訪問。圖8:模型訓練數據集商店DataStock包含的行業數據圖9:Azure提供開源數據集,與企業數據共同豐富訓練數據Industries covered2、版權合作協議:盈利模式穩定、海外商業化成效初步展現版權提供商與AI公司的合作是互利共贏2.1、AI生
26、成內容的快速增加,對于圖片素材庫、新聞出版社等版權提供商來說構成一定的威協。1)AI生成內容可能被上傳至版權庫混滑視聽。隨著大模型性能的不斷突破,AI生成內容的質量逐漸提升,甚至難以與人類作者和藝術家創作的內容區分。若版權素材庫中被上傳了大量的AI生成內容,可能會影響用戶的付費意愿。2)AI生成內容可能成為版權素材庫的替代品。隨著AIGC產品的推廣和普及、未來大模型成本的不斷降低,以及相關政策的不斷完善,A生成內容將被越來越多地運用于商業化產品中,從而擠壓傳統版權素材庫的生存空間。因此,版權提供商也需要積極擁抱AIGC潮流,探索傳統業務與AI技術結合的新形勢。對于AI公司來說,模型訓練需要海量
27、的高質量數據,且AIGC產品也需要與更多信息源產生聯動。公開渠道的數據存在侵權的風險,且需要耗費更多精力進行數據清洗和數據標注,為了模型后續的商業化和公司的長期健康發展,從版權提供商獲取高質量訓練數據是更好的方式。另外,版權提供商也可以豐富AIGC產品的信息來源和產品功能,賦能用戶使用體驗。2.1.1、海外多媒體版權庫Shutterstock:出售模型訓練素材創收,通過基金會為創作者提供補償海外知名多媒體版權庫Shutterstock緊隨AIGC浪潮,推出了AI生成圖片專區,并提供由OpenAl支持的AI文生圖工具。Shutterstock擁有100多萬投稿者貢獻的超4.5億張圖片,提供的多媒
28、體素材主要包括:1)圖片:天量圖、證券研究報告敬請參閱最后一頁特別聲明8#page#光大證券互聯網傳媒照片、AI生成的圖片等;2)Pond5視頻平臺:鏡頭、AE素材、音效、3D模型等;3)設計:商業營銷模板、社交媒體模板等。此外,Shutterstock還提供設計工具,包括圖片編輯器、招圖工具、AI生成圖片工具等。Shutterstock與OpenAI的雙向合作始于2021年。2021年Shutterstock與OpenAI、LG開始合作;23M7OpenAI與Shutterstock進一步加深合作關系,簽訂了為期六年的合作協議。圖10:Shutterstock圖片素材主頁,包含AI圖片生成工
29、具圖11:Shutterstock擁有豐富的圖片版權資源用無與倫比的圖片釋放您的創造力泰圖片類型Shutterstock與AI公司的合作可以概括為三個方面:1)Shutterstock向OpenAI提供圖片素材版權用于模型訓練。簽訂協議后,OpenAI有權訪問Shutterstock的圖像、視頻、音樂等素材用于AI模型的訓練數據。Shutterstock擁有豐富且高質量的內容素材版權,在多樣性和數據標注上處于行業領先地位,使其在訓練AI模型上具備較大的優勢。2)Shutterstock設立了貢獻者基金,當投稿人創作的圖片被用于AI圖像模型訓練時將獲得補償。Shutterstock是首個推出貢獻
30、者基金的公司,截至23M7,該基金已為數十萬創作者提供補償,并通過與新生成資產許可活動相關的版稅為創作者們提供持續補償。3)AIGC文生圖和圖片編輯工具集成進Shutterstock平臺,并得到OpenAI的文生圖模型DALLE的支持。創作的圖片被用于模型訓練的投稿人將獲得AI文生圖工具的長期使用權。除OpenAI外,Shutterstock還與英偉達、Meta、LG等公司建立合作,共同開發文本、圖像、3D等領域的AIGC創作工具。2.1.2、海外新聞出版商AxelSpringer:為OpenAI提供文本訓練數據,通過鏈接為創作者引流出版社的優質文章素材是大模型訓練的高質量文本語料來源,有助于
31、加快大模型性能選代,促進AI生成內容的版權制度完善。2023年12月13日,德國數字出版商AxelSpringer和OpenAI宣布建立全球伙伴關系,并成為全球第一家與OpenAI合作的新聞社。1)對于OpenAl:OpenAI將付費使用AxelSpringer出版物的內容,完善其AI模型訓練數據庫。ChatGPT用戶將收到AxelSpringer旗下媒體品牌精選的全球新聞摘要。當ChatGPT使用AxelSpringer出版物中的信息回答用戶問題時,將在答案下方提供來源鏈接,確保內容版權方獲得信用、補償和流量。2)對于AxelSpringer:可通過向AI公司提供優質內容素材開辟新業務線,獲
32、-9-證券研究報告敬請參閱最后一頁特別聲明#page#光大證券室互聯網傳媒取潛在收入增量,同時利用OpenAI的技術支持改進其產品。通過與OpenAl合作,利用AI來增強內容體驗和創造新的發展機會,探索新聞業的未來方向。OpenAI曾多次因未經允許使用新聞媒體的文章訓練模型引發爭議。美國頭部紐約時報都曾因版權問題與OpenAI發生過糾新聞機構華爾街日報、(紛。23M2,NewCorp道瓊斯部門的總法律顧問JasonConti在給彭博新聞社的一份聲明中表示,任何使用華爾街日報培訓AI的企業應該向道瓊斯公司尋求許可;23M8紐約時報更新服務條款,禁止其新聞報導和圖片用于開發應用軟件和訓練AI模型,
33、并警告如果持續引發爭議將起訴OpenAl。與AxelSpringer的商業合作是OpenAl與世界各地出版商互利共贏的起點。OpenAI首席運營官BradLightcap宣布OpenAI將致力于與世界各地的出版商和創作者合作,確保他們從先進的AI技術和新的收入模式中受益2.2、從Shutterstock看多媒體版權庫與AI公司的合作:AIGC的利好整體強于利空2.2.1、Shutterstock的數據授權收入已較明顯體現在業績端,驅動估值修復和股價回升隨著向合作伙伴出售數據的業務逐漸釋放業績潛力,Shutterstock股價觸底反彈。23M1-23M5,Shutterstock股價出現了快速上
34、升和回調,后續股價呈現下跌趨勢,直至23Q3業績發布后股價開始反彈。、Shutterstock股價漲跌幅與ShutterstockPE-TTM變化超勢23Q2收23Q3收4060%入超預期入低于預50935期2.6%8.8%40%3030%2520%2010%0%15-10%6.2%L11%10-20%-30%-40%2023/1/12023/4/12023/5/12023/7/12023912023/1012023/1112023/1212023/2/12023/3/12023/6/12023/8/1納斯達克綜合指數漲跌幅Shuterstock股價漲跌幅ShutterstockPE-TTM(
35、有軸)資料來發光大證券研究所整理公告:1)23M1-23M4:受AIGC行業投資邏輯催化,股價大幅拉升。AIGC投資熱點下,市場開始挖掘潛在受益的產業,Shutterstock作為2021年起就與OpenAI建立合作的公司而受到關注,且大模型訓練拉動訓練數據版權需求的邏輯非常順暢,2023年以來最高漲幅達51.1%。2)23M5-23M10:市場開始擔憂AI文生圖的快速發展擠壓Shutterstock的傳統業務圖片版權出售。3)隨著Shutterstock出售AI模型訓練數據授權的收入快速增長,股價觸底反彈。Shutterstock披露的向合作伙伴提供計算機視覺數據項目(ComputerVis
36、ionDataPartnershipsOffering)代表向大型科技公司提供的圖片、視頻、音樂、3D模型等素材授權,用于訓練生成式AI和機器學習模型。23Q3該項收入達到4550萬美元,占公司總收入的19.5%;23年前九個月該項收入達到7950萬美元,占公司總收入的12.1%。-10-敬請參閱最后一頁特別聲明證券研究報告#page#光大證券互聯網傳媒2.2.2、Shutterstock傳統業務下滑原因眾多,AIGC對于版權提供商的威脅和替代尚不明顯我們認為,Shutterstock傳統業務下滑并非受AI文生圖的影響,更可能源于競爭壓力等多種因素影響。我們將Shutterstock的傳統業務
37、(不包含計算機視覺數據收入)與其競爭對手Gettylmage的收入進行對比。Shutterstock的傳統業務代表排除了出售用于大模型訓練數據之外的其他業務,包括電商業務(客戶可以按月訂閱,或按需付費下載圖片)以及企業服務,為客戶提供圖片庫、視頻等素材,與GettyImage的收入更具可比性。圖片版權提供商GettyImages憑借其豐富的高質量圖片資源在圖片庫市場展現出強有力的競爭力。23年以來,Gettylmage的收入維持穩定,并未明顯受到AI文生圖的影響。作為Shutterstock的競爭對手,Gettylmages并未出售AI模型訓練數據,其近兩年總收入相對穩定,23Q3總收入為2.
38、3億美元,同比下降0.5%。相比GettyImage,Shutterstock傳統業務收入自2204以來連續下滑,23Q3跌至1.9億美元,同比下降7.3%,同時23Q3Shutterstock訂閱用戶數量和付費下載量也呈下降超勢。我們認為,Shutterstock的傳統業務收入下滑更多受到同業競爭壓力的影響,但計算機視覺數據出售也成為了業績的新增長點。圖13:2201-2303Shutterstock傳統業務收入,計算機視覺圖14:2103-2303Shutterstock傳統業務(不包含計算機視數據收入和占總收入的比例(單位:百萬美元)覺數據收入)、GettyImage收入(單位:百萬美元
39、)20%30025020020%20010%15015%1000%10010%5058-10%0%2103210422012202220322Q423Q123Q223Q322Q122Q222Q322Q423Q223Q3Shutterstock傳統業務收入計算機視覺數據收入傳統業務收入一計算機視覺數據收入占比(右軸)Getylmages同比增速(右軸)3、國內外模型訓練數據版權規定尚待完善,版權商股價有望得到密集催化截至23年底,公眾對于AI文生圖和其他多模態生成的反感情緒仍較為強烈。2023年12月6日,春晚吉祥物“龍辰辰”被質疑是AI作圖,受到了國內民眾的廣泛批評。自StableDiffus
40、ion、Midjourney等文生圖軟件走入公眾視野,便引發了關于AI生成圖片是否侵權的持續討論。22M12馬里蘭大學帕克分校和紐約大學合作發布的一篇論文顯示,一些參數量較小的文生圖模型會直接復制用于訓練的圖片素材的某個部分,而當時較為成熟的文生圖產品StableDifusion也出現了以像素點級別復制名畫的細節、結構和繪畫風格的情況。公眾對于AI多模態生成的質疑主要來自于:1)模型訓練采用的圖片素材是否獲得授權;2)通過機器學習生成圖片是否可以被定義為學習和創作的過程;3)AI生成圖片過程中,運用于訓練數據的圖片素材是否被簡單粗暴地拼接。-11-敬請參閱最后一頁特別聲明證券研究報告#page
41、#光大證券互聯網傳媒逐漸扭轉公眾對于AI多模態生成的消極情緒和片面認知,是AI圖片、AI視頻等技術推廣至生產生活、釋放商業化潛力的必要前提。隨著AIGC的影響力快速擴大,科技公司也需要付出更多成本以確保模型訓練數據和生成內容的版權和合規性,以應對未來可能的法律挑戰。圖15:22M12一篇論文顯示,StableDiffusion以像素點級別復制了名畫的細節、結構和繪畫風格Content and style copiedStyle copiedMatchTopI對AIGC的版權問題的爭議和相關法規主要可以分為兩類:1)AI生成內容的版權界定:指由AI生成的文字、圖片等內容是否受到版權保護,以及版權
42、應當歸屬于用戶、模型提供商、訓練數據提供者等哪一方。對于AI生成內容版權的明確,是AIGC產品大規模商業化的重要前提。2)模型訓練數據的版權規定:指OpenAI、StabilityAI等模型供應商在訓練基礎模型時采用的數據集是否受到版權保護,模型供應商應該以怎樣的方式獲得訓練數據集的版權。對于訓練數據的版權規定,是AIGC產業良性可持續發展、以及令公眾消除對AI生成內容的消極情緒的關鍵。表2:國內外關于AI生成內容和模型訓練數據的版權規定與相關糾紛判決AIGC版權分類國家時間法規或相關判決具體介紹區別于有人工參與創作的Photoshop作品,通過Midjourney、AI生成內容不受版權法保護
43、美國創作的作品,因此不受版權法保護美國版權局拒絕Midjourney2023年3月6日美國版權局在批準ZaryaoftheDawn時,拒絕為小說中Midjourney生成生成圖片的版權申請的插圖提供版權保護。AI生成內容的版權界定深圳市南山區人民法院在騰訊AI協作工具Dreamwriter引發的著作權糾紛案作權法保護中做出判決,首次認定AI生成內容具有獨創性,應當獲得著作權法保護中國北京互聯網法院認定AI生成圖2023年12月1日出一審判決,肯定了AI繪畫大模型生成的涉案圖片屬于著作權法上的美術價片屬于著作權法上的美術作品美國新聞媒體聯盟代表近2000家印刷和數字媒體出版商發布了生成式AI監式
44、A監管原則其內容的權利。美國Getty Image起訴Stability AIShutterstock的同類公司、圖片素材版權庫GettyImage起訴StabilityAI的未經允許自動爬取其擁有著作2023年1月18日權的圖片素材用于模型訓練模型訓練數據的版權規定歐盟人工智能法案2023年6月14日料來訓練Al,并添加了透明度和風險評估要求日本文部科學大臣永岡桂子表示,日本法律不會保護人工智能使用的原始材料日本不受版權保護方面獲取”政策都允許。-12-敬請參閱最后一頁特別聲明證券研究報告#page#光大證券室互聯網傳媒對于Al生成內容的版權界定,美國不承認AI生成內容擁有著作權,而中國傾向
45、于保護AI生成內容的著作權。美國版權局2023年3月16日收錄于聯邦法規中的AI版權認定和登記指引政策表明,僅由AI生成的作品不受版權保護,包含AI生成內容的作品根據情況給予登記;2023年3月6日,美國版權局拒絕為一篇小說中包含的AI生成插圖提供版權登記。中國的生成式人工智能服務管理暫行辦法未給出明確規定,在2020年1月和2023年12月的兩起AI生成內容引發的著作權糾紛案中,判決都肯定了AI生成內容具有獨創性,應當獲得著作權法保護。對于模型訓練數據的版權規定,美國、歐盟均明確要求使用受版權保護的材料來訓練模型,而日本則認定訓練數據不受版權保護。美國新聞媒體聯盟于23M4發布的生成式人工智
46、能監管原則中強調生成式AI的開發者和部署者必須尊重創作者對其內容的權利。歐盟于23M6投票通過人工智能法案,要求OpenAI、谷歌和微軟等基礎模型的供應商聲明是否使用受版權保護的材料來訓練Al,并添加了透明度和風險評估要求。日本則在23M6重申日本法律不會保護人工智能使用的原始材料版權,無論是否從非法網站或其他方式獲取訓練數據,政策上都是允許的。表3:國內外關于人工智能良性健康發展的方向性指導文件名稱發布時間主要內容互聯網信息服務算法推薦管理規定2021年11月16日對算法推薦技術提供互聯網信息服務的企業活動進行了規定互聯網信息服務深度合成管理規定2022年11月3日制定了深度合成服務的治理和
47、相關監督管理規定,完善了監管機制人工智能帶來的創新生產方式的變革,不僅帶來產業的快速發展,而且帶來科技創新范中國智能科技產業發展2023式和教育范式的新變革。七部門聯合發布生成式人工智能服務2023年7月15日23年8月15日開始施行,采取有效措施鼓勵生成式人工智能創新發展;劃定底線,管理暫行辦法關于通過聯邦政府進一步促進種加該命令對部署人工智能系統的聯邦機構規定了新的公平義務,要求各機構“防止和補教區別于有人工參與創作的Photoshop作品,通過Midjourney、StabilityAl、ChatGPT等平臺自動生式AI版權規定條例品,因此不受版權法保護美國美國NMA生成式人工智能監管原
48、則2023年4月26日生成式AI的開發者和部署者必須尊重創作者對其內容的權利自2018年不斷更新,強調人工智能的重要性,并呼呼在創新、國家安全和勞動市場等工智能戰略方面采取相應措施美國政府關于安全、可靠和可信地開為人工智能安全和安保確立了新的標準,保護了美國人的隱私,促進了公平和公民權2023年10月30日發和使用人工智能的行政命令利,促進了創新和競爭。2018年4月1日人工智能協調計劃行更密切的合作,包括計算能力、微電子、TEF、數字創新中心等人工智能、機器人和相關技術的倫理包括關于通過機器學習或深度學習開發、實施和技術演變的條款。目標是將監督擴展到2020年1月16日方面框架高度復雜技術的
49、所有領域。歐盟在歐盟委員會采取的廣泛數字舉措人工智能白皮書2020年2月19日智能對人類和道德影響的協調方法要求OpenAI、谷歌、微軟等基礎模型的供應商聲明是否使用受版權保護的材料來訓練人工智能法案2023年6月14日Al,并添加了透明度和風險評估要求。AIGC的政策挑戰包括勞動力市場的潛在變化、版權的不確定性、傳播錯誤和虛假信OECD生成式人工智能的初步政策考慮X2023年5月19日息、歧視、扭曲公共話語、編動暴力等。英國希望通過此政策文件消除用戶的優慮并降低Al的輸出風險,激勵企業、民眾共同英國支持AI創新的監管方法2023年3月29日參與到這場AI技術變革中重點關注生成式Al的知識產權
50、問題,提出“要適當地應對外界擔憂和潛在風險,以促日本知識產權戰略計劃發2023年6月9日進生成式AI的開發、提供和使用”資料來源證券研究所整理-13-敬請參閱最后一頁特別聲明證券研究報告#page#室光大證券互聯網傳媒4、投資建議整體來看,國內外對于模型訓練數據的版權保護技術尚待成熟、政策尚待完善,未來版權提供商股價有望得到密集催化。隨著模型訓練數據的版權規定進一步完善,有利于扭轉公眾對于AI多模態生成的消極情緒,促進AI生成圖片、視頻等技術的產品化,釋放商業潛力。展望數據歸因技術的成熟使版權收入和AI生成內容量緊密掛鉤,隨著AIGC下游應用的商業潛力釋放,有望持續帶動版權提供商的授權收入增量
51、。復盤Shutterstock的業績和股價表現,AIGC產業的發展對于版權提供商的利好多于利空,預期差驅動股價回升。Shutterstock授權給科技公司訓練AI模型的數據出售收入快速增長,而傳統業務的下滑更多受到同業競爭壓力的影響,AI生成圖片替代版權提供商傳統業務的擔憂逐漸消退,而模型訓練帶動的版權收入快速增長形成了預期差,驅動Shutterstock股價回升。建議關注海外版權提供商:Adobe、Shutterstock、GettyImage、Elsevier、ThomsonReuters,以及注重數據版權保護的AI公司:微軟、谷歌、Metao看好國內模型訓練數據的版權保護繼續完善,帶動新
52、聞媒體、圖片、影視等各類信息媒介版權提供商的業績增長。建議關注:1)Al+出版:中國出版、中國科傳;2)圖片版權庫:視覺中國;3)影視版權庫:捷成股份、華策影視。5、風險提示中美地緣政治摩擦、宏觀經濟不及預期、AIGC技術發展和應用落地進度不及預期、AI行業競爭加劇風險。-14-敬請參閱最后一頁特別聲明證券研究報告#page#B光大證券互聯網傳媒行業及公司評級體系評級克印買入業及公增持未來6-12個月的投資收益率領先市場基準指數5%至15%;中性未來6-12個月的投資收益率與市場基準指數的變動幅度相差-5%至5%;減持未來6-12個月的投資收益率落后市場基準指數5%至15%評賣出未來6-12個
53、月的投資收益率落后市場基準指數15%以上;級無評級A股市場基準為滬深300指數;香港市場基準為恒生指數;美國市場基準為納新達克綜合指數或標普500指數?;鶞手笖嫡f明:分析、估值方法的局限性說明分析師聲明本報告署名分析師具有中國近專業審慎的研究方法發行商或證券所發表的觀點均如實反映研究人員的個人觀點。研究人員獲取報酬的評判因素包括研客戶反饋、競爭性因素以及光的聯系。法律主體聲明本報告由光大證券股份有限公司制作告在中華人民共和國境內資咨詢業務資格,負責中國光大證券國際有限公司和EverbrightSecurities(UK)CompanyLimited是光大證券股份有限公司的關聯機構。特別聲明是世
54、界500強企業一本公司經營范圍:證券經紀;融資融券業務;中國證監會批準的其他業務。此外,本公司還通過全資或控股子公司開展資產管理、直接投資、期貨、基金管理以及香港證券業務。完整的信息為基礎,低或所表述的意見并不溫到個別。投資者應當充分考慮自身特定狀況,并完整理解和使用本報告內容,不應視本報告為做出投資決策的聽不同時提供與本報告中觀點不謹慎扶擇的唯一信賴依據。本報告根據中華人民本公司保留光大證券股份有限公司版權所有。保留一切權利。光大證券研究所北京深圳上海靜安區南京西路1266號西城區武定侯街2號日區深南大道6011號恒隆廣場1期辦公樓48層NEO綠景紀元大廈A座17樓泰康國際大廈7層光大證券股份有限公司關聯機構香港英國中國光大證券國際有限公司Everbright Securities(UK) Company Limited15-敬請參閱最后一頁特別聲明證券研究報告#page#