《傳媒行業AIGC系列專題:從AI技術演進看AIGC奇點臨近未來已來-230306(35頁).pdf》由會員分享,可在線閱讀,更多相關《傳媒行業AIGC系列專題:從AI技術演進看AIGC奇點臨近未來已來-230306(35頁).pdf(35頁珍藏版)》請在三個皮匠報告上搜索。
1、國信證券證券研究報告2023年03月06日超配AIGC系列專題從AI技術演進看AIGC:奇點臨近,未來已來核心觀點行業研究行業專題傳媒人工智能:新一輪生產力革命。1)人工智能(AI)基于機器學習和數據分析的方法,賦予機器人類的能力,從而實現解放人力、降本提效的目的。從超配維持評級C端用戶需求來看,人工智能解決的是與人相關的娛樂、出行、健康等生活證券分析師:張衡證券分析師:夏妍場景中的痛點;2)Al在C端的應用分為兩方面:a)對原有勞動力的替代與021-60933162021-60875160zhangheng2g生產力效率的提升:如語音識別、智能客服、機器翻譯等;b)需求創造:xiayan28
2、g5090520030003如基于AI算法的“千人千面”的信息分發(如抖音、快手、小紅書等)、市場走勢、內容生成(AIGC)、人機交互(如ChatGPT等)、輔助駕駛、安防等。算法創新及算力進步、數據爆發,催化本輪人工智能奇點將至。1)人工智能的技術演進經歷了符號主義、連接主義和行為主義,在行為主義思想中引入了連接主義的理念,最終誕生引導AI落地的深度學習技術;2)深度學習技術的出現,改變了傳統AI的技術路線,解決了傳統機器學習算法無法處理大量數據、準確率遭遇瓶頸的問題,使得AI從理論上具備了工程化落地的可能;3)基于摩爾定理的算力提升,互聯網及數字經濟的快速發展帶來25.0的數據量井噴,使得
3、AI最終從設想走向場景落地,在語音識別、圖像識別心小心等領域的計算準確度都實現了突破性進展并得到廣泛應用。從算法推薦到內容生成,AIGC有望引發新一輪內容與平臺投資機遇。1)結相關研究報告合AI技術特點,我們認為AI能夠創造價值的領域必須必備以下三點要素:字中國項層規劃出臺,ChatGPT開放API有適合的商業化場景:行業內存在需求,AI能夠為行業帶來降本提效;存在升廣告貨幣化率,中觀維度持海量、多維數據;算力及開發成本具備合理的商業化回報可能;2)從傳媒互聯網的實踐來看,基于AI算法推送的信息分發模型已經為web2.0時代ing,多家公司023-02-20主流的信息組織模式,并誕生出以字節跳
4、動、快手、小紅書等為代表典型產品和商業案例;3)內容生成(AIGC)時代的大門正在打開:海量的數據資源、快速提升的算力水平和不斷降低的單位算力成本開銷、基于深度學習的預訓練大模型構建的通用大模型顯著降低應用開發門檻,數字化的高滲透率賦予充裕場景應用可能;從PGC到AIGC,內容生產的大爆炸將重塑內容與平臺生態、商業模式,新一輪產業機遇漸行漸近。投資建議:從生產力到商業化應用,基于科技及產業視角聚焦傳媒互聯網關鍵環節核心標的。預訓練大模型有望走向成熟并成為AIGC應用的技術底座、降低應用開發門檻與成本,摩爾定理送代的算力有望不斷降低模型訓練及運維成本,AIGC場景化應用有望迎來爆發期并成為產業鏈
5、核心價值點,建議從數據與場景應用兩個角度把握傳媒互聯網關鍵產業鏈環節與核心標的,建議關注:1)數據要素及IP角度推薦中文在線、視覺中國、浙數文化、人民網等標的;2)場景落地關注湯姆貓、昆侖萬維、愷英網絡、芒果超媒、三人行、藍色光標、呼喱嘩喱等標的。風險提示:技術進步低于預期,應用落地低于預期,監管政策風險等。重點公司盈利預測及投資評級公司投資收盤價總市值公司評級(億元)2023代碼名稱202315.2002027.SZ分眾傳媒買入6.3B921.410.280.4222.815.7713.68買入22.71503.681.41.66002555.SZ三七互娛2437300413.S芒果超媒買入
6、32.65610.79.151.3資料來源:Wind、因信證券經濟研究所預測請務必閱讀正文之后的免責聲明及其項下所有內容#page#國信證券證券研究報告內容目錄AI(人工智能):第四次生產力革命.55AI發展原動力:提效降本,在新一輪技術革命中搶占先機產業鏈及發展歷程:三起兩落,數據及算力爆發帶來新一輪AI發展機遇.產業鏈:基礎層+技術層+應用層.8人工智能:技術流派及我們所處的階段技術演進:行為主義+連接主義,誕生深度學習技術.技術現狀:深度學習技術帶動本輪人工智能發展1實現要素:海量數據及高效算力是深度學習實現基礎.12所處時代:基于統計規律的弱人工智能時代,但商業化價值已經展現.15萬事
7、俱備,人工智能場景應用有望全面爆發.16資源層:數據及算力的大幅提升將AI推向浪潮之贛.18技術環境:開源框架大幅降低開發門檻19外部環境:政策助力,人工智能迎來發展良機從算法推薦到內容生成:AI有望引發新一輪內容與平臺投資周期.21.21AI賦能,字節跳動充分展現內容分發時代AI商業化價值.生成式AI(AIGC):從信息分發到內容生成,更為宏大的時代機遇2426算力與數據皆備、大模型加速AIGC技術導入,應用創新、場景落地漸行漸近.從PGC到AIGC,AI有望重構內容與媒介生態.投資建議:奇點臨近,擁抱內容與平臺新投資機遇.風險提示33請務必閱讀正文之后的免責聲明及其項下所有內容#page#
8、page#國信證券證券研究報告表1:人工智能產業鏈概覽,.6.12表2:人工智能的分類標準及定義表3:主流開源框架.表4:中國人工智能行業重要政策梳理1922表5:AI算法推薦在文娛領域應用.27表6:主流生成模型一覽表,27表7:主流AIGC預訓練模型一覽表.表8:國內預訓練大模型.表9:重點公司估值表.32請務必閱讀正文之后的免責聲明及其項下所有內容#page#國信證券證券研究報告AI(人工智能):第四次生產力革命Al(ArtificialIntelligence):1952年,圖靈在計算機械與智能一文中提到了“圖靈測試”來驗證機器是否具有智能:如果一臺機器能夠與人類展開交流,并且有超過3
9、0%的人無法在規定時間內識別出與自己交談的是人還是機器,那么這臺機器可以被認為是具有智能的。后來科技界又提出了其他界定人工智能的標準:例如能否實現語音識別、機器翻譯、自動寫作等等。本報告蟲所提及的人工智能技術,不僅包括具有自然語言處理能力、或通過圖靈測試的AI技術,還包括有海量數據、超復雜性、要求實時性、人類智能暫時無法處理的機器智能技術。圖1:人工智能所涉及的基礎技術及終端產品芯片機器人智能金融計算機視覺智能醫療語音識別智能安防語義識別雪能家居資料來源:36kr,國信證券經濟研究所整理AI發展原動力:提效降本,在新一輪技術革命中搶占先機微觀:提效降本,科技讓生活更美好從C端用戶需求來看,人工
10、智能解決的是與人相關的娛樂、出行、健康等生活場景中的痛點。人工智能在C端的應用分為兩方面:1)對原有勞動力的替代與生產力效率的提升:如語音識別、智能客服、機器翻譯等;2)新增需求的滿足:如“千人千面”的信息分發(如抖音、快手、小紅書等)、內容生成(AIGC)、人機交互(如ChatGPT等)、輔助駕駛、安防等。從B端需求來看,企業對于效率的提升需求旺盛,人工智能在金融、公共安全、醫療健康等領域均取得了較為普遍的應用。宏觀:新一輪技術革命,贏得未來國與國之間科技競爭的主動權人工智能有望引領了蒸汽革命、電氣技術革命以及信息產業革命之后的第四次生產力革命。1)18世紀60年代,英國率先發展并完成了第一
11、次工業革命,在隨后的一個多世界里成為了世界霸主;2)19世紀60年代,完成了資產階級革命或改革的美、德、法、日在第二次工業革命中起,使人類進入“電氣時代”;3)進入20世紀中葉,以信息技術、新能源技術的代表的第三次科技革命在美國興起,進一步強化了美國的霸主地位。自2006年以來,Hinton提出深度學習算法,令機器在自主學習方面有了革命性的突破,同時,伴隨著海量數據的積累、GPU、芯片計算能力的提升,人工智能的三大要素“算法”、“算力”和“數據”皆已準備就緒。2016年,AlphaGo首次擊敗人類問鼎世界冠軍,人工智能的關注度急速攀升。而近期人工智能技術在安防、金融、醫療、內容分發領域的持續落
12、地,使AI技術在提效降本、解放勞動力、提升資源配置效率方面的巨大作用得以顯現。我們認為,在本輪變革中具有良好技術沉淀和全面布局的國家有望搶得科技的主請務必閱讀正文之后的免責聲明及其項下所有內容#page#國信證券證券研究報告動權。圖2:人類歷史上四次工業革命神經網絡發蒸汽機8人造地球衛星裝云計算、發動機原子能技術發展毀據技術發展1784年2016年1959年第一條生產線第一臺紡織機辛辛那提居字場晶體管計算機出現AlphaGo首次擊敗人類20世紀三十年代21世紀初18-19世紀中期第四次工業革命次工業革會第三次工業機械化自動化機械自動化模擬化數字化自動化智能化資料來源:36kr,國信證券經濟研究
13、所整理產業鏈及發展歷程:三起兩落,數據及算力爆發帶來新一輪AI發展機遇產業鏈:基礎層+技術層+應用層總體來看,人工智能產業鏈可分為基礎支撐層、技術層和應用層?;A層提供算力,主要包含人工智能芯片、傳感器、大數據及云計算。其中,芯片具有極高的技術門檻,且生態搭建已基本成型。目前該層級的主要布局玩家為Nvidia、AMD、英特爾等在內的國際科技巨頭,國內在基礎層的布局和實力均相對薄弱。技術層主要解決具體類別問題,這一層級主要依托運算平臺和數據資源進行海量識別訓練和機器學習建模,開發面向不同領域的應用技術,包括語音識別、自然語言處理、計算機視覺和機器學習技術等??萍季揞^谷歌、IBM、亞馬遜、蘋果、阿
14、里巴巴、百度都在該層級深度布局,并涌現了如商湯科技、礦世科技、科大訊飛等諸多獨角獸公司。應用層主要解決場景落地問題,利用AI技術針對行業提供產品、服務和解決方案,其核心是商業化。得益于人工智能的全球開源社區,應用層的進入門檻相對較低,但也是商業價值最大的環節(典型如算法推動在抖音、快手等應用端落地)。表1:人工智能產業鏈概覽核心能力細分領域產業生態搭建以BATJ為代表的科技巨頭開始自然人工爸基礎層計算力能基礎學科實驗室加大研發力度,同時將芯片、傳感器、云計算/大數據截至目前,包括騰訊、百度、阿里在內的計算機視覺、自然語言處理、語言技術層技術開發和輸出識別、機器學習希望在人工智能時代延續自己的產
15、業優勢機器人、無人機、自動駕駛、智能巨頭公司占有數據優勢,巨頭公司開始搭應用層商業化的解決方案客服、智能物流、客戶畫像等資料來源:德勤研究,國信證券經濟研究所整理發展歷程:60年三起兩落,呈螺旋式發展回顧人工智能技術的發展歷程,我們發現,人工智能所經歷的三次興起浪潮均源請務必閱讀正文之后的免責聲明及其項下所有內容#page#國信證券證券研究報告于底層算法的革命性進展,而前兩輪的衰落是由于數據處理性能及底層算法的局限,使AI技術從成熟度以及商業可行性上無法落地。2006年,Hinton提出顛覆性的深度學習算法,使得AI產業邁出關鍵性一步:利用多層神經網絡,將人類從復雜的算法歸納中解放出來,只要給
16、予機器足夠多的數據,便能使其自動歸納出算法,疊加底層算力GPU的不斷發展及互聯網時代海量數據的積累,人工智三駕馬車:算法、算力和數據皆已準備就緒,使AI技術徹底走出實驗室,逐步滲透進各個行業和場景。圖3:人工智能發展的三次浪潮(第一輪)精耕細作:調生期(第二輪)急功近利:產業期(第三輪)集肢成襲:爆發期火爆出圖法的提出方向項目宣告失資料來源:艾瑞咨詢,智能時代,國信證券經濟研究所整理第一輪:興于感知神經網絡,終于計算機性能約束興起:1956年達特茅斯會議開啟了人工智能的元年,僅在定理層次等證明了AI商用的可能性,實際應用還十分有限。1956年,以約翰麥卡錫、馬文明斯基、克勞德香農等為代表的科學
17、家們在達特茅斯組織了一場為期兩個月的人工智能夏季研討會,探討如何通過機器模擬人類學習或人類智能的其他特征。本次會議結束后,很多國家政府、研究機構、軍方等都開始投資人工智能,披起了第一波人工智能熱潮。在第一波AI的浪潮中,占據主導地位的思想是邏輯主義,即通過引入符號方法進行語義處理、將待研究和解決的問題轉化為可以用計算機處理的符號,運用邏輯公理進行解答,從而實現人機互動。第一波人工智能浪潮的總體成就有限,僅在定理證明等特定領域取得了成功。受制于計算機性能及可獲取的數據量,當時的人工智能只能完成玩具式的簡單任務,在語音、圖像識別及想起游戲等看似簡單的任務上,進展都十分有限。衰落:計算機的性能制約了
18、早期程序的應用,人工智能的發展首次預冷。受限于計算機的處理性能,當時其所能處理的程序對象少且復雜度低,機器無法讀取足夠的數據實現智能化,AI自然無法大規模落地商用。1973年,學者萊特希爾發表了一份具有影響力的評估報告人工智能:一般性的考察,報告指出:“今為止,人工智能沒有在任何領域發生之前預想的重大影響,人工智能的投入是金錢的浪費”,該報告發表后,英國政府隨后終止了對愛丁堡等幾所高效的人工智能項目的支持。到70年代中期,美國和其他國家在該領域的投入也大幅度削減,人工智能發展進入寒冬。第二輪:興于BP神經網絡,終于專家系統失敗興起:1980年代,Hopfield神經網絡和BT訓練算法的提出,使
19、基于AI技術的專家系統首次得以商用。Hopfield神經網絡是通過對動物或人腦的基本單元一神經元建模和連接,探索模擬動物或人腦神經系統的學習、聯想、記憶和模式識別等功能的人工模型?;谠撃P?,IBM等公司開發出了一系列用于模擬專家決策請務必閱讀正文之后的免責聲明及其項下所有內容#page#國信證券證券研究報告的專家系統,使人工智能第一次實現商業化落地。衰落:算法局限使計算結遭遇瓶頸,人工智能由于實際商用成本過高再次衰落。專家系統的維護成本極高,但神經元網絡只能解決單一問題,數據量積累到一定程度后,計算結果便不再改進,實際應用價值有限。1987年,蘋果和IBM生產的臺式機性能超過了由Symbol
20、ics等廠商生產的通用計算機,專家系統逐漸淘汰。第三輪:興于深度學習算法,強于數據及算力興起:2006年,Hinton提出了神經網絡DeepLearning算法,將人類從復雜的算法歸納中解放了出來,使人工智能再一次聚焦了學術界和產業界的目光。從底層算法來講,深度學習算法彌補了傳統BP神經網絡的缺陷:1)多隱層的人工神經網絡具有優異的特征學習能力,從而有利于可視化或分類;2)傳統人工神經網絡的訓練難度可以通過“逐層初始化”來克服。通俗來講,本輪算法的革命性進步在于:不需要人工去提取規則特征,機器通過海量數據,即可自動實現規則的特征提取,將最復雜的“算法歸納”留給機器去完成。數據顯示,自2012年
21、在圖像識別領域引入深度學習算法以來,圖像識別的錯誤率顯著降低。并通過深度學習訓練層數的增長及優化,在2015年通過ResNet模型使圖像識別的精度超過了人眼可達的精度。圖4:深度學習使圖像識別逐漸超越人眼可達精度100.00%人眼可達的精度005690.00%引入深度學習850030074.20%75.00%670.00%2層65.00%資料來源:AI芯片,國信證券經濟研究所整理強化:底層算力的高速發展及多維數據的快速積累,使本輪人工智能得以爆發。計算機硬件設施的發展,如GPU(圖形處理器)、TPU(張量處理器)等新一代芯片及FPGA(現場可編程門陳列)異構計算服務器提供了足夠的計算力,能夠支
22、持人工智能算法的原型。數據的可獲得性和質量在這一時期得到了極大的改善,互聯網、物聯網等產業的發展也為人工智能提供了規??涨暗挠柧殧祿?。人工智能三大要素:“算法、算力和數據”的準備就緒,使人工智能快速滲透到各產業中,如安防、金融、醫療、文娛等。人工智能:技術流派及我們所處的階段技術演進:行為主義+連接主義,誕生深度學習技術AI的技術流派經歷了符號主義、連接主義和行為主義,在行為主義思想中引入了連接主義的技術,誕生本輪的深度強化學習技術。請務必閱讀正文之后的免責聲明及其項下所有內#page#國信證券證券研究報告符號主義符號主義又稱為邏輯主義,在人工智能早期一直占據主導地位。該學派認為人工智能源于數
23、學邏輯,其實質是模擬人的抽象邏輯思維,用符號描述人類的認知過程。早期的研究思路是通過基本的推斷步驟尋求完全解,出現了邏輯理論家和幾何定理證明器等。上世紀70年代出現了大量的專家系統,結合了領域知識和邏輯推斷,使得人工智能進入了工程應用。PC機的出現以及專家系統高昂的成本使符號學派在人工智能領域的主導地位逐漸被連接主義取代。連接主義連接主義又稱為仿生學派,當前占據主導地位。該學派認為人工智能源于仿生學,應以工程技術手段模擬人腦神經系統的結構和功能。連接主義最早可追湖到1943年麥卡洛克和皮茨創立的腦模型,由于受理論模型、生物原型和技術條件的限制在20世紀70年代陷入低潮。行為主義行為主義又稱為進
24、化主義,近年來隨著AlphaGo取得的突破而受到廣泛關注。該學派認為人工智能源于控制論,智能行為的基礎是“感知一行動”的反應機制,所以智能無需知識表示,無需推斷。智能只是在與環境交互作用中表現出來,需要具有不同的行為模塊與環境交互,以此來產生復雜的行為。在人工智能的發展過程中,符號主義、連接主義和行為主義等流派不僅先后在各自領域取得了成果,各學派也逐漸走向了相互借鑒和融合發展的道路。特別是在行為主義思想中引入連接主義的技術,從而誕生了深度強化學習技術,成為AlphaGo戰勝李世石背后最重要的技術手段。圖5:人工智能三大學派連接主義學派20世紀40、50年代,來自不同領域的一批科學,科等,在這至
25、今已有五十門進行了各種域也到此誕生了許多學派。人工智能行為主義學派號主義符號主義學派大膠功資料來源:人工智能+教育,國信證券經濟研究所整理技術現狀:深度學習技術帶動本輪人工智能發展系竟素到,吐草區素條,、將鮮圖,的孩系尊器晶工Y三個階段,其中,深度學習算法徹底將人類從復雜的算法抽象中解放了出來,用深度神經網絡+海量數據打破了計算準確度的瓶頸,帶動了本輪人工智能的爆發。人工智能算法所經歷的三大階段及實現過程如下1)既定規則系統及其實現過程請務必閱讀正文之后的免責聲明及其項下所有內容#page#國信證券證券研究報告既定規則系統尚不屬于“機器學習”的范圍,其背后的關系為人力搭建算法的邏輯關系。面對待
26、處理的問題,由人提取出問題特征、再由人設定好算法規則,交由機器進行運行。例如,判斷某幅圖片是否為猴子,既定規則系統執行過程如下:1)人為提取猴子各部分像素特征;2)人為設定猴子判定規則,如眼睛、鼻子、嘴巴等部位的像素應分別位于哪一區間內:3)機器根據讀取到的像素及判定規則,計算當前圖片是否為猴子,輸出結果“是”或“否”。如下圖所示:圖6:三代人工智能算法判定過程傳統機器學習算分界于緣素是驟資料來源:人工智能+教育,國信證券經濟研究所整理2)傳統機器學習算法及實現過程傳統機器學習算法徹底將人類從復雜的算法抽象中解放了出來,但對復雜數據的處理受到明顯制約。簡單來說,機器學習是一種實現人工智能的方法
27、,深度學習算法是實現機器學習的技術。傳統機器學習算法又稱淺層算法,這類算法如反向傳播算法(BP算法)、支持向量機(SVM)、Boosting等,局限性在于對有限樣本和計算單元的情況下對復雜函數的表示能力有限,對復雜數據的處理受到制約。例如,在圖像識別領域,淺層學習的識別準確率較低,主要原因為該算法的處理邏輯偏向淺層,不能窮舉復雜的情景,在準確率達到一定程度后,即使再投入更多數據,準確率依然無法提升。如判斷某幅圖片是否為猴子,傳統機器學習算法執行過程如下:1)人為提取猴子各部分像素特征;2)機器自動歸納猴子的判定規則,如眼睛、鼻子、嘴巴等部位的像素應分別位于哪一區間內;3)機器根據讀取到的像素及
28、判定規則,計算當前圖片是否為猴子,輸出結果“是”或“否”。3)深度學習算法及實現過程深度學習與傳統的機器學習最主要的區別在于:隨著數據規模的增加,其判斷準確度也在不斷增長。判斷準確度的提升,使人工智能技術可大規模應用于語音識別、圖像識別等多個領域。2006年,Hinton提出深度學習算法,該算法與傳統的機器學習算法最大的區別在于隨著數據規模的增加,算法計算準確率也不斷增長。當數據很少時,深度學習算法的性能并不突出,隨著數據量的增加,其優越性得以體現。如圖8所示:傳統機器學習算法,在擬合度達到某一特定值后,再增加數據量,其擬合度不再提升;深度學習算法擬合準確度隨著數據量及神經網絡層數的增加而提升
29、。例如,在引入深度學習之前,語音識別的準確率連續三年穩定在76.4%,引入該算法后,其準確率逐年遞增,2017年已達94.5%。如判斷某幅10#page#國信證券證券研究報告圖片是否為猴子,深度學習算法的執行過程如下:人為將海量帶有標簽的圖像數據到計算機中,無需進行任何特征提取或規則設定,算法自動根據輸入圖像的特征歸納出判定規則,并泛化至后續判斷過程中。圖7:三代人工智能算法判定過程人工智能機器學習一+實現人工智能的方法深度學習一實現機器學習的技術資料來源:艾瑞咨詢,國信證券經濟研究所整理圖9:深度學習算法數據量與準確率間的關系數據量與準確率之間的關系深度學習算法傳統機器學習算法教據量資料來源
30、:機器之心,國信證券經濟研究所整理資料來源:36kr,國信證券經濟研究所整理實現要素:海量數據及高效算力是深度學習實現基礎海量數據及高效算力是深度學習實現基礎。深度學習全稱深度神經網絡,本質上是多層次的人工神經網絡算法,即從結構上模擬人腦的運行機制,從最基本的單元上模擬了人類大腦的運行機制。算法的實現過程分為訓練和推斷兩個階段。訓練階段需要海量數據輸入,訓練出一個復雜的深度神經網絡模型。推斷指利用訓練好的模型,使用待判斷的數據去“推斷”得出各種結論。大數據時代的到來,圖形處理器(GraphicsProcessingUnit,GPU)等各種更加強大的計算設備的發展,使得深度學習可以充分利用海量數
31、據(標注數據、弱標注數據或無標注數據),自動地學習到抽象的知識表達,即把原始數據濃縮成某種知識。簡單來說,在深度學習算法的基礎上,海量數據解決了計算精準度的問題,算力的提升解決了計11#page#國信證券證券研究報告算速度的問題。圖10:基于深度學習的人工智能技術架構行業應用產品平臺及服務應用22284基礎硬件資料來源:中國信通院,國信證券經濟研究所整理所處時代:基于統計規律的弱人工智能時代,但商業化價值已經展現人工智能的分類標準及定義李開復及王詠剛在人工智能一書中,將人工智能按照智能程度的強弱,劃分為:弱人工智能(ArtificialNarrowIntelligence,簡稱ANI)、強人工
32、智能(ArtificialGeneralIntelligence,簡稱AGI)和超人工智能(ArtificialSuperintelligence,簡稱ASI)三個層次,各層級特點及典型代表如下表所示:表2:人工智能的分類標準及定義特點層級定義典型應用AlphaGo、AlphaGo專注于且只能解決單個特定領域弱人工智能只能在某一方面代替人類行為Zero、人臉識別、可題的人工智能語音識別本身擁有人類的思維,具有知覺和能夠勝任人類所有工作的人工智自我意識,能夠獨立能夠進行思考強人工智能尚無復雜理念、快速學習等在科學創新、通識和社交技能等多具有高級思維能力,且全方面優于超人工智能尚無領域均優于人類人
33、類,目前只存在資料來源:人工智能,國信證券經濟研究所整理弱人工智能(ANI)也稱為限制領域人工智能或應用型人工智能,本質上是某個特定領域內基于統計規律的大數據處理者。通俗來講,弱人工智能只專注于完成某個特定的任務,例如語音識別、圖像識別和翻譯,是擅長單個方面的人工智能,類似高級仿生學。該階段的AI技術是為了解決特定具體類的任務問題而存在,底層原理是從海量數據中從中歸納出模型,再泛化至新的數據中進行正向運算。例輸以是“想是工Y題,醒普olozogeudivogeudIv“郵12#page#國信證券證券研究報告勝象棋領域的世界級冠軍,但也僅限于擅長于單個游戲領域的人工智能。圖11:弱人工智能的典型
34、應用微軟二代小冰“在0防人之中,我只屬于你。微軟小冰IBMWatsonApple SIRI百度度秘小i機器人泰迪機器人資料來源:國信證券經濟研究所整理強人工智能(AGI)是人類級別的人工智能,擁有獨立思想和意識,在各方面均能與人類美。擁有AGI的機器不僅是一種工具,其本身可擁有“思維”,能夠進行獨立的思考、計劃、解決問題、抽象思維、理解復雜理念、快速學習等,可實現“全面仿人性”,在智力水平和行動能力方面與人類基本沒有差別,目前只存在于電影及人類想象中。圖12:電影機械姬中的強人工智能形象資料來源:國信證券經濟研究所整理超人工智能:假設計算機程序通過不斷發展,智力水平可以超越人類,則由此產生的人
35、工智能系統就可以被稱為超人工智能。在人工智能的三個層級中,超人工智能的定義最為模糊,目前還沒有精準預測能夠說明超越人類最高水平的智慧到底會表現為何種能力。對于超人工智能,目前只能從哲學或科幻的角度加以想象。13請務必閱讀正文之后的免責聲明及其項下所有內容#page#國信證券證券研究報告當前人工智能現狀:基于統計規律的弱AI時代當前人工智能尚屬于“弱人工智能”階段。按照人工智能的執行深度,我們將人工智能的判定層次分為計算智能、感知智能和認知智能三個層次:1)計算智能:神經網絡和遺傳算法的出現,使機器能夠高效、快速地處理海量數據,目前該技術的應用已相當成熟;2)感知智能:技術已相對成熟,典型應用語
36、音識別及人臉識別,準確率分別超過98%和99%;3)認知智能:還有較大提升空間,典型應用包括機器翻譯和計算機視覺認知,這兩項技術與人力還有較大差距。通過以上對三個層級的分析,我們判斷:人工智能技術尚不具備完全“認知”能力,處于垂直領域的應用投入商用、自主認知尚待攻克的“弱人工智能”階段。圖13:人工智能所屬階段及判斷方法所屬層級技術成熟度共型應用智能計算海量數據處理相當成熟語音識別準確率98%有能感念語音識別、圖像識別等圖像識別準確率99%智能認每機器細譯、計算機視覺感知等與人類尚存較大差距資料來源:國信證券經濟研究所整理“弱人工智能”所帶來的收效依然十分可觀弱人工智能在特定領域的表現均超過人
37、類,多種勞動密集型工作均具有較強自動化潛力。2017年10月,AlphaGo的升級版本實現了不通過向人類學習,只通過概率計算和自學自練就達成自我超越、戰勝李世石的初代AlphaGo。由IBM開發人工智能Waston,使用機器學習來分析和解讀海量醫療數據和文獻,檢查患者數據做出治療決定,印度班加羅爾研究表明,Waston與醫生在提供肺癌、結腸癌和直腸癌治療建議方面一致性比例分別高達96%、81%和93%。微軟公司的人工智能虛擬機器人小冰,學習了20世紀20年代以來519位詩人的現代詩,自2017年2月起,“小冰”在天涯、豆瓣、貼吧、簡書四個平臺上使用了27個化名發表的詩歌作品,幾乎沒有被發現是機
38、器所作。不僅如此,人工智能在交通、教育、金融領域也展示出了巨大的應用前景。與人類相比,人工智能在數據存儲、調用、分析處理方面的強大能力,以及在特定危險情境下的生存能力,都有望為人類生活帶來巨大顛覆。麥肯錫報告表明,多種人力勞動密集、機械類工作都具有較強的自動化潛力,住宿和餐飲服務、制造、交通和倉儲等職業自動化潛力巨大請務必閱讀正文之后的免責聲明及其項下所有內容#page#國信證券證券研究報告圖14:部分職業的自動化潛力3050住宿和餐飲服務交通和倉儲零售商貿等金融和保隨藝術專業管理教育服務資料來源:麥肯錫,國信證券經濟研究所整理2020年,弱人工智能為全球GDP帶來14%的提升。人工智能將提升
39、社區勞動生產率,特別是在有效降低勞動成本、優化產品和服務、創造新市場和就業等方面,將為人類的生產和生活帶來革命性的轉變。據Sage預測,2020年,人工智能的出現將為全球GDP帶來14%的提升,相當于15.7萬億美元的增長。根據世界銀行及產新智庫的分析,人工智能作為當下最先進生產力,如果能為制造業提高1%的效率,全球制造業便會節約3000億美元。再細分到各個產業,為航空提高1%的效率相當于300億美元,為電力提高1%的效率相當于660億美元,為醫療系統效率提高1%相當于630億美元,為鐵路系統效率提高1%相當于270億美元,為石油天然氣資本支出降低1%相當于900億美元。綜上,截至2025年,
40、人工智能可能影響32萬億美元的全球制造業領域,相當于將影響全球50%的經濟。圖15:全球人工智能市場規模及增速圖16:中國人工智能市場規模及增速場規模(億美元)(億美元)8資料來源:沙利文咨詢,國信證券經濟研究所整理資料來源:沙利文咨詢,國信證券經濟研究所整理萬事俱備,人工智能場景應用有望全面爆發相比于前兩輪的AI浪潮,我們認為本輪人工智能應用將全面爆發的原因如下:1)請務必閱讀正文之后的免責聲明及其項下所有內容#page#國信證券證券研究報告共學限號樂答,“安事到輪深度學習算法出現前,AI的主要算法是BP、SVM等淺層算法,由于其處理邏輯停留在淺層,即使在擁有海量數據的情況下,擬合結果的準確
41、率在提升至某一瓶頸后便無法提升,人工智能難以處理復雜的問題。深度學習算法得益于多層神經出計算算法,數據量越高,擬合精準度越網絡,可直接用海量數據“暴力破解高。這說明只要具備充足的數據和算力,便能快速訓練出精準的算法,這使得決區驟毒多喜(z:竟吐強,金轉?夏,甲科明到墩取翡晶工YGPU算力已準備就緒,為算法運行提供充足“燃料”和“引擎”:互聯網使海量數據積累成為可能,而GPU的出現,滿足了機器學習大規模并行計算要求。至此,人工智能的三駕馬車“算法、算力、數據”皆已準備就緒;3)開源框架大幅降低了AI的使用門檻;4)政策及資本的助力:AI被廣泛認為人類歷史上第四次工業革命,美國、中國等科技大國均將
42、其提升至頂層戰略高度,加之資本注入及催化,“弱人工智能”的商用已廣泛落地。資源層:數據及算力的大幅提升將AI推向浪潮之巔互聯網及數字經濟的快速發展,為AI算法訓練提供充裕的數據來源。人工智能領域頂級專家吳恩達曾提到:發展人工智能就像用火箭發射衛星,需要強大的引擎和足夠的燃料,算法模型就是其引擎,高性能的算力是打造引擎的工具,海量的數據就是引擎的燃料?;谏疃葘W習的算法特點,其計算準確度與數據量基本成正比。例如,在輸入30萬張人類對奔棋譜并經過3000萬次自我對奔后,人工智能AlphaGo具備了婉美頂尖棋手的棋力。當前,機器學習所能應用的數據已經不局限于文本、數字等結構化數據,還包括視頻、音頻、
43、圖片等非結構化數據。而根據IDC的統計數據,2021年全球數據量已經達到82ZB,預計到2026年將達到214ZB。圖17:數據量快速增長中國數據量規模CAGR24.9%,為全球第一2021202220262023202202其他地區資料來源:IDC,國信證券經濟研究所整理GPU的發展解決了深度學習的訓練速度和相應的成本問題。1)英偉達于2016年推出P100,2017年推出V100,2020年推出A100,4年間從P100至A100英偉達GPU芯片高性能計算能力提升11倍。2022年英偉達持續送代推出H100,其最新16#page#國信證券證券研究報告的H100芯片在A100的基礎上將訓練表
44、現提升9倍;2)算力芯片的快速送代使得提升AI模型訓練速度和下游用戶體驗,同時基于摩爾定律的算力提升也使得單位算力開銷持續下降,從技術成熟度和商業化成本兩端加速AI技術走向普及。圖18:典型CPU架構圖19:典型GPU架構ALUALUControlALUALUCacheDRAMDRAM資料來源:知手,國信證券經濟研究所整理資料來源:知乎,國信證券經濟研究所整理圖20:人工智能算力發展概況諾贈CO超站8H19819資料來源:中國信通院,國信證券經濟研究所整理圖21::英偉達芯片高性能計算能力顯著提升1210請務必閱讀正文之后的免責聲明及其項下所有內容#page#國信證券證券研究報告資料來源;英偉
45、達官網,國信證券經濟研究所整理圖22:人工智能技術成熟度曲線用人工暫破滅谷底期穩步恢復期技術萌芽期期望影脹期高效成熱期時間0少2年10年以資料來源:Gartner,國信證券經濟研究所整理技術環境:開源框架大幅降低開發門檻各巨頭在2016年紛紛創立AI開源的開發框架,人工智能的開發框架是底層硬件與上層軟件之間的紐帶,可以視作人工智能進行開發和應用的“操作系統”。以往的專家系統是基于本地化專業知識進行運算,以知識庫和推理機為中心進行展開,推理機設計內容由不同的專家系統應用環境決定,不具備通用性。同時,知識庫是開發者收集錄入的專家分析模型與案例的資源集合,只能在單機系統環境下使用且無法連接網絡,升級
46、更新不便。企業的軟件框架實現有閉源和開源兩種形式,少數企業選擇閉源方式開發軟件框架,目的是打造技術壁壘;目前,業內主流軟件框架基本都是基于開源化運營,如谷歌的TensorFlow、臉書的Torchnet、微軟的DMTK、IBM的SystemML、三星的VELES等,均具有分布式深度學習數據庫和商業級即插即用功能。表3:主流開源框架巨頭回點開源框架說明2015年IBMSystmcML使用Java編寫,可實現三大功能:定制算法、多個執行模式、自動優化Caffe支持非常多的計算機視覺領域算法,目前仍然有非常多的卷積神經網絡伯克利大學Caffe2013年模型還都依賴于這個框架Torch2015年靈活且
47、速度快,缺點是要求開發者掌握Lua語言,可擴展性比較差Facebook2015年GoogleTensorFlow占用內存大,模型庫不夠豐富百度PaddlePaddle2016年易用、高效、靈活、可擴展,支持Kubernetes深度學習數據庫18#page#國信證券證券研究報告DMTK2015年微軟可同時使用多臺服務器,缺點是缺乏可視化2016年Open-Al更專注于開發和對比的強化學習(RL)算法的深度學習系統資料來源:36kr,國信證券經濟研究所整理外部環境:政策助力,人工智能迎來發展良機中國密集出臺人工智能相關政策,并將AI上升至國家戰略,力求在下一輪工業革命中搶占先機。自2015年以來,
48、國內不斷出臺推動人工智能發展的鼓勵政策,包括:1)建立人工智能促進機制;2)為人工智能提供近支持,包括稅收優惠、財政扶持及制定金融政策等;3)推動創新,包括促進產業集群,布局創新基地,鼓勵人才培養;4)政府制定規制與保障措施等。表4:中國人工智能行業重要政策梳理時間政策發文單位主要內容加快推動新一代信息技術與制造技術融合發展,把智能國務院2015年5月中國制造2025國務院關于積極推進“互互國務院2015年7月日標是加快人工告、智能終端、中華人民共和國國民經濟2016年3月劃綱要機器人產業發展規劃工業和信息化部國2016年4月業機器人主要技術(2016-2020年)改革委員會財政部2016年5
49、月年行動實施方案和信息化部中央網信辦礎堅實、創放協作工智能產業生態,2016年7月規劃著力強化技智能硬件產業創新發展專工業和信息化部國家發展2016年9月項行動(2016-2018年)改革委員會2016年11月興產業發展規劃音合第物制藥、第五代2017年3月2017年政府工作報告應用大數據人工智能技術和應用業規模起2017年7月萬億元、技術與應用總體達相關產業規模超過10萬億元。十九大報告人工智能寫入十九大報告,將推動互聯網、大數據、人2017年10月請務必閱讀正文之后的免責聲明及其項下所有內容19#page#國信證券證券研究報告工智能和實體經濟深度融合。認推動產促進新一代人工智能產業2017
50、年12月劃工業和信息化部(2018-2020年)和集成應用為重點,推動人工智能和實體經濟深度融合智能研發應用;在醫療、養老文化、體育等2018年3月2018年政府工作報告拓展智能生發展智能產業過人工智能主要細分領域,選拔領頭羊、先鋒隊,樹一代人工智能產業創2018年11月工業和信息化部辦公廳重點任務揭榜工作方案關于促進人工智能和實體2019年3月官方首次明確了“新基建”的范圍,人工智能列入七大2020年4月國家發改委新聞發布會領域國家新2020年8月央網信辦國家發展改體系建設指南預研工作國民經濟和社會發展第十2021年3月個五年規劃和二0三五年遠景日標新模式網、金融證券2021年5月信息化部能
51、源局乘數據中心端到端單網絡時延原則上在秒范圍內。2021年7月(CZOZ-LZOZ)長購關于加快場景創新以人工科技部教育部工業和信息2022年7月鼓勵在制造金融商務等重點行部衛生健康委經濟高端合2022年8月較好的人工智能應用場可復制、可推廣的標桿型示范應用場景。首批支持建設資料來源;政府官網,國信證券經濟研究所整理新一代人工智能發展規劃提出了“三步走”戰略目標,加速AI再各行業滲透落地。第一步,到2020年,人工智能總體技術和應用與世界先進水平同步,人工智能產業成為新的重要經濟增長點,核心產業規模超過1500億元,帶動相關產業規模超過1萬億元;第二步,到2025年,新一代人工智能在智能制造、
52、智能醫療、智慧城市、智能農業、國防建設等領域得到廣泛應用,核心產業規模超過4000億元,相關產業規模超過5萬億元;第三步,到2030年,人工智能理論、技術與應用總體達到世界領先水平,形成涵蓋核心技術、關鍵系統、支撐平臺和智能應用的完備產業鏈和高端產業群,人工智能核心產業規模超過1萬億元,帶動相關產業規模超過10萬億元。請務必閱讀正文之后的免責聲明及其項下所有內容#page#國信證券證券研究報告圖23:我國新一代人工智能發展規劃戰略目標資料來源:艾瑞咨詢,國信證券經濟研究所整理從算法推薦到內容生成:AI有望引發新一輪內容與平臺投資周期基于對AI產業鏈及成長歷程的分析,我們認為,AI底層算法和理論
53、體系的突破相對緩慢,AI對于各個行業的滲透和改造進度各不相同。但是當前基于神經網絡的深度學習算法已經在感知層(圖像、聲音等)及部分認知處理環節逐步步入技術成熟期,在特定技術環節和應用場景中已經具備良好的商用價值。我們認為,短期內AI能夠創造價值的行業必須具備以下三點要素:1)適合的場景應用:一方面行業內存在需求,AI的應用能夠解決實際問題,真正為行業帶來降本提效;另一方面,深度學習的特點決定了AI的算法體系必須擁有特定領域的樣本數據持續訓練;2)充足的數據來源:在技術應用背后擁有足夠的數據來驅動AI能力的提升;3)所需技術具備商業可行性(技術成熟度以及成本、效率等)。結合以上三方面要素,從落地
54、的角度來看,AI在自動駕駛、安防、語音識別等領域已經得到大規模應用;從傳媒互聯網領域落地來看,基于AI的算法推薦已經在信息分發領域獲得充分應用,并誕生出以字節跳動(今日頭條、抖音等典型APP)、小紅書為代表的移動互聯網時代信息分發平臺新范式;從信息分發到內容生成(AIGC),AI有望重塑內容及互聯網產業生態。AI賦能,字節跳動充分展現內容分發時代AI商業化價值互聯網時代信息爆炸,信息過載加速AI在內容分發領域落地。在互聯網、特別是移動互聯網的快速滲透推動之下,內容創作從傳統的PGC向UGC、PUGC模式轉變,與之相應的是信息產生的數量呈現指數級上升;傳統的用戶主動獲取信息的模式不堪重負、信息過
55、載成為制約互聯網產業發展的重要障礙;基于AI的“千人千面”算法推薦模式在此背景下快速導入,推動了互聯網從“人找信息”到“信息找人”的內容分發模式轉變。請務必閱讀正文之后的免責聲明及其項下所有內容#page#國信證券證券研究報告圖24:互聯網數據量指數級上升8040120建的數據資料來源:IDC,國信證券經濟研究所整理表5:AI算法推薦在文娛領域應用適用場景數據來源所需AI相關技術應用舉例文本識別、視頻內容識別、深度學習等今日頭條、抖音、小紅書等ToC端內容分發興趣等資料來源:國信證券經濟研究所整理“圖米一V甲心一a但士十米輸入變量包括用戶特征、環境特征和內容特征,輸出變量為推薦結果。參與運算的
56、參數包括:1)用戶特征:包括興趣、職業、年齡、性別、機型、用戶反饋行為等;2)環境特征:地理位置、時間、網絡、天氣、當前場景(工作、地鐵等);3)內容特征:主題詞、興趣標簽、熱度、質量等。結合三方面的信息,模型會運算出一個預估,即推測推薦內容在這一場景下對這一用戶是否合適。然后對小批量相同標簽的用戶進行實時推薦。如果用戶反饋(轉化率、熱度)達到設定標準,則將此內容進行大規模的推薦;如果用戶反饋低于設定標準,則停止推薦。依靠該推薦系統,使平臺長尾內容實現了有效的分發和觸達。請務必閱讀正文之后的免責聲明及其項下所有內容#page#國信證券證券研究報告圖25;“千人千面”內容推薦系統原理變y=F(X
57、i.Xu,XC)出資料來源:今日頭條算法原理,國信證券經濟研究所整理從技術理念到產品落地,算法推薦引領內容分發進入新時代。從產品來看,以抖音、今日頭條、小紅書等C端娛樂內容為代表的內容平臺,基于海量用戶數據,并通過視頻識別技術,挖掘出各視頻內容的特點及標簽,通過推薦系統,將合適的內容、在合適的地點、推送給合適的人,改變內容分發行業聚焦于頭部內容的生態特征,挖掘出長尾內容的使用價值;而從當前移動互聯網產品來看,從內容分發到電商平臺產品推送,基于AI的信息分發已成標配。圖26:文娛領域已應用AI推薦算法的各內容平臺圖27:信息分發方式演進時代美國中國一分秀素引-門戶時代GoogleWAASYoul
58、ube5資料來源:獵豹大數據,國信證券經濟研究所整理資料來源:騰訊網,國信證券經濟研究所整理從產品到商業化,字節跳動的異軍突起驗證AI強大的生產力價值和商業化潛力。作為作為AI技術驅動型公司,字節跳動于2012年8月推出首款新聞資訊分發產品“今日頭條”,產品基于機器學習技術,實現“千人千面”的新聞信息推送。在上線不到兩年的時間內,用戶數已超過1.2億,MAU超過4000萬。后續,公司基于今日頭條所打磨出的智能推薦系統,低成本、大規模生產“流產品”,推出民料子十長+田米:細昭禮旅國笑木“喝禮降游提本:上推廣到全球。Questmoblie數據顯示,截至2022年底,字節跳動旗下產品合計用戶時長占比
59、達到24.5%(2017年底為10.1%),成為僅次于騰訊系的互聯網巨頭。23請務必閱讀正文之后的免責聲明及其項下所有內容#page#國信證券證券研究報告圖28:字節跳動憑借AI推薦算法成為我國互聯網領域的第四極移動互聯網巨頭系APP使用時長占比245%2022-133.6917.6921.0%2021-12357%10.29資料來源:QuestMobile,國信證券經濟研究所整理圖29:字節跳動營業收入及增速圖30:字節跳動與BAT2021年營業收入(億元人民幣)100008531400025098000200%30005613150%60002000100%367400O100050%12
60、4520000%201620172018201920202021營業收入(億人民幣)字節跳動百度騰訊阿里巴巴資料來源:wind,公司公告,國信證券經濟研究所整理資料來源:wind,公司公告,國信證券經濟研究所整理生成式AI(AIGC):從信息分發到內容生成,更為宏大的時代機遇利用人工智能方式生成內容的想法發源甚早。艾倫圖靈(AlanTuring)1950在論文計算機器與智能(ComputingMachineryandIntelligence)中提出了判定機器是否具有“智能”的試驗方法,即“圖靈測試”,判斷標準為,機器是否能模仿人類的思維方式并生成內容進一步與人交互。半個世紀的科技發展中,隨著數
61、據量快速積累、算力性能不斷提升、算法效力增強,當前的AI在與人交互的過程中還可產出寫作、編曲、繪畫、視頻制作等內容。2018年,世界上首個出售的AIGC畫作在佳士得拍賣行以43.25萬美元成交,引發各界關注。隨著AI的內容生成能力不斷增強,場景落地開花,AIGC產業浪潮興起。結合人工智能的演進歷程,AIGC的發展大致可以分為4個階段,即:早期萌芽階段(20世紀50年代至90年代中期)、沉淀積累階段(20世紀90年代中期至21世紀10年代中期),快速發展階段(21世紀10年代中期至今)以及當前的請務必閱讀正文之后的免責聲明及其項下所有內容24#page#國信證券證券研究報告破圈爆發階段(2022
62、年至今)。圖31:AIGC自20世紀中期萌芽以來經歷了四個發展階段典型事件展特點產品出圈,行業迎來爆發期21世紀104發展階段沉淀積累階段快速發展階段早期萌芽階段破圈爆發階段資料來源:中國信通院AIGC白皮書,OpenAI,國信證券經濟研究所整理早期萌芽階段(1950s-1990s):技術所限,AIGC局限于小范圍實驗。1957年,萊杰倫希勒(LeiarenHiller)和倫納德艾薩克森(Leonardlsaacson)通過將計算機程序中的控制變量換成音符得到了歷史上第一支由計算機創作的音樂作品孩樂四重奏依利亞克組曲(lIliacSuite)。1966年,世界第一款可人機對話的機器人“伊莉莎(
63、Eliza)”問世,其可在關鍵字掃描和重組的基礎上進行人機交互。80年代中期,IBM基于隱形馬爾科夫鏈模型(HiddenMarkovModel,HMM)創造了語音控制打字機“坦戈拉(Tangora)”,能夠處理約20000個單詞。然而在20世紀末期,高昂的研發與系統成本與難以落地商業變現模式,各國政府減少了對人工智能領域的投入,AIGC發展暫時停帶。沉淀積累階段(1990s-2010s):AIGC實用性增強,開啟商業化探索。2006年,深度學習算法取得重大突破,且同期圖形處理器(GraphicsProcessingUnit,GPU)、張量處理器(TensorProcessingUnitTPU)
64、等算力設備性能不斷提升。數據層面互聯網的發展引發數據規??焖倥蛎?,成為AIGC發展的算法訓練基礎,AIGC發展取得顯著進步。但算法仍然面臨瓶頸,創作任務的完成質量限制了AIGC的應用,內容產出效果仍待提升。2007年,紐約大學人工智能研究員羅斯古德溫裝配的人工智能系統通過對公路旅行中見聞的記錄和感知,撰寫出世界第一部完全由人工智能創作的小說1TheRoad。但其仍整體可讀性不強的劣勢,存在拼寫錯誤、辭藻空洞、缺乏邏輯等問題。微軟2012年公開展示的全自動同聲傳譯系統,基于深層神經網絡(DeepNeuralNetwork,DNN)可自動將英文演講者的內容通過語音識別、語言翻譯、語音合成等技術生成
65、中文語音??焖侔l展階段(2010s-2021):深度學習算法的不斷送代促進內容生態百花齊放。2014年以來,以生成式對抗網絡(GenerativeAdversarialNetwork,GAN)為代請務必閱讀正文之后的免責聲明及其項下所有內容25#page#國信證券證券研究報告表的深度學習算法被提出和送代更新,AIGC進入生成內容多樣化的時代,且產出的內容效果逼真到難以分辨。2017年,世界首部全部由AI創作的詩集陽光失了玻璃窗由微軟的人工智能少女“小冰”創造。2018年,英偉達了可以自動生成圖片的StyleGAN模型,截止2022年末,其已升級到第四代StyleGAN-XL,可生成人眼難以分辨
66、真假的高分辨率圖片。2019年,DeepMind發布了可生成連續視頻的DVD-GAN模型。2021年,OpenAI推出了DALL-E,并于2022年將其升級為DALL-E-2。該產品主要生成文本與圖像的交互內容,可根據用戶輸入的簡短描述性文字,得到極高質量的卡通、寫實、抽象等風格的圖像繪畫作品。爆發與破圈階段(2022-至今):2022年以來,AIGC產品密集發布,ChatGPT爆火出圈。Google于2022年五月推出了文本圖像生成模型Imagen,同年8月,開源AI繪畫工具StableDiffusion發布;2022年9月,Meta推出可利用文字生成視頻的產品Make-A-Video以推動
67、其視頻生態的發展。2022年11月30日,OpenAI推出AI聊天機器人ChatGPT,AIGC的內容產出能力迅速吸引大批用戶,至2022年12月5日,根據OpenAI創始人表示,ChatGPT用戶數已突破100萬。2023年2月,微軟宣布推出由ChatGPT支持的新版本Bing搜索引擎和Edge瀏覽器,AIGC與傳統工具進入深度融合歷程。算力與數據皆備、大模型加速AIGC技術導入,應用創新、場景落地漸行漸近深度模型的進步與創新美定AIGC走向成熟的基礎。就底層技術而言,不斷創新的生成算法、預訓練模型、多模態等技術是AIGC行業發展的前提,以此為基礎AIGC在自動化內容生成上具備了通用性、基礎
68、性多模態、參數多、訓練數據量大、生成內容高質穩定等特征優勢。圖32:AIGC技術積累融合AICC預訓練模型、串聯融合TransformerGANCLIPDiffusionNeRF資料來源:騰訊研究院,國信證券經濟研究所整理基礎的生成算法模型不斷突破創新。早期最為著名的生成模型生成對抗網絡(GenerativeAdversarialNetwork,GAN)在2014年問世。GAN在合作的零和博奔框架基礎上進行自動學習,可生成圖像、視頻、語音和三維物體模型等。在GAN的基礎上,多種變種生成模型被提出,例如DCGAN、StyleGAN、BigGAN、StackGANPix2pix、Age-cGAN、
69、CyceGAN、對抗自編碼器(AdversarialAutoencoders,AAE)、對抗推斷學習(AdversariallyLearnedInference,ALI)等。相繼涌現的Transformer、基于流的生成模型(Flow-basedmodels)、擴散模型DiffusionModel等深度學習的生成算法成為AIGC繁榮的底層模型。應用廣泛的Transformer模型采用自注意力機制,根據輸入數據各部分重要性分配相應權重,可應用于自然語言處理(NLP)、計算機視覺(CV)等領域。在此基礎上發展出了26#page#國信證券證券研究報告BERT、GPT-3、LaMDA等預訓練模型。擴散
70、模型(DiffusionModel)則通過定義一個擴散步驟的馬爾可夫鏈,將隨機噪聲添加到數據中,通過逆擴散過程,從噪聲中構建所需的數據樣本。擴散模型最初應用于去除圖像中的噪聲,隨著訓練時長的增長與效果的提升,當前已可以從純噪聲生成逼真的圖片。表6:主流生成模型一覽表模型提出時間模型描述2014年變分自動編碼2014年minator模型對生成對抗網絡(GAN)基于對抗的Generator-Disc學習一個非線性雙射轉換(bijectivetransformation),其將訓練基于流的生成模型2015年數據映射到另一個空間,在該空間上分布是可以因子化的,整個模型(Flow架構依靠直接最大化log
71、-likelihood來完成擴散模型(Diffusion2015年Model點為原始圖像的過程“士中數出回一種基于自注意力機制的神經網絡模型,最初用來完成不同語言之間2017年Transformr模型主體包含部分,分別負責對源它提出了神經輻射場的表示(任神經輻射場(Neural2020年日關顏色)的方法,要解決的問題就是給定一些拍攝的圖,如何生成新的視角下的圖1.進行自然理解和計算機CLIP CConstrastive2021年Pre-Training)模型使得模型分別輸出的文字特征和圖像特征值并確認匹配。資料來源:騰訊研究院,國信證券經濟研究所整理預訓練模型進一步打開了AIGC的技術和商業化
72、可能。以往的生成模型存在使用門檻高、訓練成本高、內容生成簡單和質量偏低等分勢,而真實內容消費場景具備靈活多變、高精度、高質量等痛點要求。預訓練模型的出現通過提高AIGC技術能力解決了上述問題。AI預訓練模型。即大模型、基礎模型(FoundationModel),升禁斗些號寫群暴彎長專升一禁斗型買鳥再強喜寫與群強喜子士囊其務的性能。AIGC進入預訓練模型時代以2018年谷歌發布基于Transformer機器學習方法的自然語言處理預訓練模型BERT為標志。當前按照基本類型分類,預訓練模型包括:(1)自然語言處理(NLP)預訓練模型,如谷歌的LaMDA和PaLM、0penAI的GPT系列:(2)計算
73、機視覺(CV)預訓練模型,如微軟的Florence:(3)多模態預訓練模型,即融合文字、圖片、音視頻等多種內容形式表7:主流AIGC預訓練模型一覽表公司預訓練模型應用鄉效量領域4810億BERT語言理解與生成NLPNLPLaMDA對話系統5400億NLPPaLM語言理解與生成、推理、代碼生成谷歌110億多模態Imagen語言理解與圖像生成200億多模態Parti語言理解與圖像生成Florence視覺識別6.4億Cv微軟NLPTuring-NLG170億語言理解、生成1750億OPT-175B語言模型NLPFacobookNLPM2M-100150億100種語言互譯DeepMind12億多模態G
74、ato多面手的智能體請務必閱讀正文之后的免責聲明及其項下所有內容27#page#國信證券證券研究報告2800億Gopher語言理解與生成NLP414億AIphaCod代碼生成NLPGPT3語言理解與生成、推理等1750億NLP120億多模態CLIP& DALLE圖像生成、跨模態檢索Codex120億NLP代碼生成NLPChatGPT語言理解與生成、推理等5300億英偉達NLPMegatron Turing NLG語言理解與生成、推理多模態Stability AI語言理解與圖像生成Stable Diffusior資料來源:騰訊研究院,國信證券經濟研究所整理多模態技術使得AIGC內容更具多樣性,能
75、力更具通用性。多模型技術(Multimodaltechnology),多模態表示圖像、聲音、語言等融合的機器學習。2021年,OpenAI團隊開源跨模態深度學習模型CLIP(ContrastiveLanguage-lmagePre-Training。CLIP模型可關聯文字與圖像,例如將文字“狗”和狗的圖像關聯,且關聯的特征要素多樣,具備兩方面優勢:1)同時進行自然語言理解和計算機視覺分析,實現圖像和文本匹配;2)數據利用率高,數據量大。為了有大量的“文本一圖像”的訓練數據,CLIP模型廣泛利用互聯網上帶各種文本描述的圖片進行訓練。據騰訊研究院統計,當前CLIP模型已搜集網絡上超過40億個“文本
76、-圖像”訓練數據,為AIGC通過文本生成圖像與視頻落地奠定了基礎。以GPT為代表的大模型表現優異,AIGC加速從實驗室設想向產業化落地。1)根據IDC的定義,AI大模型是基于海量多源數據打造的預訓練模型,是對原有算法模型的技術升級和產品送代,用戶可通過開源或開放API/工具等形式進行模型零樣本/小樣本數據學習,以實現更優的識別、理解、決策、生成效果和更低成本的開發部署方案。大模型的核心作用是突破數據標注的困境,通過學習海量無標注的數據來做預訓練,拓展整體模型前期學習的廣度和深度,以此提升大模型的知識水平,從而低成本、高適應性地賦能大模型在后續下游任務中的應用;2)以GPT系列自然語言處理模型為
77、例,從2018年6月的GPT-1模型,經過數代的模型送代,GPT3.5已經從早期的1.17億參數量提升至當前的千億級以上,而基于GPT3.5的ChatGPT在人機對話中表現優異并火爆出圈,印證了大模型在文本、圖像乃至視頻等領域內容生成的可能性和商業化潛力。圖33:ChatGPT訓練模型圖34:ChatGPT百度搜索指數大幅提升甲理資料來源:百度,國信證券經濟研究所整理大模型加速AIGC技術導入,應用創新、場景落地漸行漸近。1)得益于半導體產28#page#國信證券證券研究報告業進步,算力成本有望持續下降;互聯網以及數字化滲透率提升不斷豐富數據來源;2)算法大模型雖然從技術到成本均具有非常高的壁
78、壘,但是基于預訓練模型的大模型具備較好的通用性,有助于降低應用開發難度,加速應用端走向成熟?!邦A訓練+精調”模式圖35:訓練大模型智能檢索智能客服工業質檢產業應用智能審核智能錄入智能推薦智能對話智能問谷目標檢測原子能力精調智能創作文檔理解圖像分割專業教育二任務相關少量數據精調應用類似人類學習機制預訓練1通識教育海量無標注數據自監督學習視頻文本知識圖像資料來源:百度、IDC,國信證券經濟研究所整理表8:國內預訓練大模型模態功能序號 發布時間大模型發布機構參數量訓練數據高質量中文訓練數據自然語言理解阿里270億文本2021年4月PLUG文本2021年4月盤古-a華為2000億40TB訓練數據本生成
79、基于數百6級別涵蓋互聯網網頁、社區自然語言理解、文2021年4月孟子湖舟科技10億3文本、圖像本生成科訓練文本生成圖像、圖阿里1000億文本、圖像2021年6月6匹配,圖像描NLP理解、生成任務雙語多模態智源研究1.75萬億-2021年6月悟道2.0大模型任務2021年7月2600億(文心)成、圖文生成中科院自2021年9月紫東太初千億開源型動化所語音三模態同意表達和高效協同在海量中文互聯網上整理了超過浪湖信息2457億2021年9月源1.0文本生成開源文本訓練數據集已落地于騰訊廣跨模態大模2022年4月混元騰訊萬億級別型訊云服務外部客戶目前最大的通用領域文本到視頻生成開源2022年5月Cog
80、Video清華94億預訓練模型29#page#國信證券證券研究報告對話式大型語言模文本復旦百億級別112023年2月Moss資料來源:機器之心、公司官網,國信證券經濟研究所整理從PGC到AIGC,AI有望重構內容與媒介生態AIGC多樣化的內容生成能力使其覆蓋各類內容形式,各類應用場景正隨技術進步逐漸落地。AIGC不僅可覆蓋文本、音頻、圖像、視頻等基本內容模態,還可綜合圖像、視頻、文本進行跨模態生成,并應用于各類細分行業成為具體的生產力要素,例如游戲行業中的AINPC、虛擬人的視頻制作與生成等。圖36:AIGC的主要形式與應用文本生成圖像生成日緣自主生廳AIGC主要形式資料來源:量子位、國信證券
81、經濟研究所整理從PGC到AIGC,內容與平臺從生態到商業模式有望重塑,新投資周期即將來臨。1)從PGC到UGC、PUGC,傳媒互聯網從web1.0的門戶時代進入到移動互聯網的web2.0時代,結合算法推薦的信息分發模式誕生了以字節跳動(抖音、今日頭條)、美團、快手、小紅書等為代表移動互聯網新貴;2)算法推薦重塑了信息分發模式,而AIGC則實現了信息、內容的AI創作,內容生產將從PGC、UGC、PUGC邁入AIGC時代,內容生產的效率有望實現跨越式提高,內容將迎來大爆發時刻,與之相應的,從內容到媒介平臺都將會迎來生態和商業模式的重塑,內容與平臺的新投資周期即將來臨。30請務必閱讀正文之后的免責聲
82、明及其項下所有內容#page#國信證券證券研究報告圖37:AIGC是內容生產的新模式AIGCAIUGC專業制作PGC內容創作模式資料來源:騰訊研究院,國信證券經濟研究所整理投資建議:奇點臨近,擁抱內容與平臺新投資機遇AI是新一輪生產力革命,算法創新及算力進步、數據爆發,催化本輪人工智能奇點將至。1)人工智能(AI)基于機器學習和數據分析的方法,賦予機器人類的能力,從而實現解放人力、降本提效的目的,已經成為推動新一輪生產力革命的核心技術方向;2)經歷符號主義、連接主義和行為主義的持續演進,最終誕生了引導本輪AI落地的深度學習技術;深度學習技術的出現,改變了傳統AI的技術路線,解決了傳統機器學習算
83、法無法處理大量數據、準確率遭遇瓶頸的問題,使得AI從理論上具備了工程化落地的可能;基于摩爾定理的算力提升,互聯網及數字經濟的快速發展帶來的數據量井噴,使得AI最終從設想走向場景落地,在語音識別、圖像識別等領域的計算準確度都實現了突破性進展并得到廣泛應用。從算法推薦到內容生成,AIGC有望帶動新一輪內容與平臺革命。1)從傳媒互聯網的實踐來看,基于AI算法推送的信息分發模型已經為web2.0時代主流的信息組織模式,并誕生出以字節跳動、快手、小紅書等為代表典型產品和商業案例;2)從算法推動到內容生成(AIGC),新時代的大門正在打開:海量的數據資源、快速提升的算力水平和不斷降低的單位算力成本開銷、基
84、于深度學習的預訓練大模型構建的通用大模型顯著降低應用開發門檻,數字化的高滲透率賦予充裕場景應用可能;從PGC到AIGC,內容生產的大爆炸將重塑內容與平臺生態、商業模式,新一輪產業機遇漸行漸近。投資建議:從生產力到商業化應用,基于科技及產業視角聚焦關鍵環節核心標的從實驗室設想到商業化落地,AIGC有望重復信息分發、輔助駕駛等領域的產業化路徑加速落地;基于人工智能的三架馬車“算法、算力及數據”的角度,預訓練的大模型有望走向成熟并成為AIGC應用的技術底座、降低應用開發門檻與成本,摩爾定理送代的算力有望不斷降低模型訓練及應用運維成本,AIGC場景化應用有望迎來爆發期并成為產業鏈主要核心價值點,建議從
85、數據與場景應用兩個角度把握傳媒互聯網關鍵產業鏈環節與核心標的,建議關注:1)數據要素及IP角度推請務必閱讀正文之后的免責聲明及其項下所有內容31#page#國信證券證券研究報告薦中文在線(文學IP及內容數據與平臺)、掌閱科技(文學IP及內容數據與平臺)、視覺中國(圖片素材)、中國科傳(科技文獻資源)、浙數文化(數據要素及交易平臺、云計算服務等)、人民網(數據確權及內容審核)、新華網(數據確權及AIGC算法平臺)等標的;2)場景落地關注湯姆貓(人機對話游戲場景落地)、昆侖萬維(算法工具、AIGC在瀏覽器、游戲等場景落地)、天娛數科(ChatGPT+數字人)、三人行(營銷場景)、藍色光標(數字人&
86、營銷服務)、喱呼喱(UGC、PUGC內容平臺)、芒果超媒(在線視頻)、愷英網絡(游戲開發及NPC對話等場景)等標的。表9:重點公司估值表公司公司EPS投資昨收盤總市值PE2022日2023E20212022E2023E代碼評級(元)(億元)2021名稱1.411.6114.55300788.SZ中信出版44.551.2718.4516.6223.430.81.241.4326.7317.2414.95603096.SH新經典增持21.3834.740.150.190.2241.5332.7928.32603999.SH讀者傳媒6.2335.88增持0.880.220.5764.0028.800
87、02292.SZ奧飛娛樂增持5.7685.17-0.280.270.54002739.SZ萬達電影0.85269.2049.8524.9313.46293.340.210.230.2827.2924.9120.46300133.SZ華策影視買入5.73 108.93300251.SZ買入-0.110.260.36-70.3629.7721.50光線傳媒7.74227.060.130.230.4596.7727.96600977.SH中國電影增持12.58234.8754.700.731.11002291.SZ星期六買入14.07128.21-0.77-18.2719.2712.680.210.
88、160.2528.6737.6324.08300058.SZ藍色光標增持6.02149.960.180.2432.50增持7.80141.000.239.008e8600556.SH天下秀0.370.220.2926.6420.2115.84600986.SH浙文互聯增持5.8677.491.19603825.SH華揚聯眾0.1.6117.0712.919.5415.3638.9110.1211.34605168.SH三人行增持114.81116.437.257.2615.8415.810.280.4324.00002027.SZ分眾傳媒買入6.72970.520.4216.0015.6300
89、2517.SZ0.270.360.4734.1525.6119.62愷英網絡增持9.22198.46151.31.7218.2315.8013.78002555.SZ三七互娛買入23.70525.630.310.480.5814.429.317.71002602.SZ世紀華通增持4.47333.131.421.682.0512.0510.188.35002605.SZ姚記科技17.1170.24增持0.180.931.0583.0016.0614.23002624.SZ完美世界增持14.94289.831.271.5316.10300031.SZ寶通科技增持0.9812.4310.3115.7
90、8順網科技0.090.180.21140.0070.0060.80300113.SZ增持12.6087.48300418.SZ昆侖萬維增持25.13298.601.291.531.7119.4816.4214.7020.5624.7620.4318.4018.2915.19603444.SH吉比特買入376.00270.220.3474.2754.47000681.SZ視覺中國買入16.34114.470.2248.061.241.4731.7728.9524.42300413.SZ芒果超媒買入35.90671.591.130.340.490.727.60603533.SH掌閱科技增持84.7
91、956.8239.43-17.3819.95-14.06-9.72-12.019626.HK胖理畔理-SW買入168.90692.36-8.47HZ666泡泡瑪特買入22.10 305.100.610.570.8436.2338.7726.310.12400.HK心動公司買入26.25126.1218-0.92-14.5828.53262.50增持0.220.270.330302.Hk中手游2.2762.8310.328.416.883738.HK0.010.03-414.00414.00138.00阜博集團買入92.44-0.01增持0.370.65-18.6218.6210.60H0666
92、祖龍娛樂6.8955.12-0.371.811.2820.520772.HK閱文集團買入37.15377.161.4829.0225.100.581.05603466.SH增持14.9889.330.7320.5225.8314.27風語筑1.601.121.8024.2734.6721.57301102.SZ兆訊傳媒買入38.8377.660.220.2647.65300364.SZ中文在線0.1488.5056.32增持12.3990.44資料來源:wind,國信證券經濟研究所預測請務必閱讀正文之后的免責聲明及其項下所有內容#page#國信證券證券研究報告風險提示1)監管政策風險;2)技術進步低于預期風險;3)商業化落地低于預期風險等;請務必閱讀正文之后的免責聲明及其項下所有內容#page#page#國信證券證券研究報告國信證券經濟研究所深圳深圳市福田區福華一路125號國信金融大廈36層郵編:518046總機:0755-82130833上海上海浦東民生路1199弄證大五道口廣場1號樓12層郵編:200135北京北京西城區金融大街興盛街6號國信證券9層郵編:100032#page#