《人工智能行業深度:潮起潮落拐點已過AIGC有望引領人工智能商業化浪潮-230209(38頁).pdf》由會員分享,可在線閱讀,更多相關《人工智能行業深度:潮起潮落拐點已過AIGC有望引領人工智能商業化浪潮-230209(38頁).pdf(38頁珍藏版)》請在三個皮匠報告上搜索。
1、浙商證券2證券研究報告行業深度一軟件開發軟件開發報告日期:2023年02月09日潮起潮落,拐點已過,AIGC有望引領人工智能商業化浪潮一人工智能行業深度投資要點行業評級:看好(維持)口ChatGPT發布以來迅速出圈,微軟加大投資力度并宣布將AIGC應用到產品服分析師:程兵務中,彰顯AIGC潛在商業價值。我們認為人工智能在成本、算力消耗、應用執業證書號:S1230522020002生態等層面已走過揚點,商業化應用條件加速成熟,看好AI在各細分應用場景下的滲透率加速提升,建議圍繞算法模型、業務場景和AI基礎設施三大路線選相關報告擇優質投資標的。1海天瑞聲(688787):國內ChatGPT火爆出圖
2、,生成式AI商業化應用走向爆發前鄉AI訓練數據龍頭提供商,自動口駕駛業務打開成長空間1、我們綜合以下幾點,認為AIGC已走過商業化揚點,有望打開市場空間:(1)內容生成成本大幅下降滿足下游需求:(2)生成效率大幅提升:(3)模型2023.01.04計算算力消耗下降,未來有望在消費級硬件上實現AI應用:(4)生態流量快速2拓爾思(300229):語義智積累,ChatGPT月活數量過億,為應用商業化創造條件。能領軍者,大數據+AI雙輪驅動2、AIGC在文本、圖片、音視頻生成等領域有望超越人類,經測算至2030年打開公司廣間成長空間AIGC市場空間超2000億,建議關注三條投資主線:(1)AI底層模
3、型技術優勢2022.11.29廠商:(2)實際場景AI商業化應用優勢廠商:(3)AI基礎設施提供商。3、ChatGPT發布僅兩月月活用戶達到1億,系統融合RLHF模型,借鑒人類反饋不斷強化性能(現已具備基礎的數學計算能力),未來有望通過實際場景數據的輸入持續提升模型的準確度,并延伸適用場景。推理-知識-學習-創造,AIGC有望引領第四次人工智能浪潮1、梳理AI發展史上三次浪潮,AIGC有望引領第四次浪潮,以大規模商業化應用為核心特征:(1)第一次潮起:實現了AI的推理(計算)能力;潮落:對神經元模擬程度較低,無法解決復雜問題(異或問題):(2)第二次潮起:AI擁有知識儲備,可回答特定領域問題;
4、潮落:現代計算機的出現:代表產物:專家系統;意義:AI從科研場景逐步滲透到商業場景:(3)第三次潮起:深度神經網絡賦能AI擁有學習能力,且部分場景下的問題解決能力超越人類;代表產物:AlphaGo,GPT大模型;意義:AI模型的準確度、計算效率、泛化性等指標大幅優化,英定了“大模型+場景小模型”的技術路線,為商業化應用打下基礎(4)第四次潮起:AI擁有創造能力,有望成為效率乃至生產力工具;代表產物:ChatGPT;意義:AI在文本、圖像、音視頻生成領域接近商業化需求,國內外科技大廠技術布局有望打開商業化應用空間。2、數據+模型算法+基礎設施,AI商業化呈現三大趨勢:(1)趨勢一:AI模型與場景
5、深度融合,需要對場景中的復雜數據提取和處理,對非結構化數據的處理(提取、標注、清洗等)將決定AI模型的性能;(2)趨勢二:“大模型+小模型”框架成為主流,AI模型通過算法選代,實現計算效率和工作成本的下降,以滿足商業化應用的要求:(3)趨勢三:AI商業化應用將大幅拉動算力需求,AI服務器、AI芯片等細分行業規模有望加速成長口對標海外生態,AIGC有望推動AI商業化下沉各細分場景13#page#浙商證券行業深度1、國外科技大廠依托自有業務生態和科研實力,推動AI性能進步同時加速布局商業化應用。微軟宣布將ChatGPT融入新版搜索系統和瀏覽器,加速AI商業化進程;谷歌、Meta不斷提升AI模型能力
6、,實現圖文和短視頻的智能生成,未未有望融入到自有業務生態;2、國外垂類公司在文本寫作、圖像生成、音頻生成等領域打造商用產品,收費模式以訂閱制為主,業務場景覆蓋在線辦公、移動社交、廣告營銷等場景,為國內AIGC市場發展提供重要參考:3、國內科技大廠以百度為代表,以中文AI模型為核心已經構建起較為完整的人工智能技術體系,并在智能會話、圖像生成、氣象預報等領域有成熟應用,而國內垂類廠商持續探索AIGC在醫療、辦公、營銷、娛樂等場景的商業化產品,未來有望受益于國內豐富的內容生態加速人工智能商業化進程。國繞AI商業化三大主線挖據核心投資標的1、關注具備底層算法模型核心技術優勢的廠商:(1)推薦標的:拓爾
7、思(中文NLP龍頭廠商),科大訊飛(智能語音處理及合成):(2)建議關注:谷歌(DeepMind),微軟(OpenAI,ChatGPT),Meta(OPT模型),百度(“文心”模型),騰訊,浪潮信息(“源”大模型),;2、關注各細分賽道下兼具場景理解與AI布局優勢的垂類廠商:(1)推薦標的:??低暎ㄖ悄芪锫擃I域龍頭);(2)建議關注:云從科技(智慈城市),格靈深睡(智慧金融),金山辦公(辦公),萬興科技(AI繪畫),商湯(智慧安防);3、國繞AI數據、算力等基礎設施選擇優質投資標的:(1)推薦標的:海天瑞聲(國內AI訓練數據龍頭提供商);(2)英偉達(GPU),寒武紀(AI芯片)風險提示1、
8、AI技術選不及預期的風險:2、AI商業化產品發布不及預期;3、政策不確定性帶來的風險;4、下游市場不確定性帶來的風險;#page#浙商證券行業深度正文目錄1ChatGPT火爆出圖,生成式AI商業化應用走向爆發前夕.1.1AIGC成本大幅下降,人工智能商業化進程揚點已現.61.2應用場景豐富,AI商業化空間前景廣闊,建議關注三條投資主線.91.3AIGC應用有望從B端延伸至C端市場,空間廣闊規模超千億.101.4ChatGPT面世即成頂流,性能持續提升商業化價值不斷放大,1111111.5ChatGPT以GPT+RLHF模型為核心支撐,為AIGC發展指明方向.132推理-知識-學習-創造,AIG
9、C有望引領第四次人工智能浪潮.132.1復盤三次人工智能浪潮,AI從科研向細分產業生態加速滲透.132.1.1第一次AI浪潮,對人類神經元機制的模擬實現機器推理能力.142.1.2第二次AI浪潮,人工智能擁有知識儲備,專家系統為代表性產物.172.1.3第三次AI浪潮,數據爆炸背景下,AI進入學習時代.222.2未來AI發展的兩大路線,工程方法+科學方法將交替占據行業主流.2.3未來發展方向預計,數據+模型+算力供應仍為三大發展方向.232.3.1趨勢一:AI發展帶動基礎數據市場成長,高質量標注數據決定模型訓練效果.2.3.2趨勢二:場景模型特續簡化以提升訓練速度,控制成本滿足商業化應用需求.
10、242.3.3趨勢三:AI應用落地拉動算力需求,AI基礎設施市場規模有望加速成長.23對標海外生態,AIGC有望推動AI商業化下沉各細分場景.23.1海外科技大廠主導,各細分場景玩家涌現,商業模式維形已現.263.1.1微軟、谷歌等大廠科研實力雄厚,推動AIGC核心技術不斷進步.263.1.2細分賽道涌現大量初創公司,不斷探索AI商業化應用的產品形態及服務模式.27303.2國內科技大廠相繼入局,基于內容生態市場空間廣闊.303.2.2國內細分賽道涌現大量垂類公司,關注實際業務場景下的AI應用滲透.333.3國內內容生態市場空間廣闊,政策支持下看好AI應用加速滲透.4國繞AI商業化三大主線挖據
11、核心投資標的.4.1關注具備底層算法模型核心技術優勢的廠商.35354.1.1拓爾思,國內NLP龍頭廠商.354.1.2科大訊飛,AH行業應用領域領跑者.4.1.3其它建議關注標的.364.2關注各細分賽道下兼具場景理解與AI布局優勢的垂類廠商.36364.2.1??党梢暎浩鸩桨卜佬袠I的智能物聯龍頭,4.2.2其它建議關注標的.364.3圍繞AI數據、算力等基礎設施選擇優質投資標的.374.3.1海天瑞聲:AI訓練數據標注優質提供商374.3.2其它建議關注標的.5風險提示.37#page#浙商證券行業深度圖表目錄圖1:Jasper文本寫作功能收費模式6圖2:OpenAIDALL-E2模型圖片
12、生成功能收費模式6圖3:中國人工智能市場規模及增速(單位:億元)圖4:全球人工智能產業規模發展趨勢(單位:億美元).7圖5;人工智能應用場景發展.10圖6:ChatGPT實現交互問答.10圖7:ChatGPT日活用戶數爆發式增長圖8:ChatGPT具備簡單的計算能力(上:更新前,下:更新后).10圖9:微軟新版搜索引攀可根據問題內容提供完整解答及方案建議.1.12圖10:Transformer核心框架.圖11:RHFL模型核心框架.12圖12:馮諾依曼結構模擬人類記憶存儲的模式.14圖13:Rosenblatt感知機模型圖14:多層感知機(MLP)模型14圖15:反向傳播(BP)模型.14圖1
13、6:XCON專家系統核心架構.1616圖17:HopfieldNetwork模型.16圖18:卷積神經網絡(CNN)模型圖19:171986-2007年全球數據量變化趨勢(單位:EB)17圖20:大數據相關技術快速選代.圖21:AlexNet神經網絡模型,圖22:AlexNet實現深度學習在圖像識別領域的重大突破.18圖23:AlphaGo包含價值網絡和策略網絡兩個深度神經網絡模型18圖24:生成式對抗網絡(GAN)模型原理.20.20圖25:GAN模型可實現圖像風格遷移和內容修復功能圖26:幾種圖像生成模型特點對比21圖27:CLIP模型框架.21圖28:Make-A-Video實現AI自動
14、生成短視頻.24圖29:AI訓練數據智能標注服務實現路徑.圖30:我國AI芯片市場規模趨勢.25圖31:我國云計算市場規模趨勢.2527圖32:DALL-E2模型根據“宇航員騎在馬背上”描述生成圖像圖33:MetaMake-a-video模型生成短視頻.27圖34:DeepMind利用AIGC實現蛋白質結構預測.27圖35:人工智能Ciccro在策略游戲外交中可擊敗人類.2728圖36:JasperAI產品六大優勢.圖37:NotionAI產品服務矩陣28圖38:StabilityAI智能生成圖像.29圖39:DreamStudio平臺收費模式(單位:0.01英夠).29圖40:Midjoum
15、ey圖片生成工具.29圖41:Midjoumey作品太空歌劇院29圖42:Play.ht喬布斯聲音通過AI智能生成采訪音頻.30438青務必閱讀正http#page#浙商證券行業深度圖43:Play.ht平臺收費模式,30圖44:.32百度“文心”AI大模型.圖45:浪潮“源”AI大模型.32圖46:華為“盤古”AI大模型.32圖47:我國虛擬人整體市場規模趨勢預測。圖48:2022-2027年我國短視頻市場規模預測(單位:億元)34表1:Colossal-AI深度學習系統大幅降低AIGC對GPU顯存需求表2:AIGC應用場景廣泛.表3:AIGC國內理論市場空間測算.9.13表4:歷次人工智能
16、浪潮及代表性成就梳理.15表5:部分專家系統及應用場景梳理.19表6:GPT,GPT-2,GPT-3模型對比.2022表8:AI視頻生成模型發展梳理.22表9:符號主義和連接主義對比表10:AI神經網絡模型參數量及復雜程度.2323表11:AI模型對人類腦神經處理信息機制的模擬.26表12:海外科技大廠AIGC領域布局及成果28表13:AIGC領域相關初創公司及業務場景梳理30表14:國內科技大廠AIGC布局.31表15:百度基于文心大模型構建完整業務生態,.33國內細分賽道企業在AIGC各應用場景持續布局表17:國家政策大力支持人工智能商業化落地34#page#浙商證券行業深度1ChatGP
17、T火爆出圈,生成式AI商業化應用走向爆發前夕1.1AIGC成本大幅下降,人工智能商業化進程揚點已現我們認為以ChatGPT為代表的AIGC興起,在內容創作成本、創作效率、模型計算消耗、用戶流量基礎等維度實現了重大突破,有望推動AI商業化進程的大幅加速。(1)AI內容創作成本大幅降低且耗時更短,相較傳統方式優勢顯著目前OpenAI定價最高的文字模型達芬奇(基于GPT-3)為每750詞約0.02美元SEESXOdSEI(y+0)收費,根據官網顯示,每月生成10萬字的價格約82美元,折合每1000字約5.57元人民幣,而閱文集團2021年內容成本為17.74億元(每750字37元);在圖像生成領域,
18、OpenAI透露其DALL-E2模型的圖片智能編輯及生成服務的價格,超過免費額度數量的圖片收費為每460張圖片15美元,折合每張圖片約0.22元人民幣。目前國內外AIGC繪畫創作平均耗時已達到分秒級,創作效率較人工優勢明顯。(2)AIGC模型算力消耗快速下降,落地門檻降低有望驅動消費級應用出現根據量子位報告顯示,借助最新的Colossal-AI通用深度學習系統,AIGC領域的StableDifusion模型訓練過程中可最高節省約5.6倍的顯存需求(從64.5GB大福降低到11.6GB),未來有望采用消費級GTX3060顯卡實現模型運算功能,大幅降低AI商業化應用的落地門檻。(3)爆款應用快速積
19、系用戶流量,商業化條件已基本具備ChatGPT發布后日活用戶數量快速突破千萬。根據ARKlvest的測算,自2022年11月底至2023年1月下旬,不足兩個月的時間內ChatGPT的日活數量已突破1200萬,據騰訊網報道,2023年1月ChaGPT月活用戶數量達1億,成為史上增長最快的消費者應用。使用者數量的爆炸式成長即反應出用戶的嘗試使用意愿強烈,未來嵌入到微軟的業務生態中也有望提升用戶的工作效率,優化使用體驗,創造更大的商業價值。(4)國內外公司持續探索商業化路徑,AIGC生態有望加速形成近日,OpenAI推出ChatGPT付費訂閱版ChatGPTPlus,每月收費20美元,而包含Synt
20、hesia、Jasper、runway等AIGC初創公司相繼推出細分領域的收費服務,未來AIGC產業生態有望加速構建,并形成更加清晰的AI商業化應用路徑。本寫作功能收費模式圖2:OpenAIDALL-E2模型圖片生成功能收費模式Creditsfima50200REEStMont營F18中FREE/Month Afte315115460資料來源:JasperAI官網,浙商證券研究所資科未源:TheDecoder,漸商證券研究所青務必閱#page#page#浙商證券行業深度圖5:人工智能應用場景發展2025資料來源:2022-2023中國人工智能計算力發展評估報告,浙商證券研究所(1)具備AI模型
21、、算法研究實力優勢的科技公司我們梳理了人工智能發展史上出現的三次高潮(具體內容見本文第二章內容),總結出人工智能發展遵循了“計算一知識一學習”三個階段,在AIGC的推動下有望進入第四次高潮,即“創造”階段。人工智能從最早的科研主導(第一次、第二次AI浪潮),發展到科技大廠參與研究(第三次AI浪潮),再到各細分場景公司深度參與AI商業化(未來)。模型和算法的送代始終是核心主線,因此我們認為具備AI模型和算法的科研實力的科技大廠未來有望在AI商業化浪潮中保持核心競爭優勢。(2)具備對AI商業化實際應用場景理解和業務優勢的廠商AIGC推動人工智能在各類細分場景中的商業化嘗試,AIGC人工智能生產內容
22、行業研究報告指出,未來AIGC有望與傳媒、電商、影視、全融等各行業深度融合,創造更多的應用場景,大幅提高各行業的內容創作效率。表2:AIGC應用場景廣泛AIGC與產業融合場景描述AIGC+傳媒寫稿機器人、采訪助手、視頻字養生成、語音播報、視頻剪輯、AI合成主插AIGC+電商商品3D模型、虛擬主播、虛擬貨場AIGC+彩視劇本創作、合成人臉和聲音、AI創作角色和場景、自動生成影視預告片AIGC+娛樂AI換臉、AI作曲、AI合成音視頻動畫AIGC+教育虛擬教師、課本內容制作、2D課本轉換為3DAIGC+金融AI實現金融資訊、產品介紹視頻內容自動生產、AI虛擬人客服AIGC+醫療AI為失聲者合成語言音
23、頻、為殘疾人合成肢體投影、心理疾病惠者陪護AIGC+工業AI完成工程設計、衍生設計、輔助工程師決策資斜來源:AIGC人工智能生產內容行業研究報告,漸商證券研究所8/38必圓售#page#浙商證券行業深度在未來AI商業化進程中,眾多AIGC開源模型和算法平臺的存在,導致在場景應用中,單純的技術和算法很難成為玩家的競爭壁全。在細分場景中,AIGC企業需要在業務場景的深度理解、AI賦能的一體化解決方案、行業深度綁定、業務閉環等領域持續提升競爭力。因此我們建議關注各細分賽道中,現有業務具備競爭優勢,且具備AI轉型實力(場景數據儲備+AI算法技術實力)的公司。(3)具備AI硬件優勢的廠商AI商業化對硬件
24、要求仍然很高,算力作為數據加速處理的動力源泉,其重要性不言而喻。AI處理器芯片可以支持深度神經網絡的學習和加速計算,相比于GPU和CPU擁有成倍的性能提升,和極低的耗電水平。因此,我們認為國繞人工智能的硬件廠商也將有望受益AI商業化的發展。1.3AIGC應用有望從B端延伸至C端市場,空間廣闊規模超兩千億對標海外AIGC廠商商業模式進行測算,國內2030年AIGC市場空間超兩千億。根據Garmer2021年預測:人工智能對人類和社會的影響,到2025年AIGC產生的數據將式,測算國內2023年、2025年和2030年AIGC市場空間。文字、圖片滲透率有望快速提升,視頻、直播等受限于技術選代滲透率
25、較慢。目前AI在文本和圖像生成領域技術已且相對成熟,同時微軟、百度等科技大廠有望將AI技術應用到業務生態中,有望推動在線辦公、搜索引學等應用場景的滲透率提升。而在直播、影視以及音視頻等領域,由于AI生成技術處于初級階段,且下游用戶對內容要求較高,我們認為短期內滲透率提升幅度較低。經測算,我們預計到2025年國內AIGC市場空間可達403.52億元,到2030年市場空間可達2175.58億元,未來幾年市場有望迎來爆發式成長。表3:AIGC國內理論市場空間測算用戶規權ARPU假設AI滲透率AIGC市場AI滲選率AIGC市場AI滲進率AIGC市場用戶對象內容類型空間(億元)(萬)(元年)(2023年
26、)(2025年)空間(億元)(2030年)空間(億元)18060300游戲內容制作20030005%06.0040019%085109網絡文學創作者21308.524080+8創作者35000200000196音稅頻O0010%700.00直播主播000t20000019628.0010%280.00影視從業者00130001%0.308%2.401594.501501%1350圖片社交平臺用戶90000109135.0030405.00內容營銷O00I15001%15010915.00從業人員30%45.00用戶在線辦公460002001%9.20873.60276.00搜索引學用戶8%50
27、9850001001%8.5068.0000合計344540352217558一一資斜未源:前嘴產業研究院,觀研天下,艾瑞咨詢,JasperAI,Thedecoder,Plyh,浙商證券研究所9/38#page#浙商證券行業深度1.4ChatGPT面世即成頂流,性能持續提升商業化價值不斷放大ChatGPT火爆出圈,可與真人流暢交流,標志生成式AI的突破性進展。2022年11月30日,OpenAI發布了對話式AI新模型ChatGPT,該模型的功能包含了基于人機交互的問題回答、文本寫作以及代碼編寫等。ChatGPT模型使用Transformer神經網絡架構,通過維基百科以及海量真實語料庫的數據訓練
28、,實現了接近人類的交流水平。圖6:ChatGPT實現交互問答5CSDNA記憶資料來源:CSDN,浙商證券研究所ChatGPT具備自我學習能力,面世以來性能仍在不斷進步。2023年1月30日,OpenAI官方宣布ChatGPT通過新一輪的更新,在準確性和真實性上實現顯著提升,并且已經具備了比較基礎的數學計算能力。經過使用者的測試,目前ChatGPT的數學計算能力接近小學生水平,雖然相較其代碼和文本寫作相比差距甚遠,但進步非常明顯,ChaGPT在數學領域的計算能力逐漸形成反映出模型的自我學習能力以及模型遷移能力出色。ChatGPT日活用戶數爆發式增長圖8:ChatGPT具備簡單的計算能力(上:更新
29、前,下:更新后)圖7:島-1-1-1=solutiol家(-3)*(-1)*(-1)=-1資料未源:騰試新聞,浙商證券研究所資料來源:ARKIvest,浙商證券研究所10/38#page#浙商證券行業深度微軟計劃推出一系列AI應用服務,ChatGPT有望在實際應用中持續成長。2023年2月2日,OpeAI公司宣布推出付費試點訂閱計劃ChatGPTPlus,定價每月20美元。付費版功能包括高峰時段免排隊、快速響應以及優先獲得新功能和改進等。同時,OpenAI方面傷將提供對ChatGPT的免費訪問權限。新版搜索引攀發布,融合OpenAI核心技術。根據鐵媒體報道,2月8日微軟宣布推出集成ChatGP
30、T的全新Bing搜索服務,以及集成AI輔助的Edge瀏覽器。新版Bing帶有一個擴展的聊天框,它現在可以做的不僅僅是回答事實問題和為你提供各種鏈接,在ChatGPT的幫助下,它還能夠為你即時生成各種個性化的規劃、建議、分析等,解決更復雜的搜索問題。微軟新版搜索引學可根據問題內容提供完整解答及方案建議資料來源:鈦媒體,浙商證券研究所1.5ChatGPT以GPT+RLHF模型為核心支撐,為AIGC發展指明方向ChatGPT將海量訓練數據與Transformer框架結合,在GPT模型的基礎上通過RLHF模型提升交互聊天能力,實現了對自然語言的深度建模,Transformer有望在未來較長時間內成為A
31、IGC語言領域的核心技術框架。Transformer架構為自然語言理解領域帶來顛覆性變革,應用到NLP、CV、生物、化學等多領線。2017年,谷歌跳出RNN和CNN的結構,提出了完全基于SelfAttention機制的Transformer架構,當時在機器翻譯任務上取得了顛覆性的進步。Transformer由一個編碼器和一個解碼器組成,且各自由若千個編碼/解碼模塊堆登而成,每個模塊包含MuliHeadAttention層、全連接層等功能不同的工作層Transformer架構優勢突出,計算效率、并行度、解釋性均實現突破。相比于之前的框架Transformer架構除了在計算的時間復雜度更優外,還有
32、3大優勢:(1)可直接計算點乘結果,并行度高:對于數據序列x1.x2.xn,selfatention可以直接計算任意兩節點的點乘結果,而RNN必須按照順序從XI計算到x。11/38務必圓#page#浙商證券行業深度(2)一步計算,解決長時依賴問題:處理序列信息使,通常用要經過的路徑長度衡量性能,CNN需要增加卷積層數來擴大視野,RNN只能逐個進行計算,而self-atention只需要一步矩陣計算就可以,更好地解決長時依賴問題。(3)模型更可解釋:self-aitention模型更可解釋,attention結果的分布可反映該模型學習到了一些語法和語義信息。圖10:核心框架資斜來源:知乎,浙商證
33、券研究所整理RHFL模型將預訓練語言模型按照人類反饋進一步微調以符合人類偏好,利用人類反HumanFeedback,RHFL)作為ChaGPT和核心訓練方式,并稱其是“能有效提升通用人工智能系統與人類意圖對齊的技術”。RLHF的訓練包括三個核心步驟;(1)預訓練語言模型(也可以使用額外文本進行微調,監督微調新模型可以讓模型更加遵循指令提示,但不一定符合人類偏好)。(2)對模型根據提示(prompt)生成的文本進行質量標注,由人工標注者按偏好從最佳到最差進行排名,利用標注文本訓練獎勵模型,從而學習到了人類對于模型根據給定提示生成的文本序列的偏好性。(3)使用強化學習進行微調,確保模型輸出合理連貫
34、的文本片段,并且基于獎勵模型對模型輸出的評估分數提升文本的生成質量。圖11:RHFL模型核心框架資料來源:知導,浙商證券研究所整理#page#page#浙商證券行業深度圖12:馮諾依更結構模擬人類記憶存儲的模式圖13:Rosenblatt感知機模型SUM請求信號請求信號資斜未源:百度百科,浙商證券研究所資料未源:CSDN,浙商證券研究所2.1.2第二次AI浪潮,人工智能擁有知識儲備,專家系統為代表性產物20世紀80年代,第二次人工智能浪潮到來,核心發展為讓計算機學習大量專業知識,研究人員將專家的知識、言論以及經驗等數據輸入到計算機,使其成為專家系統。專家系統可以預測在一定條件下某種解的概率,由
35、于當時計算機已有巨大容量,專家系統有可能從數據中得出規律。在這一階段,多層感知機、反向傳播算法、神經網絡的出現極大程度地提升了計算機的計算及邏輯推理能力,為深度學習和強化學習模型奠定了重要基礎,同時專家系統的出現賦予了人工智能知識屬性,并進行了一系列的商用嘗試。多層感知機強調模擬人類腦神經的復雜連接,使人工智能實現解決非線性問題的處理能力。多層感知機可至少分成輸入層、隱藏層和輸出層這三層,隱藏層可根據需要建多層且每層都可以有多個節點,相鄰層的各個節點都互相連接。隱藏層和輸出層具備計算加權和激活函數處理的功能,實現數據信息的向前傳遞和分析。多層感知機的突破在于激活函數的使用,在隱藏層中使用不同的
36、激活函數可實現對數據的非線性化處理,使得AI具備擬合任何連續函數的能力,大幅提升了計算機的計算能力。1986年,GeofteyHinton等人先后提出了多層感知機(MLP)與反向傳播(BP)訓練相結合的理念,將人類基于結果誤差反饋反哺邏輯推理的思想融入AI。BP算法的基本思想是用誤差的導數(梯度)調整,并通過誤差的梯度做反向傳播,更新模型權重,以下降學習的誤差,擬合學習目標。圖14:多層感知機(MLP)模型圖15:反向傳播(BP)模型np y輸出層WAS輸入層X2貴科未源:CSDN,浙商證券研究所資斜來源:CSDN,浙商證券研究所http43#page#浙商證券行業深度第二次AI浪潮中,專家系
37、統模擬人類專家的知識和經驗解決特定領域的問題,實現了人工智能從理論研究走向實際應用、從一般推理策略探討轉向運用專門知識的重大突破。并且機器學習(特別是神經網絡)探索不同的學習策略和各種學習方法,在大量的實際應用中也開始慢慢復蘇。專家系統作為人工智能的重要分支,在這一時期逐步滲選到細分行業的實際場景解決特定任務。第二次AI浪潮期間,專家系統應用到數學、物理、化學、醫學、地質等細分行業,能夠輔助科研人員解決化學分子結構、疾病診斷、地質分析等特定任務。這一時期專家系統的特點包含:(1)單學科的專業性;(2)系統結構完整,移植性好:(3)具有一定的推理解釋功能,透明性好;(4)采用啟發式推理和不精確推
38、理;(5)用產生式規則、框架和語義網絡表達知識:表5:部分專家系統及應用場景梳理專家系統時間開發者核心亮點及應用場景DENDRAL1968年斯擔福大學可推斷化學分子結構;MYCSYMA1971年麻省理工學院用于數學運算;用于地質領域探測礦藏,可分析待檢礦床的地址1977年斯坦福大學PROSPECTOR環境、結構和礦物質類型等特征;用于青光眼的診斷與治療,采用因果聯系網絡表CASNET1977年拉特格大學示知識法則:MYCIN1978年斯坦福大學識別51種病菌并正確處理23種抗生素模擬人類進行概括、抽象和歸納推理,并發現某1981年斯坦福大學AM些數論的概念和定理;用于語音識別,證明了計算機在理
39、論上可以按照1970s卡耐基梅隆大學HEARSAY編制的程序與用戶進行交談:卡耐基梅隆大學、具有完整專業知識和經驗的計算機智能系統,可1980年XCONDEC公司為VAX計算機系統制定硬件配置方案資補來源:CSDN,浙商證券研究所專家系統商業價值顯現,在企業生產決策過程中發揮重大作用。1980年,美國卡耐基梅隆大學與DEC公司合作研發的XCON專家系統,運用計算機系統配置的知識,依據用戶的定貨,選出最合適的系統部件(如CPU型號、操作系統種類及相應型號,存儲器和外部設備等),并且能夠給出優化意見以構成一個完整的系統。XCON可以給出一個系統配置的清單和這些部件裝配關系的圖,以便技術人員進行裝配
40、。在這一時期,除DEC公司外,美國杜邦、通用汽車和波音等公司在也在生產決策中借助專家系統的輔助,1986年美國AI相關軟硬件銷售額達到4.25億美元,人工智能技術逐漸走出科研院所,進入到企業的實際業務場景中。#page#浙商證券行業深度圖16:XCON專家系統核心架構資料來源:ExpertsysteDigital:XCONandbeyond,漸商證券研究所AI模型算法研究領域,對人類腦神經的信號處理和思考機制的模擬進一步加深,代表性產物包含CNN、RNN等神經網絡模型。1982年,JohnHopfield提出了一種結合存儲系統和二元系統的神經網絡,即Hopfield網絡。這種模型保證了向局部極
41、小的收斂,由于每個神經元的輸出均連接到其它神經元的輸入,模型能夠通過訓練從某一殘缺的信息聯想到所屬的完整信息,即,Hopficld模型在模擬人類記憶儲存和聯想方面做出重大貢獻,這一模型也勾勒了未來RNN模型的維形。YamLeCu提出CNN模型,并成功驗證其商用的可行性。1989年,LeCun結合反向傳播算法與權值共享的卷積神經層發明了卷積神經網絡(ConvolutionalNeuralNetworkCNN),CNN通常由輸入層、卷積層、池化(Pooling)層和全連接層組成。卷積層負責提取圖像中的局部特征,池化層用來大幅降低參數量級,全連接層則類似傳統神經網絡部分輸出想要的結果。卷積神經網絡(
42、CNN)成功應用到美國郵局的手寫字符識別系統中,在此基礎上于1998年誕生了穩定可商業應用的CNN模型LeNet-5。圖17:HopfieldNetwork模型卷積神經網絡(CNN)模型圖18:資料表源:知手,浙商證券研究所資斜來源:CSDN,浙商證券研究所#page#浙商證券行業深度2.1.3第三次AI浪潮,數據爆炸背景下,AI進入學習時代人類進入互聯網時代,數據量爆炸以及大數據技術的成熟,為人工智能的發展注入新動能。PC互聯網以及移動互聯網時代的到來驅動了人類活動數據量的爆炸式成長,為AI模型的訓練提供有價值的原料,同時國繞大數據、云計算等領域的技術選代使得人工智能模型的計算效率、成本等均
43、有大幅優化,為商業化應用打開了空間。2000年突破50EB,到2007年已接近300EB。在針對大規模的數據計算領域,2003年,Google公布了3篇大數據英基性論文,為大數據存儲及分布式處理的核心問題提供了思路:非結構化文件分布式存儲(GFS)、分布式計算(MapReduce)及結構化數據存儲(BigTable),并奠定了現代大數據技術的理論基礎。圖19:1986-2007年全球數據量變化趨勢(單位:EB)圖20:大毅據相關技術快速選代300道A福198620071993資料來源:知乎,浙商證券研究所Systems,浙商證券研究所GeoffreyHinton等人提出深度學習(DeepLea
44、rning)概念,撤起第三次人工智能熱潮。深度學習的本質是使用多個隱藏層網絡結構,通過大量的向量計算,學習數據內在信息的高階表示。相較于傳統的神經網絡,深度學習模型具有更優異的特征學習能力,學習得到的特征對數據有更本質的刻函,有利于可視化或分類;其次,深度神經網絡在訓練上的難度,可以通過“逐層初始化”(layerwisepre-training)來有效克服,因此模型精調的效率得以大大提升。深度學習的出現標志著計算機實現了基于數據的學習和挖據分析能力,AI能夠挖據復雜信息中包含的關聯關系2012年AlexNet神經網絡獲得lmageNet大賽冠軍,標志著AI在圖像識別領域的突破性成就。2012年
45、,在計算機視覺領域的競賽lmageNet中,AlexNet以提升10%的錯誤率的進步力壓第二名以SIFT+FV、LBP+FV、GIST+FV、CSIFT+FV等組合特征的算法。AlexNet基于卷積神經網絡CNN模型,在數據、算法及算力層面均有較大改進,創新地應用了DataAugmentation、ReLU、Dropout和LRN等方法,并使用GPU加速網絡訓練。之后圖像識別領境AI模型均在此基礎上進行優化,并且識別準確度超越了人美水平。#page#浙商證券行業深度圖22:AlexNet實現深度學習在圖像識別領域的重大突破圖21:AlexNet神經網絡模型資斜來源:知導,浙商證券研究所資料未源
46、:知乎,浙商證券研究所AlphaGo具備深度學習能力,可結合人類專家比賽中學到的棋譜,以及在和自己下棋(SclfPlay)中進行強化學習。2016年,人工智能AlphaGo在圍棋競技中擊敗李世石,標志著AI具備了自我送代和學習強化的能力。AlphaGo的深度學習模型可分為策略網絡和價值網絡,分別解決了圍棋中的“下一手最佳策略”和“下一手后的勝率”兩個問題,并以此為核心通過學習人類棋譜和自我對棄,不斷調整策略提升棋力。AlphaGo較好地模擬了人類棋手對于圍棋落子的直覺判斷,即,由于圍棋存在的廣度(每一步的可能性)和深度(棋局從開始到結束的步數)導致計算機無法模擬計算所有的可能性,AlphaGo
47、通過策略網絡減少搜索廣度,即每一步搜索少量節點,而通過價值網絡減少搜索深度,無需將棋局下到底即可得出當前局勢的判斷。在AlphaGo基礎上,谷歌公司后續推出了選代版本AlphaGoZero,增強了AI在面對人類棋譜中未出現過的局勢時的自我推理和學習能力,標志著AI的自我學習具備了一定的遷移能力。圖23:AlphaGo包含價值網絡和策略網絡兩個深度神經網絡模型資料來源:CSDN,浙商廷券研究所Transformer架構橫空出世,OpenAI發布的GPT模型,AI進入“大模型”時代。GPT(GenerativePre-Training,GPT)模型利用更大規模的文本數據以及更深層的神經網絡18/3
48、條款部分#page#浙商證券行業深度模型學習更豐富的文本語義表示,打破了自然語言處理各個任務之間的壁全,使得搭建一個面向特定任務的自然語言模型不再需要非常多的任務北京,只需要根據任務的輸入和輸出形式應用預訓練模型便可達到滿意效果。NLP模型的搭建只需要“無監督預訓練+有監督的精調”兩階段:(1)生成式預訓練:在大規模文本數據上訓練一個高容量的語言模型,以學習更豐富的上下文信息;(2)判別式任務精調:將預訓練好的模型適配到下游任務中,并使用有標注數據學習判別式任務:從GPT到GPT-2和GPT-3,參數提升和訓練數據積票提升模型工作性能。到了GPT2階段,OpenAI將自然語言模型定義為要完成零
49、樣本無監督多任務學習的目標,即預訓練好的模型可以直接用于下游任務。GPT-2模型在學習更廣泛的數據信息,增加了模型的維度參數后,不需要針對特定的任務修改模型,將任務也作為提示詞,和文本一起輸入預訓練好的模型。承接GPT-2的核心思想,到了GPT-3,模型參數量達到了1750億,在不進行微調的情況下可以在多個NLP基準上達到最先進的性能。GPT模型的演進為國內外AI大廠提供了重要的借鑒意義,即通過優質訓練數據輸入和模型復雜度的增加來提升模型性能,而未來AI以少樣本乃至無樣本學習為核心目標。表6:GPT,GPT2,GPT3模型對比GPT-2GPT-1GPT-35種語料庫:CommonCrawl、B
50、ooksCorpus:7000本未WebText:清洗過的Reddit訓練數據集WebText2、Booksl、Books2、發表的書籍數據,40GB文本數據Wikipedia模型框架12層,768維,48層,1600維,96層,12888維,模型參數1.17億參數15億參數1750億參數在問答、閱讀理解、文本在少樣本學習基至零樣本學習參數增多實現原有任務模型表現總結等任務上表現出色的表現進一步優化任務上取得出色表現無監督的語言模型、引入任務條件函數,可根據輸入和任務預測輸出,日標函數實現少樣本到零樣本學習有監督的精調分類模型資斜來源:知導,漸商證券研究所整理AI大模型在任務準確度和場景泛化性
51、方面提升顯著,在此基礎上針對不同實際場景提煉出針對性的AI小模型以完成特定任務,可大大降低AI商業化部署的成本,提高訓練速度。其中,Transformer架構和GAN模型為現在的語言文本生成和圖像生成奠定了基礎。GAN模型參考博奔學習理論,通過內部兩個模型的互相博棄,實現圖像視頻的AI自動生成。生成式對抗網絡(GAN,GenerativeAdversarialNetworks)是近年來復雜分布上無監督學習最具前景的方法之一。模型通過框架中兩個模塊:生成模型(GenerativeModel)和判別模型(DiscriminativeModel)的互相博奔學習產生輸出。判別模型負責判斷一個實例是真實
52、的還是模型生成;而生成模型負責生成實例來騙過判別模型。兩個模型對抗中最達到平衡,即生成模型生成的實例與真實的沒有區別,判別模型無法區分輸入數據是生成的還是原始真實的數據。19/38#page#浙商證券行業深度GAN模型應用廣泛,成為AIGC重要底層框架但早期存在問題。GAN模型應用包含適真圖片生成、圖片翻譯、3D建模等,但由于基礎的GAN模型存在收做不穩定、容易受到部分圖片樣本欺騙等問題,初期生成的圖像可能存在失真問題,適用范圍相對局限。圖24:生成式對抗網絡(GAN)模型原理圖25:GAN模型可實現圖像風格遷移和內容修復功能NNNNooooDiscri-V3ealimagesha區資料來源:
53、ELEMENTUI,浙商證券研究所資料未源:CSDN,浙商證券研究所2.1.4第四次AI浪潮,AIGC從文本拓展至圖像及音視頻領域,商業化空間打開AIGC在圖片、音視頻領域的模型在大模型基礎上持續優化,性能超向商用化需求,空間有望打開。我們認為以ChalGPT為代表,AI將進入創造(創作)時代,引領第四次人工智能浪潮。AIGC以自動化生產和高效為兩大特點,目前已經可以自動生成文字、圖片、音頻、視頻,甚至3D模型和代碼。未來大量數字原生內容有望由AI協助完成創作。底層技術的突破使AIGC商業落地成為可能,模型選代推動AI生成文字和圖片質量實現質的提升。在圖像生成領域表7:AI圖像生成模型發展梳理
54、出現時間特點AI圖像模型GAN2014年不穩定、分辨率低、只能模仿,無法原創CAN2017年表達抽象、能夠原創2021年2月DALL-E可文字轉繪畫,但繪畫水平較普通2021年4月可文字轉繪畫、開源、繪畫水平一般CLIP+VQGANCLIP+Diffusion2022年2月可文字轉繪畫、開源、原創性、但渣染時間長2022年3月可文字轉繪畫、付費、適合人像、突出細節Midjourney可文字轉繪畫、付貨、限制較多、對復雜文字理解準確、2022年4月DALL-E2藝術性不高、痘染快可文字轉繪畫、免費開源、原創性、靈活度高、圖片精Stable Diffusion2022年8月美、真實感、藝術性、渣染
55、快Imagen (Goggle)2022年11月有限公開,理論上比DALL-E2效果好資斜來源:CSDN,浙商證券研究所20/38#page#page#浙商證券行業深度表8:AI視頻生成模型發展梳理出現時間特點AI視頻生成模型2021年10月輸入文字即可生成3D和動畫MorpheusMake-A-Video2022年9月文字轉稅頻、圖片轉視頻、視頻生成視頻2022年10月文字轉視頻、視頻質量高Imagen VideoPhenaki2022年10月文字轉視頻、情節連貨研發中尚未公布Stability AI Video資斜來源:CSDN,浙商證券研究所2.2未來AI發展的兩大路線,工程方法+科學方
56、法將交替占據行業主流人工智能的發展進程中形成符號主義和連接主義兩大陣營,從工程維度和科學維度優化選代AI模型。在AI發展早期,由于數據量較少,AI模型容易用符號模型表征,因此符號主義發展較快,而后來數據量提升,問題和任務的復雜度增加,導致基于復雜模型結構的連接主義興起,并形成了目前一系列AI范式。我們認為在AIGC主導的人工智能商業化進程中,符號主義和連接主義仍將作為AI選代的兩個重要方向。其中,AI在細分場景中的應用將推動大量時序性的復雜信息輸入到模型當中,因此對場景數據(尤其是非標準化的數據)的處理有望迎來重大發展;其次,目前AI在長視頻、虛擬人、高清圖像等領域的智能生成仍存在局限性,我們
57、看好通過模型的選代和對人類神經網絡的研究和模擬,提升AI的準確度、計算效率等指標。表9:符號主義和連接主義對比符號主義連接主義核心理念主張用公理和邏輯體系搭建AI系統主張模擬人類神經元連接機制實現AI對計算機的認知視作操作數學物理符號的計算系統視作模擬人腦的認知工具研究目標提高系統解決問題和任務的能力提高系統自我學習的知識延伸的能力代表性成就專家系統深度神經網絡可處理雜亂的非結構化數據系統具備可驗證性與可解釋性,優勢操作便捷抗噪性能更好無法模擬人腦的形象思維,當勢黑箱,無法理解模型內部運作過程對連續復雜信息的處理能力差資斜來源:百度百科,維基百科,浙商證系研究所計算機算力以及AI在細分場景下的
58、滲透率提升推動AI模型訓練數據量爆炸式成長通過增加模型參數及數據量提高AI的計算速度和準確度。大模型通過超大規模的參數設置和數據輸入,具有基礎、通用和綜合的特點,而小模型基于實際任務場景的需求,通過高質量場景數據的輸入和訓練,使AI能夠出色完成特定任務。在NLP領域,以Googlc發布的BERT模型和OpenAI提出的GPT模型為典型代表。AI通過大模型的預訓練,能夠在處理語言、推理、人機交互等領域任務上的表現實現極大提升,打開了AI滲透到各行業進行商業應用路徑。22/38#page#浙商證券行業深度表10:AI神經網絡模型參數量及復雜程度類別模型公司參數量AlexNet (2012)6000
59、萬圖像識別VGG-16(2014)1.38億ResNet-50 (2015)2500萬GPT-1(2018):1.17億OpenAIGPT (2018-2020)GPT-2(2019):15.42億GPT-3(2020);約1750億BERT(2018)Google3.4億自然語言模型MT-DNN (2019)Microsoft3.3億NVIDIA83億Project Megatron (2019)170億T-NLG(2020)Microsoft浪潮信息2457億(中文語言模型)源1.0(2021)資料來源:CSDN,浙商證券研究所以Transformer為代表性成就,AI模型在模擬人腦思維模
60、式中不斷進步。Transfommler架構的核心在于注意力機制的使用,這使得AI模型在計算過程中可大幅節約消耗在無關信息上的算力,除此之外,殘差網絡、多巴胺機制的強化學習等模型均參考了腦科學領域的研究成果,通過戰入響應的信號處理模塊,節約算力消耗的同時提升計算效率。表11:AI模型對人類腦神經處理信息機制的模擬類別模型參數量殘差網絡ResNet層機制實現外部數據從低級到高級的特征提取,在圖模擬人類大腦的分層結構LeNet像識別領域效果顯答;模擬人類視覺加工過程中的選擇有效解決信息超載問題,大隔提升計算過程中基于注意力機制性關注機制的資源分配效率;的 Transformer模擬人類大腦決策過程中
61、的多巴在神經網絡訓練中加入獎勵預測誤差信號,通基于獎勵機制的強化學習胺信號機制過獎勵機制引導AI的快速學習過程:基于海馬體機制模擬人類大腦內海馬體的空間認實現空間結構和視覺感知解,提升AI決策反饋效率及準確度:知及推理機制的強化學習資斜來源:CSDN,浙商證券研究所2.3未來發展方向預計,數據+模型+算力供應仍為三大發展方向2.3.1趨勢一:AI發展帶動基礎數據市場成長,高質量標注數據決定模型訓練效果AI模型發展帶動訓練數據需求升高,標注和結構化處理真正實現將數據轉為為AI商業價值。隨著AI與各個產業結合得念加緊密,AI商業化程度進入新階段,企業對AI在商業化落地中的表現要求越來越高。為了保證
62、AI算法的識別精度,數據標注的質量也就變得至關重要。AIGC向圖像、語音、文字多維數據延伸,AI基礎數據服務與治理賽道有望受益加速成長。數據服務是利用數據采集與標注工具處理圖片、語音、文本等非結構化數據,數據23/38請務必閱讀正文之后的內見重系款部分#page#浙商證券行業深度治理則使用數據治理的各模塊管理多源異構數據,提高數據質量并形成數據資產。高質量的數據可供各行業AI廠商訓練模型,并支撐各場景商業化產品的落地。數據標注目前仍以人工為主,行業向智能化和去人工化趨勢演進,標注數據生產效率與AI模型進步協同共振。不同于計算機視覺領域AI模型訓練所用的圖像數據,NLP模型訓練的數據往往未自于半
63、結構化或非結構化的信息,目前無法實現AI算法模型的自動化標注,目前主流的實現路徑是人工標注與智能標注協同方案,即人工完成一小部分的數據標注,再借助算法模型對制余數據進行標注,通過人工對部分難例數據樣本的二次標注后,最終形成高質量的標注數據。圖29:AI訓練數據智能標注服務實現路徑人工標注模型用戶自標注或人工標注部分數據自動標注未標注數據款入難創篩選注數據監督模型監督模型(任務匹配)用戶次優化標注自動標注小部分部難例分數據半監督模型半監督模型自動標注數據次優化標注智能標注資料來源:頭豹研究院,浙商證券研究所整理2.3.2趨勢二;場景模型持續簡化以提升訓練速度,控制成本滿足商業化應用常求大模型微調
64、成本和維護成本過高。目前大模型廠商在用戶需求較大時,微調成本和模型維護成本會相當高,若僅提供推理服務,成本可以大幅降低但是模型精度會受到較大物牡,從而降低大模型的競爭力。并且AI項目實施通常會把模型部署到終端,對算力的要求非常高,因此國內外大廠及研究院所均致力于對預訓練模型進行“瘦身”。模型蒸與遷移學習成為AI領域研究新方向,可大幅優化終端模型計算的時效性并節約算力成本?!爸R蒸餡”概念可類比于學校中的教學行為,可有效地壓縮預訓練模型的遷移學習,學生網絡可以擁有與教師網絡相似和相近的計算性能。知識蒸偏可以在基于高度復雜的大模型訓練基礎上,提升細分任務小模型的計算精度,同時也可以有效降低模型延退
65、,并且壓縮網絡參數?;谥R蒸細思想改進BERT預訓練模型,實現模型的簡化和建度的提升。DistiledBERT模型直接將BERT的部分參數作為初始化,模型參數只有BERT的約40%,但速度快提升60%,同時保留了97%的語言理解能力。我們認為在人工智能通往商業化應用的道路上,平期專注于增加數據量、計算能力或者訓練過程的優化方式可能不再適用,未來各大廠商需要計算與預測性能之間做出權衡,探索如何利用更少的數據與計算資源,幫助模型實現性能提升。24/38青務必圓售#page#浙商證券行業深度2.3.3趨勢三:AI應用落地拉動算力需求,AI基礎設施市場規模有望加速成長高算力支持是訓練AI大規模商業化
66、的基礎,AI基礎設施市場有望迎來爆發。微軟入資OpenAI后雙方達成多年的合作協議,OpenAI接入微軟的Azure云平臺開發AI技術。高算力的底層基礎設施是完成對海量數據處理、訓練的基礎。我們認為AI技術發展逐漸成熟,數字化基礎設施不斷建設完善,將拉升AI芯片、AI服務器的市場需求。AI商業化應用的加速落地,將推動我國AI基礎設施市場規模的加速成長市場規模加速成長,國內細分賽道龍頭廠商有望受益。2022-2023中國人工智能計算力發展評估報告指出,預計到2026年全球AI服務器市場規模將達到347.1億美元,五年復合增長率為17.3%。中商產業研究院數據預計,2023年我國AI芯片以及云計算
67、市場規模將分別達到1206億元和6975億元,同比分別增長41.9%和47.0%,AI基礎設施市場規??焖俪砷L。圖30:我國AI芯片市場規模趨勢圖31:我國云計算市場規模趨勢資斜來源:中商產業研究院,浙商證券研究所資料未源:中商產業研究院,浙商證券研究所#page#浙商證券行業深度3對標海外生態,AICC有望推動AI商業化下沉各細分場景3.1海外科技大廠主導,各細分場景玩家涌現,商業模式維形已現3.1.1微軟、谷歌等大廠科研實力雄厚,推動AIGC核心技術不斷進步海外科技巨頭發力布局,自有業務生態及強大科研實力成為核心競爭力。在經歷了移動互聯網浪潮下科技巨頭競爭后,谷歌、Mcta、微軟等國外科技
68、大廠近年來在AIGC領域均有所布局,并在聊天交互、圖像生成特定領域取得了一系列突破性進展,同時部分成果已投入商業化應用。表12:海外科技大廠AIGC領城布局及成果時間企業業務進展核心亮點是微軟VisualStudioCode中內置的一項新的軟件開發2021.6發布Copilot人工智能協助服務,功能包括自主生成部分代碼以及自行修復部分Bug。微軟是一個文本到圖像的AI生成模型,使用者只需要輸入(OpenAI)2022.10發布DALL-E2文字描述,AI圖像生成工具就會自動產出其認為符合描述的圖像??勺灾魃晌谋?,并與用戶進行幾乎無障礙的溝通交2022.11發布ChatGPT流,未來有望嵌入到
69、微軟的消費級和企業級應用服務。擁有700億參數量的語言模型,在大部分語音任務中擊2022.4發布Chinchilla模型敗了Gopher、GPT-3等大模型?;谌祟惙答伒膹娀瘜W習(RL)框架,可與使用者進行谷歌2022.9提出Sparrow模型DeepMind確性?;赥ransformer架構和Difiussion模型,實現文本到圖Imagcn、 Part2023像的AI智能生成,在圖像合成的保真度和圖像-文本一(研發中)致性方面擁有顯著優勢?;贏I驅動文本生成圖像,并允許通過文本輸入進行2022.7推出Make-A-Scene有針對性的創作(如輸入草圖等)Meta基于AI驅動文本、圖片
70、生成短視頻,根據輸入的自然2022.11推出Make-A-Video語言文本可生成一段5秒鐘左右的短視頻??筛鶕淖置枋錾?D模型,可將低分辨率生成的粗發布Magic3D英偉達2022.11略模型優化為高分辨率的精細模型,生成效率更高,并生成模型且計算成本更低。資料來源:零壹財經,知乎,浙商證券研究所DALLE2模型可實現文本到圖像的智能生成。2022年4月OpenAI發布DALL-E2模型,只需輸入簡短的文字prompt就可以生成全新的圖像,甚至可以修改現有圖像,創建保有其顯著特征的圖像變體。DALL-E2的訓練數據來自互聯網上大規模匹配的自然語言-圖像數據,因此消除了手動標注數據集的成本
71、瓶額。DALL-E2工作過程中,首先將文本promp輸入到經過訓練的文本編碼器中,接著將文本編碼映射到相應的圖像編碼,該圖像編碼捕獲文本編碼中包含的語義信息,最后,圖像解碼模型生成圖像,該圖像是該語義信息的視覺表現。Meta在已有AI圖像生成技術上更進一步,實現基于文本、圖片生成短視頻的AIGC模型。MetaAI將Make-A-Video分割成三個組成部分并分開訓練,分別是基礎的文字生成圖像AI模型、學習視頻中圖像在時間維度上的動態變化的AI模塊,以及超分辨率模型和插慎模型以提高視頻畫質(分辯率和慎率)。26/38#page#浙商證券行業深度DALL-E2模型根據“宇航員騎在馬背上”描述生成圖
72、像圖32:圖33:MelaMake-a-video模型生成短視頻1電電電線205資料來源:知手,浙商證券研究所資料未源:CSDN,浙商證泰研究所科技大廠主導AIGC在前沿領域的科學研究,為人工智能的商業化持續拓展想象空間。谷歌母公司Alphabet旗下子公司Decpmind開發了Alphafold2模型,通過預測蛋白質中每對氨基酸之間的距離分布以及化學鍵之間的角度,實現對蛋白質結構三維模型的準確預測。Alphafold2模仿人類注意力的網絡架構采用Atention機制,可以同時聚焦多個細節部分,使得框架預測的結果更加全面和準確。MetaCicero可在人機交互中表現出談判技巧、同理心等,未來有
73、望應用到各類社交場景。2022年11月,Mcta發布了具有談判、說服和合作能力的人工智能Cicero,在策略游戲外交的測試中,Cicero可以與其它人類玩家以自然語言溝通,甚至使用各類談判技巧以實現游戲目標,創建伙伴關系和聯盟,最終進入游戲參與者排名的前10%。Meta認為Cicero的核心技術未來有望創造更加智能的NPC,以及在多會話對話中緩解人類與AI之間的溝通障礙,將AI應用到更加廣泛的社交場景。圖34:DeepMind利用AIGC實現蛋白質結構預測在策略游戲外交中可擊敗人類資斜未源:智東西,浙商證券研究所資料未源:游研社,浙商證卷研究所3.1.2細分賽道涌現大量初創公司,不斷探索AI商
74、業化應用的產品形態及服務模式大模型API公布和模型開源催生AIGC創業浪潮,細分賽道內大量玩家在產品及商業模式等方面持續探索,AI商業化生態有望加速形成。AIGC有望賦能內容生成領域的成本下降和效率提升,目前海外公司在文案寫作、圖像生成、音視頻創作等領域持續布局。細分賽道內玩家在相對統一的底層模型基礎上,探索與實際應用場景深度融合的落地產品。27/38#page#浙商證券行業深度表13:AIGC領域相關初創公司及業務場景梳理生成內容企業成立時間應用領域底層模型企業簡介公司主打利用AI自動回復郵件,底層技術采用OpenAI的文字Oherside AI2020AI郵件寫作GPT-3GPT-3協議,
75、操作非常簡單,只要輸入郵件內容的關鍵要點,就可以生成一封完整的郵件。CopyAI通過AI寫作廣告和營銷文案,可以幫助用戶幾秒針內生成高質量的廣告和營銷文案,主要面向ToB商業場景文字Copy AI2020AI廣告文案寫作GPT-3Ebay。公司通過AI幫助企業和個人換寫管銷推廣文案以及博客等各文字2020GPT-3Jasper AIAI文案寫作目前公司產品功能包括自動換寫文章、廣告文案和播客,以AI寫作、創意提及通過頭腦風暴為用戶提供創意建議自動檢查文字拼寫和語文字2022GPT-3Notion AI供、語法檢查、法錯誤、自動翻譯文章等。目前NotionAI以白名單形式開放翻譯Alpha版本測
76、試。StableAI主要功能包含AI生成圖片、音須、視頻和3D建CLIP、Stable2020圖像Stability AIAI作圖底層協議模,公司研發了開源AI作圖模型StableDiffusion,只要輸入Diffusion文字描述就能生成高質量圖片。公司主打AI繪畫工具,對標StableDiffision以及DALL-CLIP、 Stable圖像2022AI作圖MidjoureyDiffusion對應的圖片。Play.ht是一個AI文本轉換語音應用,采用Peregrine語音模2016音頻Play.htAI生成語音Peregrine型,包含數千種說話的聲音,可以學習人類的語氣、音調和笑聲。
77、資料未源:CSDN,知手,浙商證券研究所文本創作領域,基于GPT語言模型,AI在郵件、營銷文案寫作領域已有深度應用。JasperAI成立于2020年,公司定位是營銷領域類的素材操寫,基于AI模型可為用戶提供50多種模板并生成對應的文案,可覆蓋大部分的營銷場景。公司產品優勢包含了更符合GoogleSEO規則、草稿創作效率更好、支持26種語言等六大優勢。JasperAI面向個人及企業用戶,采用SaaS訂閱制收費模式。JasperAI提供BossMode和Business兩種計費模式,其中BoSs模式針對個人及小組織(不超過5人)用戶,基礎收費為49美元/月,可使用不超過5萬字,最高收費為500美元
78、/月,可使用70萬字NotiomAI實現文本寫作、語法糾錯、機器翻譯等功能,提高筆記類產品功能價值。Notion筆記工具融合了文檔、任務、知識庫以及數據庫功能,作為生產力工具服務于互聯網群體。NotionAI模塊出色地解決了用戶在使用筆記場景下遇到的大部分問題,如翻譯、寫作、內容發布等。Notion產品通過免費+低價策略積累了超3000萬用戶,未來隨著NotionAI模塊的投入商用,有望提高客單價,提升產品營收能力。圖37:NotionAI產品服務矩陣圖36:JasperAI產品六大優勢資斜來源:JasperAI,浙商證券研究所資料未源:NotionAI,浙商證券研究所#page#浙商證券行業
79、深度圖像生成領域,擴散模型的快速選代大幅提升AI生成圖像的性能,StabilityAI公司基于開源框架構建龐大內容生態。StabilityAI自成立以來,一直致力于開發面向全球消費開發者可以繞開數據方面的限制,可為用戶自己的商業產品提供動力。2022年8月,公司發布了面向消費者的DreamStudio應用程序,用戶可在平臺上通過自然語言描述創建通真的圖像、藝術和動畫,目前平臺注冊用戶己超過100萬,用戶來自全球50多個國家,創建了超過1.7億張圖像。用戶可免費使用開源的Diffusion模型,但需要為DreamStudio平臺生成的圖像付費,平臺采用點數充值的模式,用戶可按照每100點數1英夠
80、(合)的比例兌換積分,并根據生成圖像的分斜率和渡染次數兌付不同數量的點數。以渡染150次、分辨率為1024*1024的圖像為例,單張圖片的價格約為0.282英銹。圖38:StabilityAI智能生成圖像圖39:DreamSudio平臺收費模式(單位:0.01英)512x768768*1024050.95皖2223388880838e1548220214138198Studio,浙商證券研究所資斜來源:36,浙商證券研究所Midjourney利用AI智能生成圖像,使用門檻低且圖片可用性高。用戶通過Discord千臺,輸入希望實現畫面的文字,平臺即可在一分鐘的時間內完成四張縮略圖的生成并就行逐步
81、渣染,用戶選擇相對滿意的一張圖片可繼續細化,如變形、放大尺寸和細節優化等操作。Discord平臺根據GPU使用時長、圖片是否公開、圖片生成數量的不同提供多種付費模式,免費版本可生成25張圖片,而企業級版本(600美元/年)每年可使用至少120h的GPU時間用于生成圖片。Midjourney圖片生成工具圖40:圖41:Midjoumey作品太空歌劇院資料未源:網易,浙商證券研究所資料來源:MetaStcllar,浙商證卷研究所#page#浙商證券行業深度Play.ht基于AI驅動實現文本到語音的智能生成。Play.ht依靠AI從IBM、微軟、亞馬遜和谷歌生成音頻和語音,該工具對于將文本轉換為自然
82、聲音尤為有用并且允許下載超570種口音和聲音、可提供逼真的配音的特點及優勢。Play.ht根據轉換成音頻的文本大小提供多種收費方案,專業版提供每年60萬字(詞)的語音生成權限,且生成的音頻文件可用于商業用途,該方案定價為29.25美元/月,Premium版本則可以根據用戶的個性化需求,調整AI聲音的發音特點。圖43:Play.ht平臺收費模式圖42:Play.ht喬布斯聲音通過AI智能生成采訪音頻綠虹資斜來源;IT之家,浙商證券研究所資料來源:Play.ht,浙商證券研究所3.2國內科技大廠相繼入局,基于內容生態市場空間廣闊3.2.1科技大廠持續開拓中文AIGC,借助業務生態有望推出爆款應用產
83、品國內科技大廠布局生成式AI,未來有望借助業務生態推出爆款應用產品。百度、阿里巴巴、騰訊、字節跳動等國內科技大廠相繼布局AIGC領域,在圖片生成、視頻生成、3D建模等細分場景下推出相關應用,未來有望在業務生態中打造爆款產品。表14:因內科技大廠AIGC布局公司典型產品功能百度文心通過文字描述生成圖片、圖畫修復、文檔分析、蛋白質結構分析等騰訊優圖輸入多張人像圖片完成對于人像面部的3D建模、提升電影分辨率等輸入圖片、風格、尺寸等,自動完成素材分析、拒圖、配色等設計,阿里巴巴Lubanner生成多套符合要求的設計方案字節跳動剪膚通過文字生成視頻、AI配字幕等網易網易天音通過文字生成歌曲,支持作詞、作
84、曲、編曲、演唱全鏈路音樂創作資科來源:百度文心,騰訊優圖,阿里巴巴音班,網易天音,騰訊網,浙商證券研究所百度深度布局AIGC多年,圍繞自有業務生態形成核心競爭力,在中文AI領境優勢顯著。2022年12月,百度智能云發布國內首個全棧自研的AI基礎設施“AI大底座”,具備標準化輸出AI的底層能力。百度國繞各場景,在NLP、CV、跨模態、生物計算等領域30/38務必圓南#page#浙商證券行業深度形成大模型。百度過去十年累積投入研發資金超1000億元,并且連續四年在AI專利申請量和授權量上保持國內第一,技術優勢明顯。表15:百度基于文心大模型構建完整業務生態類別產品名稱主要特點面向語言理解、語言生成
85、等NLP場景,具備超強語言理解能力以及對話生成、文學創NLP大模型作等能力。創新性地將大數據預訓練與多源豐富知識相結合,通過持續學習技術,不新吸收海量文本數據中詞匯、結構、語義等方面的新知識,實現模型效果不斷進化?;陬I先的視覺技術,利用海量的圖像、視頻等數據,為企業和開發者提供強大的視CV大模型覺基礎模型,以及一整套視覺任務定制與應用能力。大模型基于知識增強的跨模態語義理解關鍵技術,可實現跨模態檢索、圖文生成、圖片文檔跨模態大模型的信息抽取等應用的快速搭建,落實產業智能化轉型的AI助力融合自監督和多任務學習,并將生物領域研究對象的特性融入模型。構建面向化合物生物計算大模型分子、蛋白分子的生物
86、計算領域預訓練模型,就能生物醫藥行業。文心大模型與各行業企業聯手,在通用大模型的基礎上學習行業特色數據與知識,建行業大模型設行業AI基礎設施,行業覆蓋能源、金融、航天、制造、傳媒等。ERNIE3.0文本理解與創作提供多種參數量級的、具備超強的語言理解能力和文本創作能力的API服務。全球規模最大的中文跨模態生成模型,通過自然語言實現圖像生成與編輯。無需編程ERNIEViLGAI作畫開放API在體驗專區探索大模型服務能力、找到應用場景,并可通過API集成服務能力。全球首個基于隱空間的大規模生成式開放域對話模型,具備接近真人水平的多輪聊天文心PLATO會話生成能力:ERNIEKit:基于最新一代預訓
87、練范式的NLP算法定制開發工具集PaddleFleetx:當在打造一套簡單易用、性能領先且功能強大的端到端大模型工具庫,大規模套件持語言、視覺、多模態等多個領域的前沿大模型算法工具與平臺EasyDL圖像:零算法基礎定制高精度圖像應用AI模型,提供端云多種靈活部署方案零門檻AI開發平臺EasyDL輕松定制圖文匹配模型;全功能AI開發平臺BML支持一站式AI開發,集成飛柴全流程開發套件和豐富的產業場景使用范例;依托大模型,以極簡的策略和方案替代傳統搜索引攀復雜的特征,低成本接入各類企文心百中業和開發者應用,憑借數據驅動的優化模式可實現極致的行業優化效率及應用效果;哈機文心一格AI藝術和創意輔助平臺
88、,依托飛漿、文心大模型的技術創新推出的“AI作畫”產品;對標ChatGPT,百度計劃近期完成產品內測,有望加速AI產品商用化進程。近日,百度官方宣布,將在3月份完成其ChaGPT產品的內測并面向公眾開放,該項目名字確定為文心一言,英文名ERNIEBot。公司產業級知識增強文心大模型ERNIE具備跨模態、跨語言的深度語義理解與生成能力,對標微軟對OpenAI核心技術的布局,我們認為百度有望將對標產品應用到業務矩陣下的消費級和企業級應用中,加速AI商業化進程#page#浙商證券行業深度圖44:百度“文心”AI大模型據與社大模型套件圖生資料未源:百度文心大模型官同,漸商證券研究所整足中文AI大模型持
89、續選代,國內人工智能底層技術能力已相對成熟。除百度之外,國內浪潮、華為等公司均持續布局,在中文AI巨量模型領域的創新和應用上持續突破,為AI在各場景的深度應用奠定堅實基礎。浪潮“源1.0”AI大模型超越GPT3,在語言智能領域表現優異。2021年9月,浪潮信息發布AI大模型“源1.0”,參數量超越GPT-3達2457億,成為全球最大規模的AI巨量模型?!霸?.0”模型訓練采用超5000GB的中文數據集,在語言智能方面表現優異,在文獻分類、新聞分類,商品分類、原生中文推理、成語閱讀理解填空、名詞代詞關系等任務上位居行業內領先地位,并且在成語閱讀理解填空項目中的表現已超越人類得分。華為基于“盤古”
90、AI大模型發展行業應用模型,賦能行業效率提升。2022年11月,華為發布氣象大模型,提供秒級天氣預報,如重力勢、濕度、風速、溫度,氣壓等變量的1小時-7天預測。盤古氣象大模型在氣象預報的關鍵要素和常用時間范圍上精度均超過當前最先進的預報方法,同時速度相比傳統方法提升1000倍以上。盤古氣象大模型支持廣泛的下游預報方案,如在臺風路徑預測任務上,相比傳統數值氣象預報方法,盤古氣象大模型可以降低20%以上的位置誤差。圖45:浪湖“源”AI大模型圖46:華為“盤古”AI大模型浪潮源1.0I工業化開發2457億m5000GB2項a10項資料未源:科技世界網,浙商證券研究所資補來源:搜狐,浙商證券研究所3
91、2/3#page#浙商證券行業深度3.2.2國內細分賽道涌現大量垂類公司,關注實際業務場景下的AI應用滲透依托國內豐富內容生態,垂類公司探索AI應用產品,AIGC將有望成為內容生態發展的新引攀。我們認為AIGC發展根據內容分類,主要可以分為3個階段:一是AIGC內容生產技術完善階段,實現文本、視頻、圖片生成以及三者的跨模態轉換;二是多模態生成技術的聚合應用,以虛擬人為代表:三是虛擬內容生態,即元字宙。目前國內外仍然處于第一階段,AIGC內容以文本、圖片和視頻為主。目前國內各細分賽道垂類公司布局有望推動AI商業化在實際場景中的深度應用。近幾年來,在法律、營銷、醫療、人機交互等領域不斷涌現垂類公司
92、,基于AI在文本、圖像和音視頻等方面賦能業務的效率及產品競爭力的提升。表16:國內細分賽道企業在AIGC各應用場景持續布局生成內容企業成立時間主要特點提供AI驅動的高質量數字療法和新一代精神心理的解決方案,為臨床實踐實現規?;湫闹悄芪淖?021年賦能:公司致力于AI情緒智能為所有人變革傳統心理健康的服務模式,提供隨時隨地、人人可及的服務。公司針對商業場景數字化轉型,以自然語言處理為基礎提供商業洞見類產品,主要產文學潮舟科技2021年品包括基于預訓練模型的功能引攀(搜索、生成、翻譯、對話等)和針對垂直行業場景的SaaS產品。公司從事天氣預報、機器翻譯和智能寫作,致力于發展具有高階認知能力的AI
93、以提升彩云科技文學2015年公司致力于利用AI為法律行業賦能,提升法律從業者工作數率,改變法律翻譯市場高文學秘塔科技2018年收費、低效率的現狀。2019年4月公司第一款產品“秘塔翻譯”發布,新產品為文檔自動化系統,可一鍵生成多達上百份專業文件。公司解決方案包括AI智能寫作平臺,服務內容包括機器翻文學香依科技2017年慣進行深度翻譯優化,并支持英文PDF的翻譯查詞及非結構化信息抽取等服務。公司提供AI模特圖片解決方案,有效降低拍照成本和效率,提升電商轉化率。產品通圖像感知階躍2020年過AI算法生成通真的虛擬模特展示服裝公司專注于智能影像生產領域的視覺技術,憑借在AI、視頻結構化等領的技術優影
94、謂科技視頻2009年勢,提供基于智能影像生產等相關技術的商業化綜合服務。公司專注于AI與計算機視覺技術研究與產品開發,提供5G+AI超高清祝須和AI智能帝視科技2016年視頻制造等領域技術服務和行業解決方案。公司專注于智能語音交互和AI數據服務技術。公司依托先進的AI語音交互技術及高精度數據采標平臺,打造多場景應用的語音交互方案,包括通用場景的語音合成和語音頻標貝科技2016年音識別,以及TTS音色定制,聲音復刻,情感合成和聲音轉換在內的語音技術產品:AI數據業務涵蓋語音合成、語音識別、圖像視覺、NLP、3D點云等數據服務。公司運用AI為游戲行業提供寬整的解決方案。公司產品及服務覆蓋游戲的全生
95、命周游戲知覺之門2020年期,包含智能內容生成、智能測試、智能數據運營、智能投放等類型。公司是一家語音合成科技創新企業,提供基于端到端的神經網絡的音頻合成系統及行虛擬人倒映有聲2019年業解決方案,以領先的神經網絡設計和先進的深度學習合成器為依托,獨創情緒、清感控制模塊,在音色模擬、情感展現、多語種等方面達到國內外領先水平。綜合紅棉小冰2020年端和不同企業的生態中都找到小冰,目前用戶可以自主通過小冰框架,創造并訓練其擁有的人工智能主體。資斜未源:各公司官網,36,騰訊回,浙商證券研究所對標海外公司發展,內容型公司有多種商業模式可選擇,業務結合場景深度將決定玩家核心競爭力。目前海外AIGC公司
96、的商業模式大體可分為底層平臺對外開放按照實際數據量收費、按產出內容收費、類SaaS的軟件服務收費、有償模型使用等,其核心是在于賦能下游B端及C端用戶的實際業務效率和質量提升,因此企業需要對一體化解決方案、行業深度綁定、業務閉環等領域不斷耕338務必圓讀#page#浙商證券行業深度3.3國內內容生態市場空間廣闊,政策支持下看好AI應用加速滲透國內成熟內容生態為AI應用提供沃土,虛擬人有望催生新內容需求。以短視頻生態為例,根據前略產業研究院預計,到2027年我國短視頻市場規模將達到9624億元,市場空間廣闊,視頻、游戲、網絡文學等內容生態也將不斷豐富,市場規模持續增長有望帶動內容創作需求不斷升高,
97、以AIGC為核心的內容創作工具及相關服務有望加速市場滲連。同時,隨著AR/VR、云計算、區塊鏈等核心技術持續選代,我國元宇宙內容生態有望加速形成,根據速途元字宙研究院預測,到2030年我國虛擬人整體市場規模有望達3095.3億元,市場前景廣闊。圖48:2022-2027年我國短視頻市場規模預測(單位:億元)圖47:我國虛擬人整體市場規模趨勢預測資科來源:連連元字宙研究院,漸商證券研究所資料未源:前曉產業研究院,浙商證券研究所國家將人工智能上升至國家戰略層面,政策支持有望推進行業發展。政府隨著人工智能行業的不斷發展,對政策內容也持續進行細化,從頂層設計至創新成果轉化路徑,再到芯片、開源平臺等技術
98、層面都有相應政策指導,為行業提供了清晰的路徑指引1。表17:國家政策大力支持人工智能商業化落地領布時間領布主體政策名稱主要內容科技部關于促進人工智能和實體2019.3探索人工智能創新成果應用轉化路徑和方法,構建智能經濟。網信辦經濟深度融合的指導意見國家新一代人工智能開放2019.8科技部鼓勵人工智能細分領域領軍企業搭建開源、開放平臺,推動行業應用。創新平臺建設工作指引到2021年,明確AI標準化頂層設計,研究標準體系建設和標準研制的總體規則,明確標準之間的關系,指導AI標準化工作的有序開展,完成關鍵通用技中央網信辦國家新一代人工智能標準2020.7術、關鍵領域技術等20項以上重點標準的預研工作
99、。到2033年初步建立AI等五部門體系建設指南標準體系,重點研制數據、算法、系統、服務等重點標準,并率先在制通、交通、金融、安防、家居、教育、醫療健康、司法等重點行業和領戰進行推進。聚焦高端芯片、操作系統、人工智能關鍵算法、傳感器等關鍵領域,加快推進中華人民共和國國民經濟基礎理論、基礎算法、裝備材料等研發突破與選代應用。培育壯大人工智能、國務院2021.3和社會發展第十四個五年規大數據、區塊鏈、云計算、網絡安全等新興數字產業,提升通信設備、核心電劃和2035年遠景目標綱要子元器件、關鍵軟件等產業水平。工業和新型數據中心發展三年推動新型數據中心與AI等技術協同發展,構建完善新型智能算力生態體系;
100、2021.7信息化部行動計劃國家新一代人新一代人工智能在將倫理道德融入人工智能全生命周期,為從事人工智相關活動的自然人、2021.9工智能治理專法人和其他相關機構等提供倫理指引。倫理規范業委員會資斜來源:工信部,科技部,中國政府網,漸商證券研究所34/38#page#浙商證券行業深度4國繞AI商業化三大主線挖據核心投資標的4.1關注具備底層算法模型核心技術優勢的廠商4.1.1拓爾思,國內NLP龍頭廠商深耕NLP領域30年,公司發展成為國內政務領域NLP龍頭廠商。公司以“語義智能+”為發展戰略深耕多年,主要業務覆蓋內容安全和互聯網空間治理、數字政府和數據智能三大板塊,向以黨政機關及企事業單位為主
101、的下游客戶提供大數據檢索、智能風控營銷、典情監控等服務。公司以深耕多年的大數據積累與行業領先的NLP技術成為國內政府政務領域NLP龍頭,多年以來一直保持行業領先的市場地位。公司以NLP技術為核心,金融、政府、公安領域競爭優勢顯著。目前公司以公共安全市場為最主要業務,產品和場景包括公安情報研判指揮、公安知識圖譜、公安與情監控、開源情報智能分析、開源情報數據采集監測以及各類領域知識庫構建;在信息安全領域,全資子公司天行網安提供各類網安產品服務。公司積極開牌新賽道,機器人+虛擬人有望為公司業務提供新增量。公司將以“虛擬人+場景為突破口,開發支撐虛擬人的AI技術平臺,推動虛擬人在各行業場景中的率先落地
102、。公司基于中文NLP核心技術、海量數據積累及具備行業專業能力的知識圖譜等元宇宙技術基因的優勢,致力構建數字虛擬人的智能引學,提供虛擬人智能對話、知識積累、語義理解和智能決策等技術支撐。在機器人領域,公司與頭部AI廠商共同合作研究人形機器人軟件技術。合作雙方將在人形機器人的智能化方面,研發云端協同的AI算法框架以及面向特定領域的知識圖譜技術,公司在NLP、知識圖譜領域的積淀將賦能機器人軟件大腦及開放軟件生態的構建。我們認為在信創浪湖下,公司有望受益政府客戶在相關領域的投入增加,同時機器人、元宇宙等行業的加速發展可為公司提供多重增長空間,看好公司以NLP和知識圖譜為核心技術構建業務生態,實現業務規
103、模加速成長。4.1.2科大訊飛,AI+行業應用領域領跑者公司深耕智能語音領域,戰略轉型人工智能賽道,發展成為行業領軍企業。公司在智能語音行業布局多年,核心技術優勢明顯,2010年以來向人工智能產業發展,推動AI與各行業的應用結合,在智基教育、智能辦公、智慧公安、醫學影像、智能汽車、智慧服務、智慧城市等領域不斷取得成果。堅持“平臺+賽道”發展戰略,公司構建自有業務閉環生態體系。公司堅持平臺+賽道”的人工智能戰略,依托國內首家上線的AI開放平臺訊飛開放平臺,為開發者提供一站式人工智能解決方案,構建AI產業生態,并在教育、醫療、辦公、智慧城市等領域實現AI的深度應用,在多語種語音合成和識別、自然語言
104、處理、圖文識別、人機交互等領域提供豐富的AI能力,賦能下游客戶的效率提升。國頭*驗的+080“最工YI收費2022年,公司發布“訊飛超腦2030計劃”,旨在構建基于認知智能的復雜智能系統,深度融合垂直行業的細分場景任務,實現各業務場景賦能。公司計劃分為三個階段,第一階段著眼于機器人和數字虛擬人領域;第二階段著眼于自適應行走的外骨骼機器人和陪伴數字虛擬人家族,以及面向青少年的抑都癥篩查平臺:第三階段計劃全面進入家庭場景。35/38#page#浙商證券行業深度我們認為受益于人工智能產業發展機遇,國家政策對發展數字經濟和建設科技強國的進一步推動、產業信息化應用需求的不斷增長以及公司各類產品、技術不斷
105、創新,公司業務規模有望持續擴大。4.1.3其它建議關注標的(1)國外:微軟(OpenAI,ChatGPT),谷歌(DeepMind),Meta(OPT大模型):(2)國內:百度(“文心”AI大模型),騰訊(“混元”AI大模型),浪潮信息(“源”AI大模型):4.2關注各細分賽道下兼具場景理解與AI布局優勢的垂類廠商4.2.1??低暎浩鸩桨卜佬袠I的智能物聯龍頭公司致力于安防視頻監控領域,融合AI技術發展成為智能物聯龍頭。公司起步于安防前瑞領域,隨后轉型行業一體化解決方案提供商,滿足客戶定制化需求。2012年起,公司深度布局AI技術,并于2015年正式發布深度智能產品,進入智能化時代,并陸續推出
106、AI智能產品,成為安防領域數字化領軍企業。公司著力定位于“智能物聯AloT”,將物聯感知、人工智能、大數據服務于各業務場景。公司實現業務生態閉環,產品矩陣覆蓋軟硬件。公司自成立以來,始終致力于安防行業的發展,目前已形成軟硬融合、云邊融合的產品體系。公司利用HEOP嵌入式開放平臺,實現所有類型的智能物聯網設備具有相同軟件基礎,大幅提升開發效率。硬件方面,要貿共“中+學前端攝像機產品、智能交通與移動產品、門禁與對講產品等多個領域;邊緣域產品深入行業,包括智能應用一體化設備、會議平板產品、智能視頻傳輸產品等三大產品。公司深耕各大業務場景,具備AI商業化應用的良好條件。公司以安防為核心,業務覆蓋公安、
107、交通、金融、文教衛等各場景,同時積極布局包含智能家居、機器人等創新業務,對AI賦能安防領域具備業務優勢,我們認為公司有望受益于AI商業化進程加速,持續探索AI在安防領域的產品服務,為公司貢獻驅動力。4.2.2其它建議關注標的(1)智慧城市場景:云從科技;(2)智基金融場景:格靈深瞳;(3)辦公場景:金山辦公;(4)AI繪畫場景:萬興科技:(5)智慧安防場景:商湯:#page#浙商證券行業深度4.3圍繞AI數據、算力等基礎設施選擇優質投資標的4.3.1海天瑞聲:AI訓練數據標注優質提供商公司是國內領先的訓練數據專業提供商,致力于為AI產業鏈各類機構提供專業數據集。公司致力于為各類AI廠商和機構提
108、供算法模型開發訓練需要的專業數據集,覆蓋智能語音(語音識別、語音合成等)、計算機視覺、自然語言等多個核心領域,應用場景多元,包含人機交互、智能駕駛、智能家居、智慈城市等。公司智能語音業務發展成熟,競爭壁全高且小語種領域優勢顯著。公司在語音語言學基礎研究方面積累深厚,基于發音詞典構建技術和流程技術的持續選代,構建高質量的自然語言處理模型訓練所需的標注數據,截至2022HI公司已具備190個語種/方言的覆蓋能力,并且公司致力于開拓海外市場,未來業務規模有望加速擴張。公司成立智能駕駛事業部,積極布局自動駕駛業務。公司于2022年6月上線了第三代智能駕駛標注平臺,目前自動駕駛數據標注方面業務已覆蓋全景
109、語義分割、2D圖像標注、2D/3D融合標注、3D點云標注等。公司基于多年以來在數據標注領域的算法積淀,在標注效率、準確度等指標上具備顯著競爭優勢,未來有望構建行業領先的綜合性、規?;妥詣踊臄祿幚砟芰w系。公司客戶資源粘性高優勢顯著,未來有望受益行業加速發展和人工智能商業化進程加速。公司在智能語音業務方面與字節跳動、阿里巴巴、騰訊、百度、科大訊飛及海外大型客戶保持良好合作關系,考慮人工智能未來有望加速商業化應用,登加國家信創浪潮政策支持,公司有望迎來加速成長期。4.3.2其它建議關注標的國外:英偉達(GPU):國內:寒武紀(AI芯片)。5風險提示1、AI技術選不及預期的風險;2、AI商業化
110、產品發布不及預期;3、政第不確定性帶來的風險;4、下游市場不確定性帶來的風險;#page#浙商證券行業深度股票投資評級說明以報告日后的6個月內,證券相對于滬深300指數的漲跌福為標準,定義如下:1.買入:相對于滬深300指數表現+20%以上;2.增持:相對于滬深300指數表現+10%+20%3.中性:相對于滬深300指數表現-10%+10%之間波動;4.減持:相對于滬深300指數表現-10%以下。行業的投資評級:以報告日后的6個月內,行業指數相對于滬深300指數的漲跌福為標準,定義如下:1.看好:行業指數相對于滬深300指數表現+10%以上:2.中性:行業指數相對于滬深300指數表現-10%+
111、10%以上;3.看淡:行業指數相對于滬深300指數表現-10%以下。我們在此提醒您,不同證券研究機構采用不同的評級術語及評級標準。我們采用的是相對評級體系,表示投資的相對比重。建議:投資者買入或者賣出證券的決定取決于個人的實際情況,比如當前的持倉結構以及其他需要考慮的因素。投資者不應僅僅依靠投資評級來推斷結論。法律聲明及風險提示本報告由浙商證券股份有限公司(已具備中國證監會批復的證券投資咨詢業務資格,經營許可證編號為:Z39833000)制作。本報告中的信息均未源于我們認為可靠的已公開資料,但浙商證券股份有限公司及其關聯機構(以下統稱“本公司”)對這些信息的真實性、準確性及完整性不作任何保證,
112、也不保證所包含的信息和建議不發生任何變更。本公司沒有將變更的信息和建議向報告所有接收者進行更新的義務。本報告僅供本公司的客戶作參考之用。本公司不會因接收人收到本報告而視其為本公司的當然客戶。本報告僅反映報告作者的出具日的觀點和判斷,在任何情況下,本報告中的信息或所表述的意見均不構成對任何人的投資建議,投資者應當對本報告中的信息和意見進行獨立評估,并應同時考量各自的投資目的、財務狀況和特定需求。對依據或者使用本報告所造成的一切后果,本公司及/或其關聯人員均不承擔任何法律責任。本公司的交易人員以及其他專業人士可能會依據不同假設和標準、采用不同的分析方法而口頭或書面發表與本報告意見及建議不一致的市場
113、評論和/或交易觀點。本公司沒有將此意見及建議向報告所有接收者進行更新的義務。本公司的資產管理公司、自營部門以及其他投資業務部門可能獨立做出與本報告中的意見或建議不一致的投資決策。本報告版權均歸本公司所有,未經本公司事先書面授權,任何機構或個人不得以任何形式復制、發布、傳播本報告的全部或部分內容。經授權刊載、轉發本報告或者摘要的,應當注明本報告發布人和發布日期,并提示使用本報告的風險。未經授權或未按要求刊載、轉發本報告的,應當承擔相應的法律責任。本公司將保留向其追究法律責任的權利。浙商證券研究所上??偛康刂罚簵罡吣下?29號陸家嘴世紀金融廣場1號樓25層北京地址:北京市東城區朝陽門北大街8號富華大廈E座4層深圳地址:廣東省深圳市福田區廣電金融中心33層上??偛苦]政編碼:200127上??偛侩娫挘海?621)80108518上??偛總髡妫海?621)80106010浙商證券研究所:https:/http#page#