1、平安證券研究平安證券研究所所TMT團團隊隊2023年年2月月28日日證券研究證券研究報報告告行行業評級:業評級:計計算機算機強于大市(維持強于大市(維持)計算機計算機行業行業深度報告深度報告:ChatGPT火爆出圈,火爆出圈,AI算力和行業應用潛力巨大算力和行業應用潛力巨大請務必閱讀正文后免責條款2投資要點投資要點 焦點:焦點:ChatGPT帶火帶火AIGC,Open AI引領技術和引領技術和生態。生態。2022年11月,由OpenAI開發的聊天機器人ChatGPT推出并席卷了整個行業,其引入人類反饋的強化學習和監督學習訓練方法,具備優秀的聊天對話、文案創作、代碼編寫等功能,且得到了微軟的傾力
2、支持,成為史上用戶增長最快的消費應用。聚焦國內,百度在大模型領域積累深厚,總體水平處于行業前端,其創新性引入大規模知識圖譜,模型性能得到大幅提升,公司近期宣布其“文心一言”產品將于2023年3月完成內測并面向公眾開放,下游關注度極高,目前已經得到新聞傳媒、互聯網、金融等多個行業客戶的廣泛支持。變革:變革:AIGC與人更為神似,模型和數據是主要與人更為神似,模型和數據是主要助力。助力。AIGC實現了從分析內容到創造生成新內容的跨越,而模型、數據集、算力、應用是催生AI技術新范式的重要因素。在模型方面,Transformer預訓練大模型為生成式AI帶來了里程碑式飛躍,其中OPENAI發布的GPT系
3、列大模型掀起AIGC熱潮,尤其是ChatGPT火爆出圈。在數據集方面,數據量、多樣性、數據質量是訓練數據集的關鍵要素。市場:大模型需要大算力,推動市場:大模型需要大算力,推動AI服務器市場增長。服務器市場增長。大模型的實現需要十分強大的算力來支持訓練過程和推理過程,根據OPENAI數據,訓練GPT-3 175B的模型,需要的算力高達3640 PF-days。ChatGPT的訓練成本和推理成本高昂。我們認為,隨著模型的迭代和AI芯片廠商產品的迭代,ChatGPT的訓練成本和推理成本未來必將呈現下降趨勢。但一次訓練百萬美元量級的訓練成本和每天百萬美元量級的推理成本,隨著全球和中國人工智能廠商布局大
4、模型,大模型將為全球和中國AI芯片和AI服務器市場的增長提供強勁動力。根據我們的估算,大模型將為全球和中國AI服務器市場帶來約910.44億美元和345.50億美元的市場空間。市場空間巨大,相關芯片和服務器廠商將深度受益此次ChatGPT浪潮。應用應用:行業:行業將逐步回歸理性,將逐步回歸理性,能否突破需要看能否突破需要看B端。端。未來2-3年是行業應用落地的關鍵時段,AIGC在經歷了近期的炒作熱潮結束之后,預計將經歷一段下沉期,市場趨向理性。期間,AIGC需要加快教育和融入市場,培育產品和應用。其中,B端是AIGC含金量最大的市場,AIGC需將技術轉化成工具和解決方案,為企業和行業賦能。其中
5、,文本、圖像生成以及類聊天機器人等產品在B端都有較大應用潛力,游戲、金融和快消等市場有望率先取得進展。投資投資建議:建議:近年來AIGC的算法、數據質量等要素有著顯著提升,文本、圖片/視頻、代碼等技術能力快速發展,在客服、營銷、游戲等賽道都顯示出非常強的應用潛力。伴隨著chatGPT的催化,國內AIGC產業鏈也將迎來空前的市場機會。算法方面,預計今年國內龍頭AI廠商有希望推出能力接近chatGPT的產品;算力是短板,由于供應鏈的問題,我國高端訓練芯片供給可能面對較大的壓力,AI算力不足的問題可能顯現,相關設備研發和基礎設施建設企業可能繼續受益。同時,AIGC新技術也會帶來新的安全挑戰,國產安全
6、廠商也將受益。強烈推薦啟明星辰,推薦科大訊飛、金山辦公、中科曙光、浪潮信息、紫光股份等;關注AI廠商后續發展機會,如云從科技、海天瑞聲、云天勵飛(待上市,已同意注冊)。風險提示:風險提示:1)技術落地可能不及預期。2)來自監管和版權方面的風險。3)國內AI供應鏈斷裂的風險。3目錄目錄焦點:焦點:ChatGPT帶火帶火AIGC,Open AI引領技術和生態引領技術和生態1變革:變革:AIGC與人更為神似,模型和數據是主要助力與人更為神似,模型和數據是主要助力2市場:大模型需要大算力,推動市場:大模型需要大算力,推動AI服務器市場增長服務器市場增長3應用:行業將逐步回歸應用:行業將逐步回歸理性理性
7、,能否突破需要看能否突破需要看B端端4投資建議及風險提示投資建議及風險提示54焦點:憑借焦點:憑借AIGCAIGC爆款應用爆款應用ChatGPTChatGPT,Open AIOpen AI強勢出圈強勢出圈2022年11月30日,由OpenAI開發的聊天機器人ChatGPT推出并席卷了整個行業,短短5天,注冊用戶數就超過100萬,僅兩個月月活用戶數已經破億。2023年1月,全球每天約有1300萬獨立訪問者使用ChatGPT。ChatGPT擁有強大的語言理解和文本生成能力,能夠很好地支持聊天對話、代碼撰寫、文案創作等任務。與之前的AI聊天機器人相比,ChatGPT能夠理解上下文并給出合理的回復,對
8、話連續性大幅提升,可以稱為人工智能發展史上的劃時代產品。憑借著ChatGPT的成功,Open AI成為全球AI行業關注的焦點。各軟件用戶數達到各軟件用戶數達到100100萬所用的時間萬所用的時間ChatGPTChatGPT寫詩、評論和代碼生成等樣例寫詩、評論和代碼生成等樣例資料來源:Statista、百度百科,平安證券研究所5OPEN AIOPEN AI:GPTGPT模型技術領先,模型技術領先,ChatGPTChatGPT發布引發變革發布引發變革 AIGC(AI Generated Content)是人工智能生成內容,也稱為生成式AI,涉及無監督和半監督學習算法,能夠使計算機用先前創建的內容(
9、諸如文本、音頻、視頻、圖像和代碼等)來生成新的內容,以此響應用戶輸入的提示語。OPEN AIOPEN AI是全球領先的是全球領先的AIGCAIGC公司。公司。OPEN AI成立于2015年,其最初定位為“非盈利性研究機構”,2018年,OPAN AI發布了GPT-1模型,2019年,公司改制為“有上限的盈利性機構”,并于同年發布GPT-2模型;2022年3月,OPAN AI發布InstructGPT模型;2022年11月,OPEN AI發布ChatGPT。此外,公司還擁有自然語言轉圖片的應用DELL E2。資料來源:百度百科,平安證券研究所201520152023202320162016201
10、8201820202020OPEN AI成立開放人工智能應用接口20172017201920192022202220212021發布GPT-1發布GPT-2微軟投資OPAN AI 10億美元發布GPT-3發布Universe發布ProximalPolicy Optimization算法發布OPEN AI憲章發布DELL E2研究人工神經網絡中的多模式神經元ChatGPT月活用戶超1億發布ChatGPT發布InstructGPTOPEN AIOPEN AI發展歷程發展歷程6OPEN AIOPEN AI:微軟持續提供資金、算力和生態支持,助力成就爆款:微軟持續提供資金、算力和生態支持,助力成就爆款
11、 微軟高度重視人工智能領域,在資金投入、計算資源、應用開發等方面與微軟高度重視人工智能領域,在資金投入、計算資源、應用開發等方面與OPEN AIOPEN AI形成了密切的合作關系,兩者優勢互補、合作共贏。形成了密切的合作關系,兩者優勢互補、合作共贏。資金投入:2019年,微軟向OPEN AI投資10億美元;2021年,微軟再次向OPEN AI投資,數額未披露;2023年1月,微軟宣布將通過一項花費數年、數十億美金的投資深化與OPEN AI的合作,根據美國財富雜志信息,該投資可能高達100億美元。計算資源:微軟Azure是OPEN AI的獨家云供應商,且微軟將加大在超級計算機方面的投資以支持OP
12、EN AI的發展,同時OPEN AI也可以反哺增強微軟Azure的AI能力,兩者能夠很好的合作共贏。應用開發:2月8日,微軟推出基于OPEN AI模型的Edge瀏覽器和Bing搜索引擎,且微軟表示未來所有產品將全線整合ChatGPT,包括Office三件套、Azure云服務、企業定制版產品等。資料來源:美國財富雜志,平安證券研究所AzureAzure超級計算機超級計算機OPEN AI賦能MicrosoftMicrosoft計算資源計算資源軟件應用軟件應用OPEN AIOPEN AI與微軟在計算資源、應用開發方面的合作關系與微軟在計算資源、應用開發方面的合作關系微軟投資微軟投資OPEN AIOP
13、EN AI歷史歷史2019201920212021MicrosoftMicrosoftOpen AIOpen AI2023202310億$未披露數十億$投資投資7百度:百度:文心大文心大模型國內全面領先,有望打造成國產模型國內全面領先,有望打造成國產ChatGPT2019201920232023202020202021202120222022發布ERNIE1.0模型發布ERNIE3.0模型,構建通用語義表示和任務語義表示框架發布鵬城-百度文心大模型,為全球首個知識增強型千億級模型應用至百度搜索業務發布ERNIE3.0 Zeus模型發布ERNIE2.0模型,提出持續學習語義理解框架將推出將推出“
14、文心一言”“文心一言”百度在大模型領域擁有較強的技術實力和平臺積累,其文心大模型總體位于行業前列。百度在大模型領域擁有較強的技術實力和平臺積累,其文心大模型總體位于行業前列。2019年3月,百度首次發布預訓練模型ERNIE 1.0,之后針對大模型的技術創新與產業應用持續發力,目前已經實陸續實現了一定程度的突破:2021年,百度發布最新版大模型ERNIE 3.0;2022年,百度發布鵬城-百度文心大模型,其參數規模達到2600億,較GPT-3參數量高50%;2023年2月,百度宣布其最新的大模型“文心一言”將于三月份完成內測,并面向公眾開放。根據IDC對國內大模型市場的評估,百度文心大模型在產品
15、能力、應用能力、生態能力等方面處于全面領先的業界地位。L1L2L3L1L2L3L1L2L3L4L4應用能力應用能力生態能力生態能力產品能力產品能力百度文心大模型百度文心大模型平均分平均分注:目前尚未有廠商在產品能力和生態能力方面達到L5,應用能力尚未有廠商達到L4中國大模型市場中國大模型市場20222022年評估結果年評估結果-百度文心百度文心百度文心大模型發展歷程百度文心大模型發展歷程資料來源:百度,IDC,平安證券研究所8百度:創新性引入大規模知識,文心大模型性能大幅提升百度:創新性引入大規模知識,文心大模型性能大幅提升資料來源:百度,ERNIE 3.0:LARGE-SCALE KNOWL
16、EDGE ENHANCED PRE-TRAINING FOR LANGUAGE UNDERSTANDING AND GENERATION,消費日報網,平安證券研究所ERNIE3.0ERNIE3.0框架結構框架結構百度文心大模型全景圖百度文心大模型全景圖 百度文心大模型擁有百度文心大模型擁有NLPNLP、CVCV、跨模態、生物計算等大模型組合,具有產業級和知識增強兩大特點。、跨模態、生物計算等大模型組合,具有產業級和知識增強兩大特點。文心大模型源于產業、服務于產業,可以滿足真實場景中的諸多應用需求,真正發揮大模型驅動AI規?;瘧玫漠a業價值;文心大模型在海量文本數據的基礎上引入大規模知識圖譜,促
17、進了結構化知識和無結構化文本之間的融合與共享,模型能力大幅提升。20212021年百度發布了年百度發布了ERNIE3.0ERNIE3.0模型,首次在百億級預訓練中引入了大規模知識,模型學習效率和可解釋性大幅增強。模型,首次在百億級預訓練中引入了大規模知識,模型學習效率和可解釋性大幅增強??蚣芊矫?,ERNIE 3.0模型框架分為“通用表示”和“任務表示”兩層,同時具備語言理解和語言生成兩種功能;性能方面,ERNIE 3.0刷新了54個中文NLP任務基準,且其英文模型在復雜語言理解任務評測中超過了人類水平0.8個百分點。9百度:“文心一言”生態建設取得進展,具備商用拓展潛力百度:“文心一言”生態建
18、設取得進展,具備商用拓展潛力 文心文心NLPNLP大模型面向語言理解、語言生成等場景,具備超強的語言理解、對話生成、文學創作等能力。大模型面向語言理解、語言生成等場景,具備超強的語言理解、對話生成、文學創作等能力。文心NLP模型將大數據預訓練與多源豐富知識相結合,通過持續學習,不斷吸收海量文本數據中詞匯、結構、語義等方面的新知識,實現模型效果不斷進化?!拔男囊谎裕ㄓ⑽拿骸拔男囊谎裕ㄓ⑽拿篍RNIE BotERNIE Bot)”是百度基于文心大模型技術推出的生成式對話產品)”是百度基于文心大模型技術推出的生成式對話產品。2023年2月7日,百度宣布將于2023年3月份發布“文心一言”,目前已
19、經有大量下游客戶參與文心一言的生態建設,行業覆蓋面廣泛,包括新聞、傳媒、互聯網、家裝、汽車、金融等,其中新聞傳媒業積極性最高,反映出“文心一言”這類AIGC產品將給媒體創作類行業帶來巨大影響。在2023 AI+工業互聯網高峰論壇上,百度智能云宣布“文心一言”將通過百度智能云對外提供服務,率先在內容和信息相關的行業和場景落地。資料來源:百度,平安證券研究所文心文心NLPNLP大模型大模型“文心一言文心一言”生態合作伙伴生態合作伙伴10目錄目錄焦點:焦點:ChatGPT帶火帶火AIGC,Open AI引領技術和生態引領技術和生態1變革:變革:AIGC與人更為神似,模型和數據是主要助力與人更為神似,
20、模型和數據是主要助力2市場:大模型需要大算力,推動市場:大模型需要大算力,推動AI服務器市場增長服務器市場增長3應用應用:行業將逐步回歸理性,能否突破需要看行業將逐步回歸理性,能否突破需要看B端端4投資建議及風險提示投資建議及風險提示511改變:改變:AIGCAIGC實現了從分析預測到生成創造的跨越,實現了從分析預測到生成創造的跨越,AIAI開始更像人開始更像人 AIGCAIGC為人工智能技術帶來技術變革。為人工智能技術帶來技術變革。相比于之前的分析式AI,AIGC不再局限于分析已有數據的規律,而是實現了從分析內容到創造生成新內容的跨越,讓AI更像人。事實上,早在2014年,隨著一種深度學習架
21、構生成對抗網絡(GAN)的出現,生成式AI就開始流行。但近年來,生成式AI在模型、數據、算力都大幅度提升和改進,行業進入爆發期,其中模型的演進影響最為深遠。NLPNLP發展歷程發展歷程資料來源:騰訊研究院、CSDN,平安證券研究所2015年,基于流的生成模型(Flow Based);擴散模型(Diffusion)2021年,CLIP模型2012年,卷積神經網絡AlexNet2013年,變分自動編碼(VAE)2020年,神經輻射場(NeRF)2017年,Transformer模型2014年,生成對抗網絡(GAN)2015年,深度殘差網絡(ResNet)12突破突破|模型:模型:預訓練大模型預訓練
22、大模型TransformerTransformer助力,助力,AIGCAIGC實現里程碑式飛躍實現里程碑式飛躍 預訓練大模型為生成式預訓練大模型為生成式AIAI帶來里程碑式飛躍帶來里程碑式飛躍。2017年Transformer架構的出現改善了循環神經網絡(RNN)的局限性,標志性特征是采用了self-attention機制,可為輸入數據的各部分分配不同權重,支持GPT-3和LaMDA等大型語言模型(LLM)。Transformer模型可并行訓練,使GPU性能改善所帶來的模型訓練效果顯著提升,同時可以通過不斷增加模型參數量以及預訓練使用的數據量來提升模型性能。大模型(又稱基礎模型)可經過海量、多
23、樣化數據(通常無標注文本)的預訓練,再針對廣泛的下游任務進行微調或適應。針對不同的任務和應用場景,只需要將大模型遷移學習到下游任務即可實現,避免了傳統NLP技術需要從頭開始訓練下游任務的痛點。模型所需參數量變化趨勢模型所需參數量變化趨勢訓練訓練大模型“預訓練大模型“預訓練+精調”模式精調”模式資料來源:GoogleAttention is All you Need、CSDN、IDC&百度,平安證券研究所TransformerTransformer模型架構模型架構13突破突破|模型:模型:TransformerTransformer衍生出三類模型,打下生成式衍生出三類模型,打下生成式AIAI算法
24、的基礎算法的基礎 深度神經網絡結構升級引發AIGC技術開發新范式,各類預訓練模型層出不窮,可用于NLP(諸如GTP-3)、CV(諸如Florence)或多模態領域(諸如Stable Diffusion)。以以TransformerTransformer架構為基礎衍生出的典型預訓練語言模型架構為基礎衍生出的典型預訓練語言模型大致可以分為三類:大致可以分為三類:1)Encoder模型(以BERT為代表):又稱自編碼模型,適用于內容理解任務,例如需要理解輸入語義的任務,例如情感分析;2)Decoder模型(以GPT為代表):又稱自回歸模型,適用于生成式任務,例如文本生成;3)Encoder-Deco
25、der模型(以T5為代表):又稱 Seq2Seq模型,通常用于需要內容理解和生成的任務,例如翻譯。TransformerTransformer模型系列分類模型系列分類資料來源:arxiv.org、CSDN,平安證券研究所TransformerTransformer模型家族時間軸模型家族時間軸14突破突破|模型:模型:GPTGPT系列大模型演進和應用較快,最終掀起系列大模型演進和應用較快,最終掀起AIGCAIGC熱潮熱潮 TransformerTransformer三條路線中三條路線中,GPTGPT模型進展較快:模型進展較快:2018年,由OpenAI提出的生成式預訓練模型GPT誕生,提出了半監
26、督學習方法,即通過“預訓練+微調”的方式讓模型通過大量無標注數據學習,從而緩解人工標注數據有限的問題;2019年,GPT-2去除finetune,參數量增加,采用zero-shot(零樣本)學習,模型的泛化能力提升;2020年,GPT-3采用few-shot(小樣本),并將訓練參數又提升兩個數量級,模型準確率和性能再次提升;2022年,InstructGPT在GPT-3基礎上采用獎勵機制,通過人為標注和強化學習的方法提升模型輸出結果的真實性、無害性和有用性,13億參數版本實現了比1750億參數版本GPT-3更好的模型性能。GPTGPT系列模型比較系列模型比較資料來源:知乎、arxiv.org,
27、平安證券研究所AIAI模型模型發布時間發布時間模型層數模型層數詞向量維度詞向量維度數據量數據量參數量參數量說明說明GPT2018.612768約5GB1.17億無監督預訓練模型+有監督微調GPT-22019.248160040GB15億無監督預訓練模型,去除GPT的微調,架構上改進(將層歸一化移動到每個子層的輸入并在最終的自注意力塊后增加一層歸一化,將上下文窗口大小從512增加到1024)GPT-32020.5961288845TB1750億無監督預訓練模型,參數量相比GPT-2提升兩個數量級,架構上優化(將上下文窗口大小從1024增加到2048,采用交替密度和局部帶狀稀疏注意模式)Instr
28、uctGPT2022.313億從預訓練的GPT3模型開始,并在有監督微調后通過強化學習加入獎勵模型機制GPT-3.5GPT3.5系列包括一系列諸如Davinci-003等模型,它們是在InstructGPT的基礎上構建的ChatGPT2022.11ChatGPT采用GPT3.5(又名GPT3 Davinci-003)預訓練模型,并使用RLHF微調,這與InstructGPT中大致相同,但在數據收集方面略有不同。ChatGPT也不僅只是個模型,因為它包括類似于BlenderBot3的內存存儲和檢索的擴展。15突破突破|模型模型:文本、圖像生成是起點,多模態生成也正在興起文本、圖像生成是起點,多模
29、態生成也正在興起 ChatGPT建立在GPT-3.5大語言模型(LLM)系列之上,并通過監督學習和強化學習技術進行了微調,引入基于人類反饋的強化學習機制(Reinforcement Learning from Human Feedback,RLHF)。ChatGPT能完成問答、詩歌創作、代碼編寫、文案寫作、翻譯等,接近真實人類的思維方式,在生成效果上取得重大突破。除了文本、代碼生成之外,圖片、視頻甚至是圖文多模態模型也都開始應用,而且應用規模將大幅增加。多模態大模型能夠實現文本、語音、圖像、視頻等各種模態之間的融合和內容形式生成。例如,OPENAI開發的CLIP模型可同時將文字和圖片相匹配。R
30、LHFRLHF強化學習原理步驟強化學習原理步驟資料來源:Hugging Face,平安證券研究所基于基于CLIPCLIP的對比圖文多模態預訓練的對比圖文多模態預訓練16突破突破|數據集:數據集:數據量、多樣性、數據質量是關鍵要素數據量、多樣性、數據質量是關鍵要素 語料庫的數據量語料庫的數據量、多樣性多樣性、數據質量成為訓練數據集的關鍵要素數據質量成為訓練數據集的關鍵要素。GPT使用了包含7000本書的BookCorpus數據集;GPT-2則收集了更加廣泛、數量更多的語料組成數據集,包含800萬篇Reddit上高贊的文章網頁,大小為40GB,Reddit上的數據會包括各個領域,所以既保證了數據質
31、量、數量又保證了數據的多樣性;GPT-3則采用了5種語料庫(5000億tokens),大小增至45TB;InstructGPT的預訓練和GPT3相同,但用標注數據和提示語進行了微調和優化,OPENAI雇傭了40名標注人員(labeler)且進行了培訓,通過指示學習構建訓練樣本來訓練獎勵模型,最后通過獎勵模型的打分排序來指導強化學習模型的訓練。GPTGPT系列模型數據集概覽系列模型數據集概覽資料來源:知乎、arxiv.org,平安證券研究所GPT 語料庫:BookCorpus數據集(7000本書)上的無監督預訓練,在幾個特定任務數據集上有 監 督 微 調,包 括SNLI、RACE、Quora等
32、數據量:5GB 語料庫:WebTex(包含800萬個Reddit上高贊的文章網頁)數據量:40GB 語料庫:500B tokens 包含CommonCrawl(410B),WebText2(19B),Books1(12B),Books2(55B),Wikipedia(3B)數據量:45TB 語料庫:預訓練同GPT3語料庫,但用標注數據和提示語進行了微調和優化 SFT 數 據 集 包 含 13K 的prompts;RM數據集包含33K的prompts;PPO數據集包含31K的prompts??偣?7K的數據中涉及人工標注的有46K左右。GPT-2GPT-3InstructGPT17突破突破|數據
33、集:增加數據集:增加數據集采樣頻率且加入人工標注,數據質量提升數據集采樣頻率且加入人工標注,數據質量提升 OPENAI發現Common Crawl雖然包含一萬億個詞,但未經過濾或輕微過濾的版本數據質量偏低。鑒于此,他們參照高質量語料將CommonCrawl的45TB數據壓縮過濾到570GB,并且添加了幾個高質量的精選語料庫(如Wikipedia)。值得注意的是,為了得到更高質量的訓練數據,數據集不是按其大小成比例采樣,而是質量更高的數據集被更頻繁地采樣。而InstructGPT與GPT-3最大的區別在于引入RLHF,訓練SFT、RM、PPO模型的數據集既有來自API用戶的,也有來自標注人員的。
34、其中SFT、RM的prompts來自于在線API上的用戶使用數據以及標注人員標注的數據,PPO則全都是從API數據中采樣的。雖然人類標注只有46K,但是InstructGPT對于沒見過的prompt依然有較好的泛化能力。GPT3GPT3模型數據集模型數據集資料來源:OPENAI,平安證券研究所InstructGPTInstructGPT各模型數據集大?。▎挝桓髂P蛿祿笮。▎挝?prompts:prompts的數量)的數量)DatasetQuantity(tokens)Weight in training mixEpochs elapsed when training for 300B to
35、kensCommon Crawl(filtered)410 billion60%0.44WebText219 billion22%2.9Books112 billion8%1.9Books255 billion8%0.43Wikipedia3 billion3%3.4SFT DataRM DataPPO Datasplitsourcesizesplitsourcesizesplitsourcesizetrainlabeler11,295trainlabeler6,623traincustomer31,144traincustomer1,430traincustomer26,584validcu
36、stomer16,185validlabeler1,550validlabeler3,488validcustomer103validcustomer14,39918目錄目錄焦點:焦點:ChatGPT帶火帶火AIGC,Open AI引領技術和生態引領技術和生態1變革:變革:AIGC與人更為神似,模型和數據是主要助力與人更為神似,模型和數據是主要助力2市場市場:大模型需要大算力,推動:大模型需要大算力,推動AI服務器市場增長服務器市場增長3應用應用:行業將逐步回歸理性,能否突破需要看行業將逐步回歸理性,能否突破需要看B端端4投資建議及風險提示投資建議及風險提示519算力:算力:ChatGPTCh
37、atGPT是基于是基于InstructGPTInstructGPT模型,大幅擴大數據量級而得到模型,大幅擴大數據量級而得到 ChatGPT模型訓練結合了監督學習和強化學習,具體的訓練方法分為三步:1)收集數據集并進行人工標注,輸入到GPT-3.5模型中進行GPT-3.5模型微調,訓練輸出一個監督模型(SFT);2)收集SFT模型生成的多輸出比較數據集,對諸多答案進行排序打分(人工標注),訓練輸出一個獎勵模型(RM);3)利用RM模型作為獎勵函數,通過PPO算法對SFT模型進行強化學習,持續迭代生成模型,此過程無需人工標注。ChatGPTChatGPT模型訓練過程模型訓練過程資料來源:OPENA
38、I官網,平安證券研究所20算力:算力:大模型大模型的實現需要十分強大的算力來支持訓練過程和推理過程的實現需要十分強大的算力來支持訓練過程和推理過程 大模型的實現需要十分強大的算力來支持訓練過程和推理過程。根據OPENAI數據,訓練GPT-3 175B的模型,需要的算力高達3640 PF-days(即以1PetaFLOP/s的效率要跑3640天)。2018年以來,大模型的參數量級已達到數千億參數的量級規模,對算力的需求將呈現指數級增長。各個模型所需計算量及參數量各個模型所需計算量及參數量20182018-20222022年大模型參數年大模型參數增長變化趨勢增長變化趨勢資料來源:澎湃新聞,OPEN
39、AI,平安證券研究所21算力:算力:AI芯片的性能芯片的性能提升成為決定提升成為決定大模型從理論實踐到大規模應用大模型從理論實踐到大規模應用的關鍵要素的關鍵要素人工智能不同時代對算力翻倍的需求時間人工智能不同時代對算力翻倍的需求時間英偉達英偉達A100 GPUA100 GPU的性能遠超的性能遠超V100 GPUV100 GPU 根據COMPUTE TRENDS ACROSS THREE ERAS OF MACHINE LEARNING研究結果,大模型時代,算力翻倍的需求時間是9.9個月。AI芯片的性能提升成為決定大模型從理論實踐到大規模應用的關鍵要素。在供給端,AI芯片廠商推出了性能越來越強的
40、新產品來應對人工智能發展的算力需求。以英偉達為例,2020年,英偉達推出了A100 GPU芯片,相比上一代V100 GPU芯片,A100 GPU芯片性能大幅提升。針對大模型,A100 GPU芯片相比V100 GPU芯片可提供高達3倍的訓練速度。資料來源:COMPUTE TRENDS ACROSS THREE ERAS OF MACHINE LEARNING,英偉達官網,平安證券研究所22算力:算力:ChatGPT的訓練成本和推理成本的訓練成本和推理成本高昂高昂在訓練端:據報道,2020年,微軟宣布與OpenAI合作,建成了一臺超級計算機,專門用來在Azure公有云上訓練超大規模的人工智能模型。
41、這臺為OpenAI開發的超級計算機擁有超過28.5萬個CPU核心,擁有超過1萬個GPU(V100 GPU芯片)。以此規格,如果自建IDC,以A100 GPU芯片替代V100 GPU芯片,依照A100和V100的性能換算,需要約3000個A100 GPU芯片。根據英偉達網站信息,NVIDIA DGX A100服務器搭載8塊A100芯片,估算需要375臺NVIDIA DGX A100服務器,每臺NVIDIA DGX A100服務器的價格為19.9萬美元,則自建IDC的訓練服務器的算力成本為7462.5萬美元。若在云端訓練,據Lambda Labs首席科學官Chuan li介紹,擁有1750億個參數
42、的GPT-3單次訓練成本達到460萬美元。在推理(用戶訪問)端:ChatGPT推出僅兩個月月活用戶數已經破億,2023年1月,全球每天約有1300萬獨立訪問者使用ChatGPT。以ChatGPT日活用戶2000萬估算,假設每天每用戶提10個問題,則每天有2億的訪問量。若自建IDC,假設每個問題平均20個字,ChatGPT在A100 GPU芯片上對每個字的響應時間是350毫秒,則2億的訪問量需要A100芯片運行388889個芯片小時,即每天需要16204(388889/24)個A100芯片同時工作,需要2026(16204/8)臺NVIDIA DGX A100服務器同時工作,則自建IDC的推理服
43、務器的算力成本為4.03億美元。若在云端推理,據Fortune雜志數據,每次用戶與ChatGPT互動,產生的算力云服務成本約0.01美元,則每天2億的訪問量,對應的云端成本為每天200萬美元。自建自建IDCIDC的訓練成本估算的訓練成本估算A100 GPU 芯片芯片(個)(個)1臺臺NVIDIA DGX A100服務器服務器搭載搭載A100芯片個數芯片個數NVIDIA DGX A100服務器(臺)服務器(臺)NVIDIA DGX A100服務器價格服務器價格(萬美元)(萬美元)訓練成本(萬美元)訓練成本(萬美元)3000837519.97462.5自建自建IDCIDC的推理成本估算的推理成本估
44、算日日活用戶活用戶數(萬數(萬)單單用用戶戶每日提每日提問次數問次數每個問題每個問題平均字數平均字數(個)(個)A100 GPU對每個字的對每個字的響應時間(響應時間(毫秒)毫秒)每日消耗每日消耗GPU計計算時間(小時)算時間(小時)每天需要每天需要A100GPU芯片(個)芯片(個)NVIDIA DGX A100服務器服務器(臺)(臺)NVIDIA DGX A100服務器價格服務器價格(萬美元)(萬美元)推理成本(億美推理成本(億美元)元)2000102035038888916204202619.94.03資料來源:澎湃新聞,環球零碳,英偉達官網,平安證券研究所23算力:大模型將為全球和中國算
45、力:大模型將為全球和中國AI芯片和芯片和AI服務器服務器市場的增長提供強勁動力市場的增長提供強勁動力我們認為,隨著模型的迭代和AI芯片廠商產品的迭代,ChatGPT的訓練成本和推理成本未來必將呈現下降趨勢。但一次訓練百萬美元量級的訓練成本和每天百萬美元量級的推理成本,隨著全球和中國人工智能廠商布局大模型,大模型將為全球和中國AI服務器市場的增長提供強勁動力。根據2022年北京人工智能產業發展白皮書數據,截至2022年10月,北京擁有人工智能核心企業1048家,占我國人工智能核心企業總量的29%。以此計算,我國人工智能核心企業總數約為3614家。假設其中有2%的企業自建IDC訓練和推理大模型,如
46、前所述,單一企業自建IDC推理和訓練大模型的算力成本約為4.78(4.03+0.75)億美元,以此估算,大模型將為我國AI服務器市場帶來約345.50億美元的市場空間。以2021年我國AI服務器市場規模占全球AI服務器市場規模的占比估算,則將為全球AI服務器市場帶來約910.44億美元的市場空間。市場空間巨大,相關芯片和服務器廠商將深度受益此次ChatGPT浪潮。資料來源:IDC,浪潮信息,平安證券研究所2021H12021H1全球全球AIAI服務器市場競爭格局服務器市場競爭格局20212021年年中國中國AIAI服務器市場競爭格局服務器市場競爭格局20212021-20252025年全球年全
47、球AIAI服務器服務器市場規模市場規模CAGRCAGR為為19.5%19.5%20212021-20262026年年中國中國AIAI服務器服務器市場規模市場規模CAGRCAGR為為15.8%15.8%24目錄目錄焦點:焦點:ChatGPT帶火帶火AIGC,Open AI引領技術和生態引領技術和生態1變革:變革:AIGC與人更為神似,模型和數據是主要助力與人更為神似,模型和數據是主要助力2市場:大模型需要大算力,推動市場:大模型需要大算力,推動AI服務器市場增長服務器市場增長3應用應用:行業將逐步回歸理性,能否突破需要看行業將逐步回歸理性,能否突破需要看B端端4投資建議及風險提示投資建議及風險提
48、示525AIGC將逐步回歸理性,未來將逐步回歸理性,未來2-3年重點培育應用和教育市場年重點培育應用和教育市場生成式生成式AIAI走向炒作頂峰走向炒作頂峰 未來未來2 2-3 3年是年是AIGCAIGC走向成熟的關鍵時期。走向成熟的關鍵時期。類似于計算機視覺等相對成熟的技術,AIGC在經歷了近期的炒作熱潮結束之后,預計行業將經歷一段下沉期,市場趨向理性。AIGC則需要加快開始教育和融入市場,培育產品和應用。如果能夠像計算機視覺一樣,找到合適的商業化場景,行業后續將逐步得到市場認可,并持續做大;如果不能,這項技術也可能持續停留在低谷期,甚至被市場淘汰。ChatGPTChatGPT的快速推進,標志
49、著的快速推進,標志著AIGCAIGC在在C C端有著巨大潛力,但端有著巨大潛力,但B B端、端、G G端相關產品應該將是公司的主要收入來源。端相關產品應該將是公司的主要收入來源。C端看,主要是來自于內容生成等工具性的需求,一般都是輕應用,嘗鮮之后的付費意愿值得觀察,主流的產品收費模式將是SaaS應用訂閱;B端看,是含金量最大的市場,需要將技術轉化成工具和解決方案,為企業和行業賦能,收費模式可能包括項目定制+后續訂閱收入。AIGCAIGC潛在商業模式潛在商業模式資料來源:Gartner(2022.7),平安證券研究所26文本、代碼等應用有望近兩年進入快速發展期,圖像、視頻生成成熟需時日文本、代碼
50、等應用有望近兩年進入快速發展期,圖像、視頻生成成熟需時日AIGCAIGC的應用場景的應用場景文本生成文本生成圖像生成圖像生成視頻生成視頻生成游戲生成游戲生成根據使用場景,可分為非交互式文本生成和交互式文本生成。視頻生成可分為視頻編輯、視頻自動剪輯和端到端視頻生成。醫療影像生成建筑建模創作游戲生成主要包括游戲元素生成和游戲策略生成。NPC生成場景生成自主創作類人聊天智能搜索文章寫作輔助輔助編程文字生成圖片圖片編輯圖像轉圖像根據使用場景,可分為圖像編輯工具和端到端圖像生成。虛擬數字人劇情生成代碼編寫 文本生成:應用相對成熟,在垃圾郵件的檢測、基礎的問答等領域都得到了應用,并在長篇寫作等方面有所建樹
51、,快速發展階段預計很快到來;后續預期在專業論文或者文學創作上實現落地;圖像生成:已經開始應用于產品設計、建筑模型,而且在醫療領域也實現應用,但達到設計師等專業人士的水平,還有差距;視頻、游戲生成:目前還處在早期嘗試階段,如實現電子游戲和電影的個性化創作,可能需要等待較長時間。長視頻生成動畫制作視頻自動編輯短視頻生成文字生成視頻AIGCAIGC在不同場景中的發展預期在不同場景中的發展預期資料來源:紅杉資本、平安證券研究所27國內國內AIGC垂直應用起步較晚,文本、圖像等領域都還是藍海賽道垂直應用起步較晚,文本、圖像等領域都還是藍海賽道國內國內AIGCAIGC主要賽道參與企業主要賽道參與企業 相較
52、美國市場,國內AIGC在相對成熟的賽道上參與者也不是很多,這和之前的預測性AI趨于紅海的市場有著很大的差異。一方面,國內在算法和應用開發上存在差距,同時公有云SaaS發展不足帶來的訓練數據質量和應用通用性較差,限制了國內應用的大面積鋪開;另一方面,國內B端為應用付費的意愿,尤其是AIGC這類新應用付費的意愿并不夠強,反而是國內一些To C的賽道發展的更好一點。從趨勢上看,AIGC最終的市場依然是B端,但是考慮到中美市場的差異,國內企業依靠單一通用應用去打所有市場的可能性比較小,需要通過垂直化、行業定制化的開發AIGC方案,早期可能只面向1個或者幾個行業賽道,有積累之后持續拓展其他行業。美國美國
53、AIGCAIGC主要賽道參與企業(不完全統計)主要賽道參與企業(不完全統計)資料來源:百度、平安證券研究所28文本生成:通過營銷文案、摘要、故事生成引擎,賦能文創、金融等行業文本生成:通過營銷文案、摘要、故事生成引擎,賦能文創、金融等行業 功能:輸入結構化的數據、圖片或者文本來生成一段新的文本。例如輸入結構化的數據、輸入一張圖片,或者輸入若干關鍵詞來生成文本。目前主要功能是生成可控文本,即文本中帶有期望得到的屬性,比如情感、關鍵詞、事實以及主題等。應用:營銷文案引擎、文章摘要、故事生成、散文小說、文本復述、研報生成。挑戰:對篇章結構、多樣性的可控;長文本生成面臨的前后邏輯不一致、主題不一致以及
54、事實不一致等問題。國內文本生成典型解決方案國內文本生成典型解決方案國內文本生成主要應用場景及功能國內文本生成主要應用場景及功能場景場景功能功能描述描述應用實例應用實例文化創作、快消基于關鍵詞生成輸入關鍵詞句,將圍繞關鍵詞生成具有指定風格特色的原創內容中文在線:利用文本生成平臺進行輔助創作自定義模板生成用戶輸入文本并標注出待補全部分,模型基于用戶輸入進行內容補全續寫根據用戶選擇的題材和輸入的前序文本進行續寫營銷文本生成輸入品牌、核心賣點、應用場景等關鍵詞,生成營銷文案美妝、汽車等行業已經開始有應用金融行業研報觀點分析自動抽取研報中的觀點內容,并輸出觀點標簽及觀點極性。華夏基金:輿情監測。重點解決
55、傳統工具關鍵字判斷準確度低、情緒判斷和業務需求不一致、大量重復信息干擾、無法識別輿情對象等問題。金融文本情感分析對金融、財經領域中文本的情感傾向進行分析判斷,有效賦能金融財經領域信息分析以及處理。事件檢測從新聞中檢測金融相關事件,用于分析和決策。資料來源:瀾舟科技、平安證券研究所29圖片圖片/視頻生成:能力提升明顯,視頻生成:能力提升明顯,C端認知需提升但端認知需提升但B端潛力較大端潛力較大功能:通過AI技術來自動或輔助生成內容的生產方式,通過輸入指令,讓AI去完成冗雜的代碼、繪圖、建模等任務,實現“圖生圖”或者“文生圖”的模式,生成新的圖片/視頻。在開源公司StabilityAI發布了Vin
56、cent的圖形模型StableDiffusion之后,AIGC圖片生成能力顯著提高。商業模式:C端客戶目前需求更為復雜,AIGC在技術上還存在差距,目前很難有大的商業機會,業內企業6Pen調研數據顯示,60%用戶不曾付費,付費超過100元的比重也只有10%,市場拓展還需要時日;B端客戶變現的可能性會更高,垂直客戶需求相對聚焦,變現路徑也更為多元和成熟,比如廣告、營銷、文旅等行業,預計都會有較大的空間。2023/2/28行業行業應用方式應用方式應用實例應用實例廣告行業利用AI制作宣傳材料百度利用文心平臺制作電視劇宣傳海報,騰訊、美圖也在進入該賽道設計行業建筑、包裝、服飾等設計出圖ZMO.AI通過
57、生成高質量的模特兒照片圖片,降低拍照成本和等待時間營銷定制生成圖片或者視頻材料百家號、剪映開放圖文轉視頻功能,可以進行個性化的創作漫畫/動漫行業配文生成漫畫、插畫和視頻國內藝術家基于小說2086元宇宙制作漫畫版,形成可視版本游戲行業輔助角色、道具、場景設計網易推出首個游戲版ChatGPT將會在逆水寒手游國內圖片國內圖片/視頻生成典型應用場景視頻生成典型應用場景利用利用AIGCAIGC生成的繪畫、海報和手游生成的繪畫、海報和手游資料來源:觀研天下、網易、平安證券研究所30類人聊天機器人:類人聊天機器人:AIGC應用集大成者,已從形似開始走向神似應用集大成者,已從形似開始走向神似類人聊天機器人及頭
58、部廠商類人聊天機器人及頭部廠商類人聊天機器人是一種旨在模擬與用戶進行類人對話的電腦程序。它們已被應用于多個行業,包括客戶服務、電子商務和娛樂等。chatGPT帶來的變革:此前的聊天機器人只能根據設定問題回復固定內容,同同chatGPTchatGPT融合之后,將文本生成、圖像生融合之后,將文本生成、圖像生成、多模態轉換技術融合起來,環境感知、理解能力在大幅成、多模態轉換技術融合起來,環境感知、理解能力在大幅增強,實現和人的形似到神似?;谠鰪?,實現和人的形似到神似?;赾hatGPTchatGPT的類人聊天機的類人聊天機器人可以提供客戶服務、虛擬代理、內容創意和文本生成、器人可以提供客戶服務、虛
59、擬代理、內容創意和文本生成、以及信息知識提供等服務。以及信息知識提供等服務。國外重點企業:-openAI:公司核心宗旨在于“實現安全的通用人工智能(AGI)”,目前推出的“chatGPT類人聊天機器人”火爆全球,其公司在圖片生成和視頻生成的應用上也有很深的造詣。-Google:公司在AIGC領域布局很久,目前也有“bard”類人聊天機器人的誕生試用,在AIGC的多種技術領域也處于前列。國內重點企業:-百度:是國內布局AI賽道最早的公司之一,目前已宣布“文心一言”類人聊天機器人將很快進入公測環節,圖片生成方面也有突破。-小冰:從微軟獨立拆分出來的人工智能公司,推出的“小冰”機器人是目前全球范圍內
60、承載交互量最大的人工智能系統。類人聊天機器人的多種應用場景類人聊天機器人的多種應用場景以以chatGPT為例為例智能搜索引擎新聞寫稿機器人chatGPT類人聊天機器人文本生成信息提供系統創意內容生成虛擬代理客戶服務虛擬數字人虛擬主播電商智能客服金融資訊客服信息整合工具數字教育資源營銷文案生成影視劇本生成31類人聊天機器人類人聊天機器人|新聞寫稿:應用起步較早,大幅提升寫作效率新聞寫稿:應用起步較早,大幅提升寫作效率 利用AIGC技術參與新聞寫稿輔助工作,各家新聞機構起步均較早,2015年以來國外包括紐約時報、彭博都已經開始應用,國內隨后也在做相關投入,比如新華社的“快筆小新”、第一財經與阿里巴
61、巴合作開發了“DT稿王”、南方都市報與北京大學團隊合作研發的寫稿機器人“小南”等。AI機器人可以幫助精確檢索二手信息,收集素材。在高性能的AIGC工具如ChatGPT出現后,就可以像常人對話一樣直接提問并獲得答案。另外AIGC轉寫工具可以幫助記者實時生成文稿,自動撰寫提綱、精簡語句等,進而提高工作效率,保證最終產出的時效性。目前AIGC撰稿工具能在一分鐘內生成兩千條新聞,且單條質量可比擬人類半小時的作品質量。尤其是針對股市、重大體育賽事等新聞,會在關鍵時間點自動撰寫新聞,編輯只需要做最終審校就可以發出,大幅提升了新聞的時效性,降低了編輯的工作量。目前AI機器人主要在財經、體育和生活類等新聞中出
62、場,深度、調查報告等還需要人類記者完成,后續隨著技術的進步,應用面將拓寬。國內代表性的機器人記者方案國內代表性的機器人記者方案新聞寫稿機器人重點功能應用新聞寫稿機器人重點功能應用功能功能具體應用具體應用文本復述/改寫對原有文本進行改寫,觀點一致,但寫作風格和表達多樣語音交互通過口述查詢,自動生成稿件,通過ChatGPT技術可以實現智能問答看圖寫話圖片、視頻的自動生成。根據給定的圖片或者視頻,自動生成可以描述圖片或者視頻內容的稿件,類似于“看圖寫話”或是“看視頻寫話”。視頻寫稿根據現有文字提取摘要和關鍵詞,快速生成對應的短視頻稿件。對編輯填寫的文本信息進行語義分析,得到摘要與關鍵詞,并自動搜索資
63、源庫匹配關聯性最強的圖片、視頻、音頻素材,自動制作成一段視頻智能模板生成通過持續訓練,根據不同的內容要求,自動生成模板資料來源:搜狐網、新華網等、平安證券研究所32類人聊天機器人類人聊天機器人|虛擬數字人:形似到神似,活躍于客服、新聞制播等多個場景虛擬數字人:形似到神似,活躍于客服、新聞制播等多個場景 虛擬數字人是AIGC的重要應用之一,利用人像、聲音生成等技術,可以定制2D、3D的虛擬數字人,可以實現文本到視頻的輸出。目前,AIGC在該領域應用更為成熟,智能化水平更高,輸出結果更為靈活和應景,交流更為順暢,實現了從形似到神似的跨越。目前市場上的虛擬數字人可以充當虛擬客服、數字員工、虛擬老師、
64、虛擬主播、數字導游等角色,應用于金融、傳媒、旅游、電子政務等多個場景,提供客戶服務和交互、課程制作、新聞制播、政務服務和查詢等多方面的功能,大幅提升了內容制作輸出效率,保證了用戶的服務體驗。目前,科大訊飛等人工智能企業,均提供了虛擬數字人的解決方案。虛擬數字人制作流程虛擬數字人制作流程虛擬數字人當前面向的場景虛擬數字人當前面向的場景金融業金融業新聞媒體新聞媒體數字員工數字員工電子政務電子政務旅游景點旅游景點資料來源:科大訊飛、平安證券研究所33落地案例落地案例|游戲:游戲:AIGC與游戲賽道天然親和,數據資產生產等應用將加速與游戲賽道天然親和,數據資產生產等應用將加速 游戲是典型的資產復雜度非
65、常高的娛樂形式,人力密集,研發人員持續膨脹,質量、成本、效率不可能三角問題難解。AIGC與游戲具有天然的適配性,在圖片/視頻生成、虛擬玩家、音樂制作、劇情/策略開發等方面都有非常大的潛力,而且娛樂場景來自監管、倫理、安全性等方面的壓力較小,落地較快。目前,AIGC正在為游戲中的數據資產建立模型,開發智能對話、智能陪玩、智能QA,并能夠通過劇情和策略生成等方式,豐富和延展游戲內容,延展游戲壽命。通過AI生成,可以降低生產成本,提高效率,還能保證游戲質量不下降,完美解決不可能三角問題。AIGCAIGC在國內外落地案例在國內外落地案例廠商廠商產品產品應用情況應用情況騰訊“絕悟”陪玩機器人通過強化學習
66、的方法來模仿真實玩家,包括發育、運營、協作等指標類別,以及每分鐘手速、技能釋放頻率、命中率、擊殺數等具體參數,讓AI更接近正式服玩家真實表現,將測試的總體準確性提升到95%。rct A智能NPC生成、劇情延展、智能Q&A、智能陪玩等智能NPC為例,其NPC能夠分析玩家的實時輸入,并動態地生成交互反應,從而構建幾乎無限目不重復的劇情,增強自戶體驗并延長游戲生命周期。網易游戲智能NPC、玩家智能對話武俠手游逆水寒宣布實裝國內首個游戲版ChatGPT,讓智能NPC能和玩家自由生成對話,并基于對話內容,自主給出有邏輯的行為反饋。該手游已經獲得版號,預計將于2023年年內上線。行者AI游戲資產生成為游戲
67、生成2D圖片、3D 環境、單體建筑、人物角色模型、虛擬數字人等復雜內容生成。AIGCAIGC在游戲資產生成過程中的應用在游戲資產生成過程中的應用資料來源:行者AI、平安證券研究所34落地案例落地案例|銀行:通過數字員工等形式試水銀行:通過數字員工等形式試水AIGC,監管、安全性問題需關注,監管、安全性問題需關注 銀行是作為服務業的重點領域,數據豐富且質量優秀,也是與AI融合的比較快的領域。此前,AI營銷文案生成、數字員工(客服)等解決方案已經得到應用,承擔問題應答、業務操作指引、查詢響應和確權等職能。隨著ChatGPT的火爆,各家銀行正在探索AIGC進一步為虛擬數字員工賦能,提升智能化水平,在
68、內外部溝通等環節中發揮更重要的作用。在銀行線下網點,數字員工就充當“服務型數字人”的角色,提升大堂的服務效率和服務質量;線上業務可能將是各大銀行未來利用數字員工爭奪的重點,會強調”數字人“IP的打造,樹立起銀行在虛擬世界的品牌形象,實現客戶的轉化,很多銀行已經將數字員工應用到線上的營銷推廣中。后續,AIGC處理復雜問題和創造性問題的能力也將持續提高,銀行業應用面臨的監管、安全性等問題也將逐步得到解決,AIGC在銀行領域的應用范圍將擴大。除了當前正在應用的客戶服務、營銷運營和數字員工之外,未來在風險管控、經營態勢分析等領域也會有較大的應用潛力。主要銀行機構主要銀行機構AIGCAIGC應用情況應用
69、情況機構機構AIGC技術應用進展技術應用進展寧波銀行開發了數字員工小寧,用于智慧大堂服務和線上營銷等場景。工商銀行開發了數字員工工小智,提供線下支行網點大堂服務,進行產品介紹和營銷。郵儲銀行將開始內測文心一言,在智能客服、數字員工、虛擬營業廳等場景進行應用,進一步提升客戶體驗。江蘇銀行嘗試運用ChatGPT技術提升軟件開發生產力。招商銀行在智能客服、流程智能化等方面,廣泛應用了大模型技術用于意圖識別、信息提取等具體工作。百信銀行把百度文心一言的智能對話技術成果應用在數字金融、AI數字人、數字營業廳等領域。中信銀行將接入文心一言生態,在財富管理等場景嘗試應用。興業銀行接入文心一言,用于智慧網點、
70、智能服務、智能風控、智能運營、智能營銷、智能投研等。銀行機構數字員工典型應用銀行機構數字員工典型應用對外對外對外場景包括存、貸、對外場景包括存、貸、匯、監等一系列金融業匯、監等一系列金融業務服務:務服務:網點客戶服務、交流結合用戶特征定制專屬方案,成為客戶的“專屬顧問”,并在交互過程中識別用戶情感,通過話術激發用戶興趣、引導用戶選擇產品在用戶不感興趣時進行挽留、適時推薦其他產品,充分給予用戶優質體驗。對內場景,數字員工可以充對內場景,數字員工可以充當智慧助手:當智慧助手:解答員工問題,及時提醒待辦日程,快速辦理日常事務,提升員工幸福感為員工制定專屬的崗位培訓計劃,提供專業的職業發展建議,加速員
71、工成長HR的“分析助手”,對員工數據進行整合挖掘,形成員工畫像和關系圖譜,協助HR評估員工能力、調優人員配置對內對內資料來源:金融電子化、工商銀行等、平安證券研究所35目錄目錄焦點:焦點:ChatGPT帶火帶火AIGC,Open AI引領技術和生態引領技術和生態1變革:變革:AIGC與人更為神似,模型和數據是主要助力與人更為神似,模型和數據是主要助力2市場:大模型需要大算力,推動市場:大模型需要大算力,推動AI服務器市場增長服務器市場增長3應用應用:行業將逐步回歸理性,能否突破需要看行業將逐步回歸理性,能否突破需要看B端端4投資建議及風險提示投資建議及風險提示536投資建議及風險提示投資建議及
72、風險提示 投資建議:投資建議:近年來AIGC的算法、數據質量等要素有著顯著提升,文本、圖片/視頻、代碼等技術能力快速發展,在客服、營銷、游戲等賽道都顯示出非常強的應用潛力。伴隨著chatGPT的催化,國內AIGC產業鏈也將迎來空前的市場機會。算法方面,預計今年國內龍頭AI廠商有希望推出能力接近chatGPT的產品;算力是短板,由于供應鏈的問題,我國高端訓練芯片供給可能面對較大的壓力,AI算力不足的問題可能顯現,相關設備研發和基礎設施建設企業可能繼續受益。同時,AIGC新技術也會帶來新的安全挑戰,國產安全廠商也將受益。強烈推薦啟明星辰,推薦科大訊飛、金山辦公、中科曙光、浪潮信息、紫光股份等;關注
73、AI廠商后續發展機會,如云從科技、海天瑞聲、云天勵飛(待上市,已同意注冊)。風險提示:風險提示:1)技術落地可能不及預期。目前chatGPT處于市場炒作高點,未來將面臨著市場落地的考驗,由于技術本身尚需持續完善,能否跨越商業化的“死亡之谷”仍待觀察。2)來自監管和版權方面的風險。AIGC生成內容還主要依賴現有素材,可能產生版權糾紛,同時生成內容版權的認定還存在爭議,商業化可能面臨障礙;在一些特定場景,AIGC可能受到監管的限制;3)國內AI供應鏈斷裂的風險??赡艹霈F芯片、軟件和算法等供給限制更為嚴格的情況,國內研發和商業化可能受到沖擊。37重點推薦標的重點推薦標的股票簡稱股票代碼2月27日EP
74、S(元)PE(倍)評級收盤價(元)2021A2022E2023E2024E2021A2022E2023E2024E啟明星辰002439.SZ28.680.900.921.231.5731.931.223.318.3強烈推薦科大訊飛002230.SZ47.790.670.250.710.9571.3191.267.350.3推薦金山辦公688111.SH288.712.262.423.424.73127.7119.384.461.0推薦浪潮信息000977.SZ37.241.371.632.002.4727.222.818.615.1推薦紫光股份000938.SZ24.480.750.861.0
75、71.3332.628.522.918.4推薦中科曙光603019.SH31.410.791.021.311.6439.830.824.019.2推薦38重點標的科大訊飛重點標的科大訊飛智能語音領軍企業智能語音領軍企業 科大訊飛成立于科大訊飛成立于19991999年,是亞太地區知名的智能語音和人工智能企業年,是亞太地區知名的智能語音和人工智能企業。公司作為技術創新型企業,其智能語音、自然語言理解、計算機視覺等核心技術處于國際領先水平,已入駐“中國人工智能國家隊”。公司以公司以“平臺平臺+賽道賽道”戰略為指引,戰略為指引,2B+2C2B+2C雙輪驅動產品落地雙輪驅動產品落地。公司構建了以智能語音
76、和人機交互為核心的“訊飛開放平臺”,并在此基礎上推動產品及服務在消費者、智慧教育、智慧城市、智慧司法、智能汽車、智慧醫療、運營商等領域的深度應用。截至2022年5月31日,訊飛開放平臺已開放493項AI產品及能力,聚集超過337.3萬開發者團隊,總應用數超過150.1萬,累計覆蓋終端設備數35.1億+。公司營收及歸母凈利潤情況公司營收及歸母凈利潤情況公司公司AIAI產品全棧布局產品全棧布局資料來源:公司官網,WIND,平安證券研究所 2022年前三季度,公司實現營業收入126.61億元(+16.50%);實現歸母凈利潤4.20億元(-42.34%);EPS為0.18元。預計2022年實現營業收
77、入183.14-201.45億元,同比增長0%-10%;實現歸母凈利潤4.67-6.23億元,同比下降60%-70%;EPS為0.20-0.27元?!巴扑]”評級。公司簡介及公司簡介及AIAI賽道相關布局賽道相關布局公司財務狀況公司財務狀況39重點標的金山辦公重點標的金山辦公辦公領域辦公領域AI先行者先行者 金山辦公成立于金山辦公成立于20112011年,年,是國內領先的辦公軟件和服務提供商是國內領先的辦公軟件和服務提供商。公司主要從事WPS Office辦公軟件產品及服務的設計研發及銷售推廣。公司自2017年開啟AI戰略部署至今,已經在OCR、文檔翻譯、圖文識別檢測等多領域實現產品落地。公司公
78、司基于基于AIAI中臺,打造智能化辦公場景中臺,打造智能化辦公場景。公司AI中臺面向計算機視覺、自然語言處理、語音處理等算法研究方向,圍繞辦公領域,已開發出了近100項AI能力。公司推出的WPS智能寫作可以實現文本自動生成、輔助成稿寫作、句子智能補寫、文本智能校對等功能。公司開源全球首個辦公領域公司開源全球首個辦公領域DLDL框架框架KSAIKSAI-litelite。公司于2021年7月開源業界首個面向辦公領域的深度學習框架KSAI-lite,支持離線AI計算,并且適配國內外主流軟硬件平臺,在OCR、機器翻譯、智能校對等場景具有顯著優勢。公司營收及歸母凈利潤情況公司營收及歸母凈利潤情況公司公
79、司辦公領域深度學習框架辦公領域深度學習框架KSAIKSAI-litelite資料來源:公司公眾號,WIND,平安證券研究所 2022年前三季度,公司實現營業收入27.95億元(+17.83%);實現歸母凈利潤8.13億元(-4.10%);EPS為1.76元?!巴扑]”評級。公司簡介及公司簡介及AIAI賽道相關布局賽道相關布局公司財務狀況公司財務狀況readmereadme編譯腳本編譯腳本build.sh編譯平臺linuxlinuxwindowswindowsIOSIOStensorflow lite x.x.x(加速delegates)編譯產出linuxlinux.so.soandroidand
80、roid.aar.aar國產化國產化.so.sowindowswindows.dll.dllIOS IOS.framewor.framework k demodemoOCRNLP可執行程序40重點標的浪潮信息重點標的浪潮信息全球全球AI服務器龍頭服務器龍頭 浪潮信息是全球人工智能計算領導企業,浪潮信息是全球人工智能計算領導企業,AIAI服務器服務器市占率世界第一市占率世界第一。公司目前在售AI服務器產品10余款,在研產品6款,分為AI訓練服務器、AI推理服務器、元宇宙服務器等類型,主要應用場景包括自然語言處理、計算機視覺、大型推薦系統等。據IDC統計,2022年H1,公司AI服務器產品市場占有
81、率達到50.3%。公司立足公司立足算力、算力、算法算法、數據數據,構建,構建全棧全棧AIAI能力能力。算力方面,公司于2022年發布國內首款元宇宙服務器MetaEngine,將為元宇宙數字空間的創建和運行提供強大算力。算法方面,公司于2021年發布“源1.0”大模型,公司已基于此研發出對話、問答、翻譯和古文四個技能模型,同時,“源1.0”大模型落地智算中心,通過開源模型API、高質量數據集、模型代碼、技能模型等形式對外提供算法基礎服務。數據基礎設施方面,公司于2022年發布了新一代SSD高速存儲介質,具備ZNS數據分流等技術,性能大幅提升。公司營收及歸母凈利潤情況公司營收及歸母凈利潤情況浪潮人
82、工智能服務器系列浪潮人工智能服務器系列資料來源:公司公告,公司公眾號,WIND,IDC2022 H1中國加速計算服務器市場報告,平安證券研究所 2022年前三季度,公司實現營業收入527.67億元(+14.10%);實現歸母凈利潤15.46億元(+14.47%);EPS為1.06元?!巴扑]”評級。公司簡介及公司簡介及AIAI賽道相關布局賽道相關布局公司財務狀況公司財務狀況41重點標的紫光股份重點標的紫光股份國內領先國內領先ICTICT基礎設施基礎設施供應商供應商 紫光股份旗下的新華三集團是國內領先的紫光股份旗下的新華三集團是國內領先的ICTICT基礎設施服務提供商基礎設施服務提供商。新華三提供
83、一系列包括數字中心交換機、AI服務器等在內的高端AI算力基建產品,未來將基于“云智原生”戰略,加速AI創新步伐。新華三以軟硬件全站能力賦能新華三以軟硬件全站能力賦能AIAI產業發展。產業發展。在底層硬件算力支撐上,新華三服務器產品可覆蓋從AI訓練到推理的全場景。此前,新華三GPU服務器曾登頂MLPerf國際權威AI基準性能競賽。在2023年上半年,新華三還將發布基于Intel Eagle Stream平臺的GPU服務器R5300 G6。此外,面對AI作業調度、集群管理等難題,新華三推出智能算力中樞,為人工智能提供全場景的算力調度,實現了五維智能的AI開發全流程支持。除復雜的大模型訓練場景,新華
84、三集團也面向廣大AI開發者,免費開放H3C小智AI實驗室,讓用戶體驗真實的AI訓練全流程。公司營收及歸母凈利潤情況公司營收及歸母凈利潤情況新華三智能數字平臺新華三智能數字平臺資料來源:公司公眾號,WIND,平安證券研究所 2022年前三季度,公司實現營業收入538.90億元(+13.16%);實現歸母凈利潤16.40億元(+2.38%);EPS為0.57元?!巴扑]”評級。公司簡介及公司簡介及AIAI賽道相關布局賽道相關布局公司財務狀況公司財務狀況42重點標的中科曙光重點標的中科曙光智能計算領軍企業智能計算領軍企業 中科曙光是我國核心信息基礎設施領軍企業。中科曙光是我國核心信息基礎設施領軍企業。
85、公司在高端計算、存儲、安全、數據中心等領域擁有深厚的技術積淀和領先的市場份額,并充分發揮高端計算優勢,布局智能計算、云計算、大數據等領域的技術研發。公司在公司在AIAI算力領域具有先發優勢。算力領域具有先發優勢。公司在2019年就開始布局AI算力服務,將遍布全國的海量異構計算資源鏈接,形成一體化算力服務網絡。該算力服務網實現了對算力、存儲、網絡以及數據等分布資源的整合,并通過統一的算力服務門戶,根據科學計算、工程計算和智能計算等場景需求,向用戶輸出算力、算法、數據、應用高度協同的一體化資源,降低了AI大模型的訓練與推理成本,讓用戶無需投入大量成本購買硬件設施也可完成AI大模型訓練等復雜計算工作
86、。公司營收及歸母凈利潤情況公司營收及歸母凈利潤情況公司產品矩陣公司產品矩陣資料來源:公司官網,公司公眾號,WIND,平安證券研究所 根據公司2022年度業績快報數據,2022年公司實現營業收入130.09億元(+15.56%);實現歸母凈利潤15.15億元(+30.92%);EPS為1.04元?!巴扑]”評級。公司簡介及公司簡介及AIAI賽道相關布局賽道相關布局公司財務狀況公司財務狀況43重點標的啟明星辰重點標的啟明星辰人工智能安全領域實踐者人工智能安全領域實踐者 中科啟明星辰是國內極具實力的、擁有完全自主知識產權的網絡安全供應商,積極推進網絡安全領域人工智能應用的發展和工程化落地。PanguB
87、otPanguBot安全運營的“安全運營的“ChatGPTChatGPT”實戰?!睂崙?。啟明星辰基于多年對于自然語言理解、自然語言處理、大數據分析、智能化處理方面的智算能力研究基礎上,疊加二十余年在安全領域的技術、數據、運營和研究,于2022年發布了“PanguBot(盤小古)”安全智慧生命體。盤古人工智能平臺盤古人工智能平臺搭建人工智能安全應用的技術基石。搭建人工智能安全應用的技術基石。啟明星辰盤古人工智能平臺(人工智能安全建模和賦能平臺)作為安全運營的人工智能底座,為安全領域的人工智能應用提供了研發運營的一體化環境,能夠實現基于ModelOps和AIOps的人工智能應用快速搭建、模型全生命
88、周期管理和多重賦能。公司營收及歸母凈利潤情況公司營收及歸母凈利潤情況PanguBotPanguBot盤小古盤小古資料來源:公司公告,WIND,平安證券研究所 2022年前三季度,公司實現營業收入21.68億元(+3.39%);實現歸母凈利潤-2.50億元(-1554.73%);EPS為-0.27元?!皬娏彝扑]”評級。公司簡介及公司簡介及AIAI賽道相關布局賽道相關布局公司財務狀況公司財務狀況44附:團隊主要成員附:團隊主要成員TMTTMT團隊團隊行業行業分分析析師師/研究助理研究助理郵箱郵箱資格類型資格類型資格編號資格編號電子徐勇XUYONG投資咨詢資格S1060519090004半導體付強投
89、資咨詢資格S1060520070001徐碧云XUBIYUN一般證券資格S1060121070070計算機閆磊YANLEI投資咨詢資格S106051707000645股票投資評級股票投資評級:強烈推薦(預計6個月內,股價表現強于市場表現20%以上)推薦(預計6個月內,股價表現強于市場表現10%至20%之間)中性(預計6個月內,股價表現相對市場表現在10%之間)回避(預計6個月內,股價表現弱于市場表現10%以上)行業投資評級行業投資評級:強于大市(預計6個月內,行業指數表現強于市場表現5%以上)中性(預計6個月內,行業指數表現相對市場表現在5%之間)弱于大市(預計6個月內,行業指數表現弱于市場表現
90、5%以上)公司聲明及風險提示:公司聲明及風險提示:負責撰寫此報告的分析師(一人或多人)就本研究報告確認:本人具有中國證券業協會授予的證券投資咨詢執業資格。本公司研究報告是針對與公司簽署服務協議的簽約客戶的專屬研究產品,為該類客戶進行投資決策時提供輔助和參考,雙方對權利與義務均有嚴格約定。本公司研究報告僅提供給上述特定客戶,并不面向公眾發布。未經書面授權刊載或者轉發的,本公司將采取維權措施追究其侵權責任。證券市場是一個風險無時不在的市場。您在進行證券交易時存在贏利的可能,也存在虧損的風險。請您務必對此有清醒的認識,認真考慮是否進行證券交易。市場有風險,投資需謹慎。免責條款:免責條款:此報告旨為發
91、給平安證券股份有限公司(以下簡稱“平安證券”)的特定客戶及其他專業人士。未經平安證券事先書面明文批準,不得更改或以任何方式傳送、復印或派發此報告的材料、內容及其復印本予任何其他人。此報告所載資料的來源及觀點的出處皆被平安證券認為可靠,但平安證券不能擔保其準確性或完整性,報告中的信息或所表達觀點不構成所述證券買賣的出價或詢價,報告內容僅供參考。平安證券不對因使用此報告的材料而引致的損失而負上任何責任,除非法律法規有明確規定??蛻舨⒉荒軆H依靠此報告而取代行使獨立判斷。平安證券可發出其它與本報告所載資料不一致及有不同結論的報告。本報告及該等報告反映編寫分析員的不同設想、見解及分析方法。報告所載資料、意見及推測僅反映分析員于發出此報告日期當日的判斷,可隨時更改。此報告所指的證券價格、價值及收入可跌可升。為免生疑問,此報告所載觀點并不代表平安證券的立場。平安證券在法律許可的情況下可能參與此報告所提及的發行商的投資銀行業務或投資其發行的證券。平安證券股份有限公司2023版權所有。保留一切權利。4545