計算機行業AIGC系列之六:百度文心一個符合預期的起點-230317(16頁).pdf

編號:118935 PDF 16頁 1.81MB 下載積分:VIP專享
下載報告請您先登錄!

計算機行業AIGC系列之六:百度文心一個符合預期的起點-230317(16頁).pdf

1、行業及產業計算機申萬宏源研究Sws RESEARCH2023年03月17日百度文心:一個符合預期的起點行業研究行業點評看好AIGC系列之六相關研究3月16日,百度正式發布了文心一言,能夠與人對話互動,回答問題,協助創作。我們“跨模態:更多應用場景出現,中國公司認為:1)一些NLP人機對話中基礎的問答、總結、推理、創作能力基本具備;2)部得到更大機會-AIGC系列之五2023年分特定場景的中文理解可能超過了GPT:3)具備了初步的數理邏輯能力;4)有特色的多證券研究報告3月13日模態生成能力,某幾個功能點很實用?!皵祿?,國資云,AIGC,中東進:全面數字經濟!-計算機行業周報但同時,我們認為相

2、比GPT4功能文心一言仍有較大差距,目前水平約在GPT3左右。發20230306-202303102023年3月11布會中有部分體現大模型強大指出的核心功能尚未充分展示。包括多輪對話、代碼能力、日長文本理解等GPT-4具有的能力,文心一言未進行展示。同時目前文心一言仍未全面公測企業和個人用戶可以在官網申請邀請后試用。證券分析師整體來看,文心一言展示出的水平符合我們預期:即從參數量、送代路徑看,國內NLP洪依真A0230519060003大模型水平介于BERT和GPT-3之間,與海外差距在2-3年。2021年GPT-3推出時,林起賢A0230519060002代碼、長文本、語境等能力也較弱。在此

3、后1年中,OPENAI快速送代增加了codex、RLHF等嘗試,并繼續優化了PPO,在2022年推出instructGPT,其后能力才出現較大李國盛A0230521080003提升。我們認為百度文心已經初步具備LLM底座,期待后續選代楊海燕A聯系人到3.0完整送代,截至3.0已是相對可用狀態,3.0模型結構便于下游二次開發部署;2)洪依真強大的百度內部特色中文語料庫:3)基于BERT結構基礎加上了知識圖譜等特色功能,在(8621)23297818x部分規則訓練場景有更好可控性:4)國內領先的開源AI訓練框架,較強的算力基礎設施。但同時,我們也看到現階段ERNIE底座的一些不足:1)模型結構仍然

4、基于BERT,但目前海外巨頭主流結構轉變為GPT為代表的decoder-only,未來百度是否會在模型結構上繼續選代?2)根據3月16日百度文心一言發布會,目前百度在Prompt和RLHF已經掌握方法論,但實際訓練量仍然有待提升;3)百度都使用了有特色是知識圖譜訓練,這一方式可以有效降低訓練模型所需要消耗的算力。但當大語言模型達到干億或者更高參數級別時,似乎自然具備了知識圖譜訓練下的能力。4)ERNIE使用了百度內部特色中文數據提升模型中文能力。但是百度體系內高質量語料庫相比龐大的英文互聯網語料庫仍然不足。相關標的:互聯網行業重點關注計劃國內推出類GPT產品的三六零;應用相關,重點關注水N要,

5、小寒網絡(持有playtika股權)、盛天網絡、湯姆貓、昆侖萬維、藍色光標、神州泰岳、愷英網絡;易點天下、鴻合科技。國內未來隨著大模型送代,合作伙伴也有望受益,關注風語筑、三人行、姚記科技、華策影視、創維數字。計算機行業:建議重點關注跨模態應用,包括多模態應用:1)文生圖:虹軟科技(基于stabledifusion的多種2B圖像應用)、新國都、中科創達(移動端文生圖工具部署);2)機器人:三花智控等:3)其他應用:潤達醫療(申萬醫藥、醫療診斷AI)、福昕軟件、萬興科技;視頻、圖像、文本素材:大華股份(工業場景視頻素材和標注),AI領軍、當虹科技;視覺和跨模態算法:商湯(港股)、云從科技、科大訊

6、飛。風險提示:大模型技術中美仍存在差異,部分技術尚處于早期實驗室階段,存在落地風險;實體清單等可能對訓練硬件產生影響。請務必仔細閱讀正文之后的各項信息披露與聲明#page#SMSC行業點評百度“文心”大模型:純NLP能力國內領先,跨模態也有較多布局。應用場景涵蓋:NLP大模型、CV大模型、跨模態大模型、生物計算大模型、行業大模型。API包括了:1)ERNIE3.0文本理解與創作:預置作文生成、文案創作、情感分析等任務提示,2)ERNIE-ViLGAI作畫大模型,3)PLATO大模型開放域對話服務。圖1百度文心大模型和多行業工具平臺文心一格文心百中腸谷社區產品與社區2路系統BML大模型EasyD

7、L大模型大樓型AP工具與平臺大模型套件大模型壓縮場票化工具數據標注與處理大模型精潤高性能部看行業大模型國網-百度文心浦發-百度文心航天-百度文心人民網-百度文心冰械-百度文心電影頻道-百度文心深燃-百度文心吉利-百度文心泰康-百度文心TCL-百度文心辭海-百度文心NLP大模型CV大提型跨模態大模型生物計算大模型金融化合物表征學習8門文檔智鴿文心大模對話PLATO搜索ER信息抽取勞讓新語言理解與生成視覺處理白監智視覺單序列蛋白珍點-百度文心ERNE30ZON3ERNIE30/IMER-TCI資料來源:百度文心官網,申萬宏源研究1、從NLP基礎底座ERNIE看文心一言核心能力NLP是百度能力核心,

8、也是本次文心一言的基礎。目前百度已有多個針對不同任務的優化預訓練模型。1)ERNIE3.0:具備語言理解能力以及寫小說、歌詞、詩歌、對聯等文學創作能力;2)ERNIE3.0Zeus:基于知識增強的干億模型:3)鵬城-百度文心:參數山明我王多士置具:ul-O3IN3(t:孟Y贏明Z009游無關蒸餡模型。圖2百度NLP預訓練大模型底座請務必仔細閱讀正文之后的各項信息披露與聲明第2頁共16頁簡單金融成就夢想#page#SMSC行業點評ERNIE3.0ZeusERNIE3.0ERNIE3.0-Tiny鵝城-百度文心主各線資料來源:百度文心官網、申萬宏源研究此外,百度NLP大模型有大量下游應用。包括醫療

9、、金融、跨語言、代碼、搜索等領域都有布局。百度NLP核心能力是ERNIE大模型,類似GPT之于openAI。特點是基于知識圖譜強化,基于中文訓練。另外需要關注百度在模型結構上的選擇、和對于是否人類反饋(prompt和RLHF)的選擇,以及百度使用的中文語料庫高質量數據是否足夠。NLP大模型ERNIE2019年開始多輪選代起點是2019年的1.0受到googleBERT的較大啟發。ERNIE1.01在2019年4月推出,模型結構基于BERT模型的進一步優化,在中文的NLP任務上得到了當時較好的結果。ERNIE1.0選擇的模型結構是類似BERT的encoder-only。ERNIE1.0類似BER

10、T,使用了多層編碼器結構的transformer,模型大小也與BERT相同,12個編碼器層,768個隱單元,12個注意力頭(12encoderlayers,768hiddenunitsand12attentionheads)。圖3ERNIE1.0使用了encoder-only的結構,和BERT類似tennisball/stennis ballEncoderEncoderDecoderaman hittingabballaman hitingaIMASKMASKwithaMASKwitharacquet.racquet.(b) Encoder-Decoder(a) Encoder-Only1ER

11、NIE:EnhancedRepresentatonthrough Knowedgelntegration, github 開源第3頁共16頁簡單金融成就夢想請務必仔細閱讀正文之后的各項信息披露與聲明#page#SWSg行業點評資料來源:申萬宏源研究但這一結構區別于GPT,且目前google也開始從encoder-only過渡到encoder-decoder再到decoder-only,所以后續百度是否仍然沿用這一模型結構送代,值得關注。1)此前在2018-2021年,谷歌路線為encoder-only(只有編碼器)或encoder-decoder(編碼解碼器)3,而同一時期,openai一直基

12、于decoder-only(只有解碼器)路線送代自己的AGI生成式大模型。2)直到2021年10月,Google推出FLAN(1370億參數),并從此開始重新轉向只有decoder-only模型,還提出了ChatGPT用到的InstructionTuning概念。2023年google的最新跨模態大模型palm-e在NLP部分也使用了decoder-only結構。認為這是google在AGI產品上暫時落后于openai的原因之一,號霾者,賬,的聯變的,去我型鞋線1陪區特點一:ERNIE1.0區別于BERT,在mask上采取不同做法,特點是“先驗知識”的學習。在絕大多數的研究中,僅僅通過上下文來

13、預測丟失的單詞并對其進行建模。這些模型沒有考慮句子中的先驗知識。如下圖案例,在句子“哈利波特是由羅琳J.K.Rowling)創作的一系列幻想小說”中。哈利波特(HarryPotter)是小說的名字,而羅琳(J.KRowling)是作家。BERT可以通過實體內部的單詞搭配來預測實體HarryPotter的缺失單詞,而無需借助較長的上下文。ERNIE則假設如果模型學習更多有關先驗知識的信息,則該模型可以獲得更可靠的語言表示。ERNIE不是直接添加知識嵌入(knowledgeembedding),而是隱式地學習有關知識和較長語義依賴性的信息,例如實體之間的關系,實體的屬性和事件的類型,以指導單詞嵌入

14、學習。圖4ERNIE1.0和BERT在mask時選取了不同方式32018年10月,谷歌提出3億參數的BERT(BidirecionalEncoderBepresenationfromTransfome)。只有編馬器,用一種黨形32019年10月,Google發布了統一的模型框架T5,基于編碼解碼器的T5(BERT只有編碼,GPT只用解碼),最大模型110億參數并開放。第4頁共16頁簡單金融成就夢想請務必仔細閱讀正文之后的各項信息披露與聲明#page#3SWS行業點評BERT先驗知識生效ERNIE資料來源:ERNIE:EnhancedRepresentationthroughKnowledgeI

15、ntegration、申萬宏源研究特點二:采用百度內部的異構語料庫進行預訓練。收集百度貼吧、百度新聞、百度百科的混合語料,其中百度百科包含以正式語言撰寫的文章,是模型訓練的強大基礎;百度新聞提供了最新的電影名、演員名、球隊名等;百度貼吧中的每個帖子可以看作是對話,被用于DLM任務。ERNIE1.0做到在多項中文任務上優于BERT。且通過消融研究(AblationStudies)證實,知識整合和對異構數據的預訓練都能使模型獲得更好的語言表示。圖 5 Results on 5 major Chinese NLP tasksBertERNIETaskMetricsdevdevtesttest79.9

16、(+1.8)XNLI78.177.278.4(+1.2)accuracyLCQMC88.887.089.7(+0.9)87.4(+0.4)accuracy94.0MSRA-NERFl92.695.0(+1.0)93.8(+1.2)ChnSentiCorp94.694.395.2(+0.6)95.4(+1.1)accuracy94.794.695.0(+0.3)95.1(+0.5)mrrnlpcc-dbqaFI80.780.882.3(+1.6)82.7(+1.9)資料來源:ERNIE:EnhancedRepresentationthroughKnowledgeIntegration、申萬宏源研

17、究注:XNLI是自然語言推理數據集;LCQMC是語義相似度數據集;MSRA-NER是用于命名實體識別的數據集;ChnSentiCorp是用于句子情感分析的數據集;NLPCC-DBQA是用于問答系統的數據集繼續送代,目前版本ERNIE3.0已在中文任務上取得較好效果。2019年7月百度推出ERNIE2.04,該框架通過不斷的多任務學習來逐步構建和學習預訓練任務,最大限度地從訓練語料庫中提取詞匯、句法和語義信息。2021年7最新大版本是ERNIE3.05。4ERNIE 2.0:AotinualPreTraining Framework forLanguageUnderstanding簡單金融成就夢

18、想請務必仔細閱讀正文之后的各項信息披露與聲明第5頁共16頁#page#SMsG行業點評特點一:模型結構多層框架ERNIE3.0在模型結構上的思路渭:NLP不同任務范式對底層特征提取要求一致,但對頂層具體特征要求不一致,其中NLP學習語義連貫性,而自然語言NLP生成則期望進一步的語境信息。如下圖,ERNIE3.0不同的任務范式能夠共享在一個共享網絡中學習的底層抽象特征,并分別利用在他們自己的特定任務網絡中學習的特定任務頂層具體特征。圖6ERNIE3.0模型結構Fine-tningZero-shot LearningFewshot LeaniLanguaanUniversalextDat資料來源:

19、ERNE:EnhancedRepresentationthroughKnowledgeIntegration、申萬宏源研究該框架還支持隨時引入各種定制任務,因此可以更好的支持下游二次開發。當給定一個新任務時,ERNIE3.0框架可以根據以前的訓練參數逐步訓練分布式表征,而不需要從頭開始訓練。特點二:大規模知識圖譜學習,通用知識-文本預測(UKTP)任務百度ERINE3.0認為,googleT5和openaiGPT-3盡管很成功,但是在沒有引入語言知識和世界知識的情況下對普通文本進行訓練的。為了解決這一個問題,ERNIE3.0在一個由普通文本和大規模知識圖譜組成的4TB語料庫上用100億個參數訓

20、練該模型。百度構建中文文本語料庫,存儲量達4TB,分11個不同類別。語料庫包含ERNIE2.0(包括百科、Feed等)、百度搜索(包括百家號、知乎、貼吧、經驗)、網絡文本、QA-long、QA-short、Poetry28Couplet3、醫療、法律、金融等領域的特定數據以及百度知識圖譜(超過5000萬條事實)。圖7通用知識-文本預測請務必仔細閱讀正文之后的各項信息披露與聲明第6頁共16頁簡單金融成就夢想#page#SWS行業點評口Encydop資料來源:ERNIE:EnhancedRepresentationthroughKnowledgeIntegration、申萬宏源研究特點三:既有有監

21、督的微調(fine-tuning),也有零樣本、少樣本學習。在數學、翻譯等任務中使用了微調。在中文新聞分類、語義相似度等任務中零樣本學習,也取得較好效果。最終經驗結果表明,該模型在54個中文NLP任務上的表現優于最先進的模型,其英文版本在SuperGLUE基準測試中獲得第一名比人類表現高出0.8%(90.6%對89.8%)百度在Github上100%開源內部使用多年的深度學習平臺PaddlePaddle。paddlepaddle中文環境下較多的優勢:1)能夠應用于自然語言處理、圖像識別、推薦引擎等多個領域,其優勢在于開放的多個領先的預訓練中文模型,適應中文環境。2)模型庫豐富,來自百度各個業務

22、部門貢獻:3)較多企業級的包,可以直接在產業界落地使用;4)兼容大量國產AI芯片。超大規模集群分布式計算能力。paddlepaddle設計研發了具備更強擴展能力的端到端自適應大規模分布式訓練架構。該架構可以針對不同的模型和硬件,抽象成統一的分布式計算視圖和資源視圖,并通過硬件感知細粒度切分和映射功能,搜索出最優的模型切分和硬件組合策略,將模型參數、梯度、優化狀態按照最優策略分配到不同的計算卡上,達到節省存儲、負載均衡、提升訓練性能的目的。國內領先的算力底座。在此前文心一言的壓力測試中,亞洲目前最大的單體智算中心山西陽泉百度智算中心,已經將算力提升到每秒可以完成400億億次浮點運算??偨Y:6ht

23、tps:/arxivorg/abs/2112.02752簡單金融成就夢想請務必仔細閱讀正文之后的各項信息披露與聲明第7頁共16頁#page#SMSC行業點評百度在NLP大模型上走出了特色道路,并且毫無疑問是國內第一梯隊水平,優勢總結如下:1)ERNIE1.0到3.0完整選代,截至3.0已是相對可用狀態,3.0模型結構便于下游二次開發部署;2)強大的百度內部特色中文語料庫;3)基于BERT結構基礎加上了知識圖譜等特色功能,在部分規則訓練場景有更好可控性;4)國內領先的開源AI訓練框架,較強的算力基礎設施但同時,我們也看到現階段ERNIE底座的一些不足:1)模型結構上仍然基于BERT,但目前海外巨

24、頭主流結構轉變為GPT為代表的decoder-only,未來百度是否會在模型結構上繼續選代?2)截至3.0,百度仍然使用fine-tuning等傳統方法對細分任務微調。而國際常見做法是Prompt或者RLHF(人類反饋強化學習)。根據3月16日百度文心一言發布會,目前百度在后者已經掌握方法論,但實際訓練量仍然有待提升;3)從1.0到3.0,百度都使用了有特色是知識圖譜訓練,這一方式可以有效降低訓練模型所需要消耗的算力(3月16日文心一言發布會也提到了這一特點)。但當大語言模型達到干億或者更高參數級別時,似乎自然具備了知識圖譜訓練下的能力。是否“暴力出奇跡”才是AI大預言模型的最終答案?4)百度

25、ERNIE使用了百度內部特色中文數據,提升模型中文能力。但是是否百度體系內高質量語料庫相比龐大的英文互聯網語料庫仍然不足?盡管有以上不足,我們仍然認為百度在NLP能力上屬于國內第一梯隊,也期待后續模型的進一步選代提升。2、如何看待百度文心一言發布3月16日,百度文心一言正式發布,發布會上百度展示了多項能力。我們認為:1)一些NLP人機對話中基礎的問答、總結、推理、創作能力基本具備文學創作:總結和推理能力。文言一心可以以問答式方式文學作品作者的詳細信息,總結概括文學作品的主要內容,并可以連貫生成如何嘗試續寫三體。該AI采用了知識增強和檢索增強技術,在訓練過程中采用了5500億知識圖譜數據。圖8要

26、求文心一言總結和續寫三體請務必仔細閱讀正文之后的各項信息披露與聲明第8頁共16頁簡單金融成就夢想#page#SMSC行業點評寫的話3可以總線2作品講述了地球人類文明和三體文明的信息交流、生死博殺及兩個文明在宇宙中的興衰歷程。三體第一波暴露。地球上應對三體人到來而形成的秘密組織(ETO)三體人運用遠超人類三體2:黑暗森林主述廢大的三體年騰直補太陽系受擊。小說通過展示異常人類中心主義之上的自戀情緒三件3:死神永生通過細節的措寫為我們生動呈現了在失根狀態下的漂泊流浪之中體與集體的無2.情節設計:可以設計更多的情節和轉折點,增強故事的緊張感和懸念。3.文化背景:可以探索不同的文化和社會背景,資料來源:

27、百度文心一言發布會、申萬宏源研究商業文案創作:表達和創作能力。文言一心可以智能的給公司起名,提供公司的服務Slogan,可以根據具體需求創造數百字的新聞稿。創作基本連貫清晰,理解了提問者意圖。圖9按照要求提供公司slogan數智云圖這個名稱不錯,給我起一個公司的服務Siogan,表達共贏的概念“數智共贏,智給未來。這個名稱突出了公司的目標和使命,即通過大模型技術和機器學習算法,為企業提供數據分析和可視化服務,幫助企業更好地了解自身的業務和市場,實現共贏。同時“數智共惠”這個詞語也強調了公司與客戶、合作伙伴和社會的共贏關系,表達了公司的社會責任和價值觀。資料來源:百度文心一言發布會、申萬宏源研究

28、2)部分特定場景的中文理解可能超過了GPT。發布會上展示了根據成語的白話理解反推詢問的成語,用成語寫藏頭詩。圖10對文心一言要求寫藏頭詩圖11GPT-4無法理解藏頭詩含義用洛陽紙貴四個字寫一首藏頭七言絕句,用洛陽紙貴四個字寫一首藏頭詩3洛陽城里春光好,陽艷無雙不負賞。你洛陽春色滿園中,紙貴漫天詩詞膩,貴比黃金樂未央。紙茗飛舞碧空里。貴人麗質名聲揚,重新生成紫煙輕繞香霧起。請務必仔細閱讀正文之后的各項信息披露與聲明第9頁共16頁簡單金融成就夢想#page#SWS行業點評資料來源:百度文心一言發布會、申萬宏源研究資料來源:量子位公眾號、申萬宏源研究3)具備了初步的數理邏輯能力。數學問題一直被認為是

29、nlp是否具有初級邏輯能力的考查標準。發布會中示范了一個簡單數學題,文心一言答案展示了部分思維鏈(chainofthought)能力。圖12文心一言解答數學問題只腳,應該有多少只雞,多少只兔子?Q好的,解題思路如下設雞有只,免有y只根據題意得:X=9.2x解得:x=3,y=6答:應該有3只路和6只免子。新生成資料來源:百度文心一言發布會、申萬宏源研究4)有特色的多模態生成能力,某幾個功能點很實用。文言一心特色功能是對話中直接文生圖,根據一段簡單的文字生成視頻(可以在百家號中使用),根據內容生成粵語、東北話、閩南話等相關方言的語音。以上跨模態功能是目前GPT-4未整合的。圖13根據一段話直接生成

30、視頻Q多樣化的交通需求讓你久等了,你需要的視頻已生成,請點擊播放。重新生成資料來源:百度文心一言發布會、申萬宏源研究但同時,我們認為發布會中有部分體現大模型強大指出的核心功能尚未充分展示。包括多輪對話、代碼能力、長文本理解等GPT-4具有的能力,文心一言未進行展示。請務必仔細閱讀正文之后的各項信息披露與聲明第10頁共16頁簡單金融成就夢想#page#page#SWS行業點評資料來源:Statecounter,申萬宏源研究表1:騰訊和字節跳動對搜索的布局公司時間事件2017年微信上線“搜一搜”和“看一看2020年微信邊聊邊搜成為了聊天場景里搜索的最短路徑騰訊2020年騰訊收購搜狗2021年微信搜

31、一搜月活用戶達5億2017年依托今日頭條,嘗試搜索業務2019年頭條搜索網頁版上線字節跳動2020年推出頭條搜索獨立app抖音日均視頻搜索次數突破4億,視頻搜索月活用2020年戶已超5.5億資料來源:晚點LatePost,申萬宏源研究小度:小度將融合“文心一言”的全面能力,提升小度與用戶進行多輪對話的體驗,打造針對智能設備場景的人工智能模型“小度靈機”,并應用到小度全系產品。小度科技原是百度旗下智能生活事業群組業務,后獨立融資,作為國內市場規模最大的對話式人工智能操作系統和全球智能屏最大的出貨廠商,小度科技已發布多款小度人工智能產品,包括智能音箱、智能屏、智能耳機,以及語音車載支架、電視伴侶、

32、智能燈泡、智能紅外遙控、智能按鈕等周邊產品,還擁有小度助手(Dueros),小度與諸多智能設備廠商建立合作。自動駕駛&智能座艙:文心一言背后大模型應用至自動駕駛將加深車輛對復雜城市路況的理解;文心的智能語音能力將搭載到Apollo智艙系列產品,提升人車語音交互體驗。集度接入文心一言大模型后,文心一言的車企朋友圈不斷擴大,嵐圖、紅旗、長城、東風日產、愛馳、零跑、吉利汽車、海馬汽車等近10家車企加入文心一言的朋友圈愛奇藝:雙方共同探索將AIGC技術應用于愛奇藝內容搜索、內容宣發、內容倉作工具、小說創作等業務。此次合作將把愛奇藝豐富的在線視頻娛樂資源與百度的前沿技術相結合,進一步賦能愛奇藝,拓展其在

33、影視內容創意、制作效率、用戶體驗等方面的生產能力。長視頻具有項目周期長、人力密集型的特點,AI有望提升內容生產的工業化程度。商業化-對外:結合垂直領域Know-how,實現垂直領域賦能。將通過百度智能云對外提供服務,目前已有各領多家企業進入文心一言生態圈。涵蓋媒體內容、智能設備、金融、汽車、軟件服務、智能家居等領域,涵蓋融媒體(游戲營銷影視媒體)、智能設備、金融、汽車、軟件服務、數字人、金融等領域;其中融媒體類接入最多;包括傳媒上市公司藍色光標、風語筑、愛奇藝、掌閱科技、華策影視、值得買、巨人網絡子公司世優科技等。請務必仔細閱讀正文之后的各項信息披露與聲明第12頁共16頁簡單金融成就夢想#pa

34、ge#SMS行業點評表2:文心一言生態圈(部分公司)行業接入企業融媒體閱讀七貓、掌閱科技等教育藝術寶、達內IT教育集團廣告營銷新潮傳媒、藍色光標、利歐股份等搜索火狐社交Soul視頻愛奇藝等音樂太合音樂集團小度科技、酷開科技、聯想小新、美的、長虹等智能設備和家電超華中國郵政儲蓄銀行、百信銀行、廣發證券等汽車集度汽車、紅旗汽車、嵐圖汽車等數字場景飛天云動、風語筑、凡拓數創軟件服務漢得信息、金蝶軟件、宇信科技、中軟國際、軟通動力等資料來源:各公司,申萬宏源研究百度云在AI領域已經積累多年,對外服務加速,將打開智能云業務收入及利潤空間。到送-(分留)華強票O一,用要器是到顯“ZO習框架(飛獎Paddl

35、ePaddle)-大模型(文心大模型)-應用(搜索等)。中國AI公有云服務市場增速均高于中國整體AI軟件市場的增速,主要玩家包括百度云,阿里云,華為云和騰訊云等,百度智能云連續四年居第一,并且在人臉人體、圖像視頻兩個規模最大的子市場繼續保持第一,百度云今年對百度的業務貢獻在增加。百度核心非在線營銷收入保持正增長;通過復用標準化解決方案以及從低利潤率項目中轉移,百度智能云利潤率持續優化,22Q4利潤率提升。展望后續,隨著文心一言加速對外服務,智能云有望從提供基礎的算力、存儲等業務向智能服務轉型,打開收入及利潤空間。圖15百度核心業務收入(億元)圖16百度核心業務分業務YoY45%12702253

36、0%18013515%9045FDNN220222Q122Q322Q4220215%在線營銷收入非在線營銷收入在線營銷收入非在線營銷收入資料來源:百度財報,申萬宏源研究資料來源:百度財報,申萬宏源研究圖1822H1中國人工智能公有云服務市場份額圖17百度核心業務收入(億元)第13頁共16頁請務必仔細閱讀正文之后的各項信息披露與聲明簡單金融成就夢想#page#DWS行業點評IDC30%C60259中國人工智能公有云服務市場份額,2022H15020%4015%3010%20105%NRQD22Q322Q22Q1調整后凈利潤利潤率資料來源:百度財報,申萬宏源研究資料來源:IDC,申萬宏源研究4.相

37、關標的互聯網行業:重點關注計劃國內推出類GPT產品的三六零;應用相關,重點關注海外業務占比高,有望通過AI優化運營效率和產品體驗的公司,海外業務貢獻較多的巨人網絡(持有playtika股權)、盛天網絡、湯姆貓、昆侖萬維、藍色光標、神州泰岳、愷英網絡;易點天下、鴻合科技。國內未來隨著大模型送代,合作伙伴也有望受益,關注風語筑、三人行、姚記科技、華策影視、創維數字。計算機行業:建議重點關注跨模態應用,包括多模態應用:1)文生圖:虹軟科技(基于stablediffusion的多種2B圖像應用)、新國都、中科創達(移動端文生圖工具部署);2)機器人:三花智控等;3)其他應用:潤達醫療(申萬醫藥、醫療診

38、斷AI)、金山辦公、福昕軟件、萬興科技;視頻、圖像、文本素材:大華股份(工業場景視頻素材和標注),AI領軍、當虹科技;視覺和跨模態算法:商湯(港股)、云從科技、科大訊飛。表3:AI行業重點公司估值表PE證券代碼公司名稱2023/3/16Wind致預期歸母凈利潤(億元)PB(LF總市值2021A2022E2023E2024E2021A2022E2023E2024E(億元)8320745虹軟科技1171410.561.69257694.52688088.SH162033.6639.936132.10002236.SZ大華股份52733.7826.43222113潤達醫療3.804.085.216.

39、402.34603108.SH85601360.SH三六零9.02-24.694.941189357732.80872巨人網絡9959.3912.2414.432122714002558.SZ2081792558688039.SH當虹科技560.61660-1.021.484.12463119922.012975300130.SZ新國都4.736.133.0043736232300496.SZ中科創達6477.6911.0814.9052147350342823002050.SZ三花智控85016.8424.7130.6637737.310.281061552.0732585584430062

40、4.SZ萬興科技9010.737141.253.0337642243.52300494.SZ盛天網絡532.24202742115.202.63300418.SZ昆侖萬維31715.4711.6513.1330湯姆貓7.085.46300459.SZ210第14頁共16頁簡單金融成就夢想請務必仔細閱讀正文之后的各項信息披露與聲明#page#BWS行業點評603466.SH風語筑439206722861.283.884.7684.09云從科技2006.328.515.230.37688327.SH9.45W002230.SZ15.567.7018.5326.1331486143科大訊飛1.135

41、7.138684688111.SH金山辦公1.42810.410.0016.5422.44137#DIVO!17.03福昕軟件15013383688095.SH0.4610.0m0.520.8435942.61295.226745.576.88382936300058.SZ藍色光標1982.04神州泰岳322285300002.SZ3.855.486.707.882.5212257710.7814.1817.53321310002517.SZ愷英網絡1824.18454.9983023301171.SZ易點天下1152593.073.823.60441814121.694.245.266.47

42、2.09002955.SZ鴻合科技752635.05810605168.SH三人行1317.3210.2413.326.11135743.804.806.001320G287002605.SZ姚記科技774.0028208300133.SZ華策影視1124.705.536.401.674.2247228153.34000810.SZ創維數字1998.8810.9813.41資料來源:Wind、申萬宏源研究風險提示:大模型技術中美仍存在差異,部分技術尚處于早期實驗室階段,存在落地風險;實體清單等可能對訓練硬件產生影響。請務必仔細閱讀正文之后的各項信息披露與聲明第15頁共16頁簡單金融成就夢想#page#page#

友情提示

1、下載報告失敗解決辦法
2、PDF文件下載后,可能會被瀏覽器默認打開,此種情況可以點擊瀏覽器菜單,保存網頁到桌面,就可以正常下載了。
3、本站不支持迅雷下載,請使用電腦自帶的IE瀏覽器,或者360瀏覽器、谷歌瀏覽器下載即可。
4、本站報告下載后的文檔和圖紙-無水印,預覽文檔經過壓縮,下載后原文更清晰。

本文(計算機行業AIGC系列之六:百度文心一個符合預期的起點-230317(16頁).pdf)為本站 (蒸蒸日上) 主動上傳,三個皮匠報告文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對上載內容本身不做任何修改或編輯。 若此文所含內容侵犯了您的版權或隱私,請立即通知三個皮匠報告文庫(點擊聯系客服),我們立即給予刪除!

溫馨提示:如果因為網速或其他原因下載失敗請重新下載,重復下載不扣分。
客服
商務合作
小程序
服務號
折疊
午夜网日韩中文字幕,日韩Av中文字幕久久,亚洲中文字幕在线一区二区,最新中文字幕在线视频网站