《互聯網行業GPT已拉開AIGC技術革命序幕:海外為鑒看國內大模型與終端應用投資機會-230505(52頁).pdf》由會員分享,可在線閱讀,更多相關《互聯網行業GPT已拉開AIGC技術革命序幕:海外為鑒看國內大模型與終端應用投資機會-230505(52頁).pdf(52頁珍藏版)》請在三個皮匠報告上搜索。
1、國信證券證券研究報告一2023年05月05日GUOSENSECURITIEGPT已拉開AIGC技術革命序幕海外為鑒,看國內大模型與終端應用投資機會行業研究海外市場專題互聯網互聯網投資評級:超配(維持評級)證券分析師:謝琦021-S0980520080008#page#本報告的重點國信證券GUOSENSECURITIE海外發展:現階段海外大模型發展領先,GPT4已呈現出色的內容生成與交互能力,Google、Meta等也已發布相關產品,預計將帶來可觀的增量市場與效率提升,已給相關應用(微軟、彭博等)帶來巨大變化,預計相似的變革也將在國內發生。國內大模型:國內成熟大模型落地具備較好的條件:業內已有相
2、對成熟的方法路徑(Transformer等)、大模型(GPT2、Meta-LLaMA等)及相關數據基礎,而芯片短期看并未成為發展限制,百度、阿里、字節、華為、騰訊等巨頭均加速布局,百度、阿里、商湯發布大模型且選代進展迅速,預計國內GPT3級模型或在不久的將來出現,對國內產業鏈形成巨大影響。應用場景展望:考慮現階段國內大模型未完全成熟,因此更多是借鑒海外路徑演繹國內發展。目前看海外應用端已經百花齊放,辦公、搜索、教育、對話社交、游戲、金融、電商、圖片視頻等領域已出現大量產品創新,GPTplugin插件推出后相關產品和場景有望進一步擴展。投資策略1)大模型環節:具備哪些豪賦的企業更可能在大模型競爭
3、中脫穎而出?我們認為,大模型整體來說還是大廠的生意,綜合算力資源、算法人才、數據積累及產品先發四個核心要素,目前百度領先,關注字節、阿里、華為、騰訊等企業進展。2)應用場景環節:具備哪些察賦的企業能夠在技術變革下守住基本盤并更上一層樓,而哪些企業可能面臨被替代的風險?我們認為,有以下票賦的企業:原有產品場景壁壘高,且受益于AIGC出色的信息獲取、內容生成能力:2有獨特垂直的高質量數據:有用戶粘性與深度:本身有較強的AI技術研發與落地能力:加持自有大模型或外部模型API有望上臺階,關注騰訊、阿里、百度,以及游戲、金融、教育、辦公等垂直領域有高質量數據與場景的優質企業。反之,如無上述烹賦,或面臨被
4、大模型降維競爭風險。風險因素:技術進展低于預期,競爭超預期,內容、數據與技術監管風險,中美科技競爭風險#page#目錄國信證券GUOSENSECURTIE1.GPT帶動AIGC技術革命,驅動海外互聯網軟件產業巨大變革1)GPT的發展背景:全球AI產業厚積薄發,OpenAI技術突破2)AIGC技術已對海外互聯網軟件產業鏈帶來巨大變化3)展望:多模態應用、GPT插件等有望帶來更大的變革2.核心變量大模型:國內大廠加速布局,成熟大模型落地前景可期1)從GPT看大模型的核心競爭要素:算力、算法、數據、生態2)從中美差異看國內大模型發展路線:國內大廠加緊追趕,模型與應用齊頭并進3.應用展望:從海外路徑看
5、國內發展1)海外應用:AIGC應用百花齊放案例:辦公寫作、搜索、教育、對話社交、游戲、金融、電商、圖片視頻2)海外經驗:“AI賦能”or“被AI替代”?3)國內應用:有待成熟大模型落地,巨大效率提升下機遇與挑戰并存國內頭部互聯網企業應用落地場景分析4.投資策略與重點標的1)大模型及相關生態:百度領先,關注阿里、騰訊、字節、華為等2)垂直應用領域:海外關注微軟,國內關注騰訊、阿里、百度及垂直領域有高質量數據與場景的優質企業5.風險因素:技術進展低于預期,競爭超預期,內容、數據與技術監管風險,中美科技競爭風險#page#國信證券1.1GPT:自然語言處理領域突破性創新,拉開生產力革命序幕GUOSE
6、NSECURTIEChatGPT引發巨大關注。2022年11月30日,0penAI推出人工智能大語言模型產品ChatGPT,能根據用戶的文本輸入,產生相應的智能回答,能進行多輪對話與反饋,支持各領域知識場景與多語言內容,其綜合語言處理能力接近真人而處理效率顯著更高,ChatGPT產品發布以來引發巨大關注,上線兩個月后月活突破1億,日活用戶超1200萬。GPT相關技術有望拉開文本信息處理的生產效率革命。語言文本處理是人類世界最重要的工作內容之一,每年全球投入大量的人員和資源用于處理各種語言文本以協調社會分工,如果AI能夠協助人類大幅提升語言文本處理效率,將帶來巨大的生產力效率提升圖:消費級應用達
7、到一億用戶花費時長圖:ChatGPT產品功能展示消費級應用1億用戶達成時長(月)2ChatGPT山號新以下是根據這些公司的主要業務將它們分類的建議:8TikTok1.Apple-電子消費品和技術公司30InstagramApple是一家主要從事電子消費品和技術的公司,其產品線包括IPhone、IPad、Mac電腦、AppleWatch等。此外,Apple還提供軟件和服務,如macOs、iOS、iCloud等。41Pinterest2.Facebook社交爆體和技術公司Facebook是一家以社交媒體平臺而聞名的技術公司。它的核心產品是Facebook社交網55Spotify絡,但它還潤有其他社
8、交媒體應用程序,如Instagram、WhatsApp和Messenger.此61外,Facebook在虛擬現實領域通過其子公司Oculus進行了投資。Telegram3.FedEx-快遞和物流公司Uber0FedEx是一家主要從事快遞和物流服務的公司。它提供國內和國際的快遞、貨運和供應鏈管理服務。FedEx通過其庭大的運輸網絡為全球各地的客戶提供快速、可靠的運輸服務。Google Transalte78資料來源:Similarweb資料來源:ChatGPT#page#國信證券1.1發展驅動:底層技術持續積累形成質變,驅動AI產品突破GUOSENSECURTIE算力、數據、模型方法等底層要素的
9、持續進步是ChatGPT發展的重要基礎與驅動算力提升:大規模深度學習模型的參數和數據量大幅提升,如GPT-3大模型包含1750億參數,如果采用單片V100需要訓練超過300年。而近年AI算力技術持續進步是大模型發展重要先決條件,英偉達CEO表示過去十年,通過提出新處理器、新系統、新互連、新框架和算法,并與數據科學家、AI研究人員合作開發新模型,已使大語言模型的處理速度提高100萬倍(英偉達財報會議)。數據積累:隨著數字時代的到來,生成數據的工具和軟件愈發普遍,數據總量呈指數增長,可供AI訓練的數據質量和數量均有很大提升,ChaGPT訓練數據超過45TB。模型方法:GPT-1、GPT-2、GPT
10、-3版本持續優化,送代到GPT3.5(ChatGPT的模型)已在自然語言理解和內容生成上取得極大性能提升,后續GPT4在參數、語料與能力進一步提升。圖:GPT大模型在文字生產的出色表現,標志著生成式AI(AIGC)的巨大進步時序記憶性:可以連續多輪對話,大幅提升了對人類可糾偏:模型采用teachermodel+強化學習,用戶意圖的理解;主動承認錯誤和無法回答的問題,更正答案;準確性的提升:根據GPT-4TechnicalReport持續選代:可以利用戶數據持續訓練,隨著規模在語言基準測評中平均準確率超過80%,在所有增長,模型性能穩定提升;測試上都優于現有的LM,超過SOTA水平通用性:模型訓
11、練是通用的,可以適用于不同的訓練速度快:利用Transformer可以并行訓練任務;資料來源:國信證券研究部整理,OpenAI官網,GPT-4TechnicalReportOpenAl發事項下所石西號#page#國信證券1.2AIGC產業鏈概覽:算力層、大模型層、細分模型/終端應用GUOSENSECURITE產業鏈角度,可分為算力層、大模型與垂直細分模型層、終端應用:1)算力層、大模型層技術門檻高、規模效應強,預計主要集中于頭部公司(芯片、互聯網云服務巨頭);2)應用層重細分垂直行業與場景、數據,強調AI技術對細分領域的賦能提升,有望出現有更多的垂類企業機會。算力層:(nteDGoogle2N
12、VIDIAAMDAAAzureaws計算資源,AI芯片、云計算通信、技術支持服務等OpenAIODeepMindGooaleBrainOMetaANTHROPICLLaMA(語言)BERT(多模態)GPT-4(多模態)Gato(多模態)SAM(圖片)LaMDA(話言)大模型層CeonsliEonAAghaFoldz生物)Maka-A-Video(視頻)CUIP(多模態PLaM(語言)騰訊云大模型以及深度學習框架DALL-E(圖片)nagen(圖片)細分模型層:MuscLM(音頻)專業或者垂直細分領域模型,比如金融、教育、醫百度云安全圖片音頻Al for自然語言機器語言智能控制療、法律等,有獨特
13、數據、場景優勢的公司代碼生成圖片生成音頻識別機器人數據安全NLP開發science模型安全字節云(搜索引擎)代碼輔助(toc新玩音視頻剪輯自動駕駛醫學可控生成RPA交互法/tob游邊綠計算文案生成音視頻生成物理生成Avatar生成可解釋性(小說/電商/新戲、電商)化學終端應用層:聞/法律)圖片識別材料科學終端應用層,可運用與各個3D建模生成對話機器人模態場景以及各個行業,實現Al+X(銷售客服/情感陪伴)#page#國信證券1.2AIGC海外應用百花齊放、玩家眾多、變化巨大GUOSENSECURITIE圖片生成視頻3runwalpacatavusRepseFijourtoyDOOpenArtl
14、exicaQFLikicraiyonQsyntheslaColossyanPLAYOROUNDubvorartbreeKREAAMovioHour OnePhotoRsndo虛擬助手/角色文本類(文案生成、寫作助手)CharactorAAndialeoncopyaiO JasperwtsocPonzufraseOASISQuickchatADUNGECNmem BerthaaiMiycopysmlthOCKEYSanywordlotterdropHypotenuse AIcickable設計品牌)(營銷ODiagramPIDzOSALTDLAVENDERsimplifiedOmneky2Pep
15、pertype.CONTENDAVIZCOMeCULTUREUoBpry5mrwiter.lRytrSubtxCohereLeCRESTAPolyvReachwoLxeAKAKAIZANPUIXOXINTERIORArogio.aiCALAoutplayNovelAIW和TBCypawiseCreale代碼(代碼檢查、代碼生成)音頻類(音色模仿、音樂生成)GitHubCopotDebuild品OMinuitybroadnRESEMB.ASPLASHXinta5680到StenographyWELLSAIDoreplitGtwiGEnzymeHSONIFYboomyptpodcast.qiA28
16、FtobnineOdurableREPLICAVNVOICEMODSListnrQFliki7seekoxcolformulabotMUTABLEAI#page#國信證券1.3chatGPT插件(Plugin)功能:門戶、平臺與生態GUOSENSECURITIE插件使ChatGPT能夠連接到第三方應用程序交互:3月23日,OpenAI在官網宣布推出ChatGPT插件(Plugin)功能,同時開源知識庫插件源代碼,從而增強ChatGPT的功能并允許執行更廣泛的操作。第一批chatGPT插件包括:本地生活:Expedia(旅行酒店)、KAYAK(航班、住宿和租車)、OpenTable(就餐);電商
17、:FiscaINote(市場數據集)、Instacart(本地訂貨)、Klarna(線上比價)、Shop(購物);教育:Speak(學外語)、Wolfram(數學)、MiloFamilyAI(家庭教育);辦公:Zapier(郵件、文檔);ChatGPT就能夠理解如何調用、何時調用:ChatGPT調用插件只需使用者描述自己開發插件的功能,GPT可以自行調用。ChatGPT插件(Plugin)功能從開發角度類似于APPStore,越過操作系統實現生態建設,同時被下游反哺。使用角度更像微信小程序,目前不需要界面與交互過程切換(插件屬性),有望形成新的流量入口。插件安裝流程插件一覽調用插件流程口AEP
18、HAEnabled plugiModel:PLooking toeatvegan foodinSanPluginsNoplugins enabledFranciscothisweekend.CouldyougetmeonegreatrestaurantsuggestionforSaturday anda simple recipe for Sunday(justthe ingredients)?PleasecalculatethecaloriesforthorecipeusingWolframAlpha.Finaly ordertheingredientson Instacar8ChatGPT
19、TUsedOpenTable資料來源:微信公眾號”差評36#page#國信證券1.3ChatGPT的隱藏的插件:產業和產品形態變革剛拉開序幕GUOSENSECURITIE官方還托管了兩個插件:一個web瀏覽器和一個代碼解釋器,還有用戶在安裝信息還發現了隱藏的后續插件功能,如:辦公:SendEmail直接通過ChatGPT發送郵件,TOD0:設置和管理任務列表;。電商:CryptoPrices查詢Crypto價格;娛樂:DAN可以給ChatGPT賦子個性(ChatGPT陪聊)產品效果olremAphaLangChainDocsuddoueu蜜K.dEmailv2sal1oo1TODOPlugin
20、(o.BA.5tTOTOTODOPlugnTODODOD0R#page#國信證券1.3chatGPT:自然語言只是第一步,多模態后能力的涌現GUOSENSECURITIE開啟高維信息的解讀是新能力涌現的重要途經:GPT4出現多模態標志著計算機技術領域到其他領域真正的范式轉變。人類的認知和知識結構80%靠視覺在具象的過程中理解事物,例如:分子結構、機械聯動、邏輯關系、社交網絡等。不同于低維度的流數據,圖結構表示的信息通常是對環境的深層次挖掘和凝練,其內容可以支持更長周期的預測,無論是對于人類還是其他人工智能體來說,掌握這類信息具有更重大的意義,代表系統深度掌握“推理”的概念。ChatGPT 3.
21、5ChatGPT4展望ChatGPTN簡單任務略低于state-of-包括在許多領域上超過現有的state-of-the-art(SOTA)的模型在事實性任務上基本不會出錯,并附有資料來源可進行(SOTA)的模型;測試的26種語言的24種中,GPT-4優于GPT-3.5和其他大語言模型cross check(Chinchilla、PaLM)的英語語言性能復雜任務司法考試中,GPT3.5只能擊更可靠、更有創意,并且能夠處理更細微的指令,邏輯推理能力大幅提升:各種在絕大多數領域(計算、邏輯、推理、批判性思維、實敗10%左右的法學生:踐)能力強于人類,在垂直細分領域達到頂級專家水平:考生前10%;模
22、態視覺輸入能力VisualInputs:理解圖片、圖片內容總結、圖片問題回答、解釋支持所有模態(文本、代碼、圖片、音頻、視頻)的交圖片、圖片生成代碼叉輸入輸出交互性只可以進行人類的對棄操作GPT-4在不同風格和角色模仿上,完成度相當高。更加人性化可以模仿任何性格特征井不被發現“冒充”記憶性token限制為4.096個,大約可處理超過25.000字的文本。最大token數量為32.768,相當于64.000個單詞具備長期記憶性,但是懂得“遺忘”掉不重要的信息以8.000個單詞及整合重復信息來減少資源使用準確性不會胡說八道,對于模稀任務懂得引導或反駁來保證正有一定事實式錯誤,幻覺,邏輯能力大幅提升
23、,顯著減少幻覺。在九類事實性評估測試中準確得分比GPT-也就是一本正經胡說八道。確3.5高40%:安全性GPT-4比GPT-3.5模型在有害信息的輸出上少15%:與GPT-3.5相比,我們將模型響不會超出在約束的邊界,表現滴水不漏,但是內在黑箱的可解釋性會更差應不允許內容請求的趨勢降低了82號。學習性基礎模型+RLHF(人工反饋強有目的地自主學習,會自己創造數據,參與與真實世界化學習)使用相同的方法訓練的模型進行推斷,但使用的計算量為1/10000的交互來實踐驗證擴展性有一定的API接口充分的API接口,開放播伴可擴展到任意網絡終端并且擁有與真實世界交互的實體資料來源:國信證券研究部整理,Op
24、enAI官網,GPT-4TechnicalReportOpenAl#page#目錄國信證券GUOSENSECURTIE1.GPT帶動AIGC技術革命,驅動海外互聯網軟件產業巨大變革1)GPT的發展背景:全球AI產業厚積薄發,OpenAI技術突破2)AIGC技術已對海外互聯網軟件產業鏈帶來巨大變化3)展望:多模態應用、GPT插件等有望帶來更大的變革2.核心變量大模型:國內大廠加速布局,成熟大模型落地前景可期1)從GPT看大模型的核心競爭要素:算力、算法、數據、生態2)從中美差異看國內大模型發展路線:國內大廠加緊追趕,模型與應用齊頭并進3.應用展望:從海外路徑看國內發展1)海外應用:AIGC應用百
25、花齊放案例:辦公寫作、搜索、教育、對話社交、游戲、金融、電商、圖片視頻2)海外經驗:“AI賦能”or“被AI替代”?3)國內應用:有待成熟大模型落地,巨大效率提升下機遇與挑戰并存國內頭部互聯網企業應用落地場景分析4.投資策略與重點標的1)大模型及相關生態:百度領先,關注阿里、騰訊、字節、華為等2)垂直應用領域:海外關注微軟,國內關注騰訊、阿里、百度及垂直領域有高質量數據與場景的優質企業5.風險因素:技術進展低于預期,競爭超預期,內容、數據與技術監管風險,中美科技競爭風險#page#國信證券2.1研究的切入點大模型:AIGC產業鏈發展的前提與核心要素GUOSENSECURITE功能相對成熟的大模
26、型是下游應用的基礎和前提,現階段海外GPT模型驅動應用快速發展,國內等待成熟大模型落地短期內現階段中長期大模型能力邊界與適用性還以GPT為代表的基礎模隨著大模型的能力和發展速在不斷的拓寬,不僅在送代速度型作為第一驅動帶領了整度趨穩,大模型的競爭格局、優上領先一眾小模型,還呈現出下個AGI產業鏈的發展,作為劣勢以及上下游生態超于穩定,探到更多下游產業鏈以及更加核心AI能力的供給占據價應用層也許出現現象級消費應用細分垂直領域的能力,圍繞著大以及垂類領域新龍頭,大模型將值鏈中最主要的環節;模型的生態建設如火如茶;持續受益于中下游反哺。大模型的技術類比可以看出頭部大模型的市場優勢地位類公有云類操作系統
27、類搜索入口類智能終端大模型可以看做一個通用的智能大模型可以使自然語言和計算機大模型可類比為搜索入口,大模型可類比為操作系統等平臺,可以持續為下游應用提供AI搜索的用戶粘性和使用習慣極強,語言的流暢交互,讓自然對話變成數字基礎設施,這些領域先發優能力,作為大模型生態的底座其收費一旦調和大模型靈活性、準確性、操縱機器的新形式。新的交互模式勢明顯、頭部基斷效應極強,開方式按照Token計算,計算資源收費時效性之間的矛盾;是定義下一代終端的機會。發者和其生態可以有很強的壁壘;模式類似公有云。公有云市場也是頭部占優的市場格局;#page#國信證券2.1大模型成功的四要素:算力、算法、數據、生態GUOSE
28、NSECURTIE算力數據大模型龐大數據處理的先決條件決定了大模型的生成結構決定大模型選代效率的主要影響因素1提升模型能力與準確率的前提數據來源決定了模型的適用范圍算法生態3先發構筑產品生態、用戶心智以及提大模型底層的運作原理方法從理論到應用有一定的工程部署難度升產品力需要持續送代優化#page#國信證券2.1從GPT看大模型的核心競爭要素一算力GUOSENSECURTIEAI大模型規模龐大,依賴強大的計算資源,全球芯片計算性能持續提升成為GPT成功落地的重要基礎。英偉達為代表的AI產品性能持續進步。參數方面,從V100(2017年上市)到H100(2022年上市)計算性能提升3倍以上而單位功
29、耗顯著優化。GTC2023上,英偉達CEO黃仁勛稱H100配有Transformer引擎,可以專門用作處理類ChatGPT的AI大模型,其服務器效率是A100的10倍。黃仁勛在2023年2月財報會中表示“過去十年,通過提出新處理器、新系統、新互連、新框架和算法,并與數據科學家、AI研究人員合作開發新模型,已使大語言模型的處理速度提高了100萬倍?!盇I芯片性能顯著提升,成為近年大模型涌現的算力基礎。2020年0penAI推出的GPT-3大模型包含1750億參數,訓練成本達到了1200萬美元,如果采用單片V100需要訓練超過300年,而多模態預訓練大模型GPT-4預計規模更大,谷歌近期發布的Pa
30、LM-E包含5620億參數。如此龐大的模型如果沒有先進算力基礎,訓練耗時和成本將成為不可承受之重。圖:近年主要模型參數規模情況圖:英偉達最近三代AI服務器芯片主要參數對比現度根型名路模型規模時間機構V100A100H100時間FP647TFLOPS9.7TFLOPS26TFLOPSGFH1110M4GB2018.6uooFP3214TFLOPS51TFLOPS19.5TFLOPS201810BERTNOE16GB50天GogleGPU顯存32/16GB80GB80GB2610OpenAlGPT21.5B4GB200天GPU顯存帶寬900GB/s1935GB/s2TB/s2019.7Facboo
31、kRoBERTa330M6GB3年最大設計功耗250W300WMOSE-00E1B20191015GBGogl65年NVLink:300GB/sNVLink:600GB/5NVLink:600GB/s175B90GP321835年oInterconnectPCle:32GB/sPCle:64GB/sPCle:128GB/s資料來源:英偉達產品介紹資料來源:ChatGPT、Meta、Googlle#page#國信證券2.1從GPT看大模型的核心競爭要素一算法GUOSENSECURITIES過去幾十年的AI理論持續積累完善,以及GPT本身幾代模型算法的持續選代優化,最終才積累出能力出色的ChatG
32、PT。從基于規則的算法到用于分類的機器學習,再到可訓練的深度神經網絡,AI技術把任務的復雜性從函數復雜轉向了拓撲結構復雜,Transformer注意力機制進一步擬合人腦學習方式,最終實現自然語言處理任務突破性進展。Transformer基于規則機器學習神經網絡注意力機制需要特征提取像人腦一樣學習1950年開始開始關注重點而非全主要用SVM或聚頭開始嘗試大量數據少量數據大模型時代分類固定量數據提前標記一些數據無法處理線性不Google提出分類貓和狗根據大量數據分類學可分的數據習一個復雜的參數集合GPT-3GPT-1GPT-2GPT-41.17億參數15億參數1750億參數參數更多(未知宗有一定的
33、泛化能理解能力+生成方自監督模型,可引入多模態功能力,能夠用于和以完成自然語言面表現出了強大更強的記憶性與監督任務無關的的天賦處理的絕大部分更好的理解能力任務NLP任務中海量的學習數據、大模型、無監督學習(強化學習)、人對結果的反饋成為學習過程的一部分#page#國信證券2.1從GPT看大模型的核心競爭要素一數據GUOSENSECURITIE有規模與質量的數據要素是大模型的核心前提ChatGPT訓練數據達到45TB,同時基于人類反饋數據提升性能。從GPT的訓練過程可以看出數據在大模型訓練過程中的重要意義,強化學習過程是ChatGPT效果區別于其他模型的主要原因。海量互聯網數據強化學習RLHF(
34、45TB)GPT-1Transformer(符合人類邏輯的ChatGPT!高質量標注數據)人類反饋數據輸入反饋機制基礎模型太模型仿真訓練整個系統反饋(等價于真實世界)數據環節的演進特點數據環節自動化比例提升高質量反饋數據決定性能高質量垂類數據決定壁壘結構化到非結構化預計數據生產、采集、清洗GPT訓練的RLHF數據與其他階在大模型架構基本穩定之后,結構化數據即數據格式與標注等環節自動化程度會提升,目段的簡單標注數據不同,需要非常模型競爭的核心差異點在于訓練數長度規范化的數據,數據量前機器標注、自動駕駛影子模式等專業的問題、指令以及符合人類邏據的獨特性。在垂直場景、業務的與信息含量較少,隨著AGI
35、技術都是數據環節自動化的例子。輯與表達的高質量的答案數據質量決定了模型在該領域的表能力以及學習需求提升,將數據的自動化也包括機器獨立據稱OpenAI內部招了幾十名現,如:BloombergGPT憑借3630億會越來越多采用信息量更大與真實世界交互產生數據的過程PhDs來做該數據的標注以及質量個標簽的金融領域數據集FINPILE的非結構化數據,包括圖像、未來除了新的場景與新的事物需要檢測,Scale作為標注供應商,在該領域任務中表現遠超其他模型。視頻、3D(LiDAR、雷達人工參與數據環節,在成熟場景的也招聘了幾十名PhDs提供此類服等)、文本和音頻等。數據自動化程度會很高。務。#page#國信
36、證券2.1從GPT看大模型的核心競爭要素一生態GUOSENSECURITIEGPT產品的先發與生態構筑,已成為其重要的競爭優勢。1)先發構筑用戶心智與使用習慣(類似搜索引擎),據similarweb,ChatGPT網站2023年2月用戶訪問數超10億次,獨立訪客數超1.5億,隨著產品功能持續完善,AIGC模型本身有望成為超級流量入口,與用戶在各種場景直接交互。2)數據是大模型關鍵要素,通過先發構筑生態,GPT獲取更多的場景與用戶數據訓練,助力產品力領先,目前GPT回答問題的準確率、質量整體領先于其他模型。3)大量互聯網與軟件應用積極與GPT融合,一旦生態構筑,面臨遷移成本,一定程度上類似操作系
37、統的生態。ChatGPT月訪問量ChatGPT插件初步生態ChatGPT好8MothlyVsltsDesktop&MobleWeb Word1250.000.0001080.0.00KK750.0.0008888oD250.000.009資料衰源:ChatGPT資料來源:Simiillarweb#page#國信證券2.2中美產業鏈異同:國內大模型環節是工程問題而非技術問題GUOSENSECURITIE底層技術并未卡脖子:大模型技術雖有一定門檻,但對于大廠而言上述競爭要素(算力、數據、算法)并非構成絕對壁壘;國內大模型表現基本過關:國內大模型相繼發布,表觀的產品能力表現看,已接近GPT3的水平并
38、且在不斷地送代提升;生態決定大模型的生命周期:國內基本在同一起跑線,前期進展有先后,但長期壁壘門檻將弱化,未來應用落地或更重要;海外國內可以使用全球最頂尖芯片(H100及下一代推理卡),訓練端,全球芯片性能持續提升,國內大廠A100有儲備,性能略低的英偉達訂單占臺積電12寸晶圓總產能低于5%,長期A800可以繼續供給;推理端,大規模落地需要的推理芯片相對門檻低,算力看AI芯片供給側不是瓶頸,考慮AI芯片附加值高、自研、CPU等可承接,且目前也未限售。GPT3訓練算力折合成成本價格高昂,長期需求更多是經濟與成本問題。在千萬美元級,因此對大廠而言不算絕對壁壘?;赥ransfomer的深度學習與強
39、化學習技術技術路徑相對成熟確定(Transformer等)算法開源模型(GPT2、Meta-LLaMA等)完善的團隊與AI工程能力OpenAIGPT3大模型訓練語料4000億token,其目前可以找到的公開外文語料豐富,可以滿足模型訓練;中文語料規模與質量上不如英文語料,但各家企業或機構里有一中公開(爬蟲、網頁)語料占比超過90%;數據英文等語料豐富,ChatGPT訓練的英文資料占定量的中文業務數據資源;比為92.64708%,中文資料為0.09905%;目前國內已發布模型雖不如GPT4,但呈現出的基礎功能已基本過關:OpenAl:GPT系列大模型,ChatGPT應用Google:PaLM大模
40、型、應用Bard(表現不輸百度:文心大模型、應用文心一言;現狀/進展。阿里:通義大模型、應用通義千問;ChatGPT);Meta:LLaMA大模型,已經開源;商湯:日日新大模型、應用商量等;#page#國信證券2.2表觀:谷歌Bard能力接近NewBing,百度阿里基本功能過關GUOSENSECURITIEBard與Newbing問題測試對比(真格基金問題清單)近期有積累的大廠密集發布相關模型,新成立的大模型企業盡管“從頭開始”也披露進展順利、預計年內發布產品。相關產業方與資本方也對各模型進行較多的測試,整體來看,頭部廠商大語言模型所呈現的能力較好:1)海外廠商方面,通過不同類型問題測試,目前
41、谷歌Bard在語言方面呈現的能力接近NewBing(調用GPT-4大模型),正確率與質量均較高;2)國內廠商方面,百度阿里大模型雖然與GPT4尚有差距,但整體呈現的語義能力基本過關。資料來源:Bard、Newbing測試結果,國信證券研究部整理百度模型語言能力阿里模型語言能力商湯日日新大模型秒畫SenseMirage生成圖等了,再等一等批沒了,那不等了,就這個吧,請問質客量結買了幾神度安這是一段族客購買火車票的對話,對話中題客在選擇座位等級時,這程定顧客在購買只車票時,不僅要考慮座位等級,還要考想價構錯#page#國信證券2.2中美產業鏈異同:國內模型與應用雙引擎帶動產業鏈發展GUOSENSE
42、CURITIE大模型成熟才能賦能下游應用嗎?不同能力的大模型有不同的驅動力,下游應用的落地也需要時間。海外GPT4大模型能力突出,微軟憑借率先接入的優勢推出產品,其余商業化路徑仍在探索,國內則大模型到應用呈現齊頭并進的趨勢。,大模型一定要通用嗎?通用大模型難度更高,國內大廠很可能憑借業務數據優勢、有所側重的優化大模型,服務于產品功能優化、建立數據飛輪,從而將大模型更好地整合入自身技術棧與生態,變成有場景側重的基本通用大模型。海外國內GPT等大模型能力突出,海外應用微軟領先,國內的大模型到應用呈現齊頭并進的趨勢,選代大模型同應用其余行業領域仍在探索商業化路徑;時積極探索和研發垂直領域的商業化應用
43、;技術的進步需要商業化兌現,而大廠豐富的業務場景OpenAI是人工智能的研究公司,其技術的優數據給模型的訓練、落地、送代提供了優質土壤大模型勢與愿景都在于提高模型的性能來解決更多目前大廠大模型已有類似特點,百度大模型文本任務的通用人工智能問題;路徑預估表現更好,商湯大模型優于圖像處理。阿里要將通義海外大模型發展路徑預估:通用垂類大模型接入自身所有產品。國內大模型發展預估:基礎通用垂類通用(通用)大廠各自為伍OpenAl一家獨大大模型OpenAIMijoumey生態新件(目前)#page#目錄國信證券GUOSENSECURTIE1.GPT帶動AIGC技術革命,驅動海外互聯網軟件產業巨大變革1)G
44、PT的發展背景:全球AI產業厚積薄發,OpenAI技術突破2)AIGC技術已對海外互聯網軟件產業鏈帶來巨大變化3)展望:多模態應用、GPT插件等有望帶來更大的變革2.核心變量大模型:國內大廠加速布局,成熟大模型落地前景可期1)從GPT看大模型的核心競爭要素:算力、算法、數據、生態2)從中美差異看國內大模型發展路線:國內大廠加緊追趕,模型與應用齊頭并進3.應用展望:從海外路徑看國內發展1)海外應用:AIGC應用百花齊放案例:辦公寫作、搜索、教育、對話社交、游戲、金融、電商、圖片視頻2)海外經驗:“AI賦能”or“被AI替代”?3)國內應用:有待成熟大模型落地,巨大效率提升下機遇與挑戰并存國內頭部
45、互聯網企業應用落地場景分析4.投資策略與重點標的1)大模型及相關生態:百度領先,關注阿里、騰訊、字節、華為等2)垂直應用領域:海外關注微軟,國內關注騰訊、阿里、百度及垂直領域有高質量數據與場景的優質企業5.風險因素:技術進展低于預期,競爭超預期,內容、數據與技術監管風險,中美科技競爭風險#page#國信證券3.1類GPT技術的強大能力,驅動各行業相關應用百花齊放GUOSENSECURTIEChatGPT不僅僅是對話機器人,本質是完成以對話為交互形式發布的任務。GPT什么都能聊的機器人強大的語言能力鎮密的邏輯推理豐富的接口生態完善的認知體系辦公生成有價值的內容快速信息獲取協助/代替人類進V文本編
46、輯、生成想行生產操作搜索圖片編輯、生成金融社交生活助手V推薦助手音頻模仿、音樂生成編程輔助信息總結視頻編輯、生成V3D建模流暢的對話V客服教人類學習皖虛擬形象興鍋教育類助手交互終端新手指導設計#page#國信證券3.1案例:辦公軟件+AI,大幅提升辦公自動化效率GUOSENSECURITIE辦公軟件是人員處理文本等內容的工具,而類GPT技術大幅提升語言文本處理效率,提升辦公效率與體驗。微軟將Copilot融入ffice辦公軟件,包括Word、Excel、PowerPoint、Outlook、Teams等,演示產品效果出色Copilot+ExcelCopilot+Word分析數據表格中的數在編輯
47、Word的時候一據,創建強大的可視起編寫、編輯、總結化效果。并創作;舉例:舉例:按渠道和類型細分銷根據文檔中的數據起售情況;草項目提案;假如成本減少5%,0把文檔中第三段更簡利潤會增加多少,對潔;毛利有多大影響;根據這個提綱創建一對選中數據生成可視個草案;化圖表Copilot+PPTCopilot+Outlook將文檔轉成PPT,或者通處理復雜郵件,呈現過輸入你的要求自動來調主要內容。自動回復整PPT布局、格式或者生郵件。成演示動畫舉例:舉例:Clicktoaddtitle總結一下上周錯過的幻燈片添加動畫電子郵件;Clicktoa將這三個項目符號重新起草一份感謝他們的格式化為三列,每列都回復,
48、并詢問他們郵有一張圖片:件中第二點和第三點用文檔創建包含五張幻的具體內容燈片的演示文稿;郵件通知大家;資料衰源:微信公眾號“混透互聯網的文科生”#page#國信證券3.1案例:辦公軟件+AI,大幅提升辦公自動化效率GUOSENSECURITIE類GPT技術還可以和會議軟件結合,具備自動生成會議提示/概要/總結、自動生成文本、自動生成電子郵件內容等功能。把重復、枯燥的文本內容實現自動化生成,提升在線會議體驗,也可以讓用戶快速獲得所需的會議信息。谷歌2023年3月15日宣布將類ChatGPT功能集成在Workspace中,包括Docs、Gmail、Sheets、Slides、Meet、Chat等,
49、目前GoogleWorkspace全球用戶已超30億,可通過自然語言對話自動生成文本等內容,還可以自動生成PPT圖片、視頻、音頻等。ZoomIQ近期推出諸多智能化功能,例如通過文本、記錄亮點和操作項快速訪問所需的會議信息。谷歌文檔舉例:寫一份有關銷售職位的描述文檔ZOOM資料來源:Zoom8國1#page#國信證券3.1案例:語言處理+AI,大幅提升文字撰寫類工作效率GUOSENSECURITE類GPT技術對文字強大的處理能力還可以運用到記錄類產品中,用于對文檔的寫作、改寫、總結、修正、提問、翻譯,對現有文字的編輯優化,甚至到生成幾乎任何類型的內容,包括博客文章、會議日程、社交媒體內容、新聞稿
50、、工作描述、銷售郵件以及詩歌等。Loop+CopilotNotion Al微軟旗下Loop結合Copilot,產品NotionAI支持對內容做總結、翻譯、校正拼寫、簡短化、體驗上十分接近Notion??梢岳脭U寫、潤色、甚至更改語言風格,界面清晰、用戶體驗好創建、頭腦風暴、藍圖和描述四,可以完成以下任務:個按鈕來快速交互,也可以通過輸1、給出框架處理初稿入框來與Copilot交流。2、激發想法和創造力3、拼寫、語法檢查,翻譯4、總結會議和文件5、生成幾乎任何類型的內容hskAOFindacioiomsTranslateFi spelling&granMaioo#page#國信證券3.1案例:文
51、本生成+AI,寫作自動化提升效率GUOSENSECURITI語言生成是類GPT技術最常見的應用方式之一,可以用來生成各種類型的文本,例如文案、新聞報道、小說、詩歌等。代表性的應用包括Writesonic:人工智能作家,可以免費為博客、Facebook廣告、谷歌廣告和Shopify創建對SEO友好的內容。Copy.ai:一款人工智能文案生成助手,可為企業生成高質量的文案。Jasper.ai:可以幫助用戶進行營銷文案編寫,進行商業性文字創作,截至2022年12月底,Jasper付費用戶達到7萬;Rytr:AI寫作助手,可幫助用戶以極低的成本創建高質量的內容,包括廣告語、社交媒體帖子、產品介紹、電子
52、郵件等等。Compose.ai:基于GPT-3構建的幾種自動化寫作工具之一。這是一款免費的Chrome擴展程序,可以實現自動進行寫作。EduRef:基于GPT-3打造的自動化論文寫作工具,可以幫助應屆畢業生寫論文。Inspo:基于AI人工智能的靈感寫作機器人,幫助用戶高效寫作、激發創意、獲取知識、做出決策??焖偕筛哔|量的廣告、營銷文案和電子郵件Copy.ai主頁CopyMoney主頁強用在工資料來源:資料來源:CopyMoney#page#page#國信證券3.1案例:對話社交+AI,擬人化、個性化帶來更好的用戶體驗GUOSENSECURITIE類GPT技術構建對話系統,包括聊天機器人、客服
53、系統、社區管理員等,在AIGC技術加持下新聊天機器人優勢明顯:回復內容將更加擬人化,甚至可以扮演對應風格,增強客戶服務體驗;。對于用戶的意圖檢測更準確,能夠更好地滿足用戶需求,指導用戶行為;可以結合歷史數據,能更好的識別客戶個人情況,對于歷史問題也能對答如流;MyAISnapchat:聊天工具說明一款優化對話的語言模型。對話格式使ChatGPT可以回答后續問題、承認ChatGPT錯誤、挑戰不正確的前提并拒絕不適當的請求。像一款新式的搜索引擎,它不僅提供網頁鏈接,還能通過對話,為你提供Andi答案。完全對話式的人工智能聊天機器人。用戶可以使用它來自動化進行客戶支Quickohat持、在線應用程序
54、、搜索內部知識庫和許多其他任務。頻扣新機Snapchat是一個日常通訊和消息傳遞的平臺,類似“小紅書”,擁有7.5億月度活躍用戶。推出了名為MyAIforSnapchat+的實驗性功能,為Snapchat以確保訂單能夠及時Snapchatters提供了一個友好、可定制的聊天機器人,提供推薦,并可以在幾秒鐘內為朋友寫出一首排句。對話式AI自動化平臺Forethought將ChatGPT集成在產品中,可以為客戶提SupportGPT供個性化、擬人化、智能化的問答機器人服務Discord社區聊天機器人,生成對話摘要,協助管理員進行頻道管理,比如CEClyde智能屏蔽垃圾信息和排誘信息,進行AIbot
55、智能對話。后的免責聲明及其其項下所有內容#page#國信證券3.1案例:教育+AI,智能導師提供實時問答輔導GUOSENSECURTIE在教育領域,類GPT技術憑借著廣闊的知識儲備、準確的答案、流暢的問答交互、快速的內容生產可以作為智能AI導師知識問答和輔導:Speak是一款基于人工智能AI生成的英語學習平臺,讓用戶獲得類真人的交互式口語體驗,已生成ChatGPT插件。Quizlet是一個全球性的學習平臺,利用ChatGPT推出Q-ChatAI導師。每月有超過6000萬人使用Quizlet。KhanAcademy宣布將使用GPT-4來支持一款名叫Khanmigo的全新AI助手,可以同時擔當學生
56、的虛擬和教師助手。協助理解復雜信息:TalkToBooks:可以讓人們通過提問的方式查找到書籍及其中的內容。協助梳理知識并生成教輔等材料:TutorAl:一鍵生成對應年級與學科的課程模組,包括了教學模塊、教學具體內容、內容簡化、教學舉例等功能。Nerdy將在其在線輔導平臺上推出的ChatGPT集成產品是人工智能生成的課程計劃創建者。DuolingoMax宣傳界面Duolingo是一款行業領先的多語言學習平臺,借助游戲闖關模式和人工智能技術,旨在可以讓用戶利用碎片化時間高效學習新語言。目前,Duolingo擁有超過2200萬的日活躍用戶和420萬的付費用戶,為全球最大的語言學習平臺之一Duoli
57、ngo將接入GPT4大模型,并公布了全新的訂閱模式DuolingoMax,其中包含了兩個新功能即ExplainMyAnswer和Roleplayc#page#國信證券3.1案例:電商與本地生活+AI,提升商業運營效率與用戶體驗GUOSENSECURTIE類GPT技術將賦能電商與本地生活的開店、運營、導覽、支付、售后等多個環節,精準營銷、提高用戶滲透率、節約人力成本,ChatGPT已經將相關應用整合至插件生態,生成一體化、個性化的用戶服務,提升平臺一站式打包銷售能力。電商:Shopify和lnstacart是最早采用ChatGPTAPI的電商公司,現已作為插件合入;支付:電商信用支付龍頭Klar
58、na旗下電商購物平臺也被納入首批ChatGPT插件;電商支付服務商Stripe也與OpenAI達成合作,目前已經在智能導購、支付安全、電商SAAS應用等方面開展應用;旅游及本地生活:Expedia(0TA)、KAYAK(機票比價)均被納入ChatGPT首批插件:需求:在舊金山周末想吃素食,推薦餐廳、食譜、計算熱量、訂購食材。相關插件運用Instacart使客戶能夠詢問食品問題并獲得靈感,可購買的答案。這使用了來自75.000多個零售合作Mode:PluginsALPHAEnabled plugins孩6萬1can chickpeas:536 Calories伙伴商店位置的產品數據,幫助客戶發現
59、無限制購1cucumber27Calories物目標的想法。Looking toeat vegan foodin SanInstacart計劃于今年推出“AskInstacart”1redbellpepper:37CaloriesFranciscothisweekend.Couldyougetme14redonion:1Caloriesonegreatrestaurant suggestionforInstacart主頁14cupfreshparsley:5.5CaloriesHOUN OSaturdayandasimple recipe forSunday(just theingredien
60、ts)?Pleasecalculate2tablespoons olive oil:239Caloriesthecalories fortherecipeusing2tablespoonslemonjuice:6.6CaloriesWolframAlpha.FinallyordertheingredientsonInstacart.Now.letsordertheingredientsonInstacart.UsedInstacartHeresyourshoppingistforthehckpea#page#國信證券3.1案例:游戲+AI,大幅提升游戲內容制作效率GUOSENSECURITIE
61、類GPT技術可大幅降低游戲開發的門檻,支持軟件開發(編程)、角色設計、腳本、原畫、配音、視頻編輯等工作。同時,AIGC與虛擬角色扮演類游戲天然契合,隨著GPT類應用的廣泛使用,有望驅動游戲內容質量與數量大幅提升。角色扮演已有設計師指揮GPT-4編寫出了最經典的第一款商業游戲Pong!,以及同樣經典的打磚塊和行星Replika虛擬伴侶的交互平臺,可將死者防衛(Asteroids)。的通訊、訊息輸入AI模擬學習,試圖帶來一B站用戶也發表作品:2小時自制galgame游戲,包含:個真實的虛擬伴侶,在安卓平臺上已經突破繪畫、配音、角色生成;了1000萬次下載。游戲制作內容代表動作場景,Replika內
62、置了A游戲2小時自制G很強的角色扮演要素smil英格路LTALK TOANA.I.FRIENDoks backatyoud like that.IN VR#page#國信證券3.1案例:金融+AI,提升金融工具智能化GUOSENSECURITIE類GPT技術可以對金融類產品(SAAS、支付等)的入口重塑,同時在金融垂類細分領域作為AI智能助手,提供更準確、有效、及時的信息。當然也有一些公司對這種新一代AI產品存在顧慮,擔心數據資料會被竊取。Brex主要產品是企業費用管理軟件,客戶包括DoorDash、Airbnb等公司。目前3月30日,彭博社重磅發布為金融界打造的大型語言模型Bloomberg
63、GPT。構建了一個3630億個標簽的特定領域數據集FINPILE,訓練了專門用于金融領域的!市值已超過120億美元。Brex此前已通過A實現了自動解析收據和發票,利用GPT在BrexEmpower平臺推出CFO智能助手,解答預算問題、拓展能力,包括:!LLM,開發了擁有500億參數的語言模型BloombergGPT,支持金融行業內的各類1)自動生成關于支出的相關建議,比如預算利用率、支出模式、供應商趨勢,從任務。而提升Empower的實時預算能力;該模型在金融任務上的表現遠超過現有模型,在五項任務中的四項(ConvFinQA,!2)并回答用戶的商業問題,輔助用戶決策;第二,且在通用場景上的表現
64、與現有模型也能一較高下。Brex EmpowerBloombergGPT任務測評ConvFinQA金融領域的問答,旨在測試模型對金融領域相關向題的理解和推理能力。2FiQASA,情感分析任務,測試英語金融新聞和社交媒體標題中的情感走向。FPB,金融短語庫數據集包括來自金融新聞的句子情緒分類任務。562.1M20.1MHeadline,判斷新聞標題是否包含特定信息,例如價格上漲或價格下跌等。NER,命名實體識別任務,從提交給SEC的金融協議中收集數據進行信用風險評估。S1782.7722.6MBLOOMBERGGPTGPT-NooXOPToeBBLOOMB30.0636.31ConvFinQA2
65、7.8843.41120075.0750.5951.6053.12FIQA SAS25782.7744.6448.6750.25FPB51.0782.2073.2279.4176.51Headlin860957.4955.56NER60.82AIl Tasks (atg)62.5151.9053.0154.350.930.270.330.47/WRAll TasksTable 8:Results on financial domain tasks資料來源;#page#國信證券3.1案例:圖片生成+AI,大幅提升圖片生成效率GUOSENSECURITE從圖片編輯到圖片生成的廣泛應用:傳統的AGI
66、技術已經在圖片編輯、修復等領域廣泛使用,隨著GPT等模型的成熟,在圖片生成領域出現了許多極具影響力的公司,如:stabilityAl、midjourney等,其作品也引起了廣泛討論。攝影師、設計師等內容創作者們面臨巨大挑戰:隨著生成圖片的質量越來越好,只需要把參考和關鍵詞提供給AI工具,就能生成商業大片。Midjourney用于產品設計Midjourney作品及應用Midjourney通過第三方的Discord服務器提供付費服務。用戶創作的圖片會被分MidjourneyV5在人類手部刻畫上已經十分享至公共社區,需要用戶了解創作指令,對作品進行不斷地優化。細致,打破了AI不能畫手的“魔咒”。已經
67、有很多人已經在嘗試用ChatGPT生成詳細指令,用Midjourney產出結果,并將結果應用在產品設計、包裝、宣傳階段;有媒體以把特朗普被捕的生成圖片當成了真實現場照片,從而造成了虛假新間的出現和發酵。trials but says influx of new users toblameLevis開始使用AI模特#page#國信證券3.1案例:視頻生成+AI,大幅提升視頻編輯生產效率GUOSENSECURITIEAI自動剪輯、拼接素材,提高效率:通過模板或者固定流程可以秒出視頻,節省了視頻創作的寫腳本/文案、拍攝視頻或尋找第三方素材、剪輯素材、配音、配樂、添加素材(轉場、特效、字幕、標題、封面
68、圖)等環節??缒B生成視頻有待產品完善:根據用戶提供的文字、圖片等生成視頻目前未成熟,谷歌、Meta具體產品還未上線。Make-A-VideoFliki文本到語音和文本到視Meta產品“Make-A-Video”加速頻轉換器,可幫助用戶在不了文本到視頻模型的訓練。到一分鐘的時間內使用逼真其他相應產品還包括:,不需要的聲音通過腳本或博客文章從頭開始學習視覺和多模態,也創建視頻,將這些文字內容不需要成對的文本-視頻數據轉換為視頻。谷歌發布的“ImagenVideo”和“Phenaki”也能實現類似以上的效果,并且Phenaki可以根據一系列提示生成2分鐘Lumen5以上的長視頻。人工智能公司Run
69、way曾參與構建了第一個版本的Stable視頻自動剪輯工具Diffusion,旗下視頻生成器主打長圖文轉視頻,提供Gen-1”“Gen-2”;了大量視頻模板,操作上DiscoDiffusion:用戶輸入門檻更低。,也可以從預圖像或文本描述,Lumen5自2017年推出至今設中選擇幾個詞,就能快速生,官網介紹已有超100萬成4種視頻結果。家企業客戶將其作用于社交媒體營銷和傳播#page#國信證券3.2類GPT技術同時帶來機遇與挑戰,警惕被價值吞并的風險GUOSENSECURITIE目前類GPT技術及應用還處在初期探索階段,隨著技術的深入結合,未來將通過影響生產效率、交互方式以及數據資產帶來新一輪
70、社會環節重構,每個企業、個人都同時面臨著機遇與挑戰,并警被價值吞并的風險生產效率的變化交互方式的變化數據資產與數據驅動的變化GPT技術在信息獲取以及內容生原來人類與計算機交互需要習得編計算機可采集與解析的數據更成方面的強大作用將改變現有許程語言或者掌握U操作規則,而現多、更細、更全,圍繞著社會多公司的成本結構、組織架構與在用自然語言和行為動作就可以做環節的數據將成為企業生產的業務模式;交互。資源、業務拓展的籌碼、定義基礎腦力工作的解放將使得腦力交互方式變得更寬廣后將帶來兩個個人的基準。生產行業的產量與集中度進一步大的變化:有效的數據利用促進了社會效提升;大大拓展智能化產品在人類社會率的提升,構
71、成新的格局、邊運用的邊界,智能化產品將逐漸界、準則和目標,驅動產業變同時所有公司都需要警惕自身的遍布一二三產業。革;價值是否會被AGI所吞并,比如:工具型SaaS。改變產品(特別是終端)形態數據的利用也將令更多個人、未來的產品服務需要在充分考慮大企業、政府的行為過程更加透模型的能力和邊界的基礎上重新定明,隱私的保護更加困難;義。#page#國信證券3.2優勢壁壘:產品場景與AIGC能力協同而非沖突GUOSENSECURTIE與AIGC能力沖突場景與AIGC能力協同場景信息獲?。ㄋ阉鳎﹥热萆?GPT雖然具有AIGC功能,但是需谷歌核心搜索業務與GPT強Bing要人類做任務說明與結果評判。功能(
72、信息獲?。_突;因用戶在內容生產過程中同時思搜索的應用場景并不豐富;考,由于人類思維的局限性與個Youre in!業務流程不復雜;Welcome to the人意圖模糊性,需要通過不斷地new Bing!Adobe與工具交互反饋實現創造。2月7日發布NewBing截至3AIGC能力能替代一些簡單內容生GooglsPsEnAe月20日,必應的頁面訪問量上成和程式化的內容生成環節,更升了15.8%,而Google旗下搜索引擎下降了近1%。多的是提升了內容生成工具的使FbAiBr用效率和平臺的內容豐富度;PIAuS9DW翻譯、語音識別、對話機器人.#page#國信證券3.2優勢壁壘:強大的用戶流量與
73、豐富的產品場景GUOSENSECURITIE微軟本身具備0ffice、Bing等強大的用戶流量入口,同時有較強的軟件技術能力,豐富的使用場景能夠深度融合GPT以提升現有產品競爭力,是下游應用領域顯著受益于AIGC技術的企業之一,同時也是研究未來哪些國內企業能夠較好應用AIGC的參考樣本。產品使用場景豐富、壁壘高;辦公類產品與AIGC能力協同Office等產品矩陣流量強大;產品的工具屬性,需要強用戶交互,用戶粘性高、使用習慣好;不易替代;用戶場景技術數據投資綁定OpenAl,率先獲得業務為大量文本類數據,結合方便;先進大模型技術;垂直領域數據豐富,壁壘深厚;較強的軟件技術能力能深度數據基礎設施完
74、善;融合GPT模型;Azure云服服務能力;#page#國信證券3.2優勢壁壘:擁有大量優質垂類數據GUOSENSECURITIE金融科技(FinTech)領域是一個龐大且專業的領域,其中自然語言運用廣泛且復雜,NLP技術可以創造巨大的價值。彭博社作為一家金融數據公司,憑借其業務特點收集和整理了豐富的專業、高質量金融相關文本數據,構建了運今為止最大的特定領域數據集,并在特定的金融任務上表現優異準確性、真實性要求高文本語言豐富愛專業術語多盈利性好金融領域任務風險敏感性高任務復雜性高安全性要求高任務規范標準多BloombergGPT訓練過程業務數據大模型監管與應用標簽數據集任務測評基準3630億個
75、標簽的20年內的業務流LLM基準測試、生成Bloomberg特有業務數據集合規審查、注釋指程數據(新聞稿、開放式財務測試、GPT,500億參FinPile +南、安全監測、法財務文件、社交媒預期業務用途的內數的語言模型3450億個標簽的規、業務部署體數據等)部測試通用數據集#page#國信證券3.2AIGC產業鏈競爭四要素:用戶、技術、場景、數據GUOSENSECURITIEAIGC的技術發展會重構當前行業格局以及業務流程,通過對軟件開發、推廣、使用環節的改變,通過對信息獲取、內容生產、需求滿足等功能屬性的替代,AIGC產品能夠取代一些應用,同時也能賦能一些應用通過對海外產業鏈應用的變革和演進
76、的分析,用戶、技術、場景、數據四個維度具備壁壘的產品具備更大優勢,有望借助AIGC技術開創新場景或重塑傳統流程,實現產品性能提升、流量突破,保證持續的競爭力;用戶()技術(),有一定AI工程能力;。有一定用戶積累,用戶流量大;先發優勢,借助大模型流量裂變;用戶粘性高,不易切換使用習慣;數據()場景()8EE業務與數據結合方便,擁有豐富的鹵應用場景豐富,業務壁坐高;數據資源;場景與AIGC能力協同而非沖突;分屬垂類領域,擁有大量準確的業。產品平臺屬性優于工具屬性優于內容屬性;務數據(可以率先應用落地);業務流程復雜或需要較多的人工干預;數據相關的基礎設施完善Killingtime類比Saving
77、time類不易替代;#page#國信證券3.3國內應用:有待成熟大模型落地,巨大效率提升下機遇與挑戰并GUOSENSECURITE由于國內大模型尚未完全成熟,除少部分有海外業務的企業已直接嫁接GPT,現階段大部分國內企業產品處于研發或準備應對AIGC模型帶來的影響階段,隨著后續大模型持續落地與完善,預計將給相關產業帶來新的機遇與挑戰。I研不變士吐身章YY“型子已架目您薪易原有產品使用場景不會被AI替代,且受益于AIGC出色的內容生成能力;有獨特垂直的高質量數據;有用戶粘性與深度;本身有較強的AI技術研發與落地能力具體來看:不同于海外先有GPT模型后有應用,國內現階段在頭部互聯網企業加碼布局下,
78、大模型與應用同步發展頭部互聯網企業既是大模型的研發方,預計也將是主要的應用場景落地方,是AI大模型整體生態最主要的參與者。我們認為,騰訊、阿里、百度、字節跳動除了在AI與大模型領域有積累與積極布局,本身產品場景生態也有望較大受益于AIGC技術帶來的巨大效率提升,下文將具體展開討論。垂直細分領域方面,核心關注場景壁壘以及高質量獨占數據優勢,辦公、金融、電商、教育等相關企業有望受益#page#國信證券騰訊:流量與場景受益大模型能力,有望優化成本與打開商業化空間GUOSENSECURITIE騰訊是國內最核心的社交流量匯聚和內容分發平臺,AIGC大模型技術帶來的內容成本優化與體驗提升,有望帶來平臺內容
79、生態進一步完善,同時有望在toB領域提供更多的增值服務與需求創造。1)用戶流量:微信月活超13億,QQ月活5.7億,用戶高粘性且熟人社交場景基本不受AIGC技術沖擊,未來核心流量池與內容分發平臺地位穩固;2)場景與數據:游戲與影視文娛等:騰訊是國內最大的游戲、影視文娛生產商與分發平臺,包含騰訊游戲、視頻號、長視頻、網文、公眾號、音樂、直播等全維度內容服務,獨占大量內容數據,其中,2022年游戲收入超1700億元,視頻號MAU超8億(Questmobile截止22年6月),微信搜一搜MAU超8億,龐大的內容生態與成本投入有望大幅受益于AIGC技術帶來的效率提升與體驗優化。2企業服務:除C端內容,
80、騰訊提供騰訊云、企業微信、騰訊會議等企業服務,現階段整體尚未實現盈利,借鑒微軟辦公和云產品受益于GPT的提升,AI賦能下有望提升相關產品的效率價值及提升商業化水平。廣告營銷:2022年騰訊廣告收入超過800億元,主要為社交內容相關,AI技術有望持續提升內容效率與產品創新,提升廣告效率體驗。3)AI工程能力:技術與人才儲備充分,截止2022年末研發人員規模約8萬人,占比74%,積極布局混元大模型,AI技術研發與應用落地同步推進,有望持續提升運營效率、產品創新以及提升增值服務。#page#國信證券阿里巴巴:技術積累深厚,AI有望賦能電商內容及打開市場空間GUOSENSECURITIES阿里巴巴是國
81、內主要的電商平臺,同時在云計算、企業服務相關業務擁有出色競爭力,公司在AI領域長期投入,目前通義大模型已開展公測,應用端目前尚處于探索階段,AIGC技術有望帶來的內容成本優化與產品創新,提升電商效率與toB領域商業價值。1)用戶流量:淘寶年活近9億,GMV約8萬億元,在垂直電商領域的生態、電商數據與復雜場景流程積累深厚,業務基本盤非大模型可以簡單替代;2)場景與數據:電商:淘寶等電商生態需要海量文本圖片內容生成,潛在內容場景包括電商圖片文案、短視頻、直播帶貨、智能客服營銷等,AI技術有望降低電商生態內容成本,優化用戶體驗,提升電商平臺內容化水平。廣告營銷:AI技術有望提升電商搜索的效率與體驗,
82、助力阿里媽媽等產品圍繞消費者為中心的營銷、對消費者的數據洞察以及相關圖文視頻內容生成,提升營銷轉化率。企業服務:阿里提供阿里云、釘釘等企業服務,AI賦能下有望提升辦公產品效率及商業化水平,帶來更多的AI云需求。AioT:天貓精靈等智能終端在AI賦能下產品體驗有望大幅提升。3)AI工程能力:技術與人才儲備充分,截止2022年末總員工數超20萬,總部人員超過10萬人,其中技術人員占比一半以上,達摩院在技術領域積累深厚,通義大模型即將發布,AI技術研發與應用落地同步推進,有望持續提升運營效率、產品創新以及提升增值服務#page#國信證券百度:大模型產品先發,核心搜索業務機遇與挑戰并存GUOSENSE
83、CURITIE百度是國內重要的搜索門戶,有大量的中文互聯網信息數據池與技術積累,在AI、云計算領域持續投入,目前文心一言模型已先行發布,有望提升搜索產品體驗以及基于大模型產品拓展更多客戶。誠然,搜索與大模型場景有一定替代性,因此對百度應用落地角度,兼具機遇與挑戰。1)用戶流量:截止22年底百度搜索MAU超6億,近年用戶規模整體穩定,在線營銷收入超過700億元,不過國內互聯網流量分割,淘寶搜索、微信搜一搜、抖音搜索、搜狗、360等分割不同場景與市場,搜索引擎體驗與性能競爭依舊十分關鍵。2)場景與數據:整體而言,百度在深耕國內搜索,中文互聯網信息圖文數據語料積累領先。不過場景角度,考慮大模型回答問
84、題能力與傳統搜索存在一定的功能重合,提升用戶效率的同時,可能減少用戶對網頁的瀏覽,減少廣告位光,現階段newbing與谷歌均已推出搜索+大模型,但百度尚未正式將大模型結合進搜索產品,其對搜索引擎競爭力的正面提升與對商業化潛在的負面影響,有待跟蹤評估。業務拓展方面,目前百度文心產品已提供API服務,3月18日公司稱申請企業客戶超9萬,合作咨詢超6000條百度智能家居業務也有望受益于大模型技術3)AI工程能力:百度在AI領域長期積累技術與人才,在推薦引擎、深度學習、智能駕駛、全屋智能等領域均有布局,截止2022年末總員工數超4萬,其中有2.4萬名員工從事技術研發工作,率先推出文心一言大模型產品體現
85、出其AI領域的技術積累與能力#page#國信證券微軟:應用場景豐富,AI增益SaaS與云業務長期價值GUOSENSECURITIE微軟是0penAI的投資方和關系密切的商務合作伙伴。微軟作為PC、云、移動終端集大成的AI廠商,在OpenAI的賦能下,從應用的制高點層層推進,此次PC端“開始”菜單的重構和GPTAPI接口開放將成為應用端邁進AI時代的起點。2月2日,微軟宣布旗下所有產品將全線整合ChatGPT,包括且不限于Bing搜索引擎、0ffice全家桶、Azure云服務、Teams聊天程序等。微軟0ffice+云業務在這輪AI浪潮中優勢明顯,也是觀察AI領域應用發展的重要風向標。1)基本盤
86、穩固:0ffice產品與云業務競爭力出色,輕資產模式+預收款+有提價能力,業績確定性高,長期抗通脹。0ffice等辦公產品擁有超過14億的用戶量,Azure云計算平臺在全球云市場中排名第二,云計算替代勞動力,跟隨通脹擴容,長期價值穩固2)場景與數據office等辦公產品:AI提升辦公產品的使用效率和用戶體驗,OfficeTeamsDynamicsCopilot等SaaS產品有望受益于AI能力,促進單位用戶價值提升。商用0ffice365目前ARPU$120/年每終端,消費者版0ffice365約$68/年每終端,而ChatGPT目前收費$20/月,預計0ffice+AI有較大提升空間,關注后續
87、產品正式落地。云業務:由于與OpenAI的合作關系,調用ChatGPT的API接口都可以變成微軟AzurePaaS客戶,提升營銷轉化率。Bing搜索:GPT技術可以幫助Bing更好地理解用戶查詢,為用戶提供準確、簡潔的問答答案,提高搜索體驗。Windows:AI技術促進了微軟產品的流量入口性質,還可以實現更智能的語音助手Cortana、自動更新和系統優化等功能,提高用戶體驗。3)AI工程能力:微軟與0penAI有深度的合作基礎,技術合作上有一定的先發優勢。同時,作為全球頂級的科技公司之一,微軟在語音識別與合成(Cortana語音助手)、計算機視覺、自然語言處理、機器學習框架(微軟推出了Azur
88、eMachineLearning和ONNX等機器學習框架等方面都有一定的積累,目前已發布的Newbing、Copilot等產品已體現出公司的技術能力。#page#國信證券思考:目前看大廠受益概率大,但AI是否會讓競爭變得更卷?GUOSENSECURITE不專與你皆卡回“()不關身水IV“上化空間(增收),提升頭部企業及相關生態整體價值,但:跟上這輪AI節奏的企業是否一定能完全、可持續的受益?AI技術對整體社會效率創造固然是積極的,但是否會讓一些產業鏈環節和場景變得更卷,以至于企業本身無法獲取超額收益,創造的價值成為用戶與社會外部價值哪些場景可能會持續受益,而哪些場景可能會變得更卷?現階段回答這
89、個問題尚早,我們從歷史上生產效率變革下的案例提供一些思路負面案例零售數字化:電商的起消除了信息不對稱,大幅提升了社會生產、物流效率,讓所有用戶買到物美價廉的商品,出現全國幾個最優質的產業集群地的商家直接供給全國消費者的格局(小家電、標品服飾等)。但電商本身并沒有讓商家賺到更多的錢,透明化的競爭擠壓了各類商家的利潤空間,原本的高扣點的線下百貨等物業價值被顛覆、一些不具備全國大市場競爭力的區域廠商被擠壓,而拼多多的出現更是擠壓了原有電商平臺的利潤空間,激烈競爭的格局下,最終零售數字化創造的巨大價值更多成為用戶與社會外部價值,而不是留在商家和電商平臺體系。同理,如果AIGC技術只是加劇了一個領域的效
90、率與體驗競爭,但競爭格局不佳,跟不上這輪AI變革的企業固然下臺階,但競爭的贏家未必能夠持續保持超額利潤。正面案例文娛數字化:TV、紙媒時代,優質文娛內容分發渠道有限,商業變現渠道有限,用戶只能通過看電視報紙廣告給相關內容貢獻有限的商業價值,而移動互聯網時代開啟后,人手一步手機,內容分發效率大幅提升,價值責獻上直接會員付費、內容廣告規模均大幅增長,游戲、視頻、音樂娛樂的商業價值大幅提升。網絡技術在大幅提升用戶體驗的同時,利潤留存于內容和平臺。整體而言,我們認為:1)競爭格局不佳、savingmoney、savingtime的賽道場景更容易變卷,AIGC降低的成本受制于競爭壓力,更容易流向下游用戶
91、;2)而格局穩定、killingmoney、killingtime的賽道場景相對更能保留利潤,生態總收入甚至還能受益于產品體驗的提升,而AIGC降低的成本能夠提升平臺利潤率、改善生態內商家經營狀態。#page#目錄國信證券GUOSENSECURTIE1.GPT帶動AIGC技術革命,驅動海外互聯網軟件產業巨大變革1)GPT的發展背景:全球AI產業厚積薄發,OpenAI技術突破2)AIGC技術已對海外互聯網軟件產業鏈帶來巨大變化3)展望:多模態應用、GPT插件等有望帶來更大的變革2.核心變量大模型:國內大廠加速布局,成熟大模型落地前景可期1)從GPT看大模型的核心競爭要素:算力、算法、數據、生態2
92、)從中美差異看國內大模型發展路線:國內大廠加緊追趕,模型與應用齊頭并進3.應用展望:從海外路徑看國內發展1)海外應用:AIGC應用百花齊放案例:辦公寫作、搜索、教育、對話社交、游戲、金融、電商、圖片視頻2)海外經驗:“AI賦能”or“被AI替代”?3)國內應用:有待成熟大模型落地,巨大效率提升下機遇與挑戰并存國內頭部互聯網企業應用落地場景分析4.投資策略與重點標的:1)大模型及相關生態:百度領先,關注阿里、騰訊、字節、華為等2)垂直應用領域:海外關注微軟,國內關注騰訊、阿里、百度及垂直領域有高質量數據與場景的優質企業5.風險因素:技術進展低于預期,競爭超預期,內容、數據與技術監管風險,中美科技
93、競爭風險#page#4.投資思路與重點標的國信證券AIGC大模型能力強大,有望協助人類大幅提升語言文本等內容領域的處理效率,將帶來巨大的生產效率提升與社會價值創造,目前已經給海外互聯網、軟件等領域帶來巨大的影響與變革,長期投資價值值得持續重點關注。落地到投資思路與標的上,基于本報告對海外大模型與應用場景的分析研究,我們認為1)大模型環節:核心問題是回答具備哪些票賦要素的企業更可能在大模型競爭中脫穎而出?現階段大量企業積極布局大模型研發,盡管較多公開的方法路徑、模型與數據已經降低了大模型絕對壁壘,但其龐大的工程量與復雜的體系依舊不是缺乏足夠資源票賦的企業可以簡單實現,我們認為:1充足的算力資源、
94、2優質的算法人才、兼具規模質量的數據積累、產品與生態的歷史積累與先發優勢,是大模型四個核心競爭要素,目前海外GPT4領先,國內百度暫時領先,積極關注阿里、騰訊、華為、字節等企業大模型進展。整體看,芯片短期看并未成為發展限制,國內成熟大模型落地進度或超預期。2)應用場景環節:核心問題是回答具各哪些賦的企業能夠在技術變革下守住基本盤并更上一層樓,而哪些企業可能面臨被替代的風險?考慮現階段國內大模型未完全成熟,因此更多是借鑒海外路徑演繹國內發展,通過分析海外目前應用落地情況,我們認為,有以下京賦的企業:原有產品場景壁壘高,且受益于AIGC出色的信息獲取、內容生成能力:2有獨特垂直的高質量數據:有用戶
95、粘性與深度:本身有較強的AI技術研發與落地能力:加持自有大模型或外部模型API有望上臺階,海外關注微軟(openAI技術+內容生成大幅提升辦公產品效率),關注騰訊(大量的內容生成場景、粘性很強的產品、加速布局AI研發)、阿里(垂直高質量電商數據、大量內容生成、達摩院技術人才積累)、百度(產品技術先發,但對搜索業務可能是雙刃劍),以及游戲、金融、教育、辦公等垂直領域有高質量數據與場景的優質企業。反之,如無上述京賦,或面臨被大模型降維競爭風險。#page#國信證券重點公司盈利預測GUOSENSECURITIE調整后EPS:(港元/美元)市盈率P/E總市值公司名稱證券代碼貨幣收盤價(港元/美元)(十
96、億,港元/美元)2023E2023E2024E2024E微軟USD3127MSFT US289.821359.310.92018HKD365.43,49718.020.6騰訊控股0700.HK109阿里巴巴-SW9988.HKHKD94.52,0029.410.93647.48.71715百度集團-SW9888.HKHKD130.0資料來源:Wind,Bloomberg,國信證券研究部預測,其中微軟為美元,其他為港元#page#目錄國信證券GUOSENSECURTIE1.GPT帶動AIGC技術革命,驅動海外互聯網軟件產業巨大變革1)GPT的發展背景:全球AI產業厚積薄發,OpenAI技術突破2
97、)AIGC技術已對海外互聯網軟件產業鏈帶來巨大變化3)展望:多模態應用、GPT插件等有望帶來更大的變革2.核心變量大模型:國內大廠加速布局,成熟大模型落地前景可期1)從GPT看大模型的核心競爭要素:算力、算法、數據、生態2)從中美差異看國內大模型發展路線:國內大廠加緊追趕,模型與應用齊頭并進3.應用展望:從海外路徑看國內發展1)海外應用:AIGC應用百花齊放案例:辦公寫作、搜索、教育、對話社交、游戲、金融、電商、圖片視頻2)海外經驗:“AI賦能”or“被AI替代”?3)國內應用:有待成熟大模型落地,巨大效率提升下機遇與挑戰并存國內頭部互聯網企業應用落地場景分析4.投資策略與重點標的1)大模型及
98、相關生態:百度領先,關注阿里、騰訊、字節、華為等2)垂直應用領域:海外關注微軟,國內關注騰訊、阿里、百度及垂直領域有高質量數據與場景的優質企業5.風險因素:技術進展低于預期,競爭超預期,內容、數據與技術監管風險,中美科技競爭風險#page#國信證券5.風險因素GUOSENSECURTIE,技術進展低于預期:大模型相關技術依舊是最前沿的領域,盡管目前GPT4代表的大模型已經呈現出出色的能力,但其依舊有很多技術黑箱有待研究、對于復雜問題的回答準確率依舊不完美,下一階段大模型的進一步技術能力升級也存在不確定性。,競爭超預期:AI現階段實現突破本身是厚積薄發,全球幾十年持續研發積累下,業內已有相對成熟
99、的方法路徑(Transformer等)、大模型(GPT2、近期的Meta-LLaMA等)及相關數據基礎,同時摩爾定律與架構優化的加持下AI算力技術也持續進步,對于頭部公司而言,沿著既定路線訓練大模型的技術難度和壁壘并非高不可攀,未來大模型之間競爭或超預期內容、數據與技術監管風險:現階段GPT產品已經造成一定的內容、數據風險,如近期的三星因員工不當使用GPT造成機密泄露,同時部分國家地區(意大利、德國、加拿大等)也開啟對GPT的限制或調查,未來AI模型相關安全和監管風險需要持續跟蹤中美科技競爭風險:現階段國內大模型訓練對海外芯片(如英偉達A800)、數據等要素存在一定依賴,雖然短期未出現瓶頸,但
100、中美科技競爭背景下,若脫鉤加劇,或對國內大模型相關要素形成負面沖擊,影響國內大模型技術發展與大規模商業落地。#page#免責聲明國信證券GUOSENSECURTIE國信證券投資評級類別級別定義買入預計6個月內,股價表現優于市場指數20%以上增持預計6個月內,股價表現優于市場指數10%-20%之間股票投資評級中性預計6個月內,股價表現介于市場指數土10%之間賣出預計6個月內,股價表現弱于市場指數10%以上超配預計6個月內,行業指數表現優于市場指數10%以上行業投資評級中性預計6個月內,行業指數表現介于市場指數10%之間低配預計6個月內,行業指數表現弱于市場指數10%以上分析師承諾作者保證報告所采
101、用的數據均來自合規渠道:分析邏判斷并得出結論,力求獨立、客觀、公正,結論不受任何第三方的投意或影響:作者在過去、現在或未來未就其研究報告所提供的具體建議或所表述的意見直接或間接收取任何報,特此聲明重要聲明,本公司戶發布的本報告完整版本為準。理部門、自營部門以及其他投資業務部門可能獨立做出與本授告中意見或建議不一致的投資決策后果不承擔任何法律責任證券投資咨詢業務的說明本公司具備中國證監會核準的證券投資咨詢業務分析、預測或者論、報告,以及通過電臺、電視臺等公眾傳播媒體提供證券投資咨詢服務;通過電話:傳真、電腦網絡等電信設備系統,提供證券投資咨詢服務;中國證監會認定的其他形式。投資分析意見,制作證券研究報告,并向客戶發布的行為。明及其項下所有內#page#國信證券GUOSEN SECURITIES國信證券經濟研究所深圳深圳市福田區福華一路125號國信金融大廈36層郵編:518046總機:0755-82130833上海上海浦東民生路1199弄證大五道口廣場1號樓12樓郵編:200135北京北京西城區金融大街興盛街6號國信證券9層郵編:100032#page#