《人工智能行業海外大模型系列深度報告之一:OpenAI和微軟~通用人工智能道路上矢志不渝的逐夢者-230504(52頁).pdf》由會員分享,可在線閱讀,更多相關《人工智能行業海外大模型系列深度報告之一:OpenAI和微軟~通用人工智能道路上矢志不渝的逐夢者-230504(52頁).pdf(52頁珍藏版)》請在三個皮匠報告上搜索。
1、海外大模型系列深度報告之一:海外大模型系列深度報告之一:OpenAIOpenAI和微軟和微軟通用人工智通用人工智能道路上矢志不渝的逐夢者能道路上矢志不渝的逐夢者證券研究報告證券研究報告 行業深度研究行業深度研究發布日期:2023年5月4日本報告由中信建投證券股份有限公司在中華人民共和國(僅為本報告目的,不包括香港、澳門、臺灣)提供。在遵守適用的法律法規情況下,本報告亦可能由中信建投(國際)證券有限公司在香港提供。同時請參閱最后一頁的重要聲明。分析師:于芳博分析師:于芳博SAC編號:S1440522030001分析師:金戈分析師:金戈SAC編號:S1440517110001SFC編號:BPD35
2、2分析師:分析師:閻貴成閻貴成SAC編號:S1440518040002SFC編號:BNS315 核心觀點:核心觀點:OpenAIOpenAI是目前是目前全球估值最高的全球估值最高的AIAI初創公司初創公司,成立目的是讓通用人工智能朝著最有可能造福人類的方向發展成立目的是讓通用人工智能朝著最有可能造福人類的方向發展。其研究方向大致聚焦其研究方向大致聚焦在三個領域:強化學習領域在三個領域:強化學習領域、自然語言處理領域自然語言處理領域、多模態模型領域多模態模型領域,OpenAIOpenAI最新發布的最新發布的GPTGPT-4 4模型展現了出色的自然語言處理能力模型展現了出色的自然語言處理能力,并初
3、步融并初步融合多模態能力合多模態能力。當前的當前的GPTGPT系列模型不止于生成式系列模型不止于生成式AIAI,更是點燃了實現通用人工智能的希望更是點燃了實現通用人工智能的希望。同時同時,OpenAIOpenAI也進行了商業化初探也進行了商業化初探,大模型全面大模型全面賦能微軟傳統業務賦能微軟傳統業務,與其與其AzureAzure云云、OfficeOffice 365365、DynamicsDynamics 365365均有很好的結合均有很好的結合。除個人辦公領域之外除個人辦公領域之外,OpenAIOpenAI在代碼編程在代碼編程、金融金融、醫療醫療、教教育育、零售等其他領域中均打開了零售等其
4、他領域中均打開了AIAI應用新局面應用新局面。OpenAI是目前是目前全球估值最高的全球估值最高的AI初創公司初創公司,成立目的是讓通用人工智能成立目的是讓通用人工智能朝著最有可能造福人類的方向發展朝著最有可能造福人類的方向發展。OpenAI成立于2015年12月,研究方向大致聚焦在三個領域:強化學習領域、自然語言處理領域、多模態模型領域。其研究方向始終關注問題的通用性解決方案,而不是聚焦在特定問題之上,與其通用人工智能的研究目標契合。OpenAIOpenAI是大語言模型的技術先驅是大語言模型的技術先驅。OpenAI基于Transformer模型開辟自回歸建模路徑,發布了GPT系列模型。GPT
5、-1開啟了自然語言預訓練時代,GPT-2證明大模型無需微調也可以完成廣泛下游任務,GPT-3證實了無監督預訓練路線的正確性,ChatGPT引入強化學習機制增強人機對話表現,GPT-4擁有卓越的文本處理能力,并且初步融合多模態能力。OpenAI長期堅持其技術路線并且投入大量的研究資源,是大語言模型的技術先驅。OpenAIOpenAI商業化初探商業化初探,大模型全面賦能微軟傳統業務大模型全面賦能微軟傳統業務。大語言模型所需要的龐大算力是OpenAI成立之時始料未及的,2019年開始OpenAI從非營利性企業轉變為具有利潤上限的營利實體OpenAI LP。隨著GPT模型爆發出強大的應用潛力,Open
6、AI也開始其商業化布局。OpenAI在個人辦公應用領域與微軟加深合作,大模型全面賦能微軟傳統業務,與OpenAI的相關合作對其Azure云、Office 365、Dynamics 365均起到了相當程度的促進作用。微軟23Q3財報顯示,FY23Q3 Azure OpenAI已有2500個服務客戶,AzureAzure云下個季度中有云下個季度中有1 1%的收入增長來自于人工智能的收入增長來自于人工智能。在個人辦公領域之外在個人辦公領域之外,OpenAIOpenAI在其他領域中均打開了在其他領域中均打開了AIAI應用新局面應用新局面。在代碼編程領域,GPT顯著提升代碼編程效率和質量;在金融領域,G
7、PT成為金融領域強力的信息匯總和分析工具;在醫療領域,GPT全方位提升醫療領域的智能化與數字化;在教育領域,GPT提高教育和學習的效率和針對性;在零售領域,GPT提升零售中的業務效率和用戶體驗。風險提示:風險提示:技術技術發展不及預期發展不及預期、算法隱私問題算法隱私問題、應用不及預期應用不及預期、數據質量不及預期數據質量不及預期、倫理沖突風險等倫理沖突風險等。核心觀點 目 錄第一章第一章OpenAIOpenAI概述概述4 4第二章第二章OpenAIOpenAI技術發展路徑技術發展路徑1010第三章第三章大模型全面賦能微軟傳統業務大模型全面賦能微軟傳統業務2929第四章第四章OpenAIOpe
8、nAI打開打開AIAI應用新局面應用新局面4343第五章第五章風險提示風險提示4949 第一章第一章OpenAIOpenAI概述概述4 4 1.1 OpenAI:全球估值最高的人工智能創業公司 OpenAIOpenAI成立于成立于20152015年年1212月月,成立的目的是讓通用人工智能成立的目的是讓通用人工智能(ArtificialArtificial GeneralGeneral IntelligenceIntelligence)朝著最有可能造福人類朝著最有可能造福人類的方向發展的方向發展。公司的主要創始人包括山姆奧爾特曼(Sam Altman)、格雷格布羅克曼(Greg Brockma
9、n)、里德霍夫曼(Reid Hoffman)、杰西卡利文斯頓(Jessica Livingston)、埃隆馬斯克(Elon Musk)、Amazon Web Services(AWS)等。截止2022年,OpenAI擁有大約375名員工,主要面向以下三個方面:Capabilities,不斷的提高AI的功能和能力;Safety,確保這些AI系統擁有和人類一致的價值觀念;Policy,確保這些AI系統能夠得到適當的治理。根據路透社報道,OpenAI在2022年收入數千萬美元,并預計2023、2024年收入為2億、10億美元。截止2023年4月29日,OpenAI歷史融資額超200億美元,當前估值為
10、290億美元,是全球估值最高的全球估值最高的AIAI初創公司初創公司。資料來源:OpenAI,中信建投圖:圖:OpenAIOpenAI主要研究領域主要研究領域圖:福布斯圖:福布斯AIAI 5050部分企業部分企業公司公司專注領域專注領域成立年份成立年份融資金額融資金額(百萬美元百萬美元)OpenAl人工智能模型開發201511000Databricks數據存儲和分析20133500Andurillndustries防御軟件20172400Anthropic人工智能模型開發20211300Insitro藥物研發2018700Scale Al數據標簽提供商2016602Gong銷售軟件201558
11、4AlphaSense市場情報搜索2011520Shield Al自主防御軟件2015520Clari銷售軟件2012496Eightfold Al招聘軟件2016424Adept人工智能模型開發2022415強化強化學習學習自然自然語言語言多模多模態態OpenAIFiveGPT-4DALL E 2CapabilitiesCapabilitiesSafetySafetyPolicyPolicy資料來源:Forbes,中信建投 1.2 公司現任人員資料來源:wikipedia,analyticsindiamag,OpenAI,中信建投圖:圖:OpenAIOpenAI現任人員介紹現任人員介紹首席執
12、行官首席執行官山姆奧爾特曼是美國企業家、投資者和程序員。他是Loopt和OpenAI的首席執行官,也是聯合創始人。曾擔任Y Combinator的總裁,后為了更多專注于OpenAI,于2019年轉任董事長,并于2020年離開YC。Sam Altman(1985-)總裁總裁格雷格布羅克曼是美國企業家、商人和投資家。他是OpenAI的聯合創始人,并在創 立 時 擔 任 首 席 技 術 官(CTO)。在2022年5月,卸任首席技術官,擔任公司總裁,并專注于訓練公司旗艦AI系統。在OpenAI之前曾擔任Stripe的首席技術官。Greg Brockman(1985-)首席技術官首席技術官米拉穆拉蒂,出
13、生于阿爾巴 尼 亞。于 2018 年 加 入OpenAI,主要負責OpenAI的研究、產品開發和部署的相關工作。并在2022年5月接任Greg Brockman擔任首席技術官。她對于DALL.E的成功起到了重要作用。在加入OpenAI之前,曾就職于LeapMotion和特斯拉。Mira Murati(1988-)首席運營官首席運營官布拉德萊特卡在2018年加入OpenAI,擔任OpenAI首席財務官。2022年5月擔任首席運營官,與人工智能應用團隊合作,完善相關業務和商業戰略。此前,曾擔任Dropbox的戰略財務總監和摩根大通的投資銀行分析師。Brad Lightcap首席科學家首席科學家伊利
14、亞蘇茨凱弗,人工智能科學家,是OpenAI的聯合創始人,同時擔任首席科學家。曾就職于谷歌,是卷積神經網絡AlexNet的 發 明 者 之 一,是AlphaGo論文的眾多合著者之一。在2015年底,離開 谷 歌,共 同 成 立 了OpenAI并擔任首席科學家。Ilya Sutskever(1985/86-)1.3 公司愿景:以最有可能造福人類的方式推進人工智能發展 2015年公司成立之初的愿景是讓通用人工智能(Artificial General Intelligence)朝著最有可能造福人類的方向發展,與此同時不受財務回報的約束。2023年初,公司對未來發展做了進一步描述,其中提到公司目標是確
15、保通用人工智能(在智能水平上勝過人類的AI系統)造福全人類。隨著AI模型逐步邁向通用人工智能階段,公司對模型的創建和部署更為謹慎。其中OpenAI提出了三條最關心的原則:期望通用人工智能最大化造福人類,最大化賦能、最小化風險,讓通用人工智能成為人類能力的增強器。期望廣泛和公正地分享通用人工智能的能力、使用權和治理權。期望成功應對通用人工智能可能帶來的風險,通過一些功能較弱的版本來不斷學習和適應,從而化解潛在的風險。資料來源:OpenAI,中信建投圖:“圖:“Introducing Introducing OpenAIOpenAI”中對”中對OpenAIOpenAI的愿景描述的愿景描述圖:“圖:
16、“Planning for AGI and beyondPlanning for AGI and beyond”中對”中對OpenAIOpenAI的目標描述的目標描述“Our goal is to advance digital intelligence in theway that is most likely to benefit humanity as awhole,unconstrained by a need to generatefinancial return.”2015.12.11“Our mission is to ensure that artificial general
17、intelligenceAI systems that are generally smarterthan humansbenefits all of humanity.”2023.1.24資料來源:OpenAI,中信建投 1.4 OpenAI融資歷史:通用人工智能發展的有力保障 OpenAI一共經歷了7輪融資,包括種子前融資,種子輪融資,二級市場融資和企業融資,總募集資金超過200億美元。主要投資者包括有:微軟、Y Combinator、科斯拉風險投資公司,里德霍夫曼基金會、紅衫資本、基巖資本、安德森霍格威茲、馬修布朗公司等。2019年開始,OpenAI開始對融資保持相對開放的態度,彼時公司
18、的大語言模型正處于GPT-2邁向GPT-3的發展階段。訓練大語言模型所需要的龐大算力是公司成立之時始料未及的,公司開始接受融資同時尋求與云廠商的廣泛合作,與此同時也伴隨著公司商業模式的變化。圖:圖:OpenAIOpenAI融資歷史圖融資歷史圖資料來源:Crunchnews,TechCrunch,中信建投 1.5 OpenAI商業模式 20192019年年,為了獲取大規模投資和吸引人才從而更好完成企業使命為了獲取大規模投資和吸引人才從而更好完成企業使命,OpenAIOpenAI從非營利性企業轉變為具有利潤上限的營利實體從非營利性企業轉變為具有利潤上限的營利實體OpenAIOpenAI LPLP。
19、在新的公司結構下,OpenAI就特指現在的OpenAI LP,原先的非營利實體轉變為OpenAI Inc。而OpenAI LP則會受到OpenAIInc的董事會進行控制。在此結構下,所有的投資者和員工的經濟回報都是有限的,所有超額的回報都會歸OpenAI Inc所有。對于第一輪投資者(First Close Partners)的回報上限定為了投資的100倍,后續的投資回報率會不斷降低。OpenAIOpenAI的主要盈利模式包括:會員訂閱費的主要盈利模式包括:會員訂閱費、APIAPI許可費許可費、與微軟合作帶來的商業收入與微軟合作帶來的商業收入。圖:圖:OpenAIOpenAI商業模式變化情況商
20、業模式變化情況圖:圖:OpenAIOpenAI的主要盈利模式的主要盈利模式資料來源:Fortune,中信建投OpenAI會員訂閱費ChatGPT plus付費版本,每月收費20美元API流量費微軟合作收入使用API的方式接入OpenAI模型(例如GPT-4、Dall E2等),按生成內容長度和圖片數量收費大模型融入githubcopilot、bing等軟件,創造商業收入資料來源:OpenAI,中信建投 第二章第二章OpenAIOpenAI技術發展路徑技術發展路徑1010 2.1 人工智能發展歷程 人工智能大致可以分為三個發展階段:弱人工智能人工智能大致可以分為三個發展階段:弱人工智能、強人工智
21、能強人工智能、超人工智能超人工智能。弱人工智能(Weak artificial intelligence)或稱狹義人工智能(Artificial Narrow Intelligence)是實現部分思維的人工智能,且僅專注于某項特定任務。弱人工智能不需要具有人類完整的認知能力,甚至是完全不具有人類所擁有的感官認知能力,只處理特定的問題。弱人工智能專注于模仿人類如何執行基本動作,例如記憶或感知事物、解決簡單問題。比如:AI模型AlphaGo戰勝了頂尖的人類選手,但是局限于特定問題,仍然不能被稱之為強人工智能。當前人工智能技術發展處于弱人工智能相對成熟當前人工智能技術發展處于弱人工智能相對成熟、強人
22、工智能曙光乍現的階段強人工智能曙光乍現的階段。圖:人工智能發展的三個階段圖:人工智能發展的三個階段圖:圖:AlphaGoAlphaGo戰勝頂尖人類棋手戰勝頂尖人類棋手資料來源:indikaai,中信建投資料來源:Financial Times,中信建投 2.2 強人工智能 強人工智能也指通用人工智能強人工智能也指通用人工智能(artificialartificial generalgeneral intelligenceintelligence,AGIAGI),具備非常通用的“智能能力”,包括推理能力、規劃能力、抽象思考能力、理解復雜概念的能力、快速學習的能力、從經驗中學習能力等,并且在這些方
23、面達到或超過人類水平,強人工智能是人工智能研究的主要目標之一。強人工智能的目標是創建一個能夠與人類一樣自適應強人工智能的目標是創建一個能夠與人類一樣自適應、靈活地處理各種問題和任務的智能系統靈活地處理各種問題和任務的智能系統。強人工智能使得人工智能具備意識、感性、知識和自覺等人類特征,有潛力為每個人提供幾乎任何認知方面的幫助,可以為人類的聰明才智和創造力提供巨大助力。圖:強人工智能具備的能力圖:強人工智能具備的能力圖:強人工智能主要玩家圖:強人工智能主要玩家OpenAIOpenAI和和DeepMindDeepMind資料來源:中信建投AGI推理能推理能力力規劃能規劃能力力從經驗從經驗中學習中學
24、習抽象思抽象思考考理解復理解復雜概念雜概念快速學快速學習習資料來源:aibots.my,中信建投 2.3 OpenAI技術發展路線 從時間維度上看從時間維度上看,OpenAIOpenAI的研究方向大致聚焦在三個領域:強化學習領域的研究方向大致聚焦在三個領域:強化學習領域、自然語言處理領域自然語言處理領域、多模態模型領域多模態模型領域。在強化學習領域,OpenAI采用通用的強化學習策略來來幫助AI應對靈活多變的困難問題;在自然語言處理領域,OpenAI開辟自回歸建模路徑,大語言模型無需在特定領域微調也有出色的任務表現;在多模態模型領域,OpenAI圍繞Transformer主架構不斷增強多模態能
25、力。OpenAIOpenAI的研究方向始終關注問題的通用性解決方案的研究方向始終關注問題的通用性解決方案,而不是聚焦在特定問題之上而不是聚焦在特定問題之上,與其通用人與其通用人工智能的研究目標契合工智能的研究目標契合。圖:圖:OpenAIOpenAI技術發展路徑技術發展路徑資料來源:OpenAI,中信建投201520232015.122015.12OpenAIOpenAI成立成立2016.62016.6OpenAIOpenAI GymGym強化學習工具包強化學習工具包2017.82017.8OpenAIOpenAI FiveFiveDota2Dota2戰勝職業選手戰勝職業選手2018.6201
26、8.6GPTGPT-1 1開啟預訓練時代開啟預訓練時代2019.22019.2GPTGPT-2 2零微調完成下游任務零微調完成下游任務2020.72020.7GPTGPT-3 3證實技術路線正確性證實技術路線正確性2021.22021.2CLIPCLIP圖文配對模型圖文配對模型2021.22021.2DALLEDALLE文字到圖像生成文字到圖像生成2022.112022.11ChatGPTChatGPT為大語言模型引入強化學習為大語言模型引入強化學習2023.32023.3GPTGPT-4 4初步融合多模態初步融合多模態2017.82017.8DactylDactyl機械手訓練系統機械手訓練系
27、統2022.42022.4DALLEDALLE 2 2圖像質量升級圖像質量升級強化學習階段強化學習階段自然語言階段自然語言階段多模態階段多模態階段 2.4 OpenAI Gym:強化學習算法開發和評估工具包 2015年之前,深度學習的發展已經如火如荼,OpenAI成立之后,首先關注的是深度學習與強化學習的結合領域。強化學習適合決策和運動控制相關領域,涉及一系列決策相關問題,例如機器人的電機控制、玩電子游戲和棋盤游戲等,強化學習幫助AI代理在復雜、不確定環境中取得良好表現。OpenAIOpenAI GymGym是是OpenAIOpenAI最早期的開源研究成果最早期的開源研究成果,是一個用于開發和
28、評估強化學習算法的工具包是一個用于開發和評估強化學習算法的工具包。假定環境中存在一個AI代理(例如機器人),AI代理的每一次行動都會從環境中獲得相應的反饋和獎勵,強化學習算法尋求最大化獎勵途徑,促進AI代理與環境交互達到最優狀態。OpenAI Gym中有一系列環境,包括經典控制、雅達利游戲、棋盤游戲、機器人控制,同時OpenAI Gym中可以對強化學習算法進行評估。圖:圖:OpenAIOpenAI GymGym的一系列環境的一系列環境圖:圖:OpenAIOpenAI GymGym實現實現AIAI代理與環境的有效互動代理與環境的有效互動資料來源:OpenAIGym,中信建投資料來源:OpenAI
29、Gym,中信建投 2.5 OpenAI Five在多人競技游戲中擊敗人類頂尖選手 OpenAI研究早期涉及各類游戲對戰,其中包括著名的Dota 2對戰機器人,在2017年8月在1v1比賽中擊敗了世界的頂尖選手。OpenAI Five的目標是尋找最大化與人類玩家對戰獲勝的策略,模型訓練過程中通過強化學習來實現這一目標,設置了最大化的獎勵函數,獎勵函數中包括:角色死亡、資源收集等與勝率相關的信號。游戲過程中,OpenAI Five通過程序接口和游戲進行交互,直接從游戲中獲取諸如生命值、位置等具體的狀態值,在獲取觀測到的狀態后,通過LSTM長短期記憶網絡進行處理,之后AI反饋一個離散化的動作指令,如
30、移動、攻擊、使用技能等。從2018年6月開始,OpenAI Five就從OpenAI內部逐步進行了與人類對戰的測試,直至2019年4月,OpenAI Five以2-0擊敗了職業戰隊OG,并在接下來的4天時間中,在線上與3193支不同的人類隊伍進行了7257場比賽,達到了99.4%的勝率。Dota 2復雜程度接近現實世界中的問題,OpenAIOpenAI FiveFive的成功證明強化學習在困難的任務當中也能夠取得超越人類的表現的成功證明強化學習在困難的任務當中也能夠取得超越人類的表現。圖:圖:簡化版本的簡化版本的OpenAIOpenAI FiveFive模型架構模型架構圖:模型視角下的圖:模型
31、視角下的Dota2Dota2游戲游戲資料來源:Dota 2 with Large Scale Deep Reinforcement Learning,中信建投資料來源:OpenAI,中信建投 2.6 Dactyl系統通過強化學習實現機械手的靈活操控 在研究早期,OpenAI也嘗試通過強化學習策略去解決機械手的操作問題。2018年7月,OpenAI發布了機械手訓練系統Dactyl,Dactyl采用了與OpenAI Five相同的強化學習算法和代碼從頭開始學習,Dactyl通過機械手完成了對物體的精準抓握和靈活控制,甚至完成了繞軸旋轉、盤核桃之類的復雜機械手操作。Dactyl首先在OpenAI G
32、ym中的MuJoCo物理引擎構建了機器人的模擬版本,在虛擬環境中對AI機器人進行訓練,然后再把策略應用在實體機器人身上。訓練過程中還會增加大量的動態隨機事件,讓AI在這個過程中自己領悟出完成任務的訣竅,整個訓練過程中無需任何微調。在虛擬環境中,通過強化學習訓練得到的操作技能使得機械手到達前所未有的靈活度。圖:圖:DactylDactyl系統系統實現機械手的精準操控過程實現機械手的精準操控過程資料來源:OpenAI,Learning Dexterous In-Hand Manipulation,中信建投通過通過3 3個個CNNCNN模型實現三路模型實現三路攝像頭的信息處理攝像頭的信息處理攝像頭信
33、息融合得到攝像頭信息融合得到物體的具體姿態信息物體的具體姿態信息在虛擬環境中通過強化在虛擬環境中通過強化學習訓練機械手操作學習訓練機械手操作神經網絡給出針對目神經網絡給出針對目標的具體操作指令標的具體操作指令通過通過長短期記憶網絡理長短期記憶網絡理解環境中的物理過程解環境中的物理過程 2.7 OpenAI基于Transformer模型開辟自回歸建模路徑 2017年,Google在Attention is All You Need論文提出Transformer模型,將注意力機制引入到自然語言模型之中,在自然語言的翻譯任務中取得極高的準確度,隨后通過不斷挖掘Transformer模型能力,Tran
34、sformer模型在自然語言的理解和生成也取得了巨大的成功,當前已經成為自然語言處理領域的基礎模型。OpenAIOpenAI開辟自回歸建模路徑開辟自回歸建模路徑?;赥ransformer模型衍生出三條路徑,分別為BERT、T5、GPT路徑。BERT采用掩碼建模策略,利用雙向文本信息學習語言信息,在文本理解、情感分析方面具備一定優勢;GPT采用自回歸的建模策略,通過對上文文本學習預測下文,在零樣本或者少樣本的生成方面表現優異。圖:圖:TransformerTransformer模型結構模型結構圖:自然語言模型發展路徑圖:自然語言模型發展路徑資料來源:Attention is All You N
35、eed,中信建投多頭自注意力機制多頭掩碼自注意力機制前饋神經網絡前饋神經網絡EncoderDecoder資料來源:真格基金,中信建投 2.8 GPT-1開啟了自然語言預訓練時代 在GPT-1之前,傳統的NLP模型往往使用大量的數據對有監督的模型進行任務相關的模型訓練,但是這種有監督學習的任務需要大量的人工數據標注,而且只能做到特定領域的自然語言理解,極大的限制了自然語言模型的技術發展。OpenAIOpenAI率先將預訓練的方法引入到自然語言處理領域率先將預訓練的方法引入到自然語言處理領域。OpenAI采用Transformer的Decoder部分作為GPT主體架構,通過在無標簽的數據集上訓練得
36、到一個通用的語言模型,隨后在下游任務中做進一步微調訓練,自然語言模型開始從專業領域走向通用領域。GPT-1的誕生(2018.6)開啟了自然語言預訓練時代,隨后誕生的BERT模型(2018.10)也沿襲了類似的思路,但是采用Transformer的Encoder部分作為主體架構。圖:圖:GPTGPT-1 1預訓練之后在下游任務中的微調預訓練之后在下游任務中的微調圖:圖:GPTGPT模型與模型與BERTBERT模型比較模型比較資料來源:Improving Language Understanding by Generative Pre-Training,中信建投分類任務蘊含任務相似任務多選任務GP
37、TGPT主體主體不同下游任務不同下游任務雙向表示雙向表示單向表示單向表示資料來源:BERT:Pre-training of Deep Bidirectional Transformers for Language Understanding,中信建投 2.9 GPT-2證明大模型無需微調也可以完成廣泛下游任務 2019年2月GPT-2模型被提出,GPT-2的目標旨在訓練一個泛化能力更強的詞向量模型,GPT-2在GPT-1的模型架構基礎上并沒有做過多的創新與設計,但是省去了后續的fine-tune過程,同時使用了更多的網絡參數和更大的數據集。GPTGPT-2 2使用無監督的預訓練模型完成下游任務
38、使用無監督的預訓練模型完成下游任務。GPT-1在構建下游特定任務輸入時引入了起始、截斷和終止符,在微調過程中教會了機器去識別這些特定符號。GPT-2訓練過程采用多任務學習模式,選用提示取代特定符號去做下游任務,例如使用“translate to English”實現翻譯任務,“answer the question”去實現閱讀理解任務。GPT-2驗證了通過海量數據和大量參數訓練出來的詞向量模型有遷移到其它類別任務中的潛力,證明了預訓練大模型在無需微調的情況下也可以完成廣證明了預訓練大模型在無需微調的情況下也可以完成廣泛的下游任務泛的下游任務。圖:圖:GPTGPT-1 1和和GPTGPT-2 2
39、模型基礎架構保持一致模型基礎架構保持一致圖:圖:GPTGPT-2 2實現了模型規模上的擴充實現了模型規模上的擴充資料來源:Improving Language Understanding by Generative Pre-Training,CSDN,中信建投Model Name參數量參數量層數層數詞向量長度詞向量長度注意力頭數注意力頭數GPT-1117M1276812GPT-2 Small117M1276812GPT-2 Medium345M24102416GPT-2 Large762M36128016GPT-2 Extra Large1542M48160024BERT-Base110M12
40、76812BERT-Large340M24102416GPTGPT-1 1GPTGPT-2 2 SmallSmall資料來源:CSDN,中信建投 2.10 GPT-3證實了無監督預訓練路線的正確性 GPT-2證明了語言模型無監督預訓練的有效性,確立了大模型參數巨量化的技術路徑。在此基礎上,參數規模更加龐大的參數規模更加龐大的GPTGPT-3 3在在20202020年年5 5月被提出月被提出,證實了無監督預訓練路線的正確性證實了無監督預訓練路線的正確性。GPT-3相比GPT-2最顯著的改變體現在三個方面:參數量顯著提升:從GPT-2的15億參數提升至GPT-3的1750億,Transformer
41、層數從48層提升至96層。訓練數據集不斷擴充:從GPT-2的40GB上升至GPT-3的45TB,滑動窗口提升至2048,關聯語義挖掘能力進一步提升。使用少樣本學習策略替代GPT-2的零樣本學習策略,在少量任務樣本訓練(Few-shot)設定下,在部分測試中,GPT-3的表現超越了特定領域微調后的自然語言模型,例如在閱讀理解測試TriviaQA中,GPT-3表現超越了微調后的最好模型(SOTA)。圖:巨量參數和少樣本學習顯著提升模型表現圖:巨量參數和少樣本學習顯著提升模型表現圖:圖:GPTGPT-3 3在閱讀理解測試中表現超越在閱讀理解測試中表現超越SOTASOTA資料來源:Language M
42、odels are Few-Shot Learners,中信建投訓練樣本量模型參數量資料來源:Language Models are Few-Shot Learners,中信建投 2.11 ChatGPT引入強化學習機制增強人機對話表現 在在GPTGPT-3.53.5版本的基礎上,通過版本的基礎上,通過3 3個步驟實現基于人類反饋的強化學習微調(個步驟實現基于人類反饋的強化學習微調(RLHFRLHF),得到人機對話模型),得到人機對話模型ChatGPTChatGPT。步驟步驟1 1:監督微調(SFT)使用精選的人類回答來微調預訓練的語言模型以應對各種查詢;步驟步驟2 2:獎勵模型微調 使用一個
43、包含人類對同一查詢的多個答案打分的數據集來訓練一個獨立的獎勵模型(RW);步驟步驟3 3:RLHF 訓練 利用近端優化策略算法(PPO),根據獎勵模型的獎勵反饋進一步微調 SFT 模型。RLHF觸發了大語言模型的多項能力,其中包括:應盡翔實的回應、公正的答復、拒絕不當問題等,通過與人類答案的對齊過程,顯著提升了大模型的人機對話體驗。圖:基于人類反饋的強化學習微調圖:基于人類反饋的強化學習微調圖:圖:RLHFRLHF提升了自然語言模型的多方面表現提升了自然語言模型的多方面表現資料來源:OpenAI,中信建投遵循指令遵循約束幻覺問答合適用語資料來源:Training language models
44、 to follow instructions with human feedback,中信建投 2.12 GPT-4:卓越的文本處理能力,初步融合多模態能力 2023年3月15日,OpenAI發布多模態預訓練大模型GPT-4,相較于過去的GPT系列模型,提升包括幾個方面:具備多模態信息處理能力,能夠接受圖像和文本兩種模態的輸入,再通過文字給出正確的文本答復。文本處理能力更為出色,在為機器學習模型評判標準和為人類設計的專業測試中均取得良好表現。安全性和真實性顯著提升,模型訓練結束之后進行了大量的規范性調試,減少了幻覺事實的輸出概率。GPT-4構建了用于模型性能預測的深度學習堆棧,能夠在模型訓練
45、早期,在僅有1/10001/10000訓練計算量情況下外推實現GPT-4模型某些方面性能的準確預測,降低了模型訓練過程中的試錯成本,縮短了整體訓練周期。圖:圖:GPTGPT-4 4模型在各類人類考試中的表現模型在各類人類考試中的表現圖:深度學習堆棧實現模型性能的準確預測圖:深度學習堆棧實現模型性能的準確預測資料來源:AGIEval:A Human-Centric Benchmark for Evaluating Foundation Models,中信建投SATLSATGMAT&GRE中國高考中國律師資格考試公務員考試美國高中數學競賽資料來源:GPT-4 technical report,中信
46、建投 2.13 Codex賦予大模型代碼生成能力、增強邏輯思維能力 20212021年年6 6月月,OpenAIOpenAI發布具備代碼生成能力的發布具備代碼生成能力的CodexCodex模型模型。Codex模型系列是GPT-3系列的后代,它經過了自然語言和來自Github數十億行代碼的訓練,該模型系列精通十幾種語言,包括 C#、Python、JavaScript、Go、Perl、PHP、Ruby、Swift等語言,其具備代碼語言的編寫、補全、添加注釋、測試等能力?;诖a的預訓練顯著提升了大模型的推理能力基于代碼的預訓練顯著提升了大模型的推理能力。關于大模型是否具有推理能力得到了大量的研究,
47、一個結論是百億參數級別以上的大模型可能具備簡單的邏輯推理能力,通過思維鏈的提示可以激發大模型之中的推理能力。Codex(code-davinci-002)與GPT-3的模型主體保持一致,僅僅將訓練文本從文本數據集切換到文本和代碼數據集上,在大多數的推理測試中,模型的推理測試成績都得到了顯著的提升。圖:圖:GPTGPT-3 3系列模型演進過程系列模型演進過程圖:圖:GPTGPT-3 3和和CodexCodex模型在推理測試中的表現模型在推理測試中的表現資料來源:知乎,中信建投自然語言模型推自然語言模型推理能力顯著提升理能力顯著提升MethodGSM8KAsDivMulti ArithSVAMPS
48、ingleEqCommonsenseQAStrategyQACLUTRRGPT-3 davinci(175B):Greedy Decode8.731.431.421.238.248.259.333.6Self-Consistency18.952.868.644.659.657.465.942.5Diverse30.9(+12.0)57.6(+4.8)87.6(+19.0)46.9(+2.3)65.1(+5.5)75.0(+17.6)67.9(+2.0)92.5(+50.0)text-davinci-002:Greedy Decode37.160.870.760.073.365.560.318.
49、4Self-Consistency58.276.988.478.287.272.970.715.8Diverse70.2(+12.0)83.5(+6.6)96.4(+8.0)82.7(+4.5)86.5(-0.7)79.2(+6.3)73.1(+2.4)68.5(+52.7)code-davinci-002:Greedy Decode55.375.588.870.587.573.473.832.9Self-Consistency76.786.298.685.893.777.378.335.6Diverse82.3(+5.6)88.7(+1.5)99.8(+1.2)87.0(+1.2)94.9(
50、+1.2)79.9(+2.6)77.7(-0.6)95.9(+60.1)在在訓練文本中引入代碼得訓練文本中引入代碼得到了推理能力的大幅提升到了推理能力的大幅提升資料來源:On the Advance of Making Language Models Better Reasoners,中信建投 2.14 綻放源于技術路線的長期堅持 在GPT-1模型發布后4個月,Google發布了自己的語言模型BERT,其采用編碼器作為模型主體且采用雙向編碼結構。從性能上看,與GPT-1模型參數規模相當的BERTBASE性能超越GPT-1,參數量更大的BERTLARGE更是形成了壓倒性優勢,雙向結構的BERT模
51、型很快得到了學術界的廣泛歡迎。GPTGPT可能是一條難度更高可能是一條難度更高、同時天花板更高的技術路徑同時天花板更高的技術路徑。直到1750億參數量的GPT-3模型誕生,在各類下游任務中無需微調便可取得良好成績,越來越多的企業和研究機構才開始轉向GPT技術路線,BERT路線的影響力開始逐漸轉弱。OpenAI在自然語言模型方面的領先得益于公司對于其技術路徑的長期堅持,即使早期并未得到學術界的廣泛仍可。圖:大語言模型發展樹狀圖圖:大語言模型發展樹狀圖圖:圖:BERTBERT模型的性能超越模型的性能超越GPTGPT-1 1資料來源:Harnessing the Power of LLMs in P
52、ractice:A Survey on ChatGPT and Beyond,中信建投圖:圖:BERTBERT與與GPTGPT論文的引用數論文的引用數52375732928863995010000200003000040000500006000070000BERTGPTGPT-1GPT-2GPT-3BERTGPTGPT-3 3之后,之后,解解碼器路線開始碼器路線開始得到逐步重視得到逐步重視資料來源:BERT:Pre-training of Deep Bidirectional Transformers for Language Understanding,中信建投資料來源:Webof Scie
53、nce,中信建投 2.15 多模態領域的基石性模型CLIP 20202020年后年后,OpenAIOpenAI開始逐步涉足多模態研究領域開始逐步涉足多模態研究領域,20212021年年3 3月發布了圖文配對模型月發布了圖文配對模型CLIPCLIP。CLIP利用文本信息監督視覺任務自訓練,訓練數據集為網絡搜集得到的4億個“文本-圖像”對,采用Vision Transformer模型和ResNet實現圖像的特征提取,將不同模態的原始數據映射到統一或相似的語義空間,實現不同模態信號間的相互理解,模型在這種對應關系中學習到文本和圖像這兩種不同模態信息背后的內涵,為多模態的生成模型奠定了基礎。CLIPC
54、LIP在零樣本學習任務上表現較好在零樣本學習任務上表現較好。與機器視覺中常用的先預訓練然后微調不同,CLIP可以直接使用提示進行零樣本學習圖像分類,在某個具體下游任務上實現分類。CLIP在具體的細粒度對象分類、地理定位、視頻中的動作識別和OCR等27個數據集的任務中表現十分優異。圖:圖:CLIPCLIP模型實現圖文信息配對模型實現圖文信息配對圖:圖:CLIPCLIP在諸多零樣本學習任務上表現較好在諸多零樣本學習任務上表現較好資料來源:OpenAI,中信建投資料來源:Learning Transferable Visual Models From Natural Language Supervi
55、sion,中信建投 2.16 DALLE模型實現文本到圖像的跨模態生成 與與CLIPCLIP模型同期模型同期,OpenAIOpenAI開始關注多模態的生成任務開始關注多模態的生成任務,公布了圖像生成模型公布了圖像生成模型DALLEDALLE。DALLEDALLE模型包括三個主體部分:模型包括三個主體部分:dVAEdVAE、TransformerTransformer和和CLIPCLIP。首先通過dVAE將圖像信息轉序列,后將圖像序列和文本序列融合拼接,將拼接輸入的數據輸入transformer中進行自回歸訓練,在圖像生成過程中,通過文本序列自回歸得到圖像序列,在dVAE中實現圖像的還原生成過程
56、,最后通過訓練好的CLIP模型進行匹配打分來把控生成質量。20222022年年4 4月提出的月提出的DALLEDALLE 2 2進一步升級進一步升級。首先是利用CLIP文本編碼器將圖像描述映射到表示空間,其次利用擴散先驗從CLIP文本編碼映射到相應的CLIP圖像編碼,最后通過反向擴散從表示空間映射到圖像空間,生成眾多可能圖像中的一個。圖:圖:DALLEDALLE模型主體結構模型主體結構圖:圖:DALLEDALLE 2 2模型主體結構模型主體結構資料來源:Zero-Shot Text-to-Image Generation,OpenAI,中信建投基于基于CLIPCLIP模型構建起圖像模型構建起圖
57、像和文本的統一語義關系和文本的統一語義關系基于擴散模型實現基于擴散模型實現高質量的圖像生成高質量的圖像生成圖像信息圖像信息轉序列轉序列文本信息文本信息轉序列轉序列文本序列和圖像序列融合文本序列和圖像序列融合資料來源:Hierarchical Text-Conditional Image Generation with CLIP Latents,中信建投 2.17 Whisper實現語音到文本的跨模態生成 2022年9月,OpenAI提出自動語音識別(ASR)系統Whisper,根據從網絡收集的68萬小時的多語言和多任務監督數據進行訓練,Whisper支持99種語言,英語語料內容大約占據2/3。
58、WhisperWhisper架構采用標準的架構采用標準的TransformerTransformer模型編碼器模型編碼器-解碼器解碼器。輸入音頻被分成30秒一段的片段,然后轉換成log-Mel頻譜圖傳遞到編碼器。編碼器來計算注意力,最后把數據傳遞給解碼器,解碼器被訓練來預測相應的文本,并添加特殊標記,這些標記用來對單個模型執行諸如語言識別、多語言語音轉錄和英語語音翻譯等任務。圖:語音識別模型圖:語音識別模型WhisperWhisper主體架構主體架構圖:圖:WhisperWhisper在長文本轉錄方面具有較強競爭力在長文本轉錄方面具有較強競爭力資料來源:OpenAI,中信建投資料來源:Robu
59、st Speech Recognition via Large-Scale Weak Supervision,中信建投 2.18 未來技術展望 著眼于通用人工智能的發展目標,我們預計,OpenAI的研究會沿著兩個方向進一步延升:多模態能力不斷提升;大模型充當AI代理、能力范圍不斷擴大。多模態能力不斷提升多模態能力不斷提升。GPT-4初步融入了多模態能力,具備了圖像的識別和理解能力,OpenAI在圖像生成方面也頗有建樹,預期未來在大語言模型基礎之上,也會融入圖像生成等多模態能力。大模型充當大模型充當AIAI代理代理,通過調用各種專業化工具進一步擴大能力范圍通過調用各種專業化工具進一步擴大能力范圍
60、。大語言模型未來將與搜索引擎、代碼編程工具、實體機器人等專業化工具進一步深化融合,打造更強大高效的多任務解決方案,為現實世界中的復雜任務提供全面的支持,讓大模型成為日常生活中的個人助理,充分釋放個人創造力。圖:大語言模型與圖:大語言模型與AIGCAIGC模型的融合途徑模型的融合途徑圖:圖:AIAI代理進一步擴大語言模型能力范圍代理進一步擴大語言模型能力范圍資料來源:One Small Step for Generative AI,One GiantLeap for AGI:A Complete Survey on ChatGPT in AIGC Era,中信建投資料來源:Tool Learni
61、ng with Foundation Models,中信建投 第三章第三章大模型全面賦能微軟傳統業務大模型全面賦能微軟傳統業務2929 大語言模型具備出色的文本理解與處理能力大語言模型具備出色的文本理解與處理能力,個人辦公領域涉及到大量的文本處理工作個人辦公領域涉及到大量的文本處理工作,與大語言模型的優勢高度契合與大語言模型的優勢高度契合,是大語言模型最佳落地場景是大語言模型最佳落地場景。微軟業務多聚焦在個人辦公領域,是OpenAI的最佳合作伙伴之一。微軟和OpenAI合作始于2016年,2019年7月合作關系得到進一步鞏固,隨后不斷在Aure云、大模型模型方面加強合作。OpenAIOpenA
62、I與微軟達成人工智能行業的一次雙贏合作與微軟達成人工智能行業的一次雙贏合作。OpenAI的通用人工智能研究需要龐大的計算能力做支撐,同樣需要充足的資金支持去支付運營成本和科研人員薪酬。微軟也亟待OpenAI的合作增強其AI技術實力,微軟作為OpenAI先進人工智能技術的首選商業合作伙伴,獲得了人工智能技術商業化的競爭力。3.1 個人辦公是自然語言大模型的最佳落地場景資料來源:微軟,OpenAI,中信建投圖:微軟和圖:微軟和OpenAIOpenAI合作歷程合作歷程 3.2 大模型以云為基,全面賦能微軟傳統業務資料來源:中信建投圖:微軟產品體系下各業務與大模型結合下的新功能及展望圖:微軟產品體系下
63、各業務與大模型結合下的新功能及展望 3.3 微軟分業務經營情況資料來源:微軟財報,中信建投備注:微軟財年為上年7月1日至當年6月30日 微軟FY2023Q3的營業收入為528.57億美元,同比增長7.1%,營業利潤達到223.5億美元,同比增長9.7%,毛利率為69%。生產力及業務流程:生產力及業務流程:FY2023Q3營業收入175.2億美元,同比增長10.9%。得益于Office 365 copilot的推出,Office 365Commerical營收同比增長14%,用戶量增加11%,而Microsoft 365的訂閱量達到6540萬,同比增長12%。Dynamics產品營收同比增長25
64、%。智能云業務:智能云業務:FY2023Q3營業收入220.8億美元,同比增長15.9%,其中Azure和其他云服務收入增長27%。個人計算業務:個人計算業務:2023Q3營業收入132.6億美元,同比降低8.7%。受PC需求疲軟影響,Windows OEM收入和設備收入分別減少28%和30%。New Bing的推出帶來了搜索量和用戶量的提升疊加收購Xandr,搜索和新聞廣告業務收入同比增長10%。圖:微軟營業收入和營業利潤情況(億美金)圖:微軟營業收入和營業利潤情況(億美金)圖:微軟圖:微軟主營業務收入構成(億美元)主營業務收入構成(億美元)118.49151.22130.36140.86
65、133.14174.65145.20 143.56133.30142.37132.60123.19133.53135.52146.91150.39159.36157.89 166.00164.70170.02175.16129.86146.01151.18173.75169.64183.27190.51209.09203.30215.08 220.810.00100.00200.00300.00400.00500.00600.00個人計算業務生產力及業務流程智能云1,103.601,258.431,430.151,680.881,982.701,557.26350.58429.59529.59
66、699.16833.83642.6914.3%14.0%13.7%17.5%18.0%6.4%19.5%22.5%23.3%32.0%19.3%2.3%0.0%5.0%10.0%15.0%20.0%25.0%30.0%35.0%0.00500.001,000.001,500.002,000.002,500.00FY2018FY2019FY2020FY2021FY2022FY23Q1-Q3營業收入營業利潤營收yoy利潤yoy資料來源:微軟財報,中信建投 3.4 OpenAI服務與Azure云深度融合 MicrosoftMicrosoft AzureAzure是全球第二大云服務提供平臺是全球第二大
67、云服務提供平臺。Azure智能云平臺是微軟的公用云端服務平臺,遍布全球42個區域覆蓋百余個數據中心,根據Synergy數據,2023Q1 Microsoft Azure占到23%的云服務提供商市場份額,僅次于亞馬遜AWS。大模型對微軟大模型對微軟AzureAzure云服務產生直接促進作用云服務產生直接促進作用。OpenAI成立之初,與微軟就Azure云展開了合作,后續OpenAI把服務逐步轉移到微軟Azure云上運行。自然語言大模型背后需要龐大的算力和通信帶寬做支撐,對Azure云服務產生了直接促進作用。Azure OpenAI服務允許通過API訪問OpenAI的模型,包括GPT-4、Chat
68、GPT、Codex、DALL-E 2和Embeddings模型系列。微軟智能云業務FY2023Q1-Q3營收639億美金,單Q3營收221億美元,同比增長16%,其中Azure和其他云服務收入增長27%。FY23Q3 Azure OpenAI已有2500個服務客戶,下個季度中有一個百分點的收入增長來自于人工智能下個季度中有一個百分點的收入增長來自于人工智能。圖:微軟智能云業務收入情況及增速圖:微軟智能云業務收入情況及增速圖:圖:23Q123Q1云服務提供商市場份額情況云服務提供商市場份額情況32%23%10%4%3%3%2%2%21%Amazon AWSMicrosoft AzureGoogl
69、e CloudAlibaba CloudIBM CloudSalesforceORACLETencent CloudOther322.19389.85483.66600.8752.51639.1417.4%21.0%24.1%24.2%25.3%17.60%0.0%5.0%10.0%15.0%20.0%25.0%30.0%0100200300400500600700800營業收入(億美金)yoy資料來源:微軟財報,中信建投資料來源:Synergy,中信建投 3.5 OpenAI助力Azure云增強其生態優勢和協同效應 MicrosoftMicrosoft AzureAzure云具備較強的生態優
70、勢和協同效應云具備較強的生態優勢和協同效應。Azure云提供Office 365、Dynamics、LinkedIn等Saas化服務,微軟IaaS、PaaS、SaaS各產品均采用同類數據模型,形成較強的協同優勢。近期近期,AzureAzure云市場份額占比持續不斷上升云市場份額占比持續不斷上升。OpenAIOpenAI與與MicrosoftMicrosoft AzureAzure云深度融合之后云深度融合之后,實現了其實現了其SaasSaas化服務的全面賦能化服務的全面賦能。通過將大模型能力融入Office 365、Dynamics、LinkedIn等產品,不斷增強其豐富生態下的產品能力。Azu
71、re OpenAI同時提供大模型的全棧式工具,其中包括預訓練的大模型、大模型的應用微調、用于檢測和減輕人工智能有害輸出的工具、基于用戶的訪問控制和專用網絡的企業級安全性保障。全棧工具促進企業級應用與大模型的結合,進一步增強云上業務的協同優勢。圖:云服務提供商市場份額變化情況圖:云服務提供商市場份額變化情況圖:圖:MicrosoftMicrosoft AIAI產品組合產品組合資料來源:worldwide,中信建投0.0%10.0%20.0%30.0%40.0%50.0%60.0%18Q118Q218Q318Q419Q119Q219Q319Q420Q120Q220Q320Q421Q121Q221Q
72、321Q422Q122Q222Q322Q423Q1Amazon AWSMicrosoft AzureGoogle CloudOther資料來源:微軟,中信建投 3.6 ChatGPT進一步強化Office操作便捷、功能強大的優勢 OfficeOffice因為操作簡單因為操作簡單、功能強大而快速占領市場功能強大而快速占領市場。微軟Word具備“所見即所得”的編輯模式和支持鼠標操作的簡潔模式,Excel支持自動計算公式,支持宏等功能,讓用戶能在簡便操作下完成復雜任務。Office因為操作簡單、功能強大而快速占領市場,據worldwide數據,2022年Office 365在全球辦公套件領域市場中份
73、額占比為45.5%。微軟推出的微軟推出的MicrosoftMicrosoft 365365 CopilotCopilot,通過大型語言模型進一步強化通過大型語言模型進一步強化OfficeOffice 365365操作簡單操作簡單、功能強大的優勢功能強大的優勢。Microsoft365 Copilot將大語言模型與Microsoft Graph中的數據以及Microsoft 365應用程序相結合,重塑個人生產力。通過copilot應用程序,大語言模型中深刻融入到個人工作流程中,為個人工作者釋放生產力、提升創造力同時增強技能。Copilot同時提供商務聊天模式,匯集文檔、演示文稿、日歷等數據來源,
74、增強團隊成員的信息融合。目前目前MicrosoftMicrosoft 365365CopilotCopilot仍在試用階段仍在試用階段,未來有望推出定價從而拉動未來有望推出定價從而拉動OfficeOffice 365365業務量價齊升業務量價齊升。圖:圖:20222022年全球辦公軟件市場份額情況年全球辦公軟件市場份額情況圖:圖:Microsoft 365 CopilotMicrosoft 365 Copilot資料來源:worldwide,中信建投50.3%45.5%2.4%0.5%Google AppsMicrosoft Office 365Microsoft PowerPointAdob
75、e Acrobat Pro資料來源:微軟官網,中信建投 3.7 ChatGPT進一步強化Office操作便捷、功能強大的優勢 WordWord:Copilot協助用戶實現文檔的創建、編寫、潤色、總結,讓用戶專注于創造力富集、重要的工作之中。ExcelExcel:Copilot可以根據用戶需求生成模型,快速實現數據的定量分析,同時提供強大的可視化功能。Copilot協助用戶快速理解和分析數據,尋找潛藏在數據背后的客觀事實。PowerPointPowerPoint:可以通過Copilot直接基于相關的Word,一鍵生成演示文稿;也可以通過自然語言的命令,根據提示或大綱創建新的演示文稿;也可以通過語
76、言命令來調整布局、重新格式化文本、添加動畫效果。OutlookOutlook:Copilot幫助用戶篩選和總結重要的電子文件內容,并根據自然語言命令自動生成相關的電子郵件。通過Copilot可以有效地減少辦公中閱讀瀏覽電子郵件和回復電子郵件的時間,顯著提高辦公效率。圖:圖:WordWord中根據用戶需求生成文檔初稿中根據用戶需求生成文檔初稿圖:圖:PowerPointPowerPoint根據根據WordWord一鍵生成相關演示文稿一鍵生成相關演示文稿資料來源:微軟官網,中信建投資料來源:微軟官網,中信建投 3.8 Dynamics 365通過大模型進一步實現企業運行的降本增效資料來源:微軟官網
77、,中信建投 DynamicsDynamics 365365是微軟面對企業現代化需求推出的智能化應用組合是微軟面對企業現代化需求推出的智能化應用組合。Dynamics 365融合企業的銷售業務和信息管理服務,統一整合Dynamics CRM和Dynamics NA ERP等產品,有效連接組織架構下的人員、數據和操作流程,降低企業的運行成本并且簡化了商業流程。大模型助力大模型助力DynamicsDynamics 365365 CopilotCopilot實現企業運行的降本增效實現企業運行的降本增效。CRM(客戶關系管理)、ERP(企業資源管理)系統中經常需要執行繁瑣的任務操作,比如數據的手工輸入、
78、內容生成和事實記錄。微軟率先將大語言模型與其CRM、ERP系統進行融合,幫助用戶實現任務自動化、提供工作創意、并獲得見解,從而快速推進交易、深入理解客戶需求,提升客戶問題的響應速度。例如Dynamics 365下的Viva Sales,允許賣家使用Microsoft 365和Microsoft Teams自動將數據捕獲到CRM系統中,消除了手動數據輸入,同時通過AI推薦最佳的營銷行動,縮短整個銷售周期,Viva Sales用戶每月收費40美元。圖:圖:VivaViva SalesSales通過通過AIAI建議縮減銷售周期建議縮減銷售周期圖:圖:CustomerCustomer Insights
79、Insights利用生成式利用生成式AIAI提供實時客戶數據分析提供實時客戶數據分析資料來源:微軟官網,中信建投 3.9 Dynamics 365 Copilot通過AI加強核心競爭力 微軟具有的強大的報告和數據分析能力,憑借這一優勢Dynamics 365占據ERP市場主導地位。根據Software Connect數據,2022年ERP市場中,微軟市場份額占比超過30%。引入大模型之后,進一步加強Dynamics在ERP方面的優勢。根據Worldwide數據,2021年微軟在CRM的市場占比為5.3%。在CRM領域中面對Salesforce和Oracle的競爭中,核心競爭力主要是簡單易操作的
80、界面和集成度高的相關辦公軟件(可以與Access和Outlook集成)。Dynamics 365 Copilot通過自然語言模型進一步提高自身操作便捷的優勢,通過簡單語言命令完成相關操作。也可以通過AI增強與其他微軟產品的聯系,提升高集成度下的工作效率。圖:圖:20222022全球全球ERPERP市場份額情況市場份額情況圖:圖:20162016-20212021年年CRMCRM市場份額情況市場份額情況31.50%11.80%8.10%6.10%5.10%1.60%1.60%29.70%MicrosoftSAPDeltekSageOracleWorkdayEpicorOther資料來源:Soft
81、ware Connect,中信建投18.1%19.6%16.8%18.4%19.5%23.8%7.2%6.5%5.6%5.3%4.8%5.4%9.4%7.1%5.7%5.2%4.8%5.1%4.0%3.4%3.7%4.0%5.3%3.2%3.5%3.6%3.8%3.8%0.0%5.0%10.0%15.0%20.0%25.0%30.0%35.0%40.0%45.0%50.0%SAPOracleMicrosoftAdobe資料來源:Worldwide,中信建投 3.10 Linkedin通過引入GPT-4提高商業社交效率 LinkedIn(領英)是面向商業的社交網站,于2003年5月正式推出。與F
82、acebook和Myspace等其他社交網站不同,LinkedIn強調用戶之間的專業聯系,而不僅僅是用于娛樂與社交的網站與應用。用戶可以在個人資料界面制作簡歷、介紹自己的職業、技能和工作經驗,通過搜索等方式建立自己在工作上的聯系和社交網絡。微軟在2016年完成了對LinkedIn的收購。LinkedinLinkedin通過引入大語言模型加快招聘流程通過引入大語言模型加快招聘流程、提升商業效率提升商業效率。Linkedin將GPT-4融入到AI助理之中,幫助招聘單位加快招聘流程,AI助理根據公司名稱、職業名稱、工作類型等信息快速生成職位描述;針對個人用戶,AI助理可以根據用戶的工作經歷和相關工作
83、技能,提供關于個人頁面標題和摘要的撰寫建議。圖:圖:LinkedinLinkedin利用大模型快速實現職位描述利用大模型快速實現職位描述圖:圖:AIAI助理提供的寫作建議助理提供的寫作建議資料來源:Linkedin,中信建投資料來源:Linkedin,中信建投 3.11 Bing引入GPT-4有效提升搜索效率與交互體驗 20232023年年2 2月月7 7日日,微軟推出了引入大模型驅動的微軟推出了引入大模型驅動的NewNew BingBing和和EdgeEdge瀏覽器瀏覽器。在引入了GPT-4后,bing優化了相關的搜索體驗,大語言模型可以幫助查看來自整個互聯網下的搜索結果,自動查找、整合和匯
84、總相關答案,同時bing提供了相應的網站索引,方便進一步查看。根據根據FYFY2323Q Q3 3財報數據財報數據,BingBing移動應用的每日安裝量增長了移動應用的每日安裝量增長了4 4倍倍。隨著GPT-4的引入,Bing新增了Bing Chat等功能,可以通過交互式聊天的方式進行更復雜的搜索,用戶可以通過不斷的交流來完善自己的要求。GPT-4的引入讓Bing也不再僅僅擁有搜索的功能,還可以根據用戶的相關要求,撰寫電子郵件、生成具體的文案、內容來幫助用戶產生靈感。圖:使用圖:使用BingBing生成旅行計劃生成旅行計劃圖:圖:BingBing搜索每日訪問人次(百萬)搜索每日訪問人次(百萬)
85、資料來源:微軟,中信建投303540455055NewNew BingBing資料來源:similarweb,中信建投 3.12 Bing率先引入多模態生成能力 20232023年年3 3月月2121日日,微軟將微軟將BingBing ImageImage CreatorCreator集成到集成到NewNew BingBing當中當中。Bing Image Creator可以通過AI的方式根據文字描述生成相應圖片,該功能基于OpenAI的多模態模型DALL-E,Bing不僅可以搜索網絡上已經存在的圖像,還可以根據用戶的相關描述,直接生成相關的圖像,進一步提升Bing用戶的體驗。BingBing
86、推出了推出了KnowledgeKnowledge CardsCards 2 2.0 0功能功能。Bing新增的圖譜卡片會出現在必應搜索結果頁面的右側,可以通過提供圖像、短視頻、圖表、時間線等方式幫助用戶快速探索感興趣的內容,增加用戶在使用Bing時的搜索體驗和內容交互方式,使查找資料的過程更加高效和有趣。圖:圖:Bing Image CreatorBing Image Creator的圖片生成功能的圖片生成功能圖:圖:BingBing的的Knowledge Cards 2.0Knowledge Cards 2.0功能功能資料來源:微軟,中信建投資料來源:微軟,中信建投 3.13 Windows
87、有望憑借ChatGPT再度提升其市場份額資料來源:微軟,中信建投 ChatGPTChatGPT與與WindowsWindows融合進一步增強融合進一步增強WindowsWindows操作的便捷性操作的便捷性。微軟計劃將Bing With ChatGPT接入到Windows 11的任務欄中,以此提高用戶的操作性,同時讓Windows用戶能夠更容易的找到系統中的任何文件和信息,以此提高Windows便捷的操作性。WindowsWindows有望憑借有望憑借ChatGPTChatGPT再度提升市場份額再度提升市場份額。Windows的早期成功主要是因為它的兼容性和開放性,2013年windows在操
88、作系統中的市場份額占比在90%以上,隨著MacOS系統的不斷優化和其他操作系統的加入,Windows逐步下滑至2023年初的74.1%。Windows操作系統積極與大語言模型融合,同時搭載ChatGPT的Windows11操作系統份額快速提升至18.12%,我們認為,Windows有望憑借大模型再度提升其市場份額。圖:圖:ChatGPTChatGPT融入融入Windows 11Windows 11任務欄任務欄圖:圖:20232023年年1 1月操作系統市場份額情況月操作系統市場份額情況圖:圖:WindowsWindows操作系統份額變化情況操作系統份額變化情況68.86%9.55%18.12%
89、0%10%20%30%40%50%60%70%80%90%100%21-0121-0221-0321-0421-0521-0621-0721-0821-0921-1021-1121-1222-0122-0222-0322-0422-0522-0622-0722-0822-0922-1022-1122-1223-01Win10Win7Win8.1Win8WinXPWinVistaWin2003OtherWin1174.1%15.3%2.9%2.4%5.3%WindowsmacOSLinuxChrome OSOthers資料來源:StatCounter,中信建投資料來源:StatCounter,中
90、信建投 第四章第四章OpenAIOpenAI打開打開AIAI應用新局面應用新局面4343 4.1 GPT-4顯著提升代碼編程效率和質量資料來源:Github Copilot,中信建投 GPTGPT-4 4可以根據需求自動生成可以根據需求自動生成、修改修改、優化代碼優化代碼,提高編程的效率和質量提高編程的效率和質量。以往在編程過程中,程序員需要經歷搜索相關代碼,學習代碼,編寫代碼的復雜過程。而GPT-4通過學習和整合大量代碼,可以根據所寫代碼上下文意圖進行匹配,直接生成相關代碼,還可以幫助程序員修改代碼中的錯誤,大大提升程序員的編程效率和編程質量。OpenAIOpenAI和和GithubGith
91、ub合作推出合作推出AIAI輔助代碼生成工具輔助代碼生成工具GithubGithub CopilotCopilot。Copilot可以通過注釋了解程序員的目的,自動匹配相關代碼,并根據上下文進行理解,生成所需要的代碼。除此之外,還可以幫助程序員減少重復性的代碼編程工作,自動AI生成接下來的代碼,而代碼準確性也會隨著上下文的理解而不斷提升,讓程序員可以專注于創新性的代碼編程。2022年6月底,Github Copilot已正式上線,定價每月 10 美元或每年 100 美元,對學生用戶和流行開源項目的維護者免費提供。圖:使用圖:使用GitHub CopilotGitHub Copilot直接生成相
92、關代碼直接生成相關代碼圖:使用圖:使用GitHub CopilotGitHub Copilot顯著提升程序員工作效率顯著提升程序員工作效率資料來源:Github Copilot,中信建投 4.2 GPT-4成為金融領域強力的信息匯總和分析工具 GPT-4具備優秀的數據整合、搜索和分析的能力,在投研、投顧、營銷、客服、運營、風控等各類金融業務場景下都將具有廣泛的應用和可觀的潛力,可以為金融業投資者和金融從業人員提供更高質量的信息和數據分析服務。MorganMorgan StanleyStanley利用利用GPTGPT-4 4來實現企業運作中多維度的提升來實現企業運作中多維度的提升。Morgan
93、Stanley內部數據庫中包含了大量高質量的涵蓋全球資本市場、資產類別、行業分析和經濟區域等方面的見解。這些數據以PDF形式存儲在多個內部網站中,而GPT-4的應用讓這些豐富而深刻的知識以一種更可用和可操作的形式出現,助力公司內部數據與知識應用高效化。彭博社彭博社(Bloomberg)發布擁有發布擁有500億個參數的針對金融領域的自然語言模型億個參數的針對金融領域的自然語言模型BloombergGPT。BloombergGPT在常規金融問答(ConvFinQA)、情緒分析(FIQA SA)、包含觀點的金融專業詞匯分析(FPB)、通過對新聞標題研究得到特定商品價格的上漲或者下跌信息等金融領域的測
94、試中均表現優異,同時不會犧牲通用自然語言模型的基準性能。圖:咨詢圖:咨詢GPTGPT-4 4如何在如何在Morgan StanleyMorgan Stanley開通線上賬戶開通線上賬戶圖:圖:BloombergGPTBloombergGPT外部金融任務測試結果外部金融任務測試結果資料來源:OpenAI,中信建投資料來源:BloombergGPT:A Large Language Model for Finance,中信建投 4.3 GPT-4全方位提升醫療領域的智能化與數字化 醫療領域同樣是大語言模型結合的優秀場景醫療領域同樣是大語言模型結合的優秀場景,GPTGPT-4 4可以提升醫療領域的智
95、能化與數字化可以提升醫療領域的智能化與數字化。GPT-4可以幫助醫生和護士快速準確的撰寫病例和醫療記錄,節約時間和成本,同時根據病例,檢查結果等信息,提供合理的診斷建議和治療方案,輔助醫生做出決策,提高醫療質量和安全性。GPT-4還可以在知識普及、診斷輔助,科研支持等方面與醫療進行結合,提升醫療診斷水平和效率。Dragon Ambient eXperience(DAX)是Nuance和微軟聯合推出的首個用于醫療保健的全人工智能自動化臨床文檔應用程序。該應用程序與GPT-4深度結合,通過對話式、環境AI和多模態輸入數據,自動生成電子病例,導入醫療信息化系統,不需要醫生手動記錄和導入,大大提高了醫
96、療效率和管理效率,助力醫療領域進行數字化轉型,并提供更好的醫患體驗。圖:圖:DADAX X提供全方位的人工智能醫療解決方案提供全方位的人工智能醫療解決方案圖:圖:DADAX X自動生成文檔示意圖自動生成文檔示意圖資料來源:Nuance,中信建投資料來源:Nuance,中信建投 4.4 GPT-4提高教育和學習的效率和針對性 教育領域,GPT-4可以提高教育和學習的效率和針對性。GPT-4可以作為教師的輔助工具,幫助教師準備教案、出題、批改作業、評估學生水平等;也可以作為學生的學習伙伴,根據學生的水平和喜好,提供針對性的學習方案,幫助學生復習、練習、拓展知識、提高學習興趣。CheggMate是C
97、hegg打造的AI學習平臺。通過引入GPT-4模型,CheggMate將GPT-4的強大功能與Chegg廣泛的內容庫和專家庫相結合,通過AI提供更為快速和更具對話性的問題回復,通過實時AI導師的方式,提供定制化教育服務,適應學生的學習需求,提供個性化評估和練習測試,提供更加良好的學習體驗。Khan Academy是一個非盈利的教育平臺。其2022 年開始測試最新版本的Open AI語言模型,將向部分參與者提供 Khanmigo試點計劃。結合GPT-4打造的 Khanmigo AI助手可以為學習者提供定制化的教育以及為教師提升工作效率。圖:圖:CheggMateCheggMate交流頁面交流頁面
98、圖:圖:KhanmigoKhanmigo幫助教師設計教學方案幫助教師設計教學方案資料來源:CheggMate,中信建投資料來源:Khanmigo,中信建投 4.5 GPT-4提升零售中的業務效率和用戶體驗 GPTGPT-4 4幫助企業不斷的創新和提升服務質量幫助企業不斷的創新和提升服務質量,提升零售業的業務效率和用戶體驗提升零售業的業務效率和用戶體驗。GPT-4在零售業中,可以幫助企業生成個性化的商品推薦和描述,根據消費者的喜好,生成不同的商品信息,增加消費者的興趣和體驗;同時,也可以通過GPT-4構建智能的客服對話,提升用戶的售后體驗。Stripe是一個支付平臺是一個支付平臺,借助借助GPT
99、4的能力進行更好地服務客戶的能力進行更好地服務客戶、回答技術問題以及識別虛假信息回答技術問題以及識別虛假信息。Stripe借助GPT-4的能力可以掃描隱藏網站并且做出匯總,節省了人工精力更好地服務客戶。此外,借助GPT-4,Stripe能夠快速理解用戶的問題,閱讀詳細的文檔,梳理想關信息分并總結出解決方案,極大提升工作效率。GPT-4還會幫助識別虛假信息,通過分析社區Discord 中帖子的語法,就會發現欺詐團隊,以方便相關工作人員將他們清除出去。圖:圖:利用利用StripeStripe中的中的Docs AIDocs AI搜集信息搜集信息圖:圖:StipeStipe引入引入GPTGPT-4 4
100、去提升用戶體驗和對抗虛假信息去提升用戶體驗和對抗虛假信息資料來源:Stripe,中信建投Docs AI搜集并總結出關于test mode的信息資料來源:Stripe,中信建投 第五章第五章風險提示風險提示4949 風險提示技術發展不及預期:技術發展不及預期:人工智能模型屬于先進AI算法,若后續算法更新迭代效果不及預期,則會影響人工智能模型演進及拓展,進而會影響其商業化落地等;算法隱私問題:算法隱私問題:人工智能在進行預訓練過程中,使用了大量數據,其中會涉及相關隱私問題;應用不及預期:應用不及預期:人工智能算法與相關應用落地之間還存在一定距離,需要注意應用落地不及預期風險;數據質量不及預期:數據
101、質量不及預期:人工智能模型需要大量的高質量數據進行訓練,若數據數量和質量存在短板,則會影響模型效果;倫理沖突風險:倫理沖突風險:人工智能模型將進一步推動人工智能邁向通用型人工智能,人工智能進一步智能化將產生人工智能欺騙、人工智能上癮等一系列倫理問題;感謝樊文輝對本報告的貢獻。分析師介紹分析師介紹閻貴成:閻貴成:中信建投證券通信&計算機行業首席分析師,北京大學學士、碩士,專注于云計算、物聯網、信息安全、信創與5G等領域研究。近8年中國移動工作經驗,6年多證券研究經驗。系2019-2021年新財富、水晶球通信行業最佳分析師第一名,2017-2018年新財富、水晶球通信行業最佳分析師第一名團隊核心成
102、員。金戈:金戈:中信建投證券研究發展部計算機行業聯席首席分析師,帝國理工學院工科碩士,擅長云計算、金融科技、人工智能等領域。于芳博于芳博:中信建投人工智能組首席分析師,北京大學空間物理學學士、碩士,2019年7月加入中信建投,主要覆蓋人工智能等方向,下游重點包括智能汽車、CPU/GPU/FPGA/ASIC、EDA和工業軟件等方向。評級說明評級說明投資評級標準評級說明報告中投資建議涉及的評級標準為報告發布日后6個月內的相對市場表現,也即報告發布日后的6個月內公司股價(或行業指數)相對同期相關證券市場代表性指數的漲跌幅作為基準。A股市場以滬深300指數作為基準;新三板市場以三板成指為基準;香港市場
103、以恒生指數作為基準;美國市場以標普 500 指數為基準。股票評級買入相對漲幅15以上增持相對漲幅5%15中性相對漲幅-5%5之間減持相對跌幅5%15賣出相對跌幅15以上行業評級強于大市相對漲幅10%以上中性相對漲幅-10-10%之間弱于大市相對跌幅10%以上 分析師聲明分析師聲明本報告署名分析師在此聲明:(i)以勤勉的職業態度、專業審慎的研究方法,使用合法合規的信息,獨立、客觀地出具本報告,結論不受任何第三方的授意或影響。(ii)本人不曾因,不因,也將不會因本報告中的具體推薦意見或觀點而直接或間接收到任何形式的補償。法律主體說明法律主體說明本報告由中信建投證券股份有限公司及/或其附屬機構(以下
104、合稱“中信建投”)制作,由中信建投證券股份有限公司在中華人民共和國(僅為本報告目的,不包括香港、澳門、臺灣)提供。中信建投證券股份有限公司具有中國證監會許可的投資咨詢業務資格,本報告署名分析師所持中國證券業協會授予的證券投資咨詢執業資格證書編號已披露在報告首頁。在遵守適用的法律法規情況下,本報告亦可能由中信建投(國際)證券有限公司在香港提供。本報告作者所持香港證監會牌照的中央編號已披露在報告首頁。一般性聲明一般性聲明本報告由中信建投制作。發送本報告不構成任何合同或承諾的基礎,不因接收者收到本報告而視其為中信建投客戶。本報告的信息均來源于中信建投認為可靠的公開資料,但中信建投對這些信息的準確性及
105、完整性不作任何保證。本報告所載觀點、評估和預測僅反映本報告出具日該分析師的判斷,該等觀點、評估和預測可能在不發出通知的情況下有所變更,亦有可能因使用不同假設和標準或者采用不同分析方法而與中信建投其他部門、人員口頭或書面表達的意見不同或相反。本報告所引證券或其他金融工具的過往業績不代表其未來表現。報告中所含任何具有預測性質的內容皆基于相應的假設條件,而任何假設條件都可能隨時發生變化并影響實際投資收益。中信建投不承諾、不保證本報告所含具有預測性質的內容必然得以實現。本報告內容的全部或部分均不構成投資建議。本報告所包含的觀點、建議并未考慮報告接收人在財務狀況、投資目的、風險偏好等方面的具體情況,報告
106、接收者應當獨立評估本報告所含信息,基于自身投資目標、需求、市場機會、風險及其他因素自主做出決策并自行承擔投資風險。中信建投建議所有投資者應就任何潛在投資向其稅務、會計或法律顧問咨詢。不論報告接收者是否根據本報告做出投資決策,中信建投都不對該等投資決策提供任何形式的擔保,亦不以任何形式分享投資收益或者分擔投資損失。中信建投不對使用本報告所產生的任何直接或間接損失承擔責任。在法律法規及監管規定允許的范圍內,中信建投可能持有并交易本報告中所提公司的股份或其他財產權益,也可能在過去12個月、目前或者將來為本報告中所提公司提供或者爭取為其提供投資銀行、做市交易、財務顧問或其他金融服務。本報告內容真實、準
107、確、完整地反映了署名分析師的觀點,分析師的薪酬無論過去、現在或未來都不會直接或間接與其所撰寫報告中的具體觀點相聯系,分析師亦不會因撰寫本報告而獲取不當利益。本報告為中信建投所有。未經中信建投事先書面許可,任何機構和/或個人不得以任何形式轉發、翻版、復制、發布或引用本報告全部或部分內容,亦不得從未經中信建投書面授權的任何機構、個人或其運營的媒體平臺接收、翻版、復制或引用本報告全部或部分內容。版權所有,違者必究。中信建投證券研究發展部中信建投證券研究發展部中信建投(國際)中信建投(國際)北京東城區朝內大街2號凱恒中心B座12層電話:(8610)8513-0588聯系人:李祉瑤郵箱:上海浦東新區浦東南路528號南塔2106室電話:(8621)6882-1612聯系人:翁起帆郵箱:深圳福田區益田路6003號榮超商務中心B座22層電話:(86755)8252-1369聯系人:曹瑩郵箱:香港中環交易廣場2期18樓電話:(852)3465-5600聯系人:劉泓麟郵箱:charleneliucsci.hk52