《計算機行業:多模態進展迅速微軟AI應用百花齊放-231008(45頁).pdf》由會員分享,可在線閱讀,更多相關《計算機行業:多模態進展迅速微軟AI應用百花齊放-231008(45頁).pdf(45頁珍藏版)》請在三個皮匠報告上搜索。
1、請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 2023.10.08 多模態進展迅速,微軟多模態進展迅速,微軟 AI 應用百花齊放應用百花齊放 李沐華李沐華(分析師分析師)伍巍伍巍(研究助理研究助理)010-83939797 021-38031029 證書編號 S0880519080009 S0880123070157 本報告導讀:本報告導讀:隨著多模態大模型性能快速提升,以大模型驅動的各類隨著多模態大模型性能快速提升,以大模型驅動的各類 AI 應用快速落地。微軟與應用快速落地。微軟與OpenAI 主導主導 AIGC 應用走向,應用兌現迅速,深度引領應用走向,應用兌現迅速,深
2、度引領 AI辦公等市場領域發展。辦公等市場領域發展。摘要:摘要:投資建議:投資建議:推薦中國 AI 應用及 AI 算力領軍企業,推薦標的:金山辦公、科大訊飛、虹軟科技、拓維信息,受益標的:萬興科技、福昕軟件、恒潤股份。微軟攜手微軟攜手 OpenAI,AI 大模型與大模型與 AI 應用齊頭并進。應用齊頭并進。多模態正成為大模型發展的主旋律,大模型也能夠在多種模態下愈發展現出更加出色的能力,進一步推動創新應用的落地。每次 OpenAI 更新模型后,微軟都迅速推出相關應用以跟進最新技術進展,為行業樹立了典范。OpenAI 推出的推出的 GPT-4、DALLE3 等大模型,是微軟等大模型,是微軟 AI
3、 應用的核應用的核心驅動來源。心驅動來源。OpenAI 發布的 GPT-4 現已加入了語音和圖像功能,使用戶能夠通過語音與圖像的形式與之互動,為用戶提供更加豐富和多樣化的交互方式。另外,第三代 DALL E 模型它將相比以往的模型更加擅長理解文字提示,從而能生成更加細致的圖像。OpenAI 多個大模型的快速進展使得垂直領域的應用更加智能,顛覆傳統工作模式,尤其是辦公領域。同時,AI 辦公領域的其他創業公司也在興起。微軟在打造產品過程中的核心思路是把自身所有的業務問題轉化成微軟在打造產品過程中的核心思路是把自身所有的業務問題轉化成Chat 的問題,商業模式清晰,已形成行業標桿示范。的問題,商業模
4、式清晰,已形成行業標桿示范。微軟 Copilot 是全球首款 AI 智能助手,Microsoft 365 Copilot 企業版將于 2023 年 11月 1 日全面開放,用戶能以 30 美元/月的價格開通助手服務,結合辦公全家桶,用戶可以用自然語言與辦公軟件交互,個人辦公和企業協作、運營等新的運用模式都將變革現有的辦公生態。同時,Windows Copilot 通過插件連接各種軟件功能,將改變人們使用網絡獲取服務的方式,微軟操作系統龐大用戶基數預示著其活躍用戶數量將快速增長。除了傳統辦公領域,微軟 Copilot 在團隊協作、安全檢測以及軟件開發等維度也能實現高效賦能,優化現有的工作流程和業
5、務生態。風險提示:風險提示:大模型應用不及預期風險、倫理及隱私侵權風險。表表 1:推薦標的盈利預測表(股價推薦標的盈利預測表(股價 2023/09/28)股票名稱 股價 EPS(元/股)PE(倍)評級 2022A 2023E 2024E 2022A 2023E 2024E 金山辦公 375.7 2.42 3.54 4.93 155.25 106.13 76.21 增持 科大訊飛 50.93 0.24 0.96 1.23 212.21 53.05 41.41 增持 虹軟科技 40.4 0.14 0.52 0.62 288.57 77.69 65.16 增持 拓維信息 17.77-0.81 0.1
6、2 0.24-21.90 148.08 74.04 增持 數據來源:Wind,國泰君安證券研究,盈利預測均為國泰君安自主測算 評級:評級:增持增持 上次評級:增持 細分行業評級 相關報告 計算機AI 辦公商業化落地加速,多模態能力躍升 2023.09.26 計算機工業、消費雙驅動,3D視覺大有可為 2023.09.25 計算機 Windows Copilot 激活海量 AI 應用市場 2023.09.24 計算機電力現貨市場規則出爐,電力 IT迎來催化 2023.09.20 計算機國產算力催化不斷,“鵬騰”生態景氣向上 2023.09.12 行行業業專專題題研研究究 股股票票研研究究 證證券券
7、研研究究報報告告 計算機計算機 行業專題研究行業專題研究 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 2 of 45 目目 錄錄 1.AI 大模型與 AI 應用齊頭并進.3 1.1.多模態需求引領大模型不斷進化.3 1.2.OpenAI 大模型為基,與微軟攜手引領 AI 應用產品落地.5 2.OpenAI 各大模型性能提升迅速,多模態取得突破.8 2.1.OpenAI 推出 GPT-4,繼續領跑 GPT 模型.8 2.2.GPT-5 已提上日程,AI 大模型將持續顛覆更行各業.11 2.3.DALL-E 系列模型進展迅速,文圖映射性能快速提升.12 2.4.Whisper
8、 立足編碼-解碼流程,定位為通用語音識別模型.13 3.OpenAI 各類模型催生各領域創新應用.14 3.1.New Bing+DALLE3 推動圖像生成類應用崛起.15 3.2.在企業管理、營銷和銷售領域,AIGC 大有作為.17 3.3.OpenAI Codex 加持下,AI 輔助編程成為現實.18 3.4.機器人感知能力與執行效率通過生成式 AI 優化增強.19 3.5.微軟借助 LLM 通過管理現有 AI 模型可以實現復雜任務.20 4.微軟 Windows Copilot 形成 AI 應用超級流量入口,成為業界標桿21 5.AI+辦公應用是大模型落地的主要方向,商業模式較優.23
9、5.1.微軟變革軟件應用新范式:大模型作“CPU”,Chat 作指令.23 5.2.微軟 Copilot:重新定義 AI 智能辦公.25 5.3.OpenAI 也推動了 AI 辦公領域的其他創業公司的興起.32 5.3.1.電子郵件和營銷文案為代表的文本生成應用層出不窮.33 5.3.2.基于 GPT、DALLE 模型,“AI+PPT”領域玩家各顯神通 34 5.3.3.表格分析應用也是 GPT 的重要細分應用領域,產品眾多 37 6.微軟 Copilot 應用模式出彩于辦公,但遠超于辦公.39 6.1.Dynamics 365 Copilot 高效整合商業要素,釋放團隊潛能.39 6.2.S
10、ecurity Copilot 輔助安全人員檢測響應威脅和決策.41 6.3.Power Platform Copilot 讓軟件開發更簡單.42 7.投資建議.43 8.風險提示.44 XZlYnXjWaXmUtPnRtO7NdN6MpNqQnPpMiNmNrRfQmNoOaQrRwPMYnQuNxNoNoN 行業專題研究行業專題研究 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 3 of 45 1.AI 大模型與大模型與 AI應用齊頭并進應用齊頭并進 1.1.多模態需求引領大模型不斷進化多模態需求引領大模型不斷進化 語言處理領域的大模型發展已較為成熟。語言處理領域的大模
11、型發展已較為成熟。GPT-3 模型的強大表現在自然語言處理領域,GPT-3 問世也引發了一系列后續大語言模型的涌現,隨著不斷的層層迭代和進步,大語言模型在文字交流方面達到了極致的表現。然而,人們并不滿足于此,新大模型在多模態交流方面也正在取得飛速進展。多模態的布局由來已久。多模態的布局由來已久。人們希望大語言模型不僅能理解文字,還能理解音頻、圖片、視頻等多種模態。這并非空穴來風,OpenAI 從一開始就針對不同的模態開發了多個模型。其中包括針對文字對話的 GPT、針對圖像理解的 DALLE,以及針對音頻的 Whisper 等。這些工作為具備多模態能力這些工作為具備多模態能力的的 GPT-4 打
12、下了基礎。打下了基礎。谷歌最新推出的PaLM-E 模型也是一個可以同時處理視覺與文字指令輸入的大模型。它能將輸入轉化為動作輸出,從而指導機器人完成指定任務。谷歌還計劃不久后推出的 Gemin 被定位為一個多模態大模型,它將成為一個多模態智能網絡,能夠處理各種任務、數據驅動的需求,包括圖像、音頻、視頻、3D 模型甚至圖形。此外,微軟在 2023 年推出了 CoDi,它能夠從任意輸入模態的任意組合中生成語言、圖像、視頻或音頻等多種輸出模態。這標志著人機交互邁出了重要的一步,使其更具吸引力和全面性。展望未來的兩年,多模態將成為大模型發展的主旋律,大模型將繼續在多種模態下展現出更加出色的能力,以應對不
13、斷增長的需求和挑戰。圖圖 1 近年來全球大模型推出時間線如下所示近年來全球大模型推出時間線如下所示 資料來源:A Survey of Large Language Model 多模態引發大模型結構、訓練方式的變化。多模態引發大模型結構、訓練方式的變化。要實現多模態的輸入和輸出,需要提高大模型對不同形式輸入的理解能力。為此,基礎的大模型需要 行業專題研究行業專題研究 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 4 of 45 額外添加一些結構,以幫助模型將圖片、視頻和音頻等多模態輸入轉換為可分析和理解的形式。同樣地,還需要一些結構將模型生成的結果轉換為多模態輸出。這個結構通
14、常被稱為多模態解碼器-編碼器,其主要功能是實現多模態信息與公共語義空間信息之間的轉換?,F有的多模態大模型,如 CoDi 和 PaLM-E,在其架構中都包含了解碼器-編碼器結構。然而,要成功構建這樣的結構并非易事。公開網絡上缺乏高質量的多模態訓練數據集,特別是圖像-音頻和視頻-音頻之間對應轉換的數據集更是鳳毛麟角。因此,研究人員必須花費心思來解決這些訓練問題。例如,微軟例如,微軟 CoDi 模型就采用了一種巧妙的方法來應對轉換數據集缺乏模型就采用了一種巧妙的方法來應對轉換數據集缺乏的問題。的問題。它將缺乏轉換數據集的模態都轉換成文本形式,并利用這些模態轉換的文本信息進行橋接,從而實現模態之間的轉
15、換。這種方法充分利用了文本作為多模態信息之間的中介,彌補了缺乏真實轉換數據的不足。這樣一來,模型可以通過處理文本數據來學習多模態之間的關聯,進而實現多模態輸入和輸出的轉換。盡管構建多模態解碼器-編碼器結構存在一定的困難,但隨著研究人員的努力,我們可以期待更多的高質量多模態訓練數據集的開發和公開,這將進一步為實現更廣泛的多模態交互和應用提供有力支持。圖圖 2 微軟微軟 CoDi 模型的解碼器模型的解碼器-編碼器工作流程如下所示編碼器工作流程如下所示 資料來源:微軟官網 大模型參數上升,算力發展支持模型進化。大模型參數上升,算力發展支持模型進化。隨著多模態大語言模型的不斷發展,模型結構變得更加復雜
16、,模型參數量也持續上升。以谷歌的PaLM-E 模型為例,其參數量高達 3400 億,訓練參數包含了 3.6 萬億個tokens。根據媒體 semianalysis 透露,GPT4 擁有 1.8 萬億個參數,同時其訓練數據中包含了 13 萬億個 tokens。相比之下,GPT3 僅有 1750 億參數。這種模型參數量和復雜度的增加導致了訓練成本的迅速上升。然而,近年來,以英偉達為領導的人工智能算力取得了飛速的發展。英偉達推出了 A100GPU 芯片,并陸續推出了 H100 和 GH200 芯片,這些芯片在推理速度和訓練速度方面都有巨大的提升。此外,英偉達還與其他云計算廠商合作推出了 DGX Cl
17、oud 等云計算服務,使得人工智能廠商無需購買服務器也能享受到強大的算力支持。只有當算力能夠跟上大模型 行業專題研究行業專題研究 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 5 of 45 的發展進度,才有可能保證大模型的可持續發展。因此,這種人工智能算力的飛速發展對于推動大模型的進步至關重要。1.2.OpenAI 大模型為基,與微軟攜手引領大模型為基,與微軟攜手引領 AI 應用產品落地應用產品落地 微軟大規模注資微軟大規模注資 OpenAI 開展深度合作,模型與應用雙線發展。開展深度合作,模型與應用雙線發展。自 2019年起,微軟與 OpenAI 展開合作,微軟首次注資
18、 OpenAI 并在其 Azure 云計算服務上開發人工智能超級計算技術。OpenAI 逐漸將云計算服務從谷歌云遷移到 Azure,并每年在微軟云服務上進行模型訓練,成為微軟投資的重要組成部分。2020 年,微軟購買了 GPT-3 基礎技術的許可,并獲得了技術集成的優先授權,將 GPT-3 應用于 Office、Bing 搜索引擎和Microsoft design 等產品中,以改進現有工具和優化產品功能??偠灾?,OpenAI 幫助微軟不斷提升其多模態 AI 能力,而微軟則為 OpenAI 最新功能提供了強大的流量入口和使用迭代環境,二者相互結合,形成能力閉環。2021 年,微軟再次投資年,微
19、軟再次投資 OpenAI,雙方合作關系進入第二階段,從合作,雙方合作關系進入第二階段,從合作探索期進入蜜月期。探索期進入蜜月期。微軟作為 OpenAI 的云提供商,在 Azure 中集中部署 OpenAI 開發的各類工具,形成了 OpenAI 的收入來源之一。微軟開始將 OpenAI 工具與自有產品進行深度集成,并推出相應產品。其中,基于 Codex 的 AI 代碼補全工具 GitHub Copilot 于 2021 年 6 月推出。2022年,微軟通過 Edge 瀏覽器和 Bing 搜索引擎在部分國家和地區提供基于AI 圖像生成工具 DALLE 開發的 Image creator 新功能。2
20、022 年 6 月,GitHub Copilot 正式上線。2022 年 10 月,微軟宣布將推出視覺設計工具Microsoft designer。隨后,在 2022 年 11 月 30 日,OpenAI 發布了基于GPT-3.5 系列大型語言模型微調而成的全新對話式 AI 模型 ChatGPT。2023 年 1 月 7 日,外媒爆料微軟計劃將 OpenAI 的 AI 模型引入 Word、PowerPoint、Excel、Outlook 等軟件。隨著合作的深入,微軟于 2023 年2 月 1 日宣布推出 Microsoft Teams Premium,由 ChatGPT 提供技術支持,為 Te
21、ams 的高級付費版本,可提供自動生成會議紀要、生成會議模板等功能。同月,微軟短暫上線了由 ChatGPT 提供支持的新版 Bing 搜索引擎,隨后于 2 月 8 日正式上線了新版 Bing 搜索引擎和 Edge 瀏覽器,以提升用戶的搜索效率。在 2023 年 3 月 8 日,微軟宣布以公共預覽形式推出 AI 計算機視覺模型 Florence。最后,在 2023 年 3 月 17 日,微軟公布了 Microsoff 365 Copilot,計劃將 GPT-4 全面接入微軟 Office 全家桶。OpenAI 選擇微軟也不單單是商務關系促成,更來源于微軟選擇微軟也不單單是商務關系促成,更來源于微
22、軟 Azure 的高的高性能計算能力性能計算能力。在微軟還沒有擁抱開源和 Linux 的時候,為了與 Linux這個占據了市場份額超過 90%的競爭對手競爭,微軟決定在性能上要超越 linux,后來在云計算出來以后,微軟在 InfiniBand 和虛擬化作業方面進行了大量的優化,在虛擬化環境中實現了網絡性能的無損傳輸,正因為性能優勢,OpenAI 也選擇了 Azure 的高性能計算。從本質上看,25 瓦左右的腦袋的學習能力要高于插上電就幾百上千瓦的大模型,因為給一個小孩看一張老虎照片,很快他就能從成千上萬張中篩選出老虎,但還未訓練的大模型不行。但大模型有一個優點,就是它利用 GPU 可以直接復
23、制這些已經存在的知識,然后將學到的知識相互交換以提高效率,這個過程就需要高性能計算。行業專題研究行業專題研究 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 6 of 45 圖圖 3 微軟、微軟、OpenAI 大模型大模型+應用演化加速進行中應用演化加速進行中 數據來源:OpenAI、微軟官網,國泰君安證券研究 AI 應用加速落地,“應用加速落地,“AI+辦公”增長態勢最為明顯。辦公”增長態勢最為明顯。隨著大語言模型的迅猛發展,人工智能軟件應用作為商業化的最直接方式迅速落地。根據SensorTower 發布的 2023 年 AI 應用市場洞察 數據,隨著 ChatGPT 和S
24、table Diffusion 等人工智能算法的不斷更新迭代,全球人工智能市場迅速升溫。僅在 2023 年上半年,AI 應用的下載量同比增長了 114%,突破了 3 億次,超過了整個 2022 年的總下載量。同時,AI 應用內購收入同比激增了 175%,接近了 4 億美元。AI 與 Chatbot 以及 AI 與圖像的結合成為了熱門的人工智能發展方向。AI 與 Chatbot 應用的下載量占全球前100名AI應用總下載量的49%,而AI與圖像應用的下載量占比為31%。AI 與辦公軟件的結合成為了這一波人工智能應用浪潮中的核心受益方向。這一波人工智能應用浪潮的引爆點是基于自然語言處理大模型技術的
25、文字創作工具 ChatGPT 迅速成長為全球熱門應用的現象級產品。隨后,基于對圖像、視頻、音頻等多模態數據進行處理的大模型應用也迅速推廣起來。生成式人工智能天然適用于文字、音視頻、圖像等內容的自主創作場景,因此可以直接提升現有各類型辦公軟件的產品能力,推動辦公軟件的迭代升級。行業專題研究行業專題研究 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 7 of 45 圖圖 4 僅僅 2023 年上半年,年上半年,AI 應用下載量快速攀升應用下載量快速攀升 資料來源:SensorTower OpenAI 大模型獨領風騷,單月訪問量一騎絕塵。大模型獨領風騷,單月訪問量一騎絕塵。202
26、0 年 3 月 OpenAI推出 GPT-3,引發了世界大語言模型研究的浪潮,在此之后,OpenAI 不斷推出更新版本,于 2023 年 3 月 14 日發布最新的 GPT-4,憑借其巨大的模型規模、預訓練和微調的訓練策略、Transformer 架構的優勢以及多模態輸入支持,一直處于大模型進展的最前沿,在全球各個研究組織推出的大模型排行榜上,GPT 模型必定名列前茅。GPT 模型在自然語言處理和生成式人工智能領域的應用和研究中發揮著重要的作用,并為人們提供了強大的語言模型和智能助手。美國風險投資 a16z 對每月訪問量前50 的生成式 AI 網絡產品進行了排名,其中 OpenAI 推出的 C
27、hatGPT 訪問量一騎絕塵。截止 2023 年 6 月,ChatGPT 占據了整個前 50 名列表月流量的 60%,月訪問量約為 16 億,月用戶數為 2 億,這也使得 ChatGPT成為全球訪問量排名第 24 名的網站。除了排名第二的配套平臺CharacterAI,沒有其他任何一款產品擁有和 ChatGPT 一樣的增長趨勢。圖圖 5 生成式生成式 AI 產品月訪問量排名如下所示產品月訪問量排名如下所示 資料來源:a16z 行業專題研究行業專題研究 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 8 of 45 2.OpenAI各大模型性能提升迅速,多模態取得突破各大模型性
28、能提升迅速,多模態取得突破 2.1.OpenAI 推出推出 GPT-4,繼續領跑,繼續領跑 GPT 模型模型 GPT-4 是是 OpenAI 在深度學習擴展方面的最新里程碑,語音和圖像交互在深度學習擴展方面的最新里程碑,語音和圖像交互功能也得到了更新。功能也得到了更新。2023 年 3 月 14 日,OpenAI 正式發布 GTP-4。根據官網發布的 GPT-4 論文,GPT-4 已經可被視為一個通用人工智能的早期版本。2023 年 8 月 28 日,OpenAI 發布了企業版 ChatGPT,其直接對接GPT-4,并提供無限制訪問、高級數據分析功能、定制服務等服務,也支持處理更長文本輸入的長
29、上下文窗口,同時企業數據隱私和安全也能得到保證。2023 年 9 月 25 日,OpenAI 更新了 GPT-4 了語音和圖像功能,使得用戶能通過語音與 GPT-4 交流,也能以多張圖像的形式與 ChatGPT交互。至此,GPT-4 是一個真正的大型多模態模型,雖然在許多現實場景中的能力不如人類,但在各種專業和學術基準測試中表現出人類水平的性能。例如,它在模擬律師資格考試中的成績位于前 10的考生,而GPT-3.5 的成績在后 10。GPT-4 不僅在文學、醫學、法律、數學、物理科學和程序設計等不同領域表現出高度熟練程度,而且它還能夠將多個領域的技能和概念統一起來,并能理解其復雜概念。圖圖 6
30、 GPT-4 在各項測試中性能顯著優于在各項測試中性能顯著優于 GPT-3 資料來源:OpenAI 官網 除了生成能力,除了生成能力,GPT-4 還具有解釋性、組合性、可控性與空間性能力還具有解釋性、組合性、可控性與空間性能力。在視覺范疇內,雖然 GPT-4 只接受文本訓練,但 GPT-4 不僅從訓練數據中的類似示例中復制代碼,而且能夠處理真正的視覺任務,充分證明了該模型操作圖像的強大能力。另外,GPT-4 在草圖生成方面,能夠結合運用 Stable Difusion 的能力,同時 GPT-4 針對音樂以及編程的學習創造能力也得到了驗證。另外,OpenAI 花了 6 個月的時間使用對抗性測試程
31、序和 ChatGPT 的經驗教訓對 GPT-4 進行迭代調整,GPT-4 具有了更高的真實性、可控性。行業專題研究行業專題研究 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 9 of 45 圖圖 7 GPT-4 對梗圖的準確表述展現了其強大的圖片與語言理解力對梗圖的準確表述展現了其強大的圖片與語言理解力 資料來源:OpenAI 官網 GPT-4 的訓練數據集包括了的訓練數據集包括了 13 萬億個萬億個 tokens。但由于沒有高質量的訓練 token,這 13 萬億個 tokens 中包含了許多自循環的 epoch 數據。據semianalysis 官網論述,GPT-4 針
32、對文本數據進行了 2 個 epoch 的訓練,針對代碼數據進行了 4 個 epoch 的訓練。即便網絡上存在著大量高質量的文本、視頻、音頻 token,以正規方式獲取數據并非如簡單的網頁抓取那樣容易。GPT-4 參數量顯著提升,參數量顯著提升,OpenAI 使用混合專家模型控制成本。使用混合專家模型控制成本。GPT-4 的規模是 GPT-3 的 10 倍以上。GPT-4 擁有大約 1.8 萬億個參數,分布在120 個神經網絡層之上。相比之下,GPT-3 大約只有 1750 億個參數。Transformer 作為 GPT 系列的基礎模型本身具有擴展性較差的問題,強行擴展規模需要巨大成本。Open
33、AI 通過使用混合專家模型(MoE)成功將成本控制在合理范圍內。MoE 可以實現訓練數據在不同專家模型的分配,使每個模型專注處理其最擅長的部分,從而實現模型的稀疏性。GPT-4 中一共部署了 16 個專家模型,模型的每一次前向專遞都由兩個專家模型進行路由。GPT-4 采用并行性策略橫跨全部采用并行性策略橫跨全部 A100GPU 同時展開訓練。同時展開訓練。OpenAI 采用了 8 路張量并行訓練,達到了英偉達設定的 NVLink 上線。同時,考慮到 GPU 內存容量限制,OpenAI 還采用了 15 路流水線并行訓練。除此之外,semianalysis 官網推測還使用了 ZeRo Stage1
34、、塊級 FSDP 或者混合共享數據并行化完成訓練。行業專題研究行業專題研究 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 10 of 45 圖圖 8 GPT-4 并行訓練網絡框架如下所示并行訓練網絡框架如下所示 資料來源:OpenAI 官網 GPT-4 訓練成本高昂,單次訓練成本高達訓練成本高昂,單次訓練成本高達 6300 萬美元。萬美元。盡管 GPT-4 的前饋參數僅為 175B 參數的 Davinchi 模型的 1.6 倍,但其成本卻是Davinchi 模型的 3 倍。這主要是因為 GPT-4 需要更大規模的集群,并且利用率較低。故障數量過多是導致利用率低的原因之一,一
35、旦出現故障就需要重新從之前的檢查點開始訓練。已知 GPT-4 所使用的浮點操作數約為 2.15x1025,其在大約 25000 個英偉達 A100 上訓練了 90-100 天,利用率在 32%-36%之間。倘若 OpenAI 每小時使用每一張 A100 芯片的云計算成本為 1 美元,則本次訓練的成本約為 6300 萬美元。伴隨成本與價格提升,伴隨成本與價格提升,GPT-4 定價水漲船高。定價水漲船高。GPT 產品可分為 ChatGPT與 GPT API 兩部分,前者是通過 OpenAI 官網訪問 GPT 模型,后者則可用于搭建第三方外部訪問途徑。目前,官網 ChatGPT Plus 版定價為每
36、月20 美元,開通后即可對話 GPT-4 模型,但并非沒有限制,官方定制了每3 小時最多 25 個提問的數量上限。倘若不開通 Plus 版則只能使用 GPT-3,但提問數量沒有限制。GPT-4 API 的定價策略與之前模型不同,其根據響應類型分開定價,分別收取 0.03 美元/1k prompt token,0.06 美元/1k生成響應 token。該價格相比 GPT-3.5 的 0.002 美元/1k tokens 價格上漲了至少 14 倍。表表 2:OpenAI 各類模型各類模型 API 接口定價如下接口定價如下 Model Input Output GPT-4 8K context$0.
37、03/1K tokens$0.06/1K tokens 32K context$0.06/1K tokens$0.12/1K tokens GPT-3.5 4K context$0.0015/1K tokens$0.002/1K tokens 16K context$0.003/1K tokens$0.004/1K tokens 數據來源:OpenAI 官網,國泰君安證券研究 OpenAI 為搭建為搭建 GPT-4 付出眾多,持續設置技術壁壘。付出眾多,持續設置技術壁壘。OpenAI 并未公布模型架構、硬件、訓練計算、數據集構造、訓練方法的具體細節,這并不是因為對人類的某種存在風險,而是 GP
38、T-4 的架構是可復制的。但可以明確的是,OpenAI 為開發 GPT-4 付出了巨大的努力。為搭建 GPT-4,OpenAI 與 Azure 合作從頭開始設計了一臺超級計算機,并重新搭建了整個深度學習堆棧。同時,OpenAI 開源了 OPenAI Evals 自動評估 AI模型性能的框架,以讓所有人都能指出模型中的缺點,以幫助 OpenAI 進 行業專題研究行業專題研究 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 11 of 45 一步改進模型。2.2.GPT-5 已提上日程,已提上日程,AI 大模型將持續顛覆更行各業大模型將持續顛覆更行各業 GPT-5 將是基于將是基
39、于 GPT-4 的改進版本。的改進版本。美國專利商標局的文件顯示,OpenAI 已與 2023 年 7 月 18 日提交了“GPT-5”的商標申請,且申請已被正式接收,這意味著 GTP-5 的訓練極有可能已經展開,此時距離 GPT-4 發布才過去不到半年時間。從申請書中的說明來看,GPT-5 的大多數功能是 GPT-4 已經具有的。從某種程度上而言,GPT-5 將會是 GPT-4 的改進版本。GPT-5 的誕生前,算力緊缺是的誕生前,算力緊缺是 OpenAI 面對的一大難題。面對的一大難題。OpenAI CEO Sam Altman 此前在人工智能風險監管聽證會上曾表示,OpenAI 目前并沒
40、有足夠的 GPU 以支持用戶的高頻訪問。GPT-4 的訓練使用了 25000 張英偉達 A100 顯卡,耗時 90 余天,而 GPT-5 對算力的需求將遠超 GPT-4。據馬斯克推斷,GPT-5 或將需要 3-5 萬張英偉達 H100 顯卡。摩根斯坦利同樣預測 GPT-5 將使用到 2.5 萬張以上 H100 顯卡。H100 顯卡作為英偉達最新 GPU 產品之一,其 16 位推理速度較 A100 提升 3.5 倍,16位訓練速度提升約 2.3 倍。由于目前受到了供應鏈限制,英偉達雖然正在努力提高 GPU 產能,擔任無法滿足所有客戶需求。但好消息是,英偉達于 2023 年 5 月 29 日發布了
41、最新的 GH200 超級芯片,倘若在未來能夠實現量產,各類大模型的訓練時間將會明顯縮短。圖圖 9 A100 顯卡與顯卡與 H100顯卡的訓練速度對比顯卡的訓練速度對比 資料來源:英偉達官網 GPT-5 將會在多模態分析方面取得突破。將會在多模態分析方面取得突破。目前 GPT-4 只能處理文本與圖像兩種類型的數據,因此外界普遍期望 GPT-5 能夠在視頻、音頻等其他模態上有所突破。關于此,OpenAI 在提交的 GPT-5 商標說明中也有涉及,并重點放在了文字模態與語音模態之間的轉換。GPT-5 將是一個用于自然語言處理、生成、理解與分析的大型語言模型,即它在能接受音視頻模態輸入的同時,也能自主
42、生成音視頻模態的輸出。微軟先前推出的 CoDi 模型在多模態處理上擁有極其優異的表現,所以 OpenAI 極有可能與微軟進一步展開合作,推動 GPT 模型在多模態分析上的進步。根據當前技術演化進度,未來希望能看到的場景是,人們只需向 GPT-5 輸入一個有趣的 memo 或者一張模糊的概念圖,GPT-5 就能根據時下流行趨勢自動創作使用者所需的形式內容,包括但不限于 3D 模型、視頻、文字、音頻等等。行業專題研究行業專題研究 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 12 of 45 圖圖 10 GPT-5 商標申請書內容摘要如下所示商標申請書內容摘要如下所示 資料來源
43、:美國專利商標局官網 GPT-5 有望垂直滲透各行各業,顛覆傳統工作模式。有望垂直滲透各行各業,顛覆傳統工作模式。OpenAI Startup Fund在近期投資了多家企業,其中包括影視公司 Descript。GPT-5 在未來可將AI 技術引入影視創作領域,這將完全顛覆影視制作的方式,并開啟全新的交互式媒體時代。GPT-5 作為 AI 技術的重要代表,可以理解用戶拍攝的影響,感知用戶需要表達的情緒、構圖并提供拍攝建議,甚至自行創造特效,從而使視頻內容更加真實,人機交互更加自然。OpenAI Startup Fund 同樣還投資了挪威機器人公司 1X Technologies,該公司正在研發一
44、款能夠在日常場景中與人安全協作的人形機器人。GPT-5 的多模態處理能力能夠幫助機器人更好地感知與理解人類的情感和語言,從而實現更流暢的人類交互與協作??梢钥吹?,我們將迎來更加智能化、智慧化、個性化的 AI 服務,使人們的生活更加便捷舒適。2.3.DALL-E 系列模型進展迅速系列模型進展迅速,文圖映射性能快速提升,文圖映射性能快速提升 DALL-E 是一個能夠根據自然語言描述創建逼真圖像和藝術作品的人是一個能夠根據自然語言描述創建逼真圖像和藝術作品的人工智能系統。工智能系統。它能夠根據使用者輸入的提示信息創建具有特定尺寸的新圖像、編輯現有圖像或者創建用戶提供的圖像變體。2022 年 9 月
45、28 日,OpenAI 正式對外公開的 DALL-E 第二代,并于同年 11 月開放 DALL-E2 API。與前一代不同,DALL-E2 的參數量僅有原來的 30%,約 35 億個,但其生成的圖像分辨率是原來的四倍。同時,DALL-E2 在真實感與字母匹配方面做的更好。DALL-E2 目前可以免費使用,但有一定次數限制。除了初始的 50 個使用積分,每個月用戶還可以額外獲得 15 積分,每使用一次 DALL-E2 就會消耗一個積分。DALL-E2 經過經過 CLIP 訓練實現文本到圖片的映射。訓練實現文本到圖片的映射。DALL-E 2 中的文本語義與其視覺表征之間的聯系是由另一個名為 CLI
46、P 的 OpenAI 模型學習的。CLIP 接受了數億張圖像及其相關標題的訓練,以了解給定文本片段與圖像的關聯程度。在此之后,DALL-E2 將文本 prompt 映射到表征空間的文本編碼器中,并將文本編碼映射到關聯度高的圖像編碼中,捕捉文章編碼中 prompt 包含的語義信息。最終圖像編碼模型隨機生成圖像,輸出對該語義信息的視覺表現。行業專題研究行業專題研究 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 13 of 45 圖圖 11 DALL-E2 經過經過 CLIP訓練實現文本到圖片的映射訓練實現文本到圖片的映射 資料來源:OpenAI 官網 DALL-E3 將集成將集
47、成 ChatGPT,上下文理解力全面提升。,上下文理解力全面提升。據 OpenAI 官網消息,第三代 DALL-E 模型將于 2023 年 10 月正式公開。從公開的 demo來看,DALL-E3 比以往系統更能理解細微差別和細節,并將自己的想法轉化為非常準確的圖像。除了更好的作圖效果外,DALL-E 將于 ChatGPT集成,利用 ChatGPT 來創建、拓展、優化 prompt,來幫助用戶更快速地向 DALL-E3 發出詳細的繪圖指令。圖圖 12 同樣指令同樣指令下下 DALL-E2(左)、(左)、DALL-E3(右)作圖差異明顯(右)作圖差異明顯 資料來源:OpenAI 官網 2.4.W
48、hisper立足編碼立足編碼-解碼流程,定位為通用語音識別模型解碼流程,定位為通用語音識別模型 Whisper 是一個通用的語音識別模型。是一個通用的語音識別模型。它是 OpenAI 于 2022 年 9 月開源的在各種音頻的大型數據集上訓練的語音識別模型,也是一個可以執行多種語言語音識別、語音翻譯和語言識別的多任務模型。2023 年上半年,OpenAI 推出了最新版本的 Whisper v2-large model,同時支持本地部署和API 調用。Whisper 架構是一種簡單的端到端方法,實現為利用架構是一種簡單的端到端方法,實現為利用 Transformer 模型模型的編碼器的編碼器-解
49、碼器。解碼器。輸入音頻被分成 30 秒一段的模塊,然后轉換成 log-Mel 頻譜圖,然后傳遞到編碼器。編碼器來計算注意力,最后把數據傳遞給解碼器,解碼器被訓練來預測相應的文本,并添加特殊標記,這些標記用來單個模型執行諸如語言識別、多語言語音轉錄和英語語音翻譯等任務。Whisper 采用弱監督學習方法,提升性能與魯棒性。采用弱監督學習方法,提升性能與魯棒性。相比于傳統的監督 行業專題研究行業專題研究 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 14 of 45 學習,弱監督學習并不需要完全標注的數據集,而是利用類似自動標注或聽寫文本等部分標注的數據來進行訓練。這種方法可以
50、大大減少人工標注數據的成本,并且可以利用更多的數據進行訓練,從而提高模型的性能和魯棒性。在 Whisper 中,OpenAI 將弱監督學習的數量級擴展至68 萬小時,進一步提高了模型的性能。目前,Whisper 模型支持 99 種語言的識別,它在英語語音識別方面表現出來接近人類水平的魯棒性和準確性。圖圖 13 Whisper 模型訓練框架如下所示模型訓練框架如下所示 資料來源:Github Whisper 項目主頁 3.OpenAI 各類模型催生各領域創新應用各類模型催生各領域創新應用 OpenAI 大模型作為一項顛覆性的技術,正在廣泛應用于各個行業,并大模型作為一項顛覆性的技術,正在廣泛應用
51、于各個行業,并對人們的生活工作產生了深遠的影響。對人們的生活工作產生了深遠的影響。從圖像搜索到營銷、軟件開發和智能機器人等多個領域,大模型的應用正在改變著生活方式和工作方式。例如 DALLE 模型能夠識別和理解圖像內容,從海量的圖像數據庫中準確搜索出相關的圖像。這項技術不僅在媒體和設計領域有著廣泛的應用,還可以為醫學影像診斷、安防監控等提供更準確和高效的解決方案。GPT 模型在營銷領域的應用正在改變著市場推廣的方式,通過分析大數據和用戶行為模式提供個性化的營銷策略和精準的目標用戶定位,從而提高廣告的投放效果和銷售轉化率,甚至還能夠自動化營銷過程,實現智能化的廣告投放和客戶關系管理,為企業帶來更
52、高的市場競爭力;通 行業專題研究行業專題研究 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 15 of 45 過自動化技術,GPT 能夠輔助開發人員完成繁瑣的編碼任務和軟件測試,提高開發效率和質量,還能夠通過自動化的方式生成代碼和設計模型,加速軟件開發周期,推動技術創新和產品迭代。智能機器人的發展也是智能機器人的發展也是 GPT 應用的重要領域之一。應用的重要領域之一。智能機器人能夠通過感知、學習和決策等能力,執行各種任務,如家庭服務、醫療護理、生產制造等。它們能夠與人類進行交互和合作,提供更智能、便捷的服務??傊?,AI 大模型的應用為企業提供了更智能、高效的解決方案,推動
53、了商業模式的創新和升級,同時也為個人帶來了更智能化、便利化的生活體驗,從智能助理到智能家居,人們的生活正逐漸被 AI 技術所賦能。3.1.New Bing+DALLE3 推動圖像生成類應用崛起推動圖像生成類應用崛起 New Bing+DALL E3:搜索引擎被賦予圖像生成功能與信息搜尋功能。:搜索引擎被賦予圖像生成功能與信息搜尋功能。2023 年 3 月 22 日,微軟宣布必應搜索引擎已集成 OpenAI 的 DALL E2模型,以增強其生成圖像的能力。換句話說,通過與 ChatGPT 的整合,必應的功能得到了進一步加強。同時,現在 Bing Image Creator 可以利用DALLE2
54、模型生成圖像,用戶只需提供圖像描述,并提供位置或活動等額外語境,然后選擇藝術風格,Image Creator 將根據用戶的想象生成圖像。必應提供三種響應模式:創意模式、平衡模式和精確模式。必應提供三種響應模式:創意模式、平衡模式和精確模式。創意模式下生成的結果通常是獨特且富有創意的,而精確模式則更注重準確性和相關性,以獲得更真實和簡潔的答案。在 2023 年 9 月 11 日的發布會上,微軟宣布 Bing 將搭載 OpenAI 最新推出的 DALL E3 模型,旨在增強其通過圖像搜索獲取信息的能力。Bing 將能夠根據用戶的搜索歷史記錄提供更個性化的答案、全新的 AI 驅動購物體驗,以及更具移
55、動化和可視化的 Bing Chat Enterprise 智能聊天功能。Image Creator 圖像創建功能將因 DALLE3 模型而變得更加強大,提供更美麗的創作和更好的細節渲染,同時能更好地理解用戶需求并提供更準確的圖像。例如,用戶可以直接在與Bing聊天中修改新生成的游戲頭像,AI平面設計工具Microsoft Designer 也已整合到 Bing 中。目前,Image Creator 仍然免費向用戶開放,每個賬號初始都會獲得 25 次免費生成點數。行業專題研究行業專題研究 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 16 of 45 圖圖 14 New Bi
56、ng 將在圖片生成方面更進一步將在圖片生成方面更進一步 資料來源:微軟發布會演示文稿 Midjourney 是一款基于是一款基于 Dall E2 的可以通過文字描述繪制圖像的的可以通過文字描述繪制圖像的 AI應應用。用。用戶可以輸入任何自己想象的場景、物體、人物、風格等,不受限于預設的類別或模板。AI 只需要大約一分鐘就可以生成四個圖像選項供用戶選擇。除了核心功能外,Midjourney 還提供了其他功能,包括放大、編輯、保存和分享。放大功能可以讓用戶更清楚地查看生成圖像的優點和缺點,也能發現一些意想不到的細節和驚喜。編輯功能允許修改生成圖像的顏色、亮度、對比度等參數,或添加濾鏡、文字、貼紙等
57、元素。同時,用戶可將生成圖像保存到設備或上傳到云端存儲,或將其發送給其他 Discord 用戶或群組,或復制鏈接分享到其他社交媒體或網站。Midjourney 目前處于測試階段,需要通過 Discord 平臺注冊和使用。注冊后,用戶可以免費試用 Midjourney 的所有功能,但次數有限制。每次使用命令生成圖像或對圖像進行放大、編輯等操作,都會消耗一個 Job。免費試用期內用戶可使用大約 25 個 Job。此外,Midjourney 還提供兩種付費服務:每月訂閱 9.99 美元,使用 Midjourney 的所有功能無限次。該應用在 2021 年創建,團隊僅有 11 人,沒有任何融資,截止
58、2023 年 7 月已經有 1000 萬用戶,一年有 1 億美元的收入,屬 AIGC 現象級應用。行業專題研究行業專題研究 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 17 of 45 圖圖 15 Midjourney 根據用戶輸入特征作圖根據用戶輸入特征作圖 資料來源:Midjourney 官網 3.2.在企業管理、營銷和銷售領域,在企業管理、營銷和銷售領域,AIGC 大有作為大有作為 Sprinklr AI+是一款生成式是一款生成式 AI 驅動的研究平臺,加快數據分析過程。驅動的研究平臺,加快數據分析過程。它將自身的 AI 技術與 OpenAI 的生成式 AI 相結合
59、,以增強用戶體驗,并確保企業級治理、安全性和數據隱私。Sprinklr AI+利用超過 1,250 個行業特定的 AI 模型,支持 100 多種語言,并在 150 個國家/地區運營。該技術使 Sprinklr 能夠處理大量非結構化數據,包括文本、音頻、視頻、圖像、指標和時間序列數據,以使客戶能夠獲取有價值的信息。通過Sprinklr AI+,企業可以利用來自 30 多個數字渠道的非結構化數據,這些渠道包括社交平臺、消息傳遞平臺和可公開訪問的來源,如新聞、博客和評論網站。通過將生成式 AI 集成到平臺中,Sprinklr AI+使企業能夠生成內容,增強反饋和幫助,并快速識別有價值的信息,以便迅速
60、采取行動。同時,Sprinklr AI+可以從知識庫中自動提取答案,通過對大規模對話的自動質量評分和情緒分析,質量管理功能也得到增強。此外,Sprinklr AI+還通過生成 AI 功能豐富了現有的對話 AI 機器人、聊天平臺和知識庫,用于編寫、翻譯和摘要等任務。目前 Sprinklr 已經獲得了總計高達 350 億美元的融資。行業專題研究行業專題研究 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 18 of 45 圖圖 16 Sprinklr 服務助手幫用戶生成工作處理流程服務助手幫用戶生成工作處理流程 資料來源:Sprinklr AI 官網 ChatSpot 是一款由是
61、一款由 GPT-4 提供支持的營銷和銷售提供支持的營銷和銷售 AI 助手。助手。ChatSpot 使用各種數據庫和由 GPT-4 提供支持的聊天系統,能夠執行關鍵字研究、銷售勘探、內容生成等各種任務。該平臺是 HubSpot 的最新產品之一,HubSpot 是一個領先的軟件平臺,可幫助企業進行營銷和銷售。它結合了 OpenAI 的 GPT-4 模型用于文本生成,DALL E2 用于圖像生成,以及用于提取公司、域和付費廣告關鍵字等信息的各種數據庫。用戶可以使用 ChatSpot 在幾秒鐘內起草博客內容,對其進行編輯以使其簡潔明了,然后單擊一下即可發布到 HubSpot。處理營銷策略時的另一個重要
62、任務是關鍵字研究,此任務涉及識別潛在客戶在搜索產品或服務時最有可能使用的特定單詞和短語。ChatSpot 還有一個獨特功能是各種研究提示,可以使用提示更深入地了解在特定行業運營的公司。圖圖 17 ChatSpot 快速查找相關數據快速查找相關數據 資料來源:ChatSpot 官網 3.3.OpenAI Codex 加持下,加持下,AI 輔助編程成為現實輔助編程成為現實 GitHub Copilot X 是一個是一個 AI 輔助編程代碼生成工具,可以根據注釋或輔助編程代碼生成工具,可以根據注釋或 行業專題研究行業專題研究 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 19 o
63、f 45 代碼上下文提供代碼建議。代碼上下文提供代碼建議。GitHub Copilot X 由 GitHub 與 OpenAI 合作推出,由 OpenAI Codex 的強大語言模型提供支持,同時引入聊天和語音界面,支持拉取請求,回答文檔上的問題,并采用 OpenAI 的 GPT-4模型為開發者提供更個性化的編程開發體驗。GitHub Copilot X 支持數十種編程語言,并且可以在 Visual Studio Code 中進行使用。它可以在編輯器中提供一個聊天界面,讓開發者可以用自然語言和 Copilot 交流,獲取代碼分析、單元測試、錯誤修復等服務,也可以在編輯器中提供一個語音界面,讓開
64、發者可以用自然語言和 Copilot 交流,實現語音編程和控制。另外,GitHub Copilot X 可以在 GitHub 上提供一個 Pull Request 界面,讓開發者可以用 Copilot 審查代碼,獲取代碼質量、風格、安全等方面的反饋和建議,它同時可以在命令行中提供一個 Copilot 界面,讓開發者可以用 Copilot 執行各種命令,獲取快速幫助和指導。最后,GitHub Copilot X還可以在文檔中提供一個Copilot界面,讓開發者可以用Copilot查詢文檔,獲取相關的示例、解釋、鏈接等信息。GitHub Copilot X 目前還處于預覽階段,暫時不收取任何費用,
65、但未來可能會根據不同的功能和服務收取一定的費用。圖圖 18 GitHub Copilot X 根據開發者提示自動生成代碼根據開發者提示自動生成代碼 資料來源:Github Copilot 官網 3.4.機器人感知能力與執行效率通過生成式機器人感知能力與執行效率通過生成式 AI 優化增強優化增強 EVE(AI 加持的人型機器人)由加持的人型機器人)由 OpenAI 支持的機器人公司支持的機器人公司 1x 出品,出品,部分軟件功能由部分軟件功能由 ChatGPT提供支持。提供支持。EVE 是一款擁有兩臂、兩眼和四輪底盤的機器人,可以在各種環境中執行多種任務,如巡邏、監控、搬運等。EVE 機器人由人
66、類安保人員通過虛擬現實來控制,如果遇到任何問題,他們可以立即“進入”機器人的身體。EVE 機器人還有一個 LED“臉”,可以向人們展示反應,操作者也可以通過它“說話”,它的敏捷度驚人,可以打開門窗、抓取物品,執行與人類類似的任務,EVE 還作為護士或護理人員接受過測試。打造實體機器人的目的就是幫助解決勞動力不足的問題,尤其是保安、監獄、養老院等領域。該公司已經完成了 2350 萬美元的 A2 輪融資,由 OpenAI 創業基金領投,Tiger Global、Alliance V enture、Investinor 和其他投資者跟投。行業專題研究行業專題研究 請務必閱讀正文之后的免責條款部分請務
67、必閱讀正文之后的免責條款部分 20 of 45 圖圖 19 EVE 機器人如下所示機器人如下所示 資料來源:1x公司官網 3.5.微軟借助微軟借助 LLM 通過管理現有通過管理現有 AI 模型可以實現復雜任務模型可以實現復雜任務 大語言模型(大語言模型(LLM)充當控制器可以讓)充當控制器可以讓 LLM 來管理現有來管理現有 AI 模型,來模型,來完成多模態的復雜完成多模態的復雜 AI 任務。任務。在實際應用場景中,一些復雜任務通常由多個子任務組成,因此需要多個模型的調度和協作,這也超出了語言模型的能力范圍。對于一些具有挑戰性的任務,LLM 在零樣本或少樣本設置下表現出優異的結果,但它們仍然比
68、一些專家弱(如微調模型),針對這些問題,微軟亞洲研究院和浙江大學研究團隊在 2023 年 4 月發布的 HuggingGPT:Solving AI Tasks with ChatGPT and its Friends in HuggingFace 論文中介紹了一個大模型協作系統,該系統提出了一種讓 LLM 充當控制器的新方法,讓 LLM 來管理現有的 AI 模型,來完成多模態的復雜 AI 任務,并且使用語言作為通用接口。該研究提出的 HuggingGPT 是一個利用 LLM 連接機器學習社區(例如 HuggingFace)中各種 AI 模型以解決復雜 AI 任務的系統。圖圖 20 大語言模型可
69、以用來管理各類大語言模型可以用來管理各類 AI 模型,助力完成復雜任務模型,助力完成復雜任務 資料來源:HuggingGPT:Solving AI Tasks with ChatGPT and its Friends in HuggingFace 微軟“微軟“JARVIS”基于”基于 HuggingGPT 論文成果構建,該系統由論文成果構建,該系統由 LLM 作作為控制器和眾多專家模型(為控制器和眾多專家模型(HuggingFace 社區)作為協作執行者組成。社區)作為協作執行者組成?!癑ARVIS”旨在將開源社區和 ChatGPT 的力量結合在一起,Jarvis 能夠調用姿勢檢測模型、圖像生
70、成模型、圖像分類模型、圖像字幕模型和文本到語音轉換模型等。雖然 JARVIS 調用的模型并不新穎,并且多年來 行業專題研究行業專題研究 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 21 of 45 一直是開源社區的中流砥柱,但將它們組合在一起是解決復雜問題的新方法。盡管給定的提示有多個執行階段,每個步驟中都有不同的任務,但架構可以完美地處理它。Jarvis 項目目前已經在 Github 上開源,可以免費獲取,用于非商用用途。圖圖 21 Jarvis 項目運行框架如下項目運行框架如下 資料來源:Jarvis 項目 Github 界面 4.微軟微軟 Windows Copil
71、ot形成形成AI應用超級流量入口,應用超級流量入口,成為業界標桿成為業界標桿 微軟在微軟在 AI 商業領域領先全球,基礎是商業領域領先全球,基礎是 OpenAI 的強大能力。的強大能力。ChatGPT于 2022 年 11 月 30 日發布,只用了大約兩個月的時間,便達成了從 0 到1 億用戶的成就。由于對 OpenAI 的早期投資,微軟享有優先商用 OpenAI大模型的權利,并迅速將 GPT 的能力引入到核心產品和服務當中。從Azure 智能云、Windows 到 Microsoft 365、Teams,從新必應搜索引擎到Edge 瀏覽器,從 Dynamics 365 到 Power Pla
72、tform,都已整合了大模型能力。行業專題研究行業專題研究 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 22 of 45 圖圖 22 Windows Copilot 歷史沿革如下圖所示歷史沿革如下圖所示 資料來源:微軟全球營銷 微軟微軟 Copilot 是全球首款是全球首款 AI 智能助手。智能助手。微軟在 2023 年 5 月的微軟Build 大會上詳細討論了兩個概念:Copilot(智能助手)和 Plugin(插件)。Copilot 是微軟針對應用程序的 AI 助手,2021 年,微軟通過 GitHub Copilot 首次引入了 Copilot 的概念,2023 年
73、,微軟在核心產品和服務中推出了 Copilot,包括 Bing、Microsoft 365、Dynamics 365、Microsoft Viva 和 Microsoft Security 等。而“插件”是 OpenAI 為 ChatGPT 引入的工具,使其能夠與來自其他軟件和服務的應用程序編程接口(API)進行交互,插件可以視為 Copilot 與其他軟件的連接橋梁。2023 年 5 月,微軟正式發布了 AI 版本的WindowsWindows Copilot,Windows Copilot 將 直 接集成到 Windows 11 中。Windows Copilot 讓用戶可以用人類語言與操
74、作系統進行交互。讓用戶可以用人類語言與操作系統進行交互。Windows Copilot 意味著 Windows 11 將成為世界上第一個接入 AI 助手的 PC 平臺,它能夠讓當用戶用人類語言讓 windows 提供服務比如當用戶準備沉下心來辦公,就可以在 Windows 11 調出 Copilot,把需求敲進去:怎么樣工作起來更高效?Windows Copilot 會建議打開專注模式,并把系統界面調整成更沉浸的暗色模型。這時候如果還想聽一點音樂,再敲入需求:放點工作時適合聽的音樂。Windows Copilot 會根據用戶喜歡的音樂類型,在 Spotify 等音樂軟件上播放對應的歌單。選定一
75、個窗口,讓它直接幫用戶總結窗口中的網頁,可以快速獲得內容要點。通過Copilot,還可以很方便地完成把系統截圖去除背景等一系列操作。Windows Copilot 還可以幫使用者解決很多問題,例如當用戶收到一份冗長到讀不下去的文件,可以直接把它從桌面拖到 Copilot 上,讓 AI 總結這份文檔,實現快速閱讀。行業專題研究行業專題研究 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 23 of 45 圖圖 23 Windows Copilot 界面如下所示界面如下所示 資料來源:微軟官網 Windows Copilot 將會成為一個超級龐大的生態入口,通過插件連接萬將會成為
76、一個超級龐大的生態入口,通過插件連接萬物。物。openAI 開放了 ChatGPT 的插件,有了這些第三方插件,ChatGPT 可以實現訂餐、查航班、解答數理化難題等等功能?,F在,這些插件同樣可以應用在 Bing、Edge、Office 甚至 Windows 之中,因為這些產品都采用了同樣的開放插件標準。Copilot+插件,大概率會改變人類未來使用網絡獲取服務的方式。由于 Windows Copilot 是直接集成在Windows 11 里面,因此繼承了微軟操作系統龐大的用戶基數,可以預見它的活躍用戶數量將上升非???。微軟已經成為了全球微軟已經成為了全球 AI 應用落地的標桿。應用落地的標桿
77、。早在 3 月份微軟就已經宣布了 Microsoft 365 Copilot,大大提升了辦公效率,定價 30 美元/月(企業版),無疑為國內金山辦公等企業未來 AI 應用的收費樹立了標桿。2023 年 9 月 21 日周四,微軟在紐約曼哈頓舉辦了與Surface筆記本電腦和AI功能更新有關的大型活動。會上宣布Windows Copilot 將于將于 9 月月 26 日以早期形式推出,作為日以早期形式推出,作為 Windows 11 免費更新免費更新的一部分的一部分。微軟還宣布其 Microsoft 365 Copilot 企業版將于 11 月 1 日全面上市。Windows Copilot 為
78、華為打開了新的思路為華為打開了新的思路國國內未來基礎操作系統可內未來基礎操作系統可能要依靠華為的歐拉。能要依靠華為的歐拉。依靠操作系統的龐大用戶基數作為入口去連接龐大的 C 端服務市場,是微軟已經指明的路徑,華為可以采用同樣的戰略,打通所有智能硬件,當然前提是能夠解決芯片產能問題。5.AI+辦公應用是大模型落地的主要方向,商業模式辦公應用是大模型落地的主要方向,商業模式較優較優 5.1.微軟變革軟件應用新范式:大模型作“微軟變革軟件應用新范式:大模型作“CPU”,”,Chat作指作指令令“AI+辦公”是此次辦公”是此次 AIGC 浪潮中的核心受益方向,具體來看,浪潮中的核心受益方向,具體來看,
79、AI+辦公辦公應用可按功能分為文本類、電子表格類、演示文稿類三種,除此之外還應用可按功能分為文本類、電子表格類、演示文稿類三種,除此之外還有許多功能更加細分的產品有許多功能更加細分的產品。此次 AIGC 浪潮的引爆點是基于自然語言處理大模型技術的文字創作工具 ChatGPT 快速成長為火爆全球的現象 行業專題研究行業專題研究 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 24 of 45 級應用,隨后基于對圖像、視頻、音頻等進行處理的多模態大模型的應用也快速推廣起來。AIGC 天然面向文字、音視頻、圖像等內容自主創作場景,因而其可以直接提升現有各類型辦公軟件的產品力,從而推
80、動辦公軟件的迭代升級。微軟在打造產品過程中的核心思路就是把自己所有的業務問題轉化成微軟在打造產品過程中的核心思路就是把自己所有的業務問題轉化成Chat 的問題的問題。在一開始的 IT 時代,所有企業是考慮怎么把業務轉化為計算問題,這時候編譯器的作用就凸顯了,并且 windows 的出現也是應用的需要。在業務需求的程序實現過程中,毫無疑問,計算資源、內存資源、網絡資源以及安全問題都是需要突出考慮的點?,F在生成式 AI 的出現,可以將其看做一種新的“CPU”,只不過這種“處理器”封裝了底層資源的復雜性,簡化了和計算機交互的復雜度,從而降低了個人開發應用的門檻,因為可以單憑與人類語言溝通的方式就能滿
81、足應用程序的創建,進而滿足需求。從需求滿足這個根本目標來看,對用戶而言,只要能滿足功能需求,寫代碼、測試和部署這個流程并不是終端用戶關注的重點,就如同使用瀏覽器獲取信息的用戶不用管操作系統的代碼一樣,未來完成相關應用功能需求也不需要用戶理解背后的代碼邏輯。但我們認為傳統的軟件開發流程仍然存在,只不過使用起來更加簡單,就如同Windows 仍然存在,只是現在大家不再用 WinForms 編寫用戶界面,而是 JavaScript 和 HTML。圖圖 24 大模型充當了用戶需求和軟件程序之間的撮合橋梁大模型充當了用戶需求和軟件程序之間的撮合橋梁 資料來源:微軟公開演講 圖圖 25 微軟將微軟將 Op
82、enAI 大模型能力嵌入全線產品大模型能力嵌入全線產品 資料來源:微軟公開演講 微軟為什么要將應用轉化為聊天的形式?這是大模型發展到一定階段微軟為什么要將應用轉化為聊天的形式?這是大模型發展到一定階段 行業專題研究行業專題研究 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 25 of 45 的必然呈現的必然呈現。Azure 云上的大模型類似 CPU,內存和磁盤類似向量數據庫,操作指令在大模型中就如同提示符工程(prompt engineering),而完成應用開發的橋梁就是語言文字。喬姆斯基曾說過,語言是智慧的源泉,所以未來的多模態應用中,語言仍然是基礎。在與 AI 大模型
83、進行聊天中,并不是簡單的聊天,聊天背后仍然是語言,只是在問題的形式上有所變化,Chat 它成為了一種新的接口。所以,辦公領域天然是基于語言文字的邏輯,所以辦公領域的應用也是大模型的原生特征的體現。圖圖 26 Copilot 驅動驅動 App技術棧如下圖所示技術棧如下圖所示 資料來源:微軟公開演講 5.2.微軟微軟 Copilot:重新定義:重新定義 AI 智能辦公智能辦公 微軟開放微軟開放 Microsoft 365 Copilot 訂閱服務,用訂閱服務,用 AIGC 技術重塑辦公體技術重塑辦公體驗。驗。據微軟官方消息,微軟將會從 2023 年 11 月 1 日開始向商業和企業客戶提供 Mic
84、rosoft 365 Copilot 服務。2023 年 9 月 21 日,微軟推出的Copilot 平臺旨在幫助用戶更好地組織所有數據并與之交互。微軟 CEO納德拉稱,Copilot 是一種跨越 Windows 11 操作系統和 Microsoft 365 生產力工具套件等多個界面的體驗,微軟的意愿是為個人用戶與企業提供日常人工智能伴侶。Microsoft 365 Copilot 為用戶辦公模式帶了個革命式的變化,有助于提為用戶辦公模式帶了個革命式的變化,有助于提高辦公創作效率。高辦公創作效率。Microsoft 365 Copilot 一方面會嵌入到用戶高頻使用的各類辦公軟件之中,包括了
85、Word、Excel、PowerPoint、Outlook、Teams等,從而幫助用戶從繁瑣的事務性工作中解放出來,讓用戶更專注于創造性工作,從而提高辦公效率。另一方面還引入了全新的商務聊天(Business Chat)應用場景,可以基于用戶過往積累各項業務數據按照用戶需求生成全新的內容,提高創作效率,例如用戶提出“請告訴團隊成員如何更新銷售策略”指令后,系統會根據用戶過往的會議討論記錄、聊天記錄、電子郵件溝通內容等生成一份全新的銷售策略。用戶可以對生成后的內容進行自主修改、保留或舍棄,使得 Word 更具創造性、Excel 更具分析性、PowerPoint 更具表現力、Outlook 更具效
86、率性、Teams 更具協作性。圖圖 27 Microsoft 365 Copilot 為用戶工作模式帶來革命性變化為用戶工作模式帶來革命性變化 行業專題研究行業專題研究 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 26 of 45 資料來源:微軟官網 Microsoft 365 Copilot 使用自然語言作為人機交互的渠道,降低了使用自然語言作為人機交互的渠道,降低了 Office辦 公 軟 件的使 用門檻。辦 公 軟 件的使 用門檻。根據微軟發布會上披露,有 90%以上的 PowerPoint、Excel 功能是不被用戶使用的。我們認為這一現象并不是因為這些功能無用,
87、而是過往通過菜單按鈕或者函數公式的方式進行交互的門檻較高,多數用戶未經過系統學習就無法直接調用相關功能。引入 Copilot 之后,所有的辦公軟件在右側都會形成一個聊天框,用戶將自己想要實現的效果(如進行某種排班、添加某種動畫效果或者進行某種特殊運算)以自然語言聊天的方式輸入后,軟件會直接實現相關的功能,從而使得豐富的軟件功能都得到應用,極大降低了用戶的使用門檻,有助于進一步提高用戶規模和粘性,從而提高付費月活用戶數量。Word+Copilot:開啟寫作新時代。:開啟寫作新時代。Copilot 可以幫助 Word 用戶在極短的時間內從空白頁完成文檔的撰寫。無論是創建新文檔還是處理現有的文檔,C
88、opilot 都可以幫助繼續操作。使用者提供的說明可以是一個簡單的句子,也可以是一個復雜的請求,并在其中引用需要 Copilot 處理的大綱、備注或者文件,隨后點擊“引用文件“按鈕,搜索并使用最多三個現有文件作為輸入來完成 Copilot 內容草稿。在內容生成后,使用者還可以選擇保留、放棄或者要求 Copilot 重新生成其他版本,又或是讓 Copilot根據現有文檔的思路繼續生成內容。使用者還可與 Copilot 聊天對話,以獲得有關文檔的更深入回答,甚至可以與 Copilot 展開詳細討論對內容進行反復推敲和改進,或是獲取有關文檔內容的摘要或特定信息,也可以要求它生成可以復制和插入到文檔中
89、的表格或列表。行業專題研究行業專題研究 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 27 of 45 圖圖 28 Microsoft 365 Copilot 一鍵創建文檔一鍵創建文檔 資料來源:微軟官網 PowerPoint+Copilot:將靈感轉化為令人驚嘆的專業演示文稿。:將靈感轉化為令人驚嘆的專業演示文稿。Copilot可以與使用者并肩工作,幫助其完成 PPT 的創建、編輯、跟進、提問等一系列工作。在 PPT 中啟動 Copilot 后,只需向其輸入使用者的 PPT 需求,例如主題、分點要求、風格等,Copilot 即可從 0 創建一個包含藝術作品的草稿演示文檔。
90、隨后,使用者可以編輯演示文稿以滿足需求,并要求 Copilot 添加幻燈片,或者從空白演示文稿重新開始,逐步優化提示內容以包含更多詳細信息。Copilot 還支持將 word 文稿一鍵轉換為演示文稿。Copilot 還可以通讀幻燈片,并為使用者提供項目摘要。若想知道哪些幻燈片可能需要特別注意,可以要求 Copilot 顯示關鍵幻燈片。另外,Copilot 還可以幫助使用者整理幻燈片順序,只需要求 Copilot 組織演示文稿,它便能將幻燈片整理分區,然后分別添加分區標題幻燈片。如果不喜歡 Copilot 所做的更改,只需單擊功能區上的“撤消”按鈕即可將幻燈片還原到以前的狀態。圖圖 29 Mic
91、rosoft 365 Copilot 通過自然語言指令創建演示文檔通過自然語言指令創建演示文檔 資料來源:微軟官網 Excel+Copilot:輕松分析、理解、可視化數據內容。:輕松分析、理解、可視化數據內容。Copilot 可以幫助使用者創建、編輯、理解數據內容。只需選中 Excel 中的工作數據并要求Copilot 格式化表格,使用者即可獲得對于數據的詳細見解,并快速捕捉到數據中最關鍵的部分。Copilot 會以圖表、數據透視表、摘要、趨勢或異常值等多種形式表達觀點,幫助使用者充分利用數據得出相關結論。行業專題研究行業專題研究 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部
92、分 28 of 45 Copilot 還可以幫助使用者快速篩選出表格中最關鍵的數據,并自動完成數據標注。除此之外,Copilot 可以根據數據和需求創建公式并快速添加新列。即便使用者對 Excel 公式一竅不通,也可通過自然語言向 Copilot提出處理需求。Copilot 在給出公式建議后,會詳細解釋每個公式的工作原理,以供使用者判斷是否采納。圖圖 30 Microsoft 365 Copilot 自動繪制圖表展現數據重點自動繪制圖表展現數據重點 資料來源:微軟官網 Teams+Copilot:大幅降低協同工作難度。:大幅降低協同工作難度。通過 Copilot,工作團隊可以獲得針對寫作優化的
93、強大新技術,讓使用者可以專注于需要完成的任務,無需關注做筆記或是分配后續任務。Copilot 可以幫助使用者捕捉操作步驟、基于主題的不同觀點以及未解決的問題。使用者甚至可以要求Copilot 以表格形式提供回答,這樣就能生成可復制和共享的 markdown表格。Copilot 讓使用者能夠在 Teams 中提出關于聊天對話的問題。通過Copilot,使用者可以快速查看聊天中的要點、操作步驟和決策,而不需要滾動瀏覽冗長的對話。此外,使用者還可以選擇查看過去 1 天、7 天或 30 天的對話中的亮點。下載 Copilot 應用后,使用者可以將其固定并與 Copilot 進行交互,就像在 Teams
94、 聊天中與聯系人交流一樣。使用自然語言提供清晰的 Copilot 說明,提供盡可能多的詳細信息,這樣可以獲得更好的結果。通過優化指令和反復訪問,可以改善 Copilot 的表現。Copilot 還可以幫助查找和使用那些隱藏在文檔中或在對話中遺失的信息。行業專題研究行業專題研究 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 29 of 45 圖圖 31 Microsoft 365 Copilot 自動整理自動整理Teams 會議內容會議內容 資料來源:微軟官網 Outlook+Copilot:快速捕獲、準備、跟進郵件信息。:快速捕獲、準備、跟進郵件信息。Copilot 可以幫
95、助使用者生成新郵件的草稿。使用者可以在 Copilot 框中鍵入提示內容,選擇生成選項的長度和語氣,并在完成后選擇生成,Copilot 將重新生成一條消息的草稿。如果使用者不滿意結果,可以選擇重新生成草稿或更改提示并再次生成。Copilot 還可以快速生成郵件摘要,不僅能夠幫助使用者快速掌握郵件關鍵信息,還能夠自動生成其中引用到的其他郵件鏈接,實現快速跳轉。除此之外,Copilot 還可以幫助使用者策劃活動,與使用者一起頭腦風暴,詳細規劃活動內容、時間、地點、任務規劃,讓使用者簡化并享受創建活動的過程。圖圖 32 Microsoft 365 Copilot 根據需求自動創建根據需求自動創建Ou
96、tlook 郵件郵件 資料來源:微軟官網 Microsoft 365 聊天聊天+Copilot:為使用者提供智能聊天體驗:為使用者提供智能聊天體驗。Microsoft 365聊天集成了AI的強大功能和工作數據,使用者可以在Web上查找信息,甚至進行創作,而這款聊天體驗的獨特之處在于它能夠整合工作內容,如聊天記錄、電子郵件和文件,以協助合成和起草內容,及時跟進可能遺漏的重要信息,并提供特定工作問題的解答。此外,Microsoft 365 聊天還可以匯總多個數據源的信息,簡化復雜內容,助使用者更輕松地集思廣益和創作新內容,只需引用源材料即可。也可作為個性化的搜索引擎,提供快速解答特定文件、消息或公
97、司政策的查詢,并幫助使用者確 行業專題研究行業專題研究 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 30 of 45 定潛在的主題專家。通過明確的提示和反復對話,使用者能逐步接近所需信息,釋放了創意,提高了生產力,實現了更廣泛的工作目標和目的。Microsoft 365 聊天可以靈活運用于多個應用和內容工作,不僅提供了強大的 AI 功能,還保障了工作數據的安全,以更好地滿足使用者的需求。圖圖 33 Microsoft 365 聊天貫穿所有辦公應用聊天貫穿所有辦公應用 資料來源:微軟官網 OneNote+Copilot:通過自由語言對話提高工作效率。:通過自由語言對話提高工
98、作效率。Copilot 能將OneNote 中選定的文字、頁面和筆記章節總結成易分享的格式。想要創建總結時,使用者只需進入需要總結的頁面,在首頁選取 Copilot,然后在打開的 Copilot 窗格中輸入想要總結的內容和要求,比如按時間順序列出事情并用項目符號表示,隨之 Copilot 會迅速生成一個按時間順序列出事情的項目符號總結,并在窗格中展示出來。Copilot 還能為筆記創建實用的待辦事項清單,只需要告訴它想要從哪一頁中提取待辦事項清單,Copilot 就會為你完成這項工作。另外,對于項目計劃,只需告訴Copilot 想要開發新的發貨跟蹤應用的項目需求,它就會幫你制定項目計劃??傊?,
99、通過與 Copilot 的開放對話,使用者能獲得對獨特問題和筆記的回應。行業專題研究行業專題研究 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 31 of 45 圖圖 34 Microsoft 365 Copilot 在在 OneNote 中創建摘要中創建摘要 資料來源:微軟官網 Loop+Copilot:輕松協作、共同創作和保持工作同步:輕松協作、共同創作和保持工作同步。無論是啟動一個新項目還是規劃、獲得創意,Loop 中的 Copilot 都能提供幫助。通過在Loop 中打開工作區,選擇 Copilot,并根據預設提示選擇創建、集思廣益、藍圖或描述,使用者可以很快啟動所
100、需的協作。隨后,使用者可以根據具體需求編輯提示,優化結果,調整語氣、文本或格式,以符合個人需求。使用者也可以在文本框下方的 Copilot 框中提出更具體的創意或改進建議。若需要撤銷最近的結果,可以選擇撤銷按鈕。通過這種方式,Loop 中的 Copilot 為使用者提供了高效的協作和創作體驗。圖圖 35 Microsoft 365 Copilot 在在 Loop中創建新項目中創建新項目 資料來源:微軟官網 Microsoft 365 Copilot 的推出將為微軟帶來新的收入來源,提高付費用的推出將為微軟帶來新的收入來源,提高付費用戶戶 ARPU。目前 Microsoft 365 Copilo
101、t 仍處于內部測試階段,但微軟已宣布 Copilot 將于 2023 年 9 月 26 日全面鋪開,企業版將于 11 月 1 日全面開放,用戶能以 30 美元/月的價格開通 Microsoft 365 的 Copilot 人工 行業專題研究行業專題研究 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 32 of 45 智能助手服務。但根據科技媒體 The Information 報道,微軟已向包括美國銀行、沃爾瑪、福特和埃森哲等在內的 600 多家大型機構客戶測試具備 AI 能力的 Microsoft 365 Copilot 訂閱服務,在已經付費訂閱 Microsoft 36
102、5 年費會員的基礎上,每 1000 名員工使用 Copilot 服務需要支付的額外年費為 10 萬美元,對應額外的 ARPU 為 100 美元,目前試點客戶的付費意愿超出微軟早先預期。我們根據微軟財報數據測算2022年 Microsoft 365 機構訂閱的 ARPU 約為 103 美元,此次 Copilot 服務的試點價格有望推動 ARPU 實現接近翻倍增長。圖圖 36 Microsoft 365 商業版商業版 ARPU 約為約為 103 美元美元 資料來源:Wind,國泰君安證券研究 AI 辦公應用趨于同質化,微軟辦公應用趨于同質化,微軟 Copilot 憑借優秀技術與龐大用戶群體展憑借優
103、秀技術與龐大用戶群體展現出市場優勢?,F出市場優勢。AI 辦公應用本質依賴于強大的 AI 大模型,然而,隨著技術的發展,AI 辦公應用市場呈現出功能同質化的明顯特點,許多產品本質就是大模型的套殼產品,準入門檻低,難以形成明顯差異化競爭優勢。在這種背景下,微軟作為一家擁有強大技術實力和豐富行業經驗的公司,推出的 Microsoft 365 套餐將會在后期展現出更為明顯的優勢。微軟以其深厚的研發底蘊和先進的技術實力,不斷改進和優化 AI 模型,使其在語言理解、自然語言處理、協同辦公等方面達到更高水準。這種技術的不斷進步將使得微軟的辦公應用能夠更好地適應用戶的需求,提供更智能、高效的辦公體驗。此外,微
104、軟擁有廣泛的用戶群體和豐富的行業場景,能夠將 AI 技術與實際工作場景相結合,為用戶提供更有針對性的解決方案。隨著微軟不斷推進技術創新和產品升級,Copilot 的優勢將會日益凸顯,滿足用戶日益增長的智能辦公需求,成為市場的翹楚。5.3.OpenAI 也推動了也推動了 AI 辦公領域的其他創業公司的興起辦公領域的其他創業公司的興起 OpenAI 模型引發模型引發 AI 辦公應用涌現,辦公應用涌現,AI 產品價格戰或將打響。產品價格戰或將打響。OpenAI現已開放了 GPT 模型與 DALLE 模型的 API,這舉措極大地刺激了以這兩個 API 為基礎的人工智能辦公應用的開發與應用。這些應用可以
105、廣泛應用于文本生成、PPT 制作、表格處理等辦公場景。初期,率先進場的應用得到了不少用戶和投資者的青睞,取得了一定的市場影響。然而,隨著時間的推移和技術普及,類似的同質化應用也開始大量涌現。尤其是微軟推出了 Copilot 這一強有力的競爭者,勢必會加劇這一領域的市場競爭。微軟 Copilot 僅需 30 美元/月的價格便可涵蓋幾乎所有 AI 辦公 行業專題研究行業專題研究 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 33 of 45 需求,而市場上其余相對優質的 AI 辦公應用均不免費,且功能完全版單月售價均在 20 美元左右,相較于 Copilot 很難形成競爭優勢。
106、未來,各個應用將會不斷提升自身技術水平和服務質量,極有可能會降低產品服務價格(包括推出包月、包年服務等)以爭奪更多的用戶和市場份額。在這樣的競爭環境下,創新、差異化、高性價比以及持續的技術優化將成為取得成功的關鍵。只有不斷滿足用戶需求、提供獨特價值的應用,才能在激烈的市場競爭中立于不敗之地。5.3.1.電子郵件和營銷文案為代表的文本生成應用層出不窮電子郵件和營銷文案為代表的文本生成應用層出不窮 Flowrite 是芬蘭的一個基于人工智能的寫作方式工具。是芬蘭的一個基于人工智能的寫作方式工具。它通過將簡短的指令轉換為可隨時發送的電子郵件和消息,并在網站和應用程序上幫助用戶節省日常交流時間,提高日
107、常生活效率。Flowrite 利用早期的 Open AI 的 GPT-3 API 接口工作,并在此基礎上構建,而不僅僅是為 GPT-3 構建一個包裝器。Flowrite 具有瀏覽器兼容性,可以與流行的網絡瀏覽器實現無縫集成;其擁有多種智能模板,提供常用電子郵件和消息的模板庫,也可以創建自定義模板;另外,它內置語氣選擇器,可以選擇合適的語氣。自建立以來,Flowrite 公司一直緊跟 GPT 模型的進展更新自己的產品,改進其對自然語言的理解能力。目前,Flowrite 定價根據每月可處理的消息數量不同分為 4 歐元/月到 24 歐元/月不等。2021 年 Flowrite公司獲得了 440 萬美
108、元的天使輪融資,但鑒于文本生成類 AI 應用井噴式增長,其發展前景還有待觀察。圖圖 37 Flowrite 自動生成郵件內容自動生成郵件內容 資料來源:Flowrite 官網 Copy.ai作為初創公司,致力于為企業客戶建立作為初創公司,致力于為企業客戶建立AI驅動的文案寫作工具。驅動的文案寫作工具。它能在幾秒鐘內生成營銷副本,包括社交媒體主要文本、標題、鏈接描述和博客創意等功能。Copy.AI 主要利用 GPT-3 技術實現,使用者只需輸入文章的標題和核心內容,通過 AI 生成和人工修正,從而得到最滿意的文案結果。Copy.ai 的特色功能包括 Chat by Copy.AI,允許用戶通過聊
109、天界面與其交流并完成各種任務,如從網站抓取數據、生成個性化的銷售郵件,或總結 YouTube 視頻;內置文檔編輯器,用戶可以隨時剪切、行業專題研究行業專題研究 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 34 of 45 復制、粘貼和修改文本內容,并將其導出為長篇文章;預設模板,幫助用戶指導 AI 生成更高質量的內容和文案,這些模板包括創建個性化銷售郵件、SEO 友好的長篇博客文章、內容再利用和 PPC 廣告等,滿足常見寫作場景需求;團隊協作方面,Copy.AI 允許每個團隊成員獲取所需的信息、數據和相關資源,并在更高層次上解決問題。目前 Copy.ai 的免費版支持最高
110、上限 2000 字的內容輸出,無限制的專業版本收費 36 美元/月。圖圖 38 Copy.ai 根據用戶需求生成營銷文案根據用戶需求生成營銷文案 資料來源:Copy.ai 官網 5.3.2.基于基于 GPT、DALLE模型,“模型,“AI+PPT”領域玩家各顯神通”領域玩家各顯神通 Gamma AI 實現了實現了 AI 幫助創作或基于已有文檔一鍵轉換成幫助創作或基于已有文檔一鍵轉換成 PPT,能自,能自動生成多種格式的文稿。動生成多種格式的文稿。在 2023 年 3 月的更新中,Gamma 將 AI 助手和文檔自動生成能力引入演示文稿生成任務,使用者只需簡單輸入關鍵詞或描述使用場景,Gamma
111、 會根據這些信息提供兩種選項:AI 幫助創作或基于已有文檔一鍵轉換成 PPT。在確定演示主題后,Gamma AI 會提供大綱,由使用者進行刪改編輯,確保內容符合演示需求。接下來,用戶可以選擇配色模板,并允許調整配色和內容細節,以滿足個性化需求。Gamma 能自動生成多種格式的文稿,包括 PPT 和博客,同時支持20 多種語言,保證生成內容的質量和多樣性。此外,用戶可對生成的文件進行高度自由度的編輯,包括文字、顏色、圖片等。Gamma 還提供了個人專屬工作空間,方便用戶管理和查找文稿。另外,生成的文稿是自適應的,可以在不同設備上查看,也支持下載為 PDF、PPT 等格式,方便線下演示和編輯。截止
112、目前,Gamma 仍舊完全免費,只是有使用次數的限制。2021 年,Gamma 已獲得包括硅谷著名風投 Accel 以及 Zoom CEO 袁征、LinkedIn 前 CEO Jeff Weiner 等人的 700 萬美元種子輪投資。從 Beta 版本發布以來,已有上百萬用戶在創業、團隊、營銷等領域廣泛使用 Gamma 進行演示,得到了極高的認可。行業專題研究行業專題研究 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 35 of 45 圖圖 39 Gamma.AI 可羅列多種可羅列多種 PPT 主題供用戶挑選主題供用戶挑選 資料來源:Gamma AI 官網 Tome AI
113、實現了讓實現了讓 AI 來做來做 PPT,除了編輯能力,還能集成多類網站資,除了編輯能力,還能集成多類網站資源。源。它利用 GPT-3 模型生成文本,使用 Dall-E 2 模型生成圖片。該生成器于 2022 年 3 月首次發布。通過使用 AI 技術,Tome AI 使得所有人都能輕松創建一個有合理大綱、有力標題、完整故事和精美圖片的演示文稿。用戶只需在預定義的工作空間中輸入內容提示即可完成創作。Tome AI 具備編輯文案的能力,可以根據需要使文稿更簡潔或更詳細,并選擇合適的語調。用戶可以使用 Tome 重新設計的提示欄,從三種不同的輸出類型(演示文稿、故事和大綱)和多種圖像格式中進行選擇。
114、Tome AI具有強大的集成能力,可以將 figma 文件、網站甚至 Twitter 賬號直接導入,以便在演示過程中進行展示,它還支持所有原生網站的交互動作。另外,它還提供一項有趣的功能即視頻旁白,在展示 PPT 的同時,可以錄制自己的講述過程,畫面會在右上角同步出現。生成的 PPT 會根據設備自適應顯示。Tome AI 的 iOS 應用已上線,可以在手機上進行編輯。Tome 提供基于 SaaS 的服務,個人用戶可以按月付費訂閱,企業用戶可以按需定制方案。該公司最近一輪融資由 Lightspeed 領投,籌得 4300 萬美元,使 Tome 的估值達到 3 億美元,累計融資額為 8100 萬美
115、元。圖圖 40 Tome.Ai將文檔轉換為演示文稿將文檔轉換為演示文稿 行業專題研究行業專題研究 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 36 of 45 資料來源:Tome AI 官網 SlidesAI 是基于是基于 Google Slides 的的 AI 生成生成 PPT插件,可以基于對文本的插件,可以基于對文本的理解生成可自定義的理解生成可自定義的 PPT,但試用期有頁面數量限制。,但試用期有頁面數量限制。SlidesAI 基于OpenAI 技術搭建,其最大的特點是能夠使用 AI 將任何文本轉換成 PPT,只需輸入想表達的內容,SlidesAI 會分析文本內容,
116、提取主題、關鍵點和結構等信息,并生成相應的幻燈片。SlidesAI 還會自動添加合適的圖片、圖表和圖標等元素,增強演示效果。SlidesAI 提供不同類型的演示模板,適用于各種場合和目的,目前支持通用、教育、銷售和會議四種類型的演示模板。用戶可以自定義演示的外觀和風格,以及在生成的幻燈片中自由添加、刪除和修改文本、圖片、圖表和圖標等元素。SlidesAI提供免費試用期,讓用戶體驗其功能和優勢。試用期內,可以創建最多三個演示文稿,每個文稿最多十頁幻燈片。如需創建更多演示文稿或幻燈片,需升級到付費版本,包括 9.9 美元/月的基礎版與 19.99 美元/月的專業版。SlidesAI 還提供團隊版,
117、適合多人協作創建演示文稿的團隊或機構使用,團隊版價格為每月 49.99 美元。圖圖 41 SlidesAI 工作界面如下所示工作界面如下所示 資料來源:SlidesAI 官網 行業專題研究行業專題研究 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 37 of 45 ChatBA 也是一個使用也是一個使用 GPT與與 Dall.E模型自動生成模型自動生成 PPT的工具,并且的工具,并且能夠實現協作編輯。能夠實現協作編輯。同樣地,用戶只需要輸入文字描述,ChatBA 就會根據內容和上下文自動創建匹配的幻燈片,ChatBA 也會根據輸入自動選擇合適的字體、顏色、背景、圖標和圖片等
118、元素,模板和布局等外觀也可以用戶自定義。ChatBA 使用了 GPT 技術來理解和生成文字,并使用了 DALLE 2 技術來創建相應的圖像,這兩種技術的結合使得 ChatBA能夠生成高質量的幻燈片。另外,ChatBA 可以邀請其他人共同編輯幻燈片,實時查看對方的修改和評論,還可以將幻燈片導出為 PDF 或 PPT 格式,并分享給他人查看或下載。目前,ChatBA 處于測試階段,免費提供給所有用戶使用。由于 OpenAI API 的限制和用戶需求量較大,每天生成PPT 的數量受到限制。圖圖 42 ChatBA 工作界面如下所示工作界面如下所示 資料來源:ChatBA 官網 5.3.3.表格分析應
119、用也是表格分析應用也是 GPT的重要細分應用領域,產品眾多的重要細分應用領域,產品眾多 Arcwise AI 是一款基于是一款基于 GPT的的 Google Sheets 助手應用,實現“助手應用,實現“AI 分析分析師”的職能。師”的職能。Arcwise 能輕松且安全地與團隊的業務數據工具(如 Looker和Snowflake)連接,消除了繁瑣的CSV導入/導出工作流程。使用Arcwise,用戶可以立即構建透視表,利用來自 Snowflake、Looker 或其他數據系統的數據,使數據分析變得輕松。該工具可以直接集成到現有的電子表格中,無需學習新平臺,保持了業務一貫的操作模式,具有非同尋常的
120、強大功能。另外,Arcwise 具有自動生成 SQL 指標的能力,能自動將電子表格中的公式轉換為 SQL,增強了電子表格的功能,簡化了數據治理的過程,確保電子表格始終包含準確的數據??傊?,它類似一個 AI 分析師的職能,幫助用戶更快地獲得正確的結果。Arcwise 于 2023 年對外發布了測試版產品,僅需申請即可免費使用。同時,該產品的開發團隊目前僅有 4 人。行業專題研究行業專題研究 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 38 of 45 圖圖 43 Arcwise 近期推出的數據自動分析功能近期推出的數據自動分析功能 資料來源:Arcwise 官網 Sheet
121、AI 是一款是一款 Google Sheet 的智能分析插件,可以自主選擇四種模型的智能分析插件,可以自主選擇四種模型接口。接口。SheetAI 旨在簡化繁瑣的任務,如文本編輯和信息提取等,它能以簡單快速的方式處理諸如創建標語、應用標簽、翻譯文本、總結內容以及填充數據等任務。其通過使用多個內置函數,用戶可以選擇列出 AI 生成的響應、以表格形式輸出結果,甚至進行文本編輯,以滿足不同需求。這使得處理文本和數據變得更高效,而無需手動進行繁重的編輯和分析。另外該插件共內置有“gpt-3.5-turbo”、“text-curie-001”、“text-babbage-001”、“text-ada-00
122、1”四種模型接口,使用者可根據自身需求選擇 AI 處理模型。目前,SheetAI 推出了四檔包含不同功能與使用數量上限的插件套餐,價格從 0 美元到 29 美元每月不等。圖圖 44 Sheet AI 支持使用者自助配置內部參數支持使用者自助配置內部參數 資料來源:SheetAI 官網 GPT Excel是一個致力于利用是一個致力于利用AI輕松生成和解釋輕松生成和解釋 Excel和和 Google Sheets公式的網站。公式的網站。通過 GPTExcel,在 Excel、Google Sheets 或 Airtable 中創建復雜的計算和分析變得輕而易舉。比如可以不用再手動編寫公式,通過 AI
123、 Excel、VBA 自動化、Apps Script 自動化和 SQL 查詢來優化工作 行業專題研究行業專題研究 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 39 of 45 流程。此外,GPTExcel 還提供全面的解釋,幫助用戶更好地理解如何在這些平臺上執行計算和數據分析,并簡化復雜的公式表達式。它還能輕松創建、排錯和微調各種數據庫系統的復雜 SQL 查詢,告別手動編碼,提升數據庫查詢能力。通過為 Excel 生成 VBA 腳本、Google Workspace生成 Apps Script 腳本或 Airtable 生成腳本,GPTExcel 可以自動化任務,簡化工作
124、流程。GPTExcel 提供免費使用套餐,同時還提供專業版,每月價格為 6.99 美元。最近,該網站對應用程序進行了改進,增加了速度和效果,截止 2023 年 5 月 8 日,其已生成超過 12,324 個公式。對于需要簡化電子表格體驗的用戶來說,GPTExcel 是一個非常好的選擇。圖圖 45 GPTExcel通過自然語言生成公式通過自然語言生成公式 資料來源:GPTExcel 官網 6.微軟微軟 Copilot應用模式出彩于辦公,但遠超于辦公應用模式出彩于辦公,但遠超于辦公 6.1.Dynamics 365 Copilot 高效整合商業要素,釋放團隊潛能高效整合商業要素,釋放團隊潛能 與傳
125、統與傳統 ERM 和和 ERP 不同,不同,Dynamics365 幫助員工專注于最重要的事。幫助員工專注于最重要的事。根據微軟 2023 年商業趨勢調查結果,AI 和自動化工具能讓 89%的員工感到更加充實,因為他們可以花更多時間在真正重要的工作上。2023 年3 月 7 日,微軟正式推出國際版 Dynamics 365 Copilot,為各項商業應用全面引入互動式的 AI 助手。這也是全球首個應用于 CRM 和 ERP 的互動式 AI 助手。微軟 Dynamics 365 與傳統的 CRM 和 ERP 不同的是,它能夠高度互聯且支持靈活部署的應用程序,可以將企業全部業務數據、流程和團隊與現
126、有的系統配合使用,幫助企業打破數據孤島的現狀,從而加速業務進程。Dynamic 365 Viva Sales 中的中的 Copilot可以幫助使用者與客戶高效地進行可以幫助使用者與客戶高效地進行溝通溝通。AI 自動生成的會議回顧和電子郵件答復簡化重復的任務,使用Copilot 執行任務,團隊將更快地推進交易;Dynamic 365 Customer Insights 中的 Copilot 可以使用自然語言發現新的見解。因為如果沒有 AI,從客戶數據中發掘見解既耗時又需要技術,需要數據分析師操作或需要具備專門的知識?,F在,使用者的市場營銷團隊可直接接觸到客戶數據,只需使用自然語言提問,就能近實時
127、地探索和分析客戶細分領域規模和偏好。微軟表示現有 Dynamics 365 用戶無需額外支付費用就可享受 Copilot 功能,部分功能已經以預覽版形式推出,后續會開放更多新功能新特性。圖圖 46 Dynamics 365 Copilot 集成微軟眾多應用資源集成微軟眾多應用資源 行業專題研究行業專題研究 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 40 of 45 資料來源:微軟官網 Dynamics 365 Copilot 為每條業務線打造專屬為每條業務線打造專屬 AI 助手,比如助手,比如 AI 可以增可以增強營銷能力。強營銷能力。Dynamics 365 Mark
128、eting 中的 Copilot 可以輕松地創建有針對性的客戶細分領域和有創意的內容:使用 AI 簡化營銷任務,從而節省時間、提高效率和創建更優質的內容。具體地,Copilot 使用自然語言描述目標受眾,強化或生成客戶細分領域,同時能為電子郵件生成新的內容靈感,然后根據需要進行優化和個性化,減少生產時間,讓使用者有更多時間執行其他創意任務。在針對企業客戶的服務方面,在針對企業客戶的服務方面,Dynamics 可以高效、準確地與其互動,可以高效、準確地與其互動,增強服務質量、保證服務效率。增強服務質量、保證服務效率。Dynamics 365 Customer Service 中的 Copilot
129、 在對話的過程中生成內容,可以撰寫客戶答復草稿,使用者也可以與 Copilot 聊天來診斷問題、提出跟進問題和發現解決方案,這種功能的實現也來源于 Copilot 可以通過實時對話和受信任的支持資源在上下文中生成內容;再者,Supply Chain Center 中的 Copilot 可以實時預測和應對干擾,利用實時協作和其生成的見解跟進需求并應對意外的供應鏈干擾。例如,Copilot 可以主動標記天氣、金融和地緣政治新聞等外部問題,可以發現對供應商、材料和庫存的見解和預測影響,此時 AI 也可以為受到影響的供應商創建有背景信息的電子郵件,供應商隨后可調整預計到達時間(ETA)、路線和分銷流程
130、來避干擾;另外,Dynamics 365 Business Central 中的 Copilot 能創建有吸引力的產品描述,使用 AI 建議的產品描述來節省時間并促進銷售,比如 Copilot 能為品牌量身定制吸引人的營銷文本,同時能添加顏色、材質和尺寸等關鍵特性,只需單擊幾下就能發布到 Shopify 或其他電商商店。行業專題研究行業專題研究 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 41 of 45 圖圖 47 Dynamics 365 Copilot 幫助使用者加快產品發布和商業協作幫助使用者加快產品發布和商業協作 資料來源:微軟官網 6.2.Security C
131、opilot 輔助安全人員檢測響應威脅和決策輔助安全人員檢測響應威脅和決策 Security Copilot 賦能防御者檢測隱藏規律、強化防御,并通過生成式賦能防御者檢測隱藏規律、強化防御,并通過生成式 AI更快地響應事件。更快地響應事件。Copilot 利用基于 OpenAI 的 GPT-4 最新技術,讓網絡安全人員能夠就當前影響環境的安全問題提問并獲得答案,甚至可以直接整合公司內部的知識,為團隊提供有用的信息,從現有信息中進行學習,將當前威脅活動與其他工具數據相關聯、提供最新的信息。微軟在這款工具中結合了 OpenAI 大模型的功能,使其能夠理解提出的問題,總結出由公司網絡安全團隊和外部數
132、據生成的威脅報告以及微軟自己的威脅分析。微軟表示,模型是由 100 多個不同的數據源提供信息的,每天接收超過 65 萬億個威脅信號。2023 年 3 月微軟開始向白名單客戶提供新的 Security Copilot 預覽版,官方目前并未公布更廣泛地推出這個技術的日期。圖圖 48 Security Copilot 集成了來自安全工具的見解和數據集成了來自安全工具的見解和數據 資料來源:微軟官網 Security Copilot 旨在輔助安全分析師的工作,而不是替代他們旨在輔助安全分析師的工作,而不是替代他們。同時,安全助手具備便簽板功能,便于團隊合作和信息分享。安全專業人士可以利用 Securi
133、ty Copilot 進行事件調查、快速總結事件,以及支持報告撰寫。該工具接受自然語言輸入,因此用戶可以輕松地提出關于漏洞概要、文件、網址或代碼片段的查詢,還可以從其他安全工具中導入事件和警 行業專題研究行業專題研究 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 42 of 45 報信息,所有交互都會被記錄,以便進行審計。Security Copilot 還允許用戶將結果保存到共享工作空間,以便團隊共同進行威脅分析和調查。其中一個有趣功能是提示書(prompt book),它將一系列步驟或自動化功能捆綁成一個簡單易用的按鈕或提示,比如可以創建一個共享的提示來進行腳本逆向工程
134、,從而加速分析過程,甚至能夠生成 PowerPoint 幻燈片,以清晰概述事件和攻擊向量。此外,與 Bing 一樣,微軟明確標明了信息來源,包括來自網絡安全與基礎設施安全局、國家標準與技術研究院以及微軟自身威脅情報數據庫的信息。圖圖 49 Security Copilot 能能在幾分鐘內匯總任何事件、事故或威脅在幾分鐘內匯總任何事件、事故或威脅 資料來源:微軟官網 6.3.Power Platform Copilot 讓軟件開發更簡單讓軟件開發更簡單 Power Platform Copilot 讓低代碼開發更簡單。讓低代碼開發更簡單。2023 年 3 月 16 日,微軟正式對外宣布了 Pow
135、er Platform Copilot,它可以在 Power Apps,Power Virtual Agents 和 Power Automate 中,基于 GPT 讓創作者可以用自然語言描述他們想要的應用、流程或機器人,Copilot 便可以在幾秒鐘內完成創建,并提供優化建議。目前 Power Platform 采用即用即付的費用方式,根據用戶使用的云計算流量大小收費。圖圖 50 微軟自微軟自 2019 年便致力于將年便致力于將 AI 引入低代碼開發引入低代碼開發 資料來源:微軟官網 Power Platform Copilot 只要幾句話就能幫使用者輕松建造自動化流程只要幾句話就能幫使用者
136、輕松建造自動化流程 行業專題研究行業專題研究 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 43 of 45 和和 App。Power Apps 中的 Copilot 可以讓使用者通過自然語言對話來直接生成 App,只需要通過幾個簡單的自然語言來描述應用場景,Power Apps 就會生成應用,不僅僅是界面,還包括了資料表和運作邏輯。使用者還可以通過和 Copilot 的對話來對應用進行調整,比如在資料表中新增一列,甚至是給資料表填充范例資料等等。若在 App 開發過程中遇到問題,Copilot 也可以提供應用改進建議,而通過 Power Automate Copilot,
137、無論用戶需求的復雜度如何,都可以通過自然語言來生成流程。不僅如此,Copilot 還可以以對話的方式不斷優化和反復更新流程,這讓用戶不需要任何 Power Automate 專業知識,只需要用自然語言就可以構建任何想要的流程。另外在另外在 Power Automate Desktop 桌面版上,用戶也可以使用桌面版上,用戶也可以使用 GPT模型模型來來生成文字內容生成文字內容,先前 AI Builder 最新整合的 Azure OpenAI 服務,現在也可以直接在 Power Automate Desktop 中使用。這讓我們在自動流程化機器人(RPA)的領域也能隨時隨地享用到 OpenAI
138、帶來的各種智慧服務,無論是收集回饋意見,還是從大量文本中提取關鍵資訊都可以直接通過 RPA 搭配 OpenAI 的方式實現。通過 Power Virtual Agents Copilot,用戶可以直接使用自然語言來描述機器人流程,想讓機器人做什么,只需要通過對話的方式進行描述就可以,而不需要像以前一樣手動新建一筆筆的對話及資料。從傳統代碼到低代碼開發,再演變到自然語言生成代碼,可以看到,對話式機器人建造方式已經被顛覆?,F在,每個人都可以在幾分鐘內快速打造和反覆訓練任何機器人,包括觸發短語(prompt)、問題、實體、變數和各種邏輯,都可以使用自然語言來直接生成。圖圖 51 Power Plat
139、form Copilot 建立云端流程的界面如下所示建立云端流程的界面如下所示 資料來源:微軟官網 7.投資建議投資建議 推薦中國 AI 應用及 AI 算力領軍企業,推薦標的:金山辦公、科大訊飛、虹軟科技、拓維信息、浪潮信息,受益標的:萬興科技、福昕軟件、恒潤股份。行業專題研究行業專題研究 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 44 of 45 8.風險提示風險提示 1)大模型應用不及預期風險)大模型應用不及預期風險 當前大模型本身也存在代際優化空間,而且產業應用也處于初期,與各個產業應用場景的結合需要實踐探索和試錯,存在應用落地不及預期的風險。2)競爭加劇風險)競
140、爭加劇風險 國內外頭部廠商均投入巨額算力和人員研發大模型及其訓練應用,但隨著OpenAI等頭部企業提前布局完善,后來競爭者或面臨快速淘汰風險。3)倫理及隱私侵權風險)倫理及隱私侵權風險 模型本身無法核實數據來源的真實性,也不直接提供數據來源,用戶無法得知信息的可靠性;產品本身可能挖掘他人具有著作權的作品作為數據庫,用戶在使用過程中也會涉及輸入他人具有著作權的作品要求大模型進行總結分析,從而存在一定的侵權、侵犯隱私等倫理風險。行業專題研究行業專題研究 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 45 of 45 本公司具有中國證監會核準的證券投資咨詢業務資格本公司具有中國證
141、監會核準的證券投資咨詢業務資格 分析師聲明分析師聲明 作者具有中國證券業協會授予的證券投資咨詢執業資格或相當的專業勝任能力,保證報告所采用的數據均來自合規渠道,分析邏輯基于作者的職業理解,本報告清晰準確地反映了作者的研究觀點,力求獨立、客觀和公正,結論不受任何第三方的授意或影響,特此聲明。免責聲明免責聲明 本報告僅供國泰君安證券股份有限公司(以下簡稱“本公司”)的客戶使用。本公司不會因接收人收到本報告而視其為本公司的當然客戶。本報告僅在相關法律許可的情況下發放,并僅為提供信息而發放,概不構成任何廣告。本報告的信息來源于已公開的資料,本公司對該等信息的準確性、完整性或可靠性不作任何保證。本報告所
142、載的資料、意見及推測僅反映本公司于發布本報告當日的判斷,本報告所指的證券或投資標的的價格、價值及投資收入可升可跌。過往表現不應作為日后的表現依據。在不同時期,本公司可發出與本報告所載資料、意見及推測不一致的報告。本公司不保證本報告所含信息保持在最新狀態。同時,本公司對本報告所含信息可在不發出通知的情形下做出修改,投資者應當自行關注相應的更新或修改。本報告中所指的投資及服務可能不適合個別客戶,不構成客戶私人咨詢建議。在任何情況下,本報告中的信息或所表述的意見均不構成對任何人的投資建議。在任何情況下,本公司、本公司員工或者關聯機構不承諾投資者一定獲利,不與投資者分享投資收益,也不對任何人因使用本報
143、告中的任何內容所引致的任何損失負任何責任。投資者務必注意,其據此做出的任何投資決策與本公司、本公司員工或者關聯機構無關。本公司利用信息隔離墻控制內部一個或多個領域、部門或關聯機構之間的信息流動。因此,投資者應注意,在法律許可的情況下,本公司及其所屬關聯機構可能會持有報告中提到的公司所發行的證券或期權并進行證券或期權交易,也可能為這些公司提供或者爭取提供投資銀行、財務顧問或者金融產品等相關服務。在法律許可的情況下,本公司的員工可能擔任本報告所提到的公司的董事。市場有風險,投資需謹慎。投資者不應將本報告作為作出投資決策的唯一參考因素,亦不應認為本報告可以取代自己的判斷。在決定投資前,如有需要,投資
144、者務必向專業人士咨詢并謹慎決策。本報告版權僅為本公司所有,未經書面許可,任何機構和個人不得以任何形式翻版、復制、發表或引用。如征得本公司同意進行引用、刊發的,需在允許的范圍內使用,并注明出處為“國泰君安證券研究”,且不得對本報告進行任何有悖原意的引用、刪節和修改。若本公司以外的其他機構(以下簡稱“該機構”)發送本報告,則由該機構獨自為此發送行為負責。通過此途徑獲得本報告的投資者應自行聯系該機構以要求獲悉更詳細信息或進而交易本報告中提及的證券。本報告不構成本公司向該機構之客戶提供的投資建議,本公司、本公司員工或者關聯機構亦不為該機構之客戶因使用本報告或報告所載內容引起的任何損失承擔任何責任。評級
145、說明評級說明 評級評級 說明說明 1.1.投資建議的比較標準投資建議的比較標準 投資評級分為股票評級和行業評級。以報告發布后的 12 個月內的市場表現為比較標準,報告發布日后的 12 個月內的公司股價(或行業指數)的漲跌幅相對同期的滬深 300 指數漲跌幅為基準。股票投資評級股票投資評級 增持 相對滬深 300 指數漲幅 15%以上 謹慎增持 相對滬深 300 指數漲幅介于 5%15%之間 中性 相對滬深 300 指數漲幅介于-5%5%減持 相對滬深 300 指數下跌 5%以上 2.2.投資建議的評級標準投資建議的評級標準 報告發布日后的 12 個月內的公司股價(或行業指數)的漲跌幅相對同期的滬深300 指數的漲跌幅。行業投資評級行業投資評級 增持 明顯強于滬深 300 指數 中性 基本與滬深 300 指數持平 減持 明顯弱于滬深 300 指數 國泰君安證券研究所國泰君安證券研究所 上海上海 深圳深圳 北京北京 地址 上海市靜安區新閘路 669 號博華廣場 20 層 深圳市福田區益田路 6003 號榮超商務中心 B 棟 27 層 北京市西城區金融大街甲 9 號 金融街中心南樓 18 層 郵編 200041 518026 100032 電話(021)38676666(0755)23976888(010)83939888 E-mail: