《海外科技行業中美科技巨頭的AI大模型競賽:GPT裂變時刻-230406(36頁).pdf》由會員分享,可在線閱讀,更多相關《海外科技行業中美科技巨頭的AI大模型競賽:GPT裂變時刻-230406(36頁).pdf(36頁珍藏版)》請在三個皮匠報告上搜索。
1、請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 2023.04.06 GPT 裂變時刻裂變時刻 中美科技巨頭的中美科技巨頭的 AI 大模型競賽大模型競賽 梁昭晉梁昭晉(分析師分析師)0755-23976666 證書編號 S0880523010002 本報告導讀:本報告導讀:A AI I 產業臨界點產業臨界點來臨,中美科技來臨,中美科技巨頭巨頭軍備競賽全面啟動,算力需求具備高確定性軍備競賽全面啟動,算力需求具備高確定性。摘要:摘要:A AI I 技術發展多時,深度學習時代技術發展多時,深度學習時代 A AI I 浪潮開啟浪潮開啟。AI 研究領域最早源自于 1943 年神經元模型
2、誕生,并于 1956 年達特茅斯會議正式確立;隨后 AI 技術先后進入專家系統時期(1970s-1980s)、機器學習時期(1990s-2000s),目前 AI 領域已邁入深度學習時期(2010s-至今),深度神經網絡、自然語言處理成為深度學習時代的技術內核,大型科技公司和研究院開啟深度學習熱潮,共同推動 AI 產業迎來變革。全球科技巨頭爭相布局,全球科技巨頭爭相布局,A AI I 技術成果不斷涌現技術成果不斷涌現。海外科技巨頭 Open AI、谷歌、Meta、蘋果、亞馬遜、微軟、英偉達、Adobe、特斯拉布局AI領域多時,Open AI GPT-4,微軟365 Copilot,英偉達 DGX
3、 Cloud、Adobe Firefly 等旗艦產品落地推動產業變革;國內科技巨頭騰訊、百度、字節跳動、華為、阿里巴巴等持續研發投入,百度文心一言率先推出,騰訊“混元”AI 大模型、華為“盤古”AI 大模型、阿里達摩院“通義”大模型等有望加速引爆 AI 熱潮。G GPTPT 裂變時刻裂變時刻,中美科技巨頭軍備競賽全面啟動中美科技巨頭軍備競賽全面啟動。AI 產業發展至今,其發展進程已經達到了大量行業應用革新的臨界點,在繪畫、設計、辦公、廣告和硬件設施等為代表性領域,產生了廣泛的應用和顯著的影響。AI 大模型方向上,受限于財力要求、硬件設施、人才儲備等門檻存在,小型人工智能廠商或初創企業難以追趕,
4、AI 大模型將成為中美科技巨頭間的軍備競賽。投資建議:投資建議:A AI I 產業發展進入臨界點,中美科技產業發展進入臨界點,中美科技巨頭巨頭競賽下算力需求競賽下算力需求確定性高。確定性高。通過系統回顧 AI 技術發展歷程、主要科技巨頭 AI 布局及其主要成果,我們認為 AI 產業發展的臨界點已經來臨,應用變革層出不窮,在財力要求、硬件設施、人才儲備、輿論關注、商業模式沖擊等要素影響下,AI 大模型將成為中美科技巨頭間的軍備競賽,算力層面的需求確定性最高,推薦標的聯想集團(0992.HK),受益標的英偉達(NVDA.O)、微軟(MSFT.O)。風險提示:風險提示:AI 技術迭代進度不及預期;應
5、用落地進度不及預期;國內 AI 供應鏈波動風險等。評級:評級:增持增持 交易數據 行業主要上市公司行業主要上市公司 市值市值(百萬、美元百萬、美元)A 13,197 B 678,089 C 2,137,711 市值合計市值合計 2,828,898 感謝秦和平對本報告的貢獻感謝秦和平對本報告的貢獻 相關報告 海外行業專題(海外行業專題(美國美國)行業名稱行業名稱 海外科技海外科技 股票股票研究研究 證券研究報告證券研究報告 海外行業專題海外行業專題 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 2 of 36 目目 錄錄 1.AI 技術發展歷程.4 1.1.早期 AI 時期(
6、1943 1960s).4 1.1.1.神經元模型.4 1.1.2.圖靈測試.4 1.1.3.達特茅斯會議.4 1.1.4.符號主義.5 1.1.5.感知機與神經網絡.5 1.2.專家系統時期(1970s 1980s).6 1.2.1.專家系統.6 1.2.2.反向傳播法.7 1.3.機器學習時期(1990s 2000s).7 1.3.1.監督學習.7 1.3.2.非監督學習.8 1.3.3.強化學習.9 1.4.深度學習時期(2010s-至今).9 1.4.1.深度神經網絡.9 1.4.2.自然語言處理.10 1.4.3.GPU 加速計算.11 2.主要科技公司及其 AI 技術成果.12 2
7、.1.Open AI.12 2.1.1.GPT 系列.12 2.1.2.Codex 系列.15 2.2.谷歌.15 2.2.1.Bard 聊天機器人.15 2.2.2.Bert 預訓練模型.16 2.2.3.DeepMind 實驗室.16 2.3.臉書(Meta).17 2.3.1.FAIR(Meta AI).17 2.4.蘋果.18 2.4.1.虛擬助手 Siri.18 2.4.2.Core ML、ARKit,Face ID.19 2.5.亞馬遜.19 2.5.1.AWS 云計算平臺.19 2.5.2.Alexa 智能語音助手.20 2.6.微軟.21 2.6.1.新必應(New Bing)
8、.21 2.6.2.Microsoft 365 Copilot.21 2.6.3.Azure 云服務平臺.22 2.7.英偉達.22 2.7.1.DGX Cloud.22 2.7.2.圖形處理器(GPU).23 2.8.Adobe.24 2.8.1.Adobe Firefly.24 2.8.2.Adobe Sensei.24 2.9.特斯拉.25 BVbWkZkWeYjYrYsXuV9PbPaQtRmMnPsRiNpPnRlOoOoR8OnNyRMYtQwONZsOmM 海外行業專題海外行業專題 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 3 of 36 2.9.1.自動
9、駕駛.25 2.10.騰訊.25 2.10.1.混元大模型.25 2.10.2.太極機器學習平臺.26 2.11.百度.26 2.11.1.文心一言.26 2.11.2.飛槳.27 2.12.字節跳動.27 2.12.1.KubeRay 項目.27 2.12.2.推薦算法、自然語言處理技術和計算機視覺技術.28 2.13.華為.28 2.13.1.“盤古”大模型.28 2.13.2.Ascend 系列芯片.29 2.13.3.ModelArts 開發平臺.29 2.14.阿里巴巴.30 2.14.1.達摩院.30 2.14.2.通義大模型.30 2.14.3.阿里云 ET 大腦,菜鳥網絡,天貓
10、精靈.31 3.AI Critical Mass 已至.31 3.1.AI 發展達到 Critical Mass.31 3.2.AI 已成為中美科技巨頭間的軍備競賽.31 4.投資建議.33 5.風險提示.33 海外行業專題海外行業專題 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 4 of 36 1.AI 技術發展歷程技術發展歷程 1.1.早期早期 AI 時期時期(1943 1960s)1.1.1.1.1.1.神經元模型神經元模型 神經元模型的誕生為神經元模型的誕生為 AIAI 研究領域的出現奠定了研究領域的出現奠定了理論理論基礎?;A。1943 年,心理學家沃倫麥卡洛克
11、(Warren McCulloch)和沃爾特皮茨(Walter Pitts)首次提出了被稱為神經元計算的數學模型(Neural Model),該模型將生物神經元的工作原理簡化為二進制閾值邏輯,這也成為了后續AI 學科最重要的基礎之一。1.1.2.1.1.2.圖靈測試圖靈測試 圖靈測試圖靈測試印發印發機器人機器人是否是否能具備人類的智能能具備人類的智能思考思考。1950 年,英國計算機科學家艾倫麥席森圖靈在其論文Computing Machinery and Intelligence中提出了著名的圖靈測試實驗(Turing Test),其目的是通過自然語言對話來判斷計算機是否能產生與人無法區分的
12、智能,這一實驗也引發了大規模的思考:機器人能夠否過編程語言從而具有人智。圖圖 1 1:艾倫艾倫麥席森麥席森圖靈進行圖靈測試實驗圖靈進行圖靈測試實驗 數據來源:PHYS.ORG 1.1.3.1.1.3.達特茅斯會議達特茅斯會議 達特茅斯會議達特茅斯會議確立確立 AIAI 成為一個成為一個研究領域研究領域。1956 年,John McCarthy在達特茅斯會議(Dartmouth Conference)上首次提出 AI 概念,標志著 AI 從此作為了一個獨立的研究領域的誕生。海外行業專題海外行業專題 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 5 of 36 圖圖 2 2:達
13、特茅斯會議主要參加成員:達特茅斯會議主要參加成員 數據來源:CSDN 1.1.4.1.1.4.符號主義符號主義 早期早期 A AI I 主要學派主要學派符號主義是一種基于邏輯推理的智能模擬方法。符號主義是一種基于邏輯推理的智能模擬方法。符號主義(Symbolic)也被稱為是邏輯主義,是早期 AI 的主要學派,其認為人類認知的基本單位是具有意義的表示符號,而智能則體現在符號的表示和運算過程中。1955 年,艾倫紐厄爾(Allen Newell)和哈伯特西蒙(HerBert A.Simon)首次提出了邏輯理論機(Logic Theorist)的概念,這是第一個依賴符號操作的 AI 程序。1959
14、年,他們進一步開發了通用問題求解器(General Problem Solver)程序,該程序能通過遞歸分解方式解決復雜問題。受到符號主義研究的啟發,約瑟夫維森鮑姆(Joseph Weizenbaum)于 1966 年開發了 ELIZA,這是一個能模擬心理治療師并根據用戶描述提供診療意見的程序。圖圖 3 3:ElizaEliza 系統對話效果系統對話效果 數據來源:Thought Catalog 1.1.5.1.1.5.感知機與神經網絡感知機與神經網絡 感知機是感知機是 AI 經典理論神經網絡的經典理論神經網絡的早期早期代表模型。代表模型。1958 年,美國心理學家弗蘭克羅森布拉特首次引入了感
15、知機模型(Perceptron),作為早期神經網絡理論(Neural Network)的典型模型,它嘗試模擬生物神經元的功能來進行實驗。然而,感知機僅具有單層神經元結構,并進行 海外行業專題海外行業專題 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 6 of 36 線性分類,但難以處理復雜的非線性問題。在感知機的基礎上,后續神經網絡研究發展出多層結構和更強的表達能力,能應對更復雜的非線性問題。通過優化訓練算法和權重調整,神經網絡實現了更有效的數據擬合和分類。圖圖 4 4:感知機與神經網絡模型感知機與神經網絡模型 數據來源:知乎 1.2.專家系統時期專家系統時期(1970s
16、1980s)1.2.1.1.2.1.專家系統專家系統 專家系統嘗試利用過往經驗來專家系統嘗試利用過往經驗來把計算機把計算機程序訓練成某一個領域的程序訓練成某一個領域的專家。專家。專家系統(Expert System)作為 AI 研究起步階段的重要代表,是一種模擬人類具體領域專家的知識和經驗的智能計算機程序,通過推理模型,解決那些需要人類專家才能處理的復雜問題,其核心是知識庫(領域專家的知識和經驗)和推理機(根據知識庫內容對問題進行求解)。1970 年代初,斯坦福大學 AI 研究團隊開發了 DENDRAL 系統,利用質譜數據預測分子結構,成為歷史上第一個專家系統。它證明了計算機程序在解決實際問題
17、上具有專業知識吸收能力。在長時間研發后,斯坦福大學的另一個研究團隊于 1972-1978 年間開發了 MYCIN 系統,它根據病人癥狀和實驗室檢查結果提供專家級別的診斷和治療建議,成功率達到69%,與當時美國臨床醫生平均水平相當。1980 年代,麻省理工學院開發了 XCON 系統,主要應用于計算機領域,實現高效計算機系統配置。隨后,眾多科技公司也開始開發自己的專家系統,如 IBM 的 Watson 知識圖譜回答系統,Cyc 大型知識庫,以及西門子的 PSS SINCAL 電力系統規劃分析系統。圖圖 5 5:專家系統原理專家系統原理 數據來源:Google Site 海外行業專題海外行業專題 請
18、務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 7 of 36 1.2.2.1.2.2.反向傳播法反向傳播法 反向傳播法是目前用于訓練多層感知機的最優算法,為近代深度學反向傳播法是目前用于訓練多層感知機的最優算法,為近代深度學習的發展奠定了基礎。習的發展奠定了基礎。反向傳播法(Backpropagation)是目前用于訓練多層感知機(MLP)的最常用且最有效的優化算法,它的工作原理是通過計算損失函數相對于每個權重的梯度來調整神經網絡的權重與配置,從而提高模型預測的準確性?;?Bryson 的“最速下降法”和 Werbos初步提出的“反向傳播”概念,1986 年,David R
19、umelhart、Geoffrey Hinton 和 Ronald J.Williams 在他們的論文中系統地介紹了反向傳播算法,并將其應用于多層神經網絡的訓練,這一算法徹底解決了單層感知器無法求解非線性分類的問題,大大提高了當時AI模型的預測性能。目前卷積神經網絡(CNN)、循環神經網絡(RNN)和長短時記憶網絡(LSTM),都是基于反向傳播法的基礎上對數據進行訓練。反向傳播法后續被大量用于語音識別、圖像處理、計算機視覺和自然語言處理的應用中,它也為近代深度學習的發展奠定了基礎。圖圖 6 6:反向傳播中的四層神經網絡模型反向傳播中的四層神經網絡模型 數據來源:Towards Data Sci
20、ence 1.3.機器學習時期機器學習時期(1990s 2000s)1.3.1.1.3.1.監督學習監督學習 監督學習通過帶標簽數據進行模型訓練,主要涵蓋決策樹、支持向監督學習通過帶標簽數據進行模型訓練,主要涵蓋決策樹、支持向量機、隨機森林三種。量機、隨機森林三種。監督學習(Supervised Learning)是一種對事先帶標簽數據進行模型訓練,從而來優化模型的機器學習范式。目前,蘋果的 Siri,谷歌的語音助手助手和亞馬遜的 Alexa 等智能語音助手,都是通過監督學習算法進行語音識別,奈飛、TikTok 和亞馬遜為用戶提供個性推薦,也是使用了監督學習算法。目前主要的監督學習有三種,1
21、1)決策樹()決策樹(Decision TreeDecision Tree):):1986年,羅思昆(Ross Quinlan)提出 ID3 決策樹算法,它在基于樹結構分類和回歸方法的基礎上,通過遞歸劃分數據集,從而根據數據的特征值進行預測,后續的決策樹算法還包括 C4.5 和 CART 等;2 2)支持向量機)支持向量機(Support Vector MachineSupport Vector Machine):):1995 年,Cortes 和 Vapnik 提出經典的支持向量機理論,它在解決小樣本、非線性識別中的性能更高。支持向量機本質上是一種基于最大間隔原則的分類方法,盡可能通過找到一
22、個最優的超平面,使我們對與樣本或數據進行分類;3 3)隨機森林()隨機森林(Random Random ForestForest):):隨機森林由何天琴(Tin Kam Ho)于 1995 年首次提出,并由Leo Breiman 和 Adele Cutler 進一步發展,它本質上是一種基于多個決 海外行業專題海外行業專題 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 8 of 36 策樹的集成式算法,通過對多個決策樹模型進行訓練,從而進一步提高預測性能。圖圖 7 7:亞馬遜亞馬遜 AlexaAlexa 產品形態產品形態 數據來源:亞馬遜 Alexa 1.3.2.1.3.2.
23、非監督學習非監督學習 非監督學習通過未標記的數據挖掘潛在結構及關系,涵蓋非監督學習通過未標記的數據挖掘潛在結構及關系,涵蓋 K K-均值均值聚類和主成分分析兩種聚類和主成分分析兩種。非監督學習(Unsupervised Learning)與監督學習正好相反,它不依賴預先標記的訓練數據。在這種學習方法中,模型試圖從未標記的數據中發現潛在的結構、模式和關系。由于模型不依賴于已知答案或特定目標,非監督學習通常被用于數據探索、聚類、降維和特征提取等任務。目前,主要的非監督學習有兩種:1 1)K K-均值聚類(均值聚類(K K-means means Clustering AlgorithmCluste
24、ring Algorithm):):K-均值聚類由麥昆(MacQueen)在 1967 年提出,它通過將數據集劃分為 K 個聚類,提高了文本挖掘和市場細分的準確性,例如,谷歌就在他的新聞服務谷歌 News 中使用 K0 均值聚類方法,對新聞主題進行聚類;2 2)主成分分析()主成分分析(PCAPCA):):主成分分析在霍特林(Hotelling)在 1933 年的論文被首次提出,它是一種將目標現行降維的方法,以此可以提取樣本的主要成分,它在減少數據維度的同時能夠保留樣本的大部分信息,多被用于高維數據降維,人臉識別和數據壓縮等方面。目前人臉識別技術(Eigenfaces)就是通過主成分分析對人臉
25、提取特征來識別用戶,它被廣泛用于安全監控和身份驗證系統。圖圖 8 8:監督學習與非監督學習監督學習與非監督學習原理對比原理對比 數據來源:CSDN 海外行業專題海外行業專題 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 9 of 36 1.3.3.1.3.3.強化學習強化學習 強化學習算法基于環境反饋而行動,包括強化學習算法基于環境反饋而行動,包括 Q Q-L Learearningning 和和 DeDeep ep Q Q-NetworkNetwork 兩種。兩種。強化學習(Reinforcement Learning)是一種強調基于環境反饋而行動,從而達到預期目的的機器
26、學習的范式,主要的強化學習算法有兩種:1 1)Q Q 學習(學習(Q Q-learninglearning):Q-learning 是一種基于值函數的強化學習方法,由 Watkins 和 Dayan 在 1992 年的論文中首次被提出,通過建立動作值函數 Q,讓機器人能夠根據當前環境做出最優的動作。Q-learning 被廣泛用于機器人控制和路徑規劃領域,如 KUKA 公司就使用了這一算法,實現了對機器臂的智能控制;2 2)Deep QDeep Q-NetworkNetwork(DQNDQN):Volodymyr Mnih 等人在 2015 年的論文中首次提出 DQN 方法,這是一種將深度學習
27、和 Q-learning 相結合的強化學習方法,通過使用卷積神經網絡(CNN)求得近似的 Q 函數。DeepMind 旗下的 AlphaGo 和AlphaZero 便是是用來這一算法,它們可以在游戲領域取得超越人類的表現,AlphaGo 戰勝圍棋世界冠軍李世石就是這一算法最好的證明。圖圖 9 9:20162016 年年 AlphaGoAlphaGo 戰勝李世石戰勝李世石 數據來源:BBC 1.4.深度學習時期深度學習時期(20102010s s-至今)至今)大型科技公司及研究院紛紛入局,大型科技公司及研究院紛紛入局,A AI I 熱潮開啟未來已至熱潮開啟未來已至。2012 年,AlexNet
28、網絡在 ImageNet 競賽上取得突破性成果;2017 年,中國香港Hanson Robotics 技術開發公司開發的類人機器人索菲亞;2020 年,馬斯克提出腦機接口(Brain-Computer Interface),谷歌旗下 DeepMind的 AlphaFold2、中國 76 個光子的量子計算機原型“九章”等等,以及如今的 Open AI 的 GPT 系列,谷歌的 Bard,Adobe Firefly,Midjourney,英偉達的 GPU 技術與 DGX Cloud,都是爆發式深度學習時代下的產物,大型科技公司和研究院深度學習熱潮開啟,疊加 ChatGPT 裝載 GPT-4,AI
29、的未來已至。1.4.1.1.4.1.深度神經網絡深度神經網絡 深度神經網絡能夠提取預料復雜的特征和模式,卷積神經網絡和循深度神經網絡能夠提取預料復雜的特征和模式,卷積神經網絡和循環神經網絡是兩種代表。環神經網絡是兩種代表。深度神經網絡(Deep Neural Networks)是一類具有多層結構的神經網絡,能夠提取預料開更為復雜的特征和模式,卷積神經網絡、循環神經網絡是它的兩種典型。海外行業專題海外行業專題 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 10 of 36 卷積神經網絡(CNN):CNN 是一種專門用于處理二維數據信息的神經網絡,由目前任職于 Facebook
30、 的計算機科學家楊立昆(Yann LeCun)首次提出。楊立昆在收到生物處理過程和神經元連接模式的啟發后創立了 CNN,其本質上是卷積層通過卷積操作實現局部感受視野的特征提取。CNN 不僅可以通過局部特征識別整體,還能夠大幅減少網絡參數,從而降低過擬合風險。CNN 常被用于圖像分類,目標檢測和人臉識別。AlexNet在 ImageNet 圖像分類比賽中取得突破性成果,FaceNet 的人臉識別技術和 YOLO 的實施物體檢測功能,都是基于 CNN 的產物。圖圖 1010:AlexNetAlexNet 在在 ImageNetImageNet 上上取得取得顯著的成績顯著的成績 數據來源:Pinec
31、one 1.4.2.1.4.2.自然語言處理自然語言處理 自然處理典型分支包括詞嵌入和自然處理典型分支包括詞嵌入和 T Transformerransformer,G GPTPT 系列、系列、谷歌谷歌 BertBert 等均使用了等均使用了 TraTransformernsformer 結構。結構。自然語言處理(Natural Language Processing)旨在讓計算機程序能夠理解人類語言,根據語言指令生成結果,是當前最熱門的的 AI 領域研究方向。目前自然語言處理有兩種比較典型的分支:1 1)詞嵌入()詞嵌入(Word Word EmbeddingEmbedding):):詞嵌入本
32、質上是一種將詞匯映射到低維向量空間的技術,它對于理解人類語言語義和語法關系,進而處理自然語言有著重大意義。主流的詞嵌入算法目前有谷歌 的 Word2Vec,GolVe 和 FastText,它們多被用于詞義消歧,語義相似度計算和文本分類;2 2)TransformerTransformer:Hinton 等人在 2006 年的論文中初步闡述了 Transformer 這一概念,而谷歌在2017年發布的文章 Attention Is All You Need 中,Transformer正式進入大眾視野。Transformer 本質上是一種基于自我注意力(Self-Attention)處理序列數據
33、的新網絡結構,從而放棄了 RNN 或 CNN。Transformer 在發布之初就創造了多項紀錄,后續在自然語言處理任務中,也取得了許多突破性的成果。當前討論最熱烈的 GPT 系列,便是基于 Transformer decoder 部分的生成式預訓練模型,除此之外,谷歌 Bert 也使用了這一架構。海外行業專題海外行業專題 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 11 of 36 圖圖 1111:標準標準 TranTransformersformer 模型架構模型架構 數據來源:量子位 1.4.3.1.4.3.GPUGPU 加速計算加速計算 G GPUPU 是是 A
34、AI I 發展引擎,英偉達發展引擎,英偉達 G GPUPU 系列系列已成為已成為深度學習大模型的發深度學習大模型的發展基石。展基石。GPU 技術的發展,將成為未來 AI 發展的引擎,其重要性主要包括:1 1)高性能計算:)高性能計算:與傳統的 CPU 相比,GPU 有用更多的計算核心,因此能夠處理大量的多并行計算任務,在此基礎上,深度學習模型中的許多計算都可以高度并行化,從而顯著提高深度學習模型的訓練效率。例如,在使用英偉達 GPU 的 Tesla V100 GPU 訓練 ResNet-50 模型,訓練速度相較以往提高了 10 倍;2 2)軟件庫:)軟件庫:英偉達公司針對性地推出了深度學習相關
35、的軟件庫,如 CUDA,cuDNN,在使用這些有針對性的軟件庫后,能夠進一步提高深度學習模型的計算效率,如 cuDNN 可以使卷積神經網絡操作速度提高三倍。英偉達旗下的 GPU,是目前市場上算力最高,性能最強的硬件處理器,可以說是 GPU 系列是當今 AI 深度學習大模型發展的基石。圖圖 1212:英偉達英偉達 DGX CloudDGX Cloud 數據來源:Venturebeat 海外行業專題海外行業專題 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 12 of 36 2.主要科技公司及其主要科技公司及其 AI技術成果技術成果 2.1.Open AI 2.1.1.2.1.
36、1.GPTGPT 系列系列 GPTGPT 系列采用“預訓練系列采用“預訓練+微調”訓練策略,目前已微調”訓練策略,目前已在在 A AI I 領域獲廣泛領域獲廣泛應用應用。GPT 系列采用了 Hinton 等人在 2006 年提出的一種自然語言處理模型 Transformer 的 decoder 部分,并采用了一種經典的神經網絡訓練策略:“預訓練+微調”的訓練策略。在預訓練階段,基于龐大的無標簽文本語料庫訓練一個生成式語言模型,從而獲得對于語言的深層次理解;在微調階段,使用后續數據繼續訓練模型,以應對不同的運用場景。ChatGPT 系列功能強大,目前已成為最被大眾所熟知與認可的 AI 聊天機器人
37、,同時許多科技公司陸續開展了跟進項目,與 ChatGPT 系列進行深度融合,令 GPT 系列成為目前 AI 領域的發動機與方向盤。GPT 系列的第一個模型 GPT-1 于 2018 年 6 月發布,它使用了一個12-layer 的 Transformer 解碼器,并進行了一個包含 4500 萬詞條的書籍語料庫進行預訓練,此時只能完成一些基本的自然語言處理任務,如文本生成,分類和語言翻譯功能。;2019 年 2 月,Open AI 發布了 GPT系列的第二個模型 GPT-2,在沿用一代網絡結構設計的基礎上,升級了模型參數和數據集的規模,并使用了一個 24-layer 的 Transformer
38、解碼器,相比前代,GPT-2 最大的進步在于可以生成更加連貫、流暢、邏輯性更強的文本結果,甚至可以根據對話者的要求修改自己的回答文本風格。2020 年 5 月,GPT-3 正式推出,GPT-3 擁有著前所未有的 1750億個參數量級的 Transformer 解碼器,并在一個包含 5700 億詞條的多源文本語料庫上進行了預訓練。GPT-3 的能力已經可以做到以人類的流利程度撰寫散文,其生產的文本質量之高,讓 31 名 Open AI 研究人員在 GPT-3 2020 年 5 月 28 日的原始論文中強調了 GPT-3 的潛在風險。2020年 9 月 22 日,微軟宣布獲得 GPT-3 的“獨家
39、”使用權;其他人仍可以使用公共 API 獲取輸出,但只有微軟能夠訪問 GPT-3 的底層模型。圖圖 1313:GPTGPT 系列系列在在 TransformerTransformer 架構上進行了優化架構上進行了優化 數據來源:Improving Laguage Understanding by Generative Pre-training GPTGPT 系列高速迭代,系列高速迭代,G GPT 3.5PT 3.5、G GPT 4PT 4 及及 ChaChat tGPTGPT 插件插件先后發布先后發布推動推動人工智能人工智能高速發展高速發展。2022 年至今,GPT 系列進入高速迭代期。202
40、2 年 1月,Open AI 宣布 GPT-3.5 誕生,它是基于 GPT-3 迭代后的微調版本,也被稱為 InstructGPT,GPT-3.5 相比前代,加入了人類反饋強化學習(RLHF)的概念,在人類反饋強化學習下,人類向機器學習算法提供反饋,這些反饋可以用于調整模型。這種方法可以解決監督和非監督學習 海外行業專題海外行業專題 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 13 of 36 的局限性,即機器學習算法從僅標記或未標記的數據中學習的能力有限。2022年11月,Open AI正式發布ChatGPT,它是一款建立在GPT系列(LLM)的基礎之上的 AI 聊天機
41、器人,并進一步強化了 RLHF 的作用:從用戶的問答中收集數據,從而更好地訓練和微調 ChatGPT 本身。與前身InstructGPT 相比,ChatGPT 有害性和欺騙性的回應概率被大幅降低,令搭載了 GPT-3.5 的 ChatGPT 成為 AI 領域最成功的產品。2023 年 3 月 14 日,GPT-4 橫空出世,是 Open AI 擴大深度學習成果的一項里程碑式的杰作。GPT-4 是一款大型的多模態模型(接受圖像和文本輸入,發出文本輸出),其最大的進步在于,GPT-4 相比 GPT-3.5,能夠表現得更可靠,回答更有創造力,并且能夠產出更細致的回答,具體來說:1.GPT-4 大幅提
42、高了應對專業學術考試的表現,如通過了模擬律師考試,并且成績排在考生前 10%;2.跨語言 MMLU 的識別精度提升;3.視覺輸入能力的加入,從此 ChatGPT 也可以額接受圖像的輸入并生成回答。Open AI以極高地速度迭代優化GPT系列。短期內接連發布的GPT-4和 ChatGPT Plugins,推動這 AI 領域飛速發展并進一步打開潛在的應用空間。圖圖 1414:GPTGPT 系列測試結果對比系列測試結果對比 數據來源:Open AI G GPTPT-4 4 參數規模達到參數規模達到 G GPTPT-3 3 的的 6 6 倍以上,不同領域的熟練程度超越倍以上,不同領域的熟練程度超越人
43、類 表 現。人 類 表 現?;?于 微 軟 發 布 的 Sparks of Artificial General Intelligence:Early experiments with GPT-4報告,從推理、規劃、解決問題、抽象思維、理解復雜思想、快速學習和經驗學習能力等角度足以發現,GPT-4 相較歷代具有顯著進步。從參數規模上來看,GPT-4有超過 1 萬億個參數,是 GPT-3(1750 億個參數)的 6 倍以上,根據預測,以這個速度繼續發展下去,或許在 5 年之內,GPT 系列就能達到甚至超過人類大腦的規模(170 萬億個參數)。除此之外,微軟具體測試了 GPT-4 在語言、數學、編
44、程、視覺、醫學、法律和心理學領域的表現水平,結果演示,GPT-4 已經有超越人類水平的表現。GPT-4 能夠在不同領域表現出高度熟練程度,理解復雜概念,并將多個領域的技能和概念統一起來。研究結果表明,GPT-4 不僅 海外行業專題海外行業專題 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 14 of 36 能學習不同領域和風格的通用原則和模式,還能以創造性的方式將其結合。圖圖 1515:GPTGPT-4 4 可以根據需求編寫可以根據需求編寫 3D3D 游戲游戲 數據來源:Sparks of Artificial General Intelligence:Early expe
45、riments with GPT-4 2023 年 3 月 23 日,Open AI 再次帶來了 ChatGPT 的重量級更新ChatGPT Plugins,它是的 ChatGPT 通過 Open AI 插件可以連接到第三方應用程序,使得 ChatGPT 在某一具體領域的功能被大幅增強,并且被允許執 行更廣泛 的操作。目前 解鎖的官 方插件 有:Expedia,FiscalNote,Instacart,KAYAK,Klarna,Milo,OpenTable,Shopify,Slack,Speak,Wolfram,and Zapier。以 Expedia 和 Wolfram 為例,加載 Expe
46、dia 后,ChatGPT 在為用戶生成旅行計劃后,可以直接通過Expedia 進行預訂機票、酒店行為;加載 Wolfram 后,ChatGPT 近期飽受詬病的復雜數學問題解決能力將被大幅提升。圖圖 1616:ChatGPT ChatGPT PluginsPlugins 目前可支持目前可支持多個多個插件插件 數據來源:Open AI ChatGPT 目前也仍存在一定的風險和問題,例如有害的建議,錯誤的代碼提示或者是不準確的信息,而目前 Open AI 的做法是:在 RLHF訓練過程中加入額外的安全獎勵信號,通過訓練模型拒絕此類內容的請求來減少有害信息的輸出。截止目前,除 ChatGPT 本身的
47、功能,大量的科技公司也開發了新的 AI 技術,如 Adobe Firefly,Microsoft 365 海外行業專題海外行業專題 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 15 of 36 Copilot,與 GPT 系列深度融合,從辦公,設計,繪畫領域,開啟了一場史無前例的生產力革命。GPT 系列,無疑將成為當前時代一切領域發動機。2.1.2.2.1.2.CodexCodex 系列系列 C Codexodex 是一款是一款 N NLPLP 模型,定位彌補模型,定位彌補 G GPTPT-3 3 代碼生成缺陷。代碼生成缺陷。Codex 最初的設計理念,是作為彌補 GPT
48、-3 在代碼生成方面的不足而開發的另一款 NLP 模型。借助 Codex,即使是非專業的程序員,也可以輕松編寫代碼,這大大降低了編寫程序的門檻。隨著后續的發展,Coedex 迭代為了微軟 365 Copilot,不僅能作為編程助手,更加入了微軟辦公軟件助手功能,從而極大地提高了當前辦公效率,或將在不久后引發一場世界范圍的辦公室革命。2021 年 6 月,基于早期 Codex 的早期版本和原型,Open AI 與 GitHub合作推出了 GitHub Copilot,作為一款 AI 技術下的代碼補全工具,以技術預覽的形式暫時向公眾開放。2021 年 8 月,Open AI 正式發布了Codex,
49、宣布了這一款全新的高效編程助手模型,Codex 專注于優化 GPT系列在程序設計和代碼生成上的不足,根據用戶輸入的文本 prompt 提供編程建議,從而幫助開發者更好地編寫代碼。2.2.谷歌谷歌 2.2.1.2.2.1.BardBard 聊天機器人聊天機器人 谷歌谷歌內測內測 BardBard,提供自然語言問答服務。,提供自然語言問答服務。為了與 Open AI 的 ChatGPT抗衡,谷歌在 3 月 21 向一部分內測用戶推出了一款實驗性、對話式的聊天 AI 服務Bard,相比于 ChatGPT,Bard 使用更輕量級的 LaMDA模型和互聯網語料庫提供自然語言問答服務。根據谷歌官方,Bar
50、d 是一款與 ChatGPT 相當的,富有智慧的 AI 聊天機器人,但 Bard 的使用體驗未達預期,這主要表現在回答的準確性上。例如,在一次演示中,Bard 針對于用戶對于詹姆斯韋伯太空望遠鏡(JWST)的問題,提供了相距事實甚遠的信息。與此同時,Bard 也有一些比較明顯的優點,比如 Bard 會主動提醒用戶,自己目前還比較容易犯錯誤,并且 Bard 在和用戶的問答中,會提供相比 ChatGPT 而言,更為溫和的回答。除此之外,谷歌官方表示,Bard 在語音理解能力和上下文敏感性都相比 ChatGPT 將有很大程度的提升,因為從原理上,LaMDA 生成器首先在給定當前多輪對話上下文的情況下
51、生成多個候選響應,LaMDA 分類器預測每個候選響應的 SSI 和安全分數,從而給出更高質量的回答。盡管 Bard 和 ChatGPT 在一些性能上的表現各有優劣,但是二者仍然在 AI 聊天服務上旗鼓相當,期待 Bard 正式發布后的持續進化及后續表現。海外行業專題海外行業專題 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 16 of 36 圖圖 1 17 7:谷歌谷歌 BardBard 對話演示效果對話演示效果 數據來源:CNET 2.2.2.2.2.2.BertBert 預訓練模型預訓練模型 BertBert 技術內核與技術內核與 G GPTPT 系列相似,但系列相似,
52、但 N NLPLP 處理任務性能上存在差距。處理任務性能上存在差距。Bert 是谷歌于 2018 年 10 月發布的一款 NLP 預訓練模型,它的技術內核與 GPT 系列非常相似。它同樣采用了谷歌在 2017 年提出的 Transformer架構,并使用了與訓練和微調的方法,使得 Bert 能夠在處理文本時同時考慮上下文信息,從而生成更豐富、準確的自然語言。BERT 的發布改變了自然語言處理的領域,刷新了多項 NLP 任務的性能記錄,如文本分類、命名實體識別和問答系統等。GPT 系列模型確實借鑒了 Bert 的一些關鍵思路,基于 Transformer 架構的預訓練加微調模型,但是它們在處理文
53、本的方向性上和預訓練使用的任務上具有顯著差異,這導致了它們在 NLP 處理任務的性能上最終還是存在較大差別。2.2.3.2.2.3.DeepMindDeepMind 實驗室實驗室 DeepDeepMind AIMind AI 實驗室被谷歌收購,專注于醫療健康與策略游戲應用。實驗室被谷歌收購,專注于醫療健康與策略游戲應用。DeepMind 是一家成立于 2010 年,專注于 AI 領域的實驗室,并于 2014年被谷歌收購,在這十年的發展中,它的研究主要集中于醫療健康與策略游戲上,并產出了許多優秀的 AI 程序:1 1)AlphaGoAlphaGo:DeepMind 于 2016 年推出的 Alp
54、haGo 是一款革命性的圍棋 AI 程序。它運用先進的強化學習和蒙特卡洛樹搜索算法,成為了首個擊敗人類圍棋世界冠軍的計算機程序。AlphaGo 在 2016 與圍棋大師李世石的對弈勝利被認為是 AI 領域的一個里程碑式的事件。2 2)AlphaZeroAlphaZero:繼 AlphaGo 成功之后,DeepMind 在 2017 年推出了 AlphaZero,一種具有更廣泛應用范圍的強化學習算法。AlphaZero 能夠在無需輸入任何資料的情況下,僅通過不斷進行自我對弈,就可以成為國際象棋、圍棋和將棋等游戲的頂級選手。僅用幾小時的學習時間,AlphaZero 便能精通這些游戲。3 3)Alp
55、haStarAlphaStar:2019 年,DeepMind 推出了 AlphaStar,一款基于強化學習的實時戰略游戲星際爭霸 IIAI 系統。AlphaStar 通過大量自我對弈,掌握了高級游戲策略,并在與人類選手的對戰中表現出了卓越的戰術素養。AlphaStar 是首個成功擊敗人類職業選手的 星際爭霸 IIAI。4 4)AlphaFoldAlphaFold:DeepMind 于 2020 年發布了 AlphaFold,一款旨 海外行業專題海外行業專題 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 17 of 36 在預測蛋白質三維結構的 AI 系統。AlphaFol
56、d 運用深度學習算法,為研究人員提供了更快速且準確的蛋白質結構預測方法。這一科技突破被認為是近年來生物學領域最具影響力的進展之一,為生物學研究和藥物開發領域帶來了巨大潛力。2021,DeepMind 發布了該系列的第二代:AlphaFold 2,它的性能相比前代在效率和預測性上有著突出的優勢,可在幾分鐘內破譯一般蛋白質的三維結構,還可以預測一個由 2180 個氨基酸相連的大蛋白質的結構。圖圖 1 18 8:AlphaFoldAlphaFold 系統提供精準的蛋白質結構預測方法系統提供精準的蛋白質結構預測方法 數據來源:Highly accurate protein structure pred
57、iction with AlphaFold 2.3.臉書臉書(M Metaeta)2.3.1.2.3.1.FAIRFAIR(M Meta AIeta AI)FAIRFAIR 為為 MetaMeta 旗下旗下 A AI I 研究部門,研究部門,開發開發 A AI I 計算機及計算機及 L LLaMALaMA 大型語言大型語言模型模型。Facebook AI(FAIR,現更名為 Meta AI)于 2013 年正式成立,是 Meta 旗下的核心的 AI 研究部門,它致力于運用 AI 技術,包括計算機視覺、自然語言處理(NLP)、語音識別、機器學習、強化學習、機器人學等多個方面,為 Facebook
58、 產品提供支持。2014 年,在 FAIR 研究結果幫助下,Facebook 推出了一款基于深度學習的人臉識別系統:DeepFace,在當時的準確率就已經高達 97.35%,甚至高于人類對于人臉的識別能力。2015 年,FAIR 發布了一款虛擬助手:M,這是一款早期的非常早期的 AI 聊天程序,由于 M 在準確性和識別性上的性能不高,在2018 年該項目最終停止運營。2017-2018 年,為了更好地對 Facebook用戶數據進行分析和審核,FAIR 分別推出了 DeepText 自然語言處理引擎和 Rosetta 計算機視覺系統,使得 Facebook 在新聞推送,評論排序和內容審核上的能
59、力大幅提高。2019 年,FAIR 正式發布了一款面向研究人員的預訓練模型:PyTorch Hub,PyTorch 早在 2016 其實已經基本開發成型,并在后續研究過程中不斷完善。PyTorch 的設計靈活、易于使用,支持動態計算圖,讓開發人員能夠更容易地構建、調試和優化神經網絡模型。2020 年,FAIR 發布了一款開放領域聊天機器人:Blender,同樣是基于預訓練加微調的方法,但是在對話質量上仍然與 ChatGPT 有著較大差距,這主要是源于優化目標(Blender 的開發目標是實現連貫有趣的對話)、模型架構(沒有使用更加先進的 Transformer 架構)和訓練數據規模上的差別。2
60、022 年,FAIR 建造了一臺帶有新型 AI 研究超 海外行業專題海外行業專題 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 18 of 36 級集群(RSC)AI 超級計算機,Meta 表示,在徹底建成后,它將成為世界上計算速度最快的超級計算機。圖圖 1 19 9:MetaMeta AIAI 超級計算機超級計算機第一階段已完成第一階段已完成 數據來源:DataCenter 2023 年,FAIR 公開了一個名為 LLaMA(Large Language Model Meta AI)的大型語言模型,并對其進行了開源,該模型具有 650 億個參數,。與其他大型語言模型相比,
61、LLaMA 更小、更高效、更節省資源,并且廣泛可用于許多不同的實例,而不是針對特定任務對模型進行微調,但同時,它的參數級別也明顯更低,在回答的準確性上還有待提升。2.4.蘋果蘋果 2.4.1.2.4.1.虛擬助手虛擬助手 SirSiri i 虛擬助手虛擬助手 SiriSiri 是是蘋果蘋果代表性的代表性的 AIAI 成果。成果。2011 年,Siri 隨著 iPhone 4s 的推出被一同發布,并在后續被迅速整合到蘋果旗下的其他產品中。Siri 是一款整合了語音識別、NLP、對話管理、語音合成、個性化上下文通知以及集成第三方應用的強大的虛擬助手,其最大的優勢在與與蘋果產品的深度融合,能夠執行多
62、樣的命令,并在后續加載更多的功能。根據蘋果的官方 2022 年報告,iPhone 14pro 搭載的 Siri 能夠回答的知識是三年前的 20 倍,對于用戶提出的各種問題,Siri 都能基于互聯網資訊并給出答案。但是從現在看來,ChatGPT 至少在回答的準確性上對Siri 造成了極大地挑戰,Siri 未來發展的關鍵,或許將朝著更加便捷、更加準確的方向繼續前進。根據紐約時報最新報道,蘋果正在測試一款最新的生成式 AI(generative AI)技術,并計劃將該技術未來能用于 Siri 虛擬助手,來彌補 Siri 在原始設計上的根本性問題,但是具體的發布時間,以及能夠解決哪些根本性的問題尚未透
63、露。據 9to5Mac 消息,在最新的 tvOS 16.4 和 macOS Ventura 13.3 測試版中,蘋果正在更新其電視產品。在蘋果 TV 上的 Siri 將獲得自然語言更新,并且 macOS TV 應用程序的界面也會發生改變,期待蘋果在 ChatGPT 催動 AI 爆發式更新下的應用革新。海外行業專題海外行業專題 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 19 of 36 圖圖 2020:虛擬助手虛擬助手 S Siriiri 自自 i iPhone 4SPhone 4S 首次推出首次推出 數據來源:IT 之家 2.4.2.2.4.2.Core MLCore
64、ML、ARKitARKit,Face IDFace ID 蘋果蘋果推出推出 C Core MLore ML、A ARKRKitit、FaceFace IDID 三項三項 A AI I 技術,對比其他技術,對比其他 A AI I巨頭仍存差距。巨頭仍存差距。除蘋果的核心 AI 技術 Siri 之外,蘋果在 2017 年也爆發式地推出了與其產品高度相關的三款AI 技術:Core ML、ARKit 和 Face ID。Core ML 是 蘋果 推出的一個高性能機器學習框架,專為 iOS 和 macOS 設備設計。它允許開發者在應用中集成預訓練的機器學習模型,實現實時、低延遲的機器學習任務。Core M
65、L 支持多種模型架構,包括卷積神經網絡(CNN)、循環神經網絡(RNN)以及廣義線性模型(GLM)等,適用于圖像識別、自然語言處理、推薦系統等領域。ARKit 是 蘋果 推出的一款增強現實(AR)開發框架,利用設備的攝像頭和各種傳感器捕捉現實環境的數據。ARKit 能夠識別現實世界的表面和物體,將虛擬內容與現實環境相融合。開發者可以借助 ARKit 構建各類 AR 應用,涵蓋游戲、導航、購物等場景。Face ID 是 蘋果 開發的一種面部識別技術,基于深度學習算法進行生物識別。Face ID 使用 TrueDepth 攝像頭系統獲取用戶的面部特征,將其轉換為數學表示。通過神經網絡進行模式匹配和
66、識別,實現對設備的解鎖、蘋果 ID 驗證以及支付操作等。Face ID 的設計旨在確保用戶數據的安全性和隱私保護。對比科技巨頭的 AI 產業布局,蘋果在自然語言處理大模型上的研究與產品對比其他巨頭有明顯差距,蘋果仍需在AI 大模型領域取得突破。2.5.亞馬遜亞馬遜 2.5.1.2.5.1.AWSAWS 云云計算平臺計算平臺 A AWSWS 云計算平臺廣泛應用,全球市場份額遙遙領先。云計算平臺廣泛應用,全球市場份額遙遙領先。亞馬遜網絡服務(Amazon Web Services,簡稱 AWS)是全球最廣泛使用的云計算平臺之一。AWS 自 2006 年成立以來,逐步建立了一個龐大的云計算生態系統。
67、其服務范圍涵蓋了計算、存儲、數據庫、分析、機器學習、物聯網等多個領域。AWS 以創新的技術和豐富的服務類型滿足了各種客戶需求,從創業公司到大型企業,從政府機構到非營利組織,都在使用 AWS 提供的 海外行業專題海外行業專題 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 20 of 36 服務,幾乎占據了云計算服務的半壁江山?;仡?AWS 的發展歷程,2006 年,AWS 發布的 Elastic Compute Cloud(EC2)和 Simple Storage Service(S3)奠定了其基礎服務;2009 年推出的 Relational Database Servic
68、e(RDS)簡化了數據庫管理;2014年推出的無服務器計算服務 Lambda 開創了新的編程模式;2015 年發布的亞馬遜 SageMaker 大大降低了機器學習應用的門檻。AWS 在擴展其服務范圍的同時,它的市場地位也在不斷鞏固。根據市場研究公司 Synergy Research Group 的數據,截止 2022 年,AWS 在全球云基礎設施服務市場的份額約為 31%,遠高于其他競爭對手微軟Azure、谷歌等,成為全球云計算領域的絕對龍頭。2.5.2.2.5.2.AlexaAlexa 智能語音助手智能語音助手 亞馬遜亞馬遜 AlexaAlexa 智能語音助手佼佼者,攜手硬件制造商豐富智能語
69、智能語音助手佼佼者,攜手硬件制造商豐富智能語音功能。音功能。亞馬遜 Alexa 是一款由亞馬遜公司開發的 AI 助手,自 2014年亮相以來,逐漸成為智能語音助手市場的佼佼者。Alexa 最初是作為亞馬遜 Echo 系列智能音響的內置功能而誕生的,后來逐步擴展到了其他智能設備,如智能手機、平板電腦、電視和汽車等。憑借其強大的語音識別能力和易用性,Alexa 迅速贏得了用戶和開發者的青睞。亞馬遜 Alexa 的核心功能包括語音識別、自然語言處理和語音合成等。用戶可以向 Alexa 發出語音指令,如查詢天氣、播放音樂、控制智能家居設備等,Alexa 會理解指令并執行相應的操作。隨著時間的推移,Al
70、exa 的技能庫不斷擴展,為用戶提供了越來越豐富的功能。開發者可以利用 Alexa Skills Kit(ASK)為 Alexa 開發新的技能。ASK 提供了豐富的工具和資源,使開發者能夠輕松地為 Alexa 擴展功能。截至 2022年,Alexa 技能庫中已有超過 10 萬個技能,涵蓋了各個領域,如購物、旅游、健康、娛樂等。此外,亞馬遜還致力于與硬件制造商合作,將 Alexa整合到更多的設備中,形成了一個龐大的生態系統。同時,通過亞馬遜 Voice Service(AVS),第三方廠商可以將 Alexa 集成到自家的產品中,從而提供更豐富的智能語音功能。圖圖 2121:亞馬遜智能音箱亞馬遜智
71、能音箱亞馬遜亞馬遜 EchoEcho 整合整合亞馬遜亞馬遜 AlexaAlexa 數據來源:Messe Frankfurt 海外行業專題海外行業專題 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 21 of 36 2.6.微軟微軟 2.6.1.2.6.1.新必應(新必應(N Newew BingBing)N New Bingew Bing結合結合A AI I與搜索引擎,深度融合與搜索引擎,深度融合微軟微軟生態。生態。Bing AI ChatGPT,也被稱之為 New Bing,是一款革命性的 AI 與搜索引擎相結合的產物,它讓我們尋找信息有了更加快捷高效的方式。2023 年
72、 2 月 7 日,借助ChatGPT 的風口,微軟發布了全新的 Bing 搜索引擎,最值得關注的一點在于,現在的Bing搭載了全新的Bing AI聊天機器人,名為Edge Copilot。這一功能替代了以前的“Discover”特性,現在側邊欄將提供一個 AI聊天機器人。用戶可以通過懸停在工具欄中的Bing圖標上打開側邊欄,側邊欄在不使用時可自動隱藏。Edge Copilot 能夠根據網頁內容和用戶目標提供智能建議和見解。AI 聊天機器人在發布時具有兩個主要功能:聊天和撰寫。這些功能可幫助用戶做諸如總結冗長的網頁內容、進行比較或在某些情況下創建內容等任務。根據微軟,AI Copilot 還可以
73、幫助用戶更好地撰寫電子郵件、更快地搜索網絡并學習新技能。不過,IT 管理員可以控制用戶是否能夠在Edge 瀏覽器中訪問側邊欄,這是一個重要的考慮因素,因為一些公司已經禁止將機密信息分享給 ChatGPT 等 AI 機器人。除 AI 側邊欄外,此版本的 Edge 還包含其他新功能。微軟 365 標簽頁將包含更大的微軟 Feed,顯示更多的生產力內容,并將重要郵件、最近的 SharePoint 站點、即將到來的活動和待辦事項移到標簽頁右方。此外,瀏覽器還將提供各種安全模式改進,并支持一項新策略,該策略可以控制用戶在退出瀏覽器應用程序時是否刪除瀏覽歷史記錄。Edge 瀏覽器的穩定版本將在后續逐步推出
74、,支持 Windows 和 Mac 平臺。2.6.2.2.6.2.M Microsofticrosoft 365 Copilot365 Copilot 微軟微軟 365 365 CopilotCopilot 重磅發布,糅合辦公室軟件釋放生產力重磅發布,糅合辦公室軟件釋放生產力。隨著ChatGPT 引發了世界范圍內的 AI 討論熱潮,微軟于 2023 年 3 月 16 日再次發布了一個 AI 重量級產品:微軟 365 Copilot,這款 AI 助手將大型語言模型與微軟辦公軟件中的數據相結合,為用戶提供強大的生產力。微軟 365 Copilot 的革命性功能包括但不限于:1 1)釋放創造力:)釋
75、放創造力:在 Word、PowerPoint 和 Excel 等應用中,為辦公者提供創意啟發,簡化寫作、分析和設計過程;2 2)提高生產力:)提高生產力:在 Outlook、Teams 和 Power Platform 等應用中,為辦公者減輕繁瑣工作負擔,提高工作效率;3 3)簡化復雜技能:簡化復雜技能:通過自然語言對話,讓剛開始使用微軟的用戶輕松掌握 微軟 365 中的高級功能。借助微軟 365 Copilot,文檔編寫,PPT 報告生成,數據可視化都可以由更少的工作者以更高的效率完成,甚至能表現出更強的辦公水平。這無疑是將引起一場全世界范圍內的辦公室革命。海外行業專題海外行業專題 請務必閱
76、讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 22 of 36 圖圖 2222:微軟微軟 365 Copilot365 Copilot 與與 W Wordord 深度結合深度結合 數據來源:科技狐,微軟 2.6.3.2.6.3.AzureAzure 云服務平臺云服務平臺 微軟微軟 AzureAzure 服務和產品不斷豐富服務和產品不斷豐富,廣泛應用于,廣泛應用于企業和開發者企業和開發者。2008年的專業開發者大會(PDC)上,微軟首次公開展示了名為“Windows Azure”的云服務平臺。這是一個基于 Windows 操作系統的云計算平臺,為開發者提供了各種服務,包括計算、存儲和
77、網絡等。2010 年,Azure 正式上線并開始為客戶提供服務。2010-2014 年間,Azure 不斷擴展其服務范圍,并引入了許多新功能。例如,2012 年,Azure 推出了基于 Linux 的虛擬機,并開始支持多種編程語言和框架。此外,Azure 還推出了新的服務,如 Azure SQL 數據庫、Azure Active Directory 和 Azure Blob 存儲等。2014 年以來,Azure 的發展迅速,不斷推出新的服務和產品。在 Satya Nadella 成為微軟 CEO 后,Azure 成為公司的核心戰略之一。Azure 開始支持更多的開源技術,并與其他云服務提供商競
78、爭。在這段時間里,Azure 推出了一系列新功能,包括 Azure Kubernetes 服務(AKS)、Azure Functions、Azure Cognitive Services 和 Azure Machine Learning 等。2.7.英偉達英偉達 2.7.1.2.7.1.DGX CloudDGX Cloud 英偉達攜手云服務商打造英偉達攜手云服務商打造 D DGX CGX Cloudloud,提供云上,提供云上 A AI I 運算效能。運算效能。2023年 3 月 22 日,英偉達在 GTC 2023 上順勢推出 DGX Cloud,這是一項AI 超級計算服務,為企業提供即時訪
79、問所需的基礎設施和軟件,以訓練生成式 AI 和其他創新應用的先進模型。DGX Cloud 為每個企業提供了專用的英偉達 DGX AI 超級計算集群,搭配英偉達 AI 軟件,用戶只需通過簡單的網絡瀏覽器就可以訪問自己的AI超級計算機,無需處理購買、部署和管理本地基礎設施的復雜性。企業可按月租用 DGX Cloud 集群,以便在無需等待高需求的加速計算資源的情況下,快速輕松地擴展大型、多節點訓練工作負載。英偉達與頂級云服務提供商合作托管 DGX Cloud 基礎設施,首先與 Oracle Cloud Infrastructure(OCI)合作,預計將在下季度擴展至微軟 Azure,并很快擴展至谷歌
80、 Cloud 等。全球領先的生物技術公司 Amgen、保險科技領導者 CCC Intelligent Solutions(CCC)和數字業務平臺提供商ServiceNow 等 AI 先驅已經開始使用 DGX Cloud。Amgen 使用 DGX Cloud 海外行業專題海外行業專題 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 23 of 36 和英偉達 BioNeMo大型語言模型軟件加速藥物發現,包括英偉達 AI Enterprise 軟件,該軟件包含英偉達 RAPIDS數據科學加速庫。此外,企業可以使用英偉達 Base Command平臺軟件管理和監控DGX Cloud
81、 上的訓練工作負載,該軟件在 DGX Cloud 和本地英偉達 DGX超級計算機之間提供無縫的用戶體驗。DGX Cloud 包括英偉達 AI Enterprise,這是英偉達 AI 平臺的軟件層,為數據科學流水線提供端到端的 AI 框架和預訓練模型,簡化 AI 的開發和部署。DGX Cloud 的每個實例包括 8 個英偉達 H100 或 A100 80GB Tensor Core GPU,每節點總共有 640GB 的 GPU 內存。英偉達 Networking 構建的高性能、低延遲互連網絡確保工作負載可以跨集群擴展,允許多個實例充當一個大型GPU 以滿足先進 AI 訓練的性能要求。DGX Cl
82、oud 還整合了高性能存儲,為 AI 超級計算提供了完整的解決方案。圖圖 2323:英偉達與云服務商合作推出英偉達與云服務商合作推出英偉達英偉達 DGXDGX CloudCloud 數據來源:站長之家 2.7.2.2.7.2.圖形處理器(圖形處理器(GPUGPU)算力是算力是 A AI I 發展的底座,英偉達發展的底座,英偉達是是 G GPUPU 領域掌控者領域掌控者。AI 發展的三大支柱包括數據、算法和算力,缺一不可。在算力方面,不僅需要訓練能力,還需要 AI 在硬件上運行和進行推理,這些都離不開強大的算力支持。在最開始,深度學習算法主要依賴 CPU 進行運算。但隨著數據量的不斷增長,CPU
83、 的運算能力逐漸暴露出瓶頸。GPU(圖形處理器)是英偉達公司 1999 年推出的一款跨時代的產品,它在早期主要用于 PC 游戲市場的發展,為運行更高畫面配置的游戲提供了可能性。隨著英偉達不斷推出全新的 GPU 產品,徹底改變了現在計算機的圖形技術,發揮了并行計算的潛能。GPU 的優勢在于其擁有數千個核心,雖然單核性能可能僅為 CPU 的一半,但總算力可能是 CPU 的上百倍,因為它是專門為圖形應用開發的硬件組件,適合進行大量并行浮點運算,而不涉及 CPU 通常遇到的復雜分支運算。2023 年 3 月 22 日,英偉達在 GTC 開發者大會上發布了針對 ChatGPT龐大算力需求的全新 GPU
84、產品 H100 GPU 和解決方案英偉達 H100 NVL。這些產品主要面向大語言模型和生成式 AI 的云服務,通過最新的 GPU產品,英偉達再次搭上了 AI 騰飛的翅膀,在處理器算力中繼續保持了行業領先的地位。目前,英偉達在 GPU 領域掌控者約 80%的市場份額,在 AI 領域始終保持著領先地位。在 AI 如此火熱的當下,牢牢在算力硬件領域占據壟斷的英偉達或許才是最大的贏家。海外行業專題海外行業專題 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 24 of 36 2.8.AdobeAdobe 2.8.1.2.8.1.Adobe FireflyAdobe Firefly
85、AdobeAdobe 推出創意生成式推出創意生成式 A AI I 模型,模型,AdobeAdobe FireflyFirefly 自動感知上下文和自動感知上下文和用戶需求精準作畫。用戶需求精準作畫。Adobe 公司在 2023 年 3 月 21 日推出了一款全新的AI 繪畫領域重磅產品:Adobe Firefly,本質上是一款創意生成式 AI模型,能夠創造卓越的 AI 繪畫產品。Firefly 可以通過關鍵詞輸入來創作繪畫作品,這使得它其檢舉實用性、創新性、便捷性和高效性。與市場上的其他 AI 繪畫軟件相比,如 Midjourney 和 Stable Diffusion,Firefly 具有更
86、強的上下文感知和個性化圖像生成能力,能夠為設計師提供精準的圖像生成。它的功能包括但不限于:根據文字生成圖像、將草圖轉換成矢量圖和畫筆紋理、修改視頻內容以改變環境和氣氛,以及根據提示詞設計個性化海報等。這些功能使設計師能夠快速將概念轉化為視覺藝術作品,滿足客戶需求。目前,Firefly 已經開放測試,未來將直接融入到 Adobe 旗下 Photoshop、Illustrator 和 Premiere 等熟知軟件中,幫助設計師實現無限創意可能。盡管目前仍有一些 AI 訓練和版權歸屬方面的爭議,但 Adobe 正在努力解決這些問題,使 Firefly 成為合法且實用的創意生成式 AI 模型。圖圖 2
87、424:AdobeAdobe FireflyFirefly 已開放測試已開放測試 數據來源:Adobe Blog 2.8.2.2.8.2.Adobe Adobe SenseiSensei AdobeAdobe 探索探索 A AI I 機器學習平臺,機器學習平臺,Adobe SenseiAdobe Sensei 豐富豐富 A AI I 驅動功能構建驅動功能構建個性化客戶體驗。個性化客戶體驗。Adobe Sensei 是 Adobe 與 2016 年推出的 AI 和機器學習平臺,為 Adobe 各種產品提供了智能功能。Sensei 利用大量數據和深度學習算法,為用戶帶來更加便捷、高效的創意體驗。A
88、dobe Photoshop在近期的更新中,引入了許多 AI 驅動功能:1 1)Select SubjectSelect Subject 功能功能:可以自動識別圖像中的主要物體并進行快速選擇;Content-Aware Fill功能則利用 AI 自動填充圖像中被刪除物體的空白區域。2 2)Premiere ProPremiere Pro:Adobe 旗下一款專業的視頻編輯軟件,也引入了一些基于 Sensei 的 AI功能。例如,Auto Reframe 功能可以自動調整視頻的畫面比例,以適應不同的設備和平臺;Color Match 功能則可以利用 AI 自動匹配不同視頻片段的顏色風格。3 3)
89、Adobe Experience PlatformAdobe Experience Platform:一個基于 AI 的客戶體驗管理解決方案,幫助企業構建個性化的用戶體驗。借助 Sensei技術,Experience Platform 可以實時分析用戶數據,并根據用戶行為和需求為他們提供定制化的內容和推薦。海外行業專題海外行業專題 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 25 of 36 2.9.特斯拉特斯拉 2.9.1.2.9.1.自動駕駛自動駕駛 特斯拉特斯拉攜手攜手 O Open AIpen AI,加速探索自動駕駛。,加速探索自動駕駛。特斯拉(Tesla)方面,
90、其當前的 AI 技術聚焦于自動駕駛汽車方面,自 2019 年開始,Tesla 正式宣布了與 Open AI 的長期合作關系,也汽車行業帶來了革命性的創新。開放式 AI 技術使計算機能夠自主學習和操作,特斯拉利用這一技術改善其自動駕駛汽車的性能。通過與 Open AI 公司合作,特斯拉正在開發新的算法,并改進現有算法,以使自動駕駛汽車的性能更上一層樓。Open AI 技術在特斯拉自動駕駛汽車中的應用具有諸多益處,例如,開發新算法,提供用于訓練和測試自動駕駛汽車的數據,了解其他駕駛員和行人的行為以確保安全,以及及時更新汽車的人工智能技術。盡管實施開放式 AI 技術面臨一定挑戰,但特斯拉已經成功地將
91、其應用于旗下的Autopilot 系統,實現了自動駕駛汽車在道路上的更精確、高效行駛,令其在自動駕駛領域仍處于市場相對領先地位。圖圖 2525:特斯拉特斯拉在在 O Open AI Daypen AI Day 上展示了自動駕駛中的視覺感知上展示了自動駕駛中的視覺感知 數據來源:CSDN,Tesla 2.10.騰訊騰訊 2.10.1.2.10.1.混元大模型混元大模型 騰訊發布混元騰訊發布混元 A AI I 大模型,成功應用于微信搜索、廣告等領域。大模型,成功應用于微信搜索、廣告等領域。國內互聯網巨頭方面,2022 年 4 月,騰訊公布了“混元”AI 大模型的研發進展,這款 AI 大模型整合了該
92、模型整合了自然語言處理(NLP)、計算機視覺(CV)和多模態等基礎模型。在諸如 CLUE、VCR、MSR-VTT 和MSVD 等權威評測集合中,混元 AI 大模型均取得了優異成績。為了優化模型性能,騰訊技術團隊首次引入了“課程學習”訓練方法,模擬人的學習習慣,實現漸進式的從易到難的學習。這不僅增強了模型的通用性和復用性,還顯著降低了訓練成本。應用層面,混元 AI 大模型已成功應用于騰訊微信搜索、廣告等業務領域,有效提升了用戶體驗和推薦精準度。利用騰訊太極機器學習平臺的 GPU 算力和訓練加速框架,實現了穩定且高效的模型迭代。未來,混元 AI 大模型將繼續深化研究,深入業務實踐,賦能更多場景,以
93、更好地滿足用戶需求。騰訊自研的萬億 MoE 模型在相同資源和計算量的前提下,其性能優于稠密模型。此外,在相同規模的大模型中,MoE 模型訓練和推理效率更高,資源消耗更少。大模型在自然語言理解和生成任務上能持續提升性能,且邊際效益并未遞減。因此,騰訊選擇基于 MoE模型開展 HunYuan-NLP 1T 大模型研究,旨在充分發揮模型規模提升、海外行業專題海外行業專題 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 26 of 36 壓縮技術和 MoE 模型優勢,實現更高效、可靠的 AI 應用。2.10.2.2.10.2.太極機器學習平臺太極機器學習平臺 騰訊自研太極機器學習平臺
94、業界領先,廣泛應用于多個騰訊自研太極機器學習平臺業界領先,廣泛應用于多個 A AI I 核心應核心應用場景。用場景。騰訊太極機器學習平臺是騰訊自研的一款易用性高,計算資源豐富的機器學習平臺。2015 年,騰訊推出了太極機器學習平臺的 1.0版本,為用戶提供了數據支持、模型訓練、模型服務三大功能,一站式的解決算法工程師在 AI 應用過程中可能遇到的工程問題。自誕生以來,太極機器學習平臺經歷了多次升級和拓展,包括深度學習訓練加速、騰訊云合作、云原生架構升級等。平臺在騰訊廣告業務中實踐了 MLOps 理念,為廣告平臺提供高效易用的模型迭代產品服務。2020 年,太極平臺機器學習研發能力再度升級為統一
95、的云原生架構,服務騰訊廣告、游戲、信安、金融等多個核心 AI 業務場景;2022 年,為了解決“廣告模型迭代流程研發效率”這樣一個問題,太極廣告一站式平臺正式全面上線,目標將廣告模型迭代業務流程通過“上太極”產品化,為廣告業務提供端到端的一站式模型研發體驗。目前,騰訊太極機器學習已廣泛應用于不同業務領域,讓用戶更加聚焦業務 AI 問題解決和應用。圖圖 2626:2 2022022 年騰訊太極年騰訊太極廣告一站式平臺上線廣告一站式平臺上線 數據來源:騰訊太極機器學習平臺 2.11.百度百度 2.11.1.2.11.1.文文心一言心一言 生成式生成式 A AI I 對話應用文心一言發布,定位對話應
96、用文心一言發布,定位 A AI I 基座賦能基座賦能 B B 端應用。端應用。國內傳統搜索龍頭百度方面,2023 年 3 月 16 日,百度正式官宣了一款全新的生成式 AI 對話應用文心一言,3 月 27 日,文心一言云服務正式上線。文心一言是基于飛槳深度學習平臺和文心知識的知識增強的大語言模型。從應用范圍而言,文心一言是一種文本生成技術而非對話生成技術,因此它在生成一些富有文化內涵和哲理性的短文本,如名言警句、詩詞歌賦等具有相當大的優勢,但在自然語言對話方面,文心一言回答的準確性與提供有害性信息的幾率較 ChatGPT 仍有較大差距。相比ChatGPT,文心一言上將核心定位放在了 AI 基座
97、型的賦能平臺,更加注重 to B 方向的應用,包括政務、金融、企業、電商和旅游服務等各方面,有望實現產業賦能升級 海外行業專題海外行業專題 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 27 of 36 圖圖 2727:百度全新一代知識增長大預言模型文心一言發布百度全新一代知識增長大預言模型文心一言發布 數據來源:文心一言 2.11.2.2.11.2.飛槳飛槳 飛槳定位內部飛槳定位內部深度學習深度學習研究項目,全面服務文心大模型研發研究項目,全面服務文心大模型研發。百度旗下飛槳(PaddlePaddle)最早起源于 2013 年,當時是作為百度內部的一個深度學習研究項目。經
98、過幾年的內部研發和優化,飛槳逐漸成熟并在 2016 年正式對外開源,旨在推動中國深度學習領域的發展。開源初期,主要面向研究人員和開發者,提供了基本的深度學習功能,如多層感知機、卷積神經網絡和循環神經網絡等。同時,飛槳支持分布式訓練,能夠充分利用計算資源,提高模型訓練效率。隨著社區的參與和技術的進步,飛槳逐步擴展了其功能,包括支持更多的網絡結構、優化算法和預訓練模型等。此外,飛槳還推出了一系列工具和組件,如模型壓縮、可視化和自動超參數優化等,以滿足用戶在不同場景下的需求。為了進一步提升性能,飛槳開始支持高性能計算平臺,如英偉達 GPU 和Intel CPU 等。此外,飛槳還推出了一些針對特定硬件
99、的優化策略,如使用 TensorRT 進行 GPU 推理加速等。2020 年,飛槳發布了 2.0 版本,引入了動態圖機制,使得模型構建和調試變得更加靈活和便捷。其次,飛槳 2.0 還提供了更加豐富的預訓練模型庫(PaddleHub),覆蓋了計算機視覺、自然語言處理和語音識別等多個領域。此外,飛槳 2.0 還支持多種部署環境,包括服務器、移動設備和嵌入式系統等,以滿足不同場景下的推理需求。2020-2023 年,飛槳全面服務與百度文心大模型的研發,在文心一言問世之后,飛槳亦有望陸續釋出。2.12.字節字節跳動跳動 2.12.1.2.12.1.KubeRayKubeRay 項目項目 字節攜手微軟研
100、發字節攜手微軟研發 A AI I 軟件軟件 KubeRayKubeRay,基于分布式計算提升軟件運,基于分布式計算提升軟件運行效率。行效率。2022 年 8 月,微軟與字節跳動在 Ray Summit 2022 年度峰會上宣布達成合作,將擴展 AI 項目 KubeRay,該項目旨在幫助組織更高效地管理和運行人工智能應用程序。KubeRay 是一款基于分布式計算,能夠在多臺計算機上運行的 AI 軟件,這有助于提升軟件的運行效率,以幫助企業更高效的 AI 應用程序。目前,KubeRay 已經發布了 Ray2.0 的 Beta階段,它的主要功能有:Ray AI runtime(一個可以拓展和統一的
101、ML工具集)、大規模 shuffle 支持、Ray cluster 部署等。KubeRay 涵蓋的 海外行業專題海外行業專題 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 28 of 36 功能提供了高可用性和易用性,或許在未來將成為一項強大的AI工具。圖圖 2828:KubeRayKubeRay 項目由字節跳動與項目由字節跳動與微軟微軟共同開發共同開發 數據來源:電商報 2.12.2.2.12.2.推薦算法、自然語言處理技術和計算機視覺技術推薦算法、自然語言處理技術和計算機視覺技術 多款多款 A AI I 技術領先全球,深度應用于其核心產品中。技術領先全球,深度應用于其核
102、心產品中。字節跳動的 AI技術,基本凝結在了它的核心產品中,為用戶帶來了前所未有的使用體驗,也讓字節跳動成為了近年中國發展最迅猛的科技獨角獸企業。1 1)推薦算法:推薦算法:字節跳動的核心競爭力之一是其出色的推薦算法。它采用深度學習和自然語言處理技術,分析用戶行為、興趣和社交關系,為用戶提供個性化的內容推薦。這種推薦算法被廣泛應用于抖音、今日頭條等字節跳動的應用產品。2 2)自然語言處理()自然語言處理(NLPNLP)技術:)技術:字節跳動 AI Lab 在自然語言處理領域取得了世界領先水平。字節跳動的 NLP 技術涵蓋了文本分類、情感分析、關鍵詞提取、文本摘要等多個方面。這些技術被應用于今日
103、頭條、悟空問答等產品,以提高內容的智能推薦和用戶體驗。3 3)計算機視覺技術:)計算機視覺技術:字節跳動在計算機視覺領域也取得了突破性成果。字節跳動的計算機視覺技術涉及人臉識別、物體檢測、圖像分類和風格遷移等。這些技術被運用于抖音、VUE 等產品,提供更豐富的視覺體驗。2.13.華為華為 2.13.1.2.13.1.“盤古”大模型“盤古”大模型 華為“盤古”大模型即將亮相,華為“盤古”大模型即將亮相,N NLPLP 大模型具備強大理解能力和生大模型具備強大理解能力和生成能力。成能力。2021 年 4 月,華為云團隊立項了“盤古”大模型;近日,華為云官網透露,“盤古”系列 AI 大模型即將上線,
104、其中包括 NLP 大模型、CV 大模型和科學計算大模型,而多模態大模型的上線時間仍未透露。盤古 NLP 大模型同樣適用了 Transformer 結構,并與 ChatGPT 不同的是,它采用了其中 Encoder-Decoder 架構,兼顧 NLP 大模型的理解能力和生成能力,保證了模型在不同系統中的靈活性。而盤古 CV 大模型是按次實現模型按需抽取的業界最大的 CV 模型,他兼顧了圖像識別和生成能力,能夠基于模型大小和運行速度自適應抽取不同模型規模,提高 AI產品的開發效率。華為“盤古“大模型上線,有望進一步助推國內 AI產業發展。海外行業專題海外行業專題 請務必閱讀正文之后的免責條款部分請
105、務必閱讀正文之后的免責條款部分 29 of 36 圖圖 2929:華為盤古華為盤古系列系列 AIAI 大模型大模型涵蓋多種大模型涵蓋多種大模型 數據來源:IT 之家 2.13.2.2.13.2.AscendAscend 系列芯片系列芯片 華為高性能華為高性能 A AI I 處理器處理器 A Ascendscend,多個多個 A AI I 計算場景表現不俗計算場景表現不俗。Ascend系列是華為推出的一款高性能AI處理器,被廣泛用于劃分為自身設備,在數據中心、邊緣計算和端側設備等場景的表現極為出色。2018 年 10月,華為首次發布了 Ascend 310 和 Ascend 910 兩款 AI
106、芯片。其中,Ascend 310 面向端側和邊緣計算場景,功耗較低;Ascend 910 則針對數據中心場景,具有更強的計算能力。2019 年 8 月:Ascend 910 正式發布。Ascend 910 是當時全球最高性能的 AI 處理器之一,性能達到了每秒 256 TFLOPs(FP16)。2020 年:華為發布了 Ascend 710、Ascend 610和 Ascend 620 等多款 AI 芯片,分別應用于云端、數據中心、邊緣計算和智能終端等場景。直至 2022 年,Ascend 芯片仍然繼續優化其性能和功耗,以滿足不同的 AI 計算場景。截至目前,華為 Ascend 芯片的出貨量的
107、市場占比較小,實際應用效果仍待驗證。2.13.3.2.13.3.ModelArtsModelArts 開發平臺開發平臺 AIAI 開發平臺開發平臺 M ModelArtodelArts s 不斷升級,為用戶提供全流程支持不斷升級,為用戶提供全流程支持。ModelArts 是華為云研究中心推出的另一款面向開發者的 AI 開發平臺,為用戶提供從數據預處理、模型訓練、模型部署到模型管理的全流程支持。2018 年,華為云 ModelArts 正式發布。ModelArts 提供了豐富的 AI算法庫、預訓練模型、數據處理工具等資源,幫助用戶快速構建和部署AI 應用。2019-2021 年,ModelArt
108、s 發布多項新功能,包括 AutoML(自動化機器學習)、分布式訓練、彈性訓練等,進一步降低了用戶構建 AI應用的門檻。加入了更多 AI 領域的算法和預訓練模型,如自然語言處理、計算機視覺等。此外,ModelArts 還提供了端云協同能力,方便用戶在不同場景下部署和管理AI模型。支持更多的AI框架(如TensorFlow、PyTorch 等),提供更強大的算力支持,包括 Ascend 系列 AI 芯片、GPU等。2022年,ModelArts再次進行了大幅度的更新優化,不僅支持VS Code一鍵連接 Notebook,和自動以鏡像創業算法和訓練作業,還上線了Workflow 工作流功能。目前為
109、止,ModelArts 仍在進行不斷地優化,比如標簽管理服務 TMS 和新版轉專屬資源池,已成為華為旗下最富有生命力的一款 AI 產品。海外行業專題海外行業專題 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 30 of 36 2.14.阿里巴巴阿里巴巴 2.14.1.2.14.1.達摩院達摩院 達摩院聚焦前沿科技領域研發,達摩院聚焦前沿科技領域研發,A AI I 成果不斷助推產業變革。成果不斷助推產業變革。阿里達摩院(Alibaba DAMO Academy)是阿里巴巴集團于 2017 年成立的研究院,旨在開展前沿科技研究和創新。2018 年,達摩院發布了“Ali-NLP”
110、自然語言處理技術,以深度學習為基礎,大幅提升了中文自然語言理解能力。這項技術應用于阿里巴巴的搜索引擎、推薦系統、語音助手等業務,優化了用戶體驗。同年時間,阿里達摩院推出了阿里云 MaxCompute,一種大數據計算服務,幫助企業高效、安全地處理大規模數據,提高數據處理能力。2019 年,阿里達摩院成功研發了自家的 AI 芯片 含光800,這款芯片主要應用于數據中心的 AI 計算,提供高性能、低能耗的計算能力,助力阿里巴巴在云計算領域的布局。2020 年,達摩院發布了首個大規模預訓練模型“盤古大師”,為阿里在自然語言處理、計算機視覺等多模態任務提供強大支持。2021 年,阿里達摩院推出了 AI開
111、源社區“魔搭”(ModelScope),其目標是構建下一代模型即服務共享平臺,從而降低 AI 應用的門檻。到 2023 年 3 月,阿里在“魔搭”上線了“文本到視頻生成擴散模型”,實現了文本信息轉換為視頻內容的功能。阿里達摩院已經推出了多個版本的多模態和深度學習大模型,極大地推動了中文大模型的發展。圖圖 3030:阿里達摩院機器智能、數據計算等實驗室遍布全球各地阿里達摩院機器智能、數據計算等實驗室遍布全球各地 數據來源:達摩院 2.14.2.2.14.2.通義大模型通義大模型 通義大模型國內首創通義大模型國內首創 A AI I 統一底座,參數規模全球第一。統一底座,參數規模全球第一。在發展過程
112、中,阿里達摩院專注于多模態預訓練,并探索了通用統一大模型。2022年,阿里達摩院發布了多個版本的多模態和語言大模型,實現了超大模型、低碳訓練技術、平臺化服務和實際應用等方面的突破。2022 年 9月 2 日,阿里達摩院發布了業界首個通用統一大模型 M6-OFA。作為最新通義系列的一部分,M6-OFA 模型擁有 10 萬億參數的模型,成為全球參數規模最大的 AI 模型。M6-OFA 模型在國內首創了 AI 統一底座,將模態表示、任務表示和模型結構統一起來。在無需引入任何新增結構的前提下,可同時處理逾30 種跨模態任務,達到國際領先水平;此外,M6-OFA 模型采用模塊化設計,借鑒了人腦的模塊化結
113、構,從而提升了效率和性能。這些模型在電商、醫療、娛樂、設計和金融等領域均有實際應用。由此可見,阿里 海外行業專題海外行業專題 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 31 of 36 達摩院的通用統一大模型 M6-OFA 為 AI 從感知智能向知識驅動的認知智能邁進提供了先進的基礎設施,實現了模態表示、任務表示和模型結構的統一,展現了廣泛的應用前景。2.14.3.2.14.3.阿里云阿里云 ETET 大腦,菜鳥網絡,大腦,菜鳥網絡,天貓精靈天貓精靈 阿里旗下阿里旗下 A AI I 產品眾多,阿里云產品眾多,阿里云 E ET T 大腦、菜鳥網絡、天貓精靈應用大腦、菜鳥網
114、絡、天貓精靈應用已久。已久。除了通義大模型以外,阿里巴巴旗下 AI 產品眾多,阿里云 ET 大腦,菜鳥網絡,天貓精靈是阿里旗下三個最具代表性的 AI 產品。1 1)阿)阿里云里云 ETET 大腦大腦:阿里于 2016 年推出的一個 AI 平臺,為合作企業和開發者提供強大的 AI 算法和計算能力。它整合了大數據、機器學習和深度學習等多種技術,支持自然語言處理、計算機視覺、語音識別和推薦系統等多種應用。經過多年的發展,ET 大腦在城市管理、工業生產、醫療健康等多個領域取得了顯著成果,目前牢牢占據了世界云計算市場第四的位置。2 2)菜鳥網絡)菜鳥網絡:阿里巴巴集團旗下于 2013 年正式成立的 AI
115、 物流平臺,利用大數據和 AI 技術優化物流過程。它采用了智能路徑規劃、實時數據分析、預測性調度等技術,從而極大地提高物流效率和準確性。3 3)天貓精靈:)天貓精靈:2017 年推出,并迅速成為了中國市場上頗受歡迎的智能語音助手,天貓精靈與阿里巴巴旗下的電商平臺、支付系統等深度集成,提供了便捷的購物和支付體驗。與此同時,天貓精靈自然語言處理技術的持續優化使得天貓精靈在中文語境下的語音識別和理解能力更加強大。3.AI Critical Mass 已至已至 3.1.AI 發展達到發展達到 Critical Mass A AI I 產業發展進入臨界點,應用變革層出不窮。產業發展進入臨界點,應用變革層
116、出不窮。AI 產業發展至今,其發展進程已經達到了大量行業應用革新的臨界點,在繪畫、設計、辦公、廣告和硬件設施等代表性領域,產生廣泛的應用和顯著的影響。在這種情況下,AI 發展已經具備了足夠的規模和實力,能夠在這股勢頭下引發更多的創新和變革。因此,無論是科技大廠還是新興的科創公司,其對于 AI 發展的判斷以及未來的行業布局,都是當前值得關注的焦點。3.2.AI 已成為中美科技巨頭間的軍備競賽已成為中美科技巨頭間的軍備競賽 A AI I 大模型存在財力大模型存在財力要求要求、硬件設施、人才設備等高門檻,已成為、硬件設施、人才設備等高門檻,已成為中美科技巨頭軍備競賽焦點。中美科技巨頭軍備競賽焦點。針
117、對于 AI 大模型方向,目前已經進入了中美科技巨頭的軍備競賽環節,小型人工智能廠商或初創企業,展望未來,均難以在大模型領域立足,主要面臨以下多個門檻:1)財力財力要求要求:AI 的研發投入無疑是巨大的,人才引進、硬件租用、研發投入都是巨大的開銷,且 AI 并不是一個短期見效從而獲得收益的項目,它需要長時間、不間斷地投入。目前,各大科技巨頭,如谷歌,微軟,亞馬遜,騰訊,華為,阿里巴巴等等,都在 AI 研發投入了巨額資金。據 IDC 數據,2022 年全球 AI 市場支出以及超過 700 億美元,預計到 2024 年將超過 1100 億美元。這樣龐大的資金投入,不是小型 AI科技廠商能夠通過融資就
118、能達到的。2 2)硬件設施:)硬件設施:AI 大模型的預訓練任務對于語料庫數據的要求同樣是巨大的,這也對科技公司的算力硬件提出了更高的要求。目前英偉達 H100 GPU 已經是供不應求,僅有少數的科技巨頭能夠與英偉達簽訂合同 海外行業專題海外行業專題 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 32 of 36 獲得硬件設施上的支持,或是自主研發定制 AI 芯片,例如谷歌推出的Tensor Processing Unit(TPU)。而強大的硬件要求導致小型科技公司只能在針對性的 AI 領域進行小規模深度學習模型的訓練和推理。3 3)人才儲備:)人才儲備:當前大量的 AI
119、領域人才都紛紛受聘與大型科技公司,尤其是中國和美國,如谷歌,微軟,Meta,華為,百度,阿里巴巴,騰訊等企業。以谷歌為例,2012 年底,杰弗里辛頓(Geoffrey Hinton)與其兩位學生成立了公司 DNN-Research,以 4400 萬美元高價被谷歌并購,最終被稱為人工智能教父的杰弗里辛頓成為了谷歌副總裁、Engineering Fellow。人工智能團隊的同樣是巨頭之間競爭的一大領域,高額的人力投入,是小型科技公司難以競爭和負擔的。4 4)輿論關注度:)輿論關注度:2014 年開始,中美的科技巨頭已經創立了旗下 AI研究中心,進行了長期的產品研發和技術創新。而 2022 年 Ch
120、atGPT 的成功,再次拔高了巨頭們對于 AI 產業的關注度,并在第一時間著手推出自己的 AI 產品,我們可以看到,截至目前為止,市面上大部分的 AI產品都出自科技巨頭旗下,且有許多公司已經對于自己的 AI 產品發布了預告,進一步搶占市場的關注度,如華為的盤古 AI 大模型,360 AI大模型,谷歌 Bard 和百度文心大模型,對于小公司而言,很難在輿論宣傳和媒體推廣上,與大公司抗衡在擠占市場關注度。5 5)商業模式沖擊:)商業模式沖擊:AI 領域的跨越式進步,對于傳統科技巨頭的商業模式是有毀滅性打擊的,它從根本上否定了近年進化產品的方向,以UI(用戶界面)為基礎的人機交互模式在未來或許會徹底
121、消失,取而代之的是,AI 將成為最底層的操作系統,并可能成為 App 的入口。以ChatGPT 為例,以往的 App 要求用戶來完成一系列繁瑣的操作,但是在ChatGPT Plugins 加載第三方應用的情況下,我們僅僅需要做的就是與AI 交流,讓 AI 來代替我們發送指令,完成操作。這樣商業模式的革命性改變,目前已經在廣告、搜索引擎和購物等多個領域,讓巨頭們產生了極大的危機感,迫使這些科技巨頭進一步加大 AI 領域的研發投入,從而及時搶占市場,來規劃未來的商業模式。以谷歌為例,AI 聊天機器人的出現,讓谷歌賴以生存的廣告商業模式的根基產生了巨大的動搖,谷歌的廣告收入占到了公司總收入的 56%
122、,但是在當前,用戶通過 AI進行知識搜索的情況下,并不會收到搜索引擎中的廣告推送,廣告的曝光量大幅下降,從而導致廠商減少了廣告投入,谷歌的收入也將大幅減少。因此,以谷歌為首的科技巨頭將會更加大力投入 AI 領域研發,務求降低對現有商業模式的沖擊同時尋找 AI 浪潮下的新增長點。圖圖 3131:22Q4 Alphabet22Q4 Alphabet 公司公司收入結構收入結構 數據來源:Alphabet,國泰君安證券研究 56.02%10.47%11.14%11.57%9.62%0.30%Google Search&OtherYoutubeGoogle NetworkGoogle OtherGoog
123、le CloudOthers Bets 海外行業專題海外行業專題 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 33 of 36 4.投資建議投資建議 A AI I 產業發展進入臨界點,中美科技競賽下算力需求確定性高產業發展進入臨界點,中美科技競賽下算力需求確定性高。通過系統回顧 AI 技術發展歷程、主要科技巨頭 AI 布局及其主要成果,我們認為 AI 產業發展的臨界點已經來臨,應用變革層出不窮,在財力要求、硬件設施、人才儲備等高門檻下,現階段 AI 將成為中美科技巨頭的軍備競賽,算力層面的需求確定性最高,推薦標的聯想集團(推薦標的聯想集團(0 0992.HK992.HK)
124、,),受益標的英偉達(受益標的英偉達(N NVDA.OVDA.O)、微軟(、微軟(M MSFT.OSFT.O)。表表 1:重點公司估值表重點公司估值表 證券代碼證券代碼 證券簡稱證券簡稱 總市值總市值 (億美元)(億美元)凈利潤(億美元)凈利潤(億美元)評級評級 2022A2022A 2023E2023E 2024E2024E 2022A2022A 2023E2023E 2024E2024E 0992.HK 聯想集團 131.97 17.20 19.09 21.46 7.67 6.91 6.15 增持 NVDA.O 英偉達 6,780.89 97.52 43.68 81.89 58.96 83
125、.31 59.44 未評級 MSFT.O 微軟 21,377.11 727.38 695.86 808.84 28.02 30.41 26.37 未評級 數據來源:Bloomberg,國泰君安證券研究(注:英偉達、微軟盈利預測取自彭博,總市值和一致預測截至 2023/4/5)5.風險提示風險提示 AI 技術迭代進度不及預期;應用落地進度不及預期;國內 AI 供應鏈波動風險等。海外行業專題海外行業專題 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 34 of 36 國泰君安海外科技國泰君安海外科技團隊介紹團隊介紹 深耕全球互聯網,輻射海外大科技,全面覆蓋社交、游戲、電商、互聯
126、網金融、互聯網服務、AI 及硬科技、美股等領域,致力于結合產業視角與買方視角做差異化研究。秦和平秦和平 執業證書編號:S0880123010042 海外科技領域負責人、首席研究員 梁昭晉梁昭晉 執業證書編號:S0880523010002 海外科技分析師 海外行業專題海外行業專題 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 35 of 36 本公司具有中國證監會核準本公司具有中國證監會核準的證券投資咨詢業務資格的證券投資咨詢業務資格 分析師聲明分析師聲明 作者具有中國證券業協會授予的證券投資咨詢執業資格或相當的專業勝任能力,保證報告所采用的數據均來自合規渠道,分析邏輯基于作
127、者的職業理解,本報告清晰準確地反映了作者的研究觀點,力求獨立、客觀和公正,結論不受任何第三方的授意或影響,特此聲明。免責聲明免責聲明 本報告僅限中國大陸地區發行,僅供國泰君安證券股份有限公司(以下簡稱“本公司”)的客戶使用。本公司不會因接收人收到本報告而視其為本公司的當然客戶。本報告僅在相關法律許可的情況下發放,并僅為提供信息而發放,概不構成任何廣告。本報告的信息來源于已公開的資料,本公司對該等信息的準確性、完整性或可靠性不作任何保證。本報告所載的資料、意見及推測僅反映本公司于發布本報告當日的判斷,本報告所指的證券或投資標的的價格、價值及投資收入可升可跌。過往表現不應作為日后的表現依據。在不同
128、時期,本公司可發出與本報告所載資料、意見及推測不一致的報告。本公司不保證本報告所含信息保持在最新狀態。同時,本公司對本報告所含信息可在不發出通知的情形下做出修改,投資者應當自行關注相應的更新或修改。本報告中所指的投資及服務可能不適合個別客戶,不構成客戶私人咨詢建議。在任何情況下,本報告中的信息或所表述的意見均不構成對任何人的投資建議。在任何情況下,本公司、本公司員工或者關聯機構不承諾投資者一定獲利,不與投資者分享投資收益,也不對任何人因使用本報告中的任何內容所引致的任何損失負任何責任。投資者務必注意,其據此做出的任何投資決策與本公司、本公司員工或者關聯機構無關。本公司利用信息隔離墻控制內部一個
129、或多個領域、部門或關聯機構之間的信息流動。因此,投資者應注意,在法律許可的情況下,本公司及其所屬關聯機構可能會持有報告中提到的公司所發行的證券或期權并進行證券或期權交易,也可能為這些公司提供或者爭取提供投資銀行、財務顧問或者金融產品等相關服務。在法律許可的情況下,本公司的員工可能擔任本報告所提到的公司的董事。市場有風險,投資需謹慎。投資者不應將本報告作為作出投資決策的唯一參考因素,亦不應認為本報告可以取代自己的判斷。在決定投資前,如有需要,投資者務必向專業人士咨詢并謹慎決策。本報告版權僅為本公司所有,未經書面許可,任何機構和個人不得以任何形式翻版、復制、發表或引用。如征得本公司同意進行引用、刊
130、發的,需在允許的范圍內使用,并注明出處為“國泰君安證券研究”,且不得對本報告進行任何有悖原意的引用、刪節和修改。若本公司以外的其他機構(以下簡稱“該機構”)發送本報告,則由該機構獨自為此發送行為負責。通過此途徑獲得本報告的投資者應自行聯系該機構以要求獲悉更詳細信息或進而交易本報告中提及的證券。本報告不構成本公司向該機構之客戶提供的投資建議,本公司、本公司員工或者關聯機構亦不為該機構之客戶因使用本報告或報告所載內容引起的任何損失承擔任何責任。評級說明評級說明 Table_InvestInfo 評級評級 說明說明 1.1.投資建議的比較標準投資建議的比較標準 股票投資評級股票投資評級 增持 相對美
131、國標普指數漲幅 15%以上 投資評級分為股票評級和行業評級。投資評級分為股票評級和行業評級。以報告發布后的以報告發布后的 1212 個月內的市場表現為個月內的市場表現為比較標準,報告發布日后的比較標準,報告發布日后的 1212 個月內的公個月內的公司股價(或行業指數)的漲跌幅相對同期司股價(或行業指數)的漲跌幅相對同期的美國標普指數指數漲跌幅為基準。的美國標普指數指數漲跌幅為基準。謹慎增持 相對美國標普指數漲幅介于 5%15%之間 中性 相對美國標普指數漲幅介于-5%5%之間 減持 相對美國標普指數下跌 5%以上 2 2.投資建議的比較標準投資建議的比較標準 行業投資評級行業投資評級 增持 明
132、顯強于美國標普指數 報告發布日后的報告發布日后的 1212 個月內的公司股價(或個月內的公司股價(或行業指數)的漲跌幅相對同期的美國標普行業指數)的漲跌幅相對同期的美國標普指數指數的漲跌幅。指數指數的漲跌幅。中性 基本與美國標普指數持平 減持 明顯弱于美國標普指數 國泰君安證券研究國泰君安證券研究所所 上海上海 深圳深圳 北京北京 地址 上海市靜安區新閘路 669 號博華廣場 20 層 深圳市福田區益田路 6003 號榮超商務中心 B 棟 27 層 北京市西城區金融大街甲 9 號 金融街中心南樓 18 層 郵編 200041 518026 100032 電話(021)38676666(0755
133、)23976888(010)83939888 E-mail: 海外行業專題海外行業專題 請務必閱讀正文之后的免責條款部分請務必閱讀正文之后的免責條款部分 36 of 36 附:海外當地市場指數附:海外當地市場指數 亞洲指數名稱亞洲指數名稱 美洲指數名稱美洲指數名稱 歐洲指數名稱歐洲指數名稱 澳洲指數名稱澳洲指數名稱 滬深 300 標普 500 希臘雅典 ASE 澳大利亞標普 200 恒生指數 加拿大 S&P/TSX 奧地利 ATX 新西蘭 50 日經 225 墨西哥 BOLSA 冰島 ICEX 韓國 KOSPI 巴西 BOVESPA 挪威 OSEBX 富時新加坡海峽時報 布拉格指數 臺灣加權 西班牙 IBEX35 印度孟買 SENSEX 俄羅斯 RTS 印尼雅加達綜合 富時意大利 MIB 越南胡志明 波蘭 WIG 富時馬來西亞 KLCI 比利時 BFX 泰國 SET 英國富時 100 巴基斯坦卡拉奇 德國 DAX30 斯里蘭卡科倫坡 葡萄牙 PSI20 芬蘭赫爾辛基 瑞士 SMI 法國 CAC40 英國富時 250 歐洲斯托克 50 OMX 哥本哈根 20 瑞典 OMXSPI 愛爾蘭綜合 荷蘭 AEX 富時 AIM 全股