《互聯網行業:大陸企業獲GPT賦能數據安全將成關鍵考量-230410(18頁).pdf》由會員分享,可在線閱讀,更多相關《互聯網行業:大陸企業獲GPT賦能數據安全將成關鍵考量-230410(18頁).pdf(18頁珍藏版)》請在三個皮匠報告上搜索。
1、 請仔細閱讀在本報告尾部的重要法律聲明 大陸企業獲 GPT 賦能,數據安全將成關鍵考量 AzureAzure OpenAIOpenAI 獲獲 GPTGPT 能力,大陸企業率先布局能力,大陸企業率先布局 隨著 3 月份的兩次升級,目前微軟 Azure 上的 OpenAI 服務已經可以使用 ChatGPT 和 GPT-4 模型。雖然國內大模型當前發展十分迅速,但我們認為,在數據、算力、算法等因素的限制下,一段時期內 AIGC 行業仍會由微軟等海外大廠主導,且 AI發展日新月異,當前來看國內的商用 GPT 使用權限依然是稀缺資源,受限于 GPT-4 模型當前的高定價、微軟對 Azure OpenAI
2、的權限管理以及數據跨境的政策監管,我們認為,大陸現有的Azure OpenAI 客戶憑借其 GPT 模型使用權限的短期稀缺性以及相對成熟應對政策監管的能力,有望進一步鞏固在市場中的領先地位,構筑起競爭壁壘。技術層面海外大模型仍占據領先地位技術層面海外大模型仍占據領先地位 數據方面,英文互聯網數據質量相對較高,清洗起來也相對容易;盡管中文互聯網的數據量很大,但數據質量存在一定差距,且互聯網巨頭之間的數據相互封閉,數據孤島化現象嚴重,這使得數據抓取變得相對困難。算力方面,中國的 AI 大模型發展正受到算力“卡脖子”,更具確定性的解決方案還是依靠于自研芯片和服務器,當前國產頂級芯片仍難以超越英偉達和
3、 AMD 高端產品,預期全球市場仍將由海外龍頭壟斷。算法方面,GLUE 測評排名中,前十名得分均在 90 分以上,已經十分接近乃至超越人類平均水平,其中來自國內得分大模型僅有百度 ERNIE 及阿里 AliceMind,在英文回答水平上海外頂級模型仍占據絕對優勢,而國產大模型在攻克了數據和算力的難關后有望另辟蹊徑實現中文水平上的突破。Azure OpenAIAzure OpenAI 進駐進駐中國中國香港香港,數據安全為關鍵因數據安全為關鍵因素素 Azure OpenAI 在中國香港實裝 GPT-4 模型及 ChatGPT,大陸企業使用速度預計會有顯著提升,對于國內企業來說,此次Azure Op
4、enAI 在中國香港實裝 GPT-4 和 ChatGPT 意味著其可以更便捷地獲取和應用先進的 AI 技術,同時數據傳輸速度和安全性都有望大幅提升。由于使用如 Azure OpenAI 等海外大模型需要將數據跨境傳輸,因此受到境內和境外的數據傳輸政策限制,內部來看,數據出境安全評估辦法規定涉及重要數據和個人信息的出境,必須接受安全評估,不排除后期數據出境限制更加嚴格,使得 GPT 模型使用受限;外部來看,2019年美國國家安全和個人數據保護法案(尚未生效),對于美國用戶數據出境,尤其是傳輸至中國進行明確的限制,若企業使用海外大模型數據出境經由美國,則也需面對這方面的數據傳輸風險。評級及分析師信
5、息 行業評級:推薦 行業走勢圖 證券分析師:朱蕓證券分析師:朱蕓 郵箱: SAC NO:S1120522040001 -30%-23%-16%-9%-2%5%2022/032022/062022/092022/122023/03標普500納斯達克100科技指數證券研究報告|行業點評報告 僅供機構投資者使用 Table_Date 2023 年 04 月 10 日 171391 證券研究報告|行業點評報告 請仔細閱讀在本報告尾部的重要法律聲明 2 投資建議:投資建議:我們認為 AIGC 模型迭代正在加速,AI 發展日新月異,當前海外頂級模型仍占據領先地位,已接入 Azure OpenAI 獲得原生
6、GPT-4 和 ChatGPT 賦能的企業有著一定的先發優勢,可率先開始根據需求部署 AI 解決方案和應用;同時,國內大模型有望在特定領域及中文處理上另辟蹊徑實現趕超。后續國內率先落后續國內率先落地地 Azure OpenAIAzure OpenAI 應用的標的應用的標的有望受益有望受益,包括萬科(2202.HK)、創夢天地(1119.HK)、醫脈通(2192.HK),以及以及國內已實現自研大模型的企業國內已實現自研大模型的企業,包括阿里巴巴(9988.HK)、騰訊(0700.HK)、百度(9888.HK)。風險提示風險提示 技術落地商業化不及預期;人工智能在部分領域應用的監管風險;數據出海的
7、政策風險。RUiWiXOXkYhUsRpMoMaQ8Q9PnPnNsQoNjMoOnRkPmNmN8OrQrRvPrRpNxNoOsO 請仔細閱讀在本報告尾部的重要法律聲明 正文目錄 1.Azure OpenAI 重磅升級,數家企業獲得 GPT加持.4 1.1.Azure 接入 GPT-4及 ChatGPT,大陸公司獲 GPT賦能.4 1.2.GPT 模型在大陸仍為稀缺資源,看好現有參與者.5 2.技術層面來看大模型仍是海外巨頭更優.6 2.1.技術加速成熟下 AIGC模型百花齊放.6 2.2.數據端:英文天然數據優勢,中文數據仍有改進空間.7 2.3.算力端:進口受限,海外巨頭仍將長期領先.
8、8 2.4.算法端:英文語義測評海外模型占優,國產大模型有望在中文領域突圍.10 3.Azure OpenAI 進駐中國香港,商業應用潛力有待發掘.11 3.1.Azure OpenAI 進駐中國香港,大陸傳輸速度提升.11 3.2.Azure OpenAI 未來可持續賦能眾多行業,能力上限取決于企業本身.12 3.3.OpenAI 亞洲大規模封號,數據安全是未來 AIGC重要因素.13 4.投資建議.15 5.風險提示.16 圖表目錄 圖 1 Azure 云上 AI及機器學習相關服務.4 圖 2 MOSS回答中文時更像“官方套話”.8 圖 3 MOSS 能較好完成英文任務.8 圖 4 美國和
9、中國大陸半導體制造業市場份額.9 圖 5 Power Platform 幫助客戶構建應用程序.13 圖 6 Github Copilot 大幅提高開發者工作效率.13 圖 7 CarMax 利用 OpenAI 將客戶評價總結為摘要.13 圖 8 Kepro 使用 Azure AI 優化臨床文檔.13 圖 9 部分 OpenAI 賬號于上月底被大規模封禁.14 表 1 微軟 Azure OpenAI 發展進程.4 表 2 中國大陸已接入 Azure OpenAI 企業.5 表 3 Azure OpenAI 模型定價.6 表 4 中美主要語言大模型參數對比.7 表 5 國產 AI 芯片與 NVID
10、IA、AMD 高端產品技術規格對比.9 表 6 GLUE 通用語言理解測評排名.10 表 7 CLUE 中文語言理解測評排名(1.1版及 1.0版綜合得分).11 表 8 中國大陸使用主流地區服務器網絡延遲.12 表 9 數據出境安全評估辦法重點內容.15 表 10 受益標的.15 證券研究報告|行業點評報告 請仔細閱讀在本報告尾部的重要法律聲明 4 1.1.AzureAzure OpenAIOpenAI 重磅升級,重磅升級,數家企業獲得數家企業獲得 GPTGPT 加持加持 1.1.1.1.AzureAzure 接入接入 GPTGPT-4 4 及及 ChatGPTChatGPT,大陸公司獲,大
11、陸公司獲 GPTGPT 賦能賦能 AzureAzure OpenAIOpenAI 為為企業賦能企業賦能 AIAI 能力。能力。微軟 Azure OpenAI 服務最早于 2021 年 11月推出,允許通過 REST API 訪問 OpenAI 的強大語言模型,包括 GPT-3、Codex 和 Embeddings 模型系列。這些模型可以輕松適應特定的任務,包括但不限于內容生成、匯總、語義搜索和自然語言到代碼的轉換。用戶可以通過 REST API、Python SDK 或 Azure OpenAI Studio 中基于 Web 的界面訪問該服務。圖 1 Azure 云上 AI 及機器學習相關服務
12、 AzureAzure 獲得獲得 ChatGPTChatGPT 及及 GPTGPT-4 4,AIAI 能力進一步強化。能力進一步強化。3 月 10 日,微軟宣布,可以在基于云計算的操作系統 Azure 上的 OpenAI 服務中使用 ChatGPT;此后 3 月 21日,微軟又宣布 Azure OpenAI 加入 GPT-4。開發者可以將定制的人工智能驅動的體驗,直接整合到他們自己的應用程序中,包括增強現有的機器人來處理突發問題,以實現更快的客戶支持解決方案,創建具有個性化優惠的新廣告副本等。表 1 微軟 Azure OpenAI 發展進程 時間時間 進展進展 功能變化功能變化 2021 年
13、11 月 微軟發布 Azure OpenAI 服務 允許通過 REST API 訪問 OpenAI 的強大語言模型 2022 年 5 月 擴展 Azure OpenAI 服務 加入 GPTGPT-3 3、Codex 等模型 2023 年 1 月 Azure OpenAI 推出正式版 加入 GPTGPT-3.53.5、Codex、DALLDALLE 2E 2 2023 年 3 月 Azure OpenAI 獲得 ChatGPT 功能 加入 GPTGPT-4 4 以及以及 ChatGPTChatGPT 大陸可通過大陸可通過 AzureAzure OpenAIOpenAI使用使用GPTGPT 模型,
14、數家公司已率先接入。模型,數家公司已率先接入。中國大陸企業如果需要使用大模型,由于受到芯片進口的限制,目前可行的路徑一是使用本土算力 證券研究報告|行業點評報告 請仔細閱讀在本報告尾部的重要法律聲明 5 平臺及自研模型,如百度文心一言、華為盤古模型;二是通過數據出海接入海外云平臺及大模型,如 Azure OpenAI,目前其已經加入 GPT-4 模型及 ChatGPT,因此國內的Azure OpenAI 商業用戶可以直接使用 ChatGPT。雖然國內大模型當前發展十分迅速,但我們認為,在算力和數據等因素的限制下,一段時期內 AIGC 行業仍會由微軟等海外大廠主導,且 AI 發展日新月異,國內已
15、接入 Azure OpenAI 的數家公司可率先開始軟件和服務的適配,有十分顯著的先發優勢。截至目前大陸已有數家公司接入 Azure OpenAI,因此已經能實現 GPT 模型以及ChatGPT 的使用,其中五家為 A 股及港股上市公司,目前對 GPT 模型的使用主要集中在廣告營銷、影音娛樂、游戲開發、數據分析等,以及萬科將其用于公司內部的管理系統??傮w而言不論是將 AI 作為一項業務增量,或是輔助營銷與管理,我們認為GPT-4 和 ChatGPT 都將為公司賦能,使業務煥發活力。表 2 中國大陸已接入 Azure OpenAI 企業 公司公司 股票代碼股票代碼 接入時間接入時間 主要業務主要
16、業務 接入接入 GPTGPT 用途用途 吉宏吉宏股份股份 002803.SZ002803.SZ 2023 年 1月 公司的主要產品為彩色包裝紙盒、彩色包裝箱、塑料軟包裝等,廣泛應用于快速消費品的外包裝。賦能公司跨境電商業務中的選品、素材制作、廣告投放、翻譯、客服等業務節點;已提交 OpenAI Plugin(GPT 插件)申請 萬興萬興科技科技 300624.SZ300624.SZ 2023 年 2月 25 日 面向全球海量新生代互聯網用戶提供潮流前沿、簡單便捷的數字創意軟件產品與服務 已于多個產品內落地虛擬人、文生圖、AI 智能摳像、AI 智能降噪、AI 音樂重組、AI 換臉等功能 萬科萬科
17、 2202.HK2202.HK 2023 年 3月 9 日 國內領先的城市配套服務商,業務聚焦于全國經濟最具活力的三大經濟圈及中西部重點城市 在客戶反饋分析平臺搭載 GPT 模型,將自動采集、輿情分析、大數據處理、AI 模型研判等功能集合應用于服務需求管理和隱患預警 創夢創夢天地天地 1119.HK1119.HK 2023 年 3月 23 日 在中國的游戲發行市場占據領先地位,2017年在中國所有獨立手游發行商中排名第一 在公司游戲產品研發、Fanbook AI 生態建設等多個領域展開深化合作,實現 Microsoft Azure 和Fanbook 技術團隊協同研發,打造多場景的 AI 應用落
18、地 醫脈醫脈通通 2192.HK2192.HK 2023 年 4月 3 日 中國最大的在線專業醫生平臺,公司致力于協助醫生作出更好的臨床決策。公司的醫脈通平臺亦廣獲中國醫生認可,已成為最值得信賴的專業醫療平臺 進一步加強數智化能力,特別是在提升平臺內容生產效率和用戶智能交互等方面,持續為藥械企業客戶提供更豐富、更高效的數字化精準營銷解決方案。瑞泰瑞泰信息信息 -2023 年 3月 30 日 致力于用科技加速企業增長,賦能企業營銷服務數字化轉型 根據客戶需求自動生成營銷文案或者圖片素材用于創意制作;實現智能機器人與客戶交互;幫助銷售團隊快速回應客戶的詢問,提供產品信息、報價等信息,實現輕松銷售跟
19、進 售后售后寶寶 -2023 年 3月 31 日 面向企業用戶提供的數字化客戶服務管理運營平臺 服務響應智能化;客戶服務數據更易用;利用 AI構建構建內部知識庫 神策神策數據數據 -2023 年 4月 3 日 提供神策分析云、神策營銷云、神策數據根基平臺三大產品方案,幫助企業完成全渠道的數據采集與全域用戶 ID 打通、全場景多維度數據分析,全通道的精準用戶觸達 智能化指標生成與管理;數據分析模型與 AI 深度融合,對話式分析方式降低數據分析門檻 傲途傲途 -2023 年 4月 3 日 專注海外私域營銷的 SaaS 服務品牌 發力于更細致的海外社媒和社交營銷場景,如批量化 PGC 內容分發、內容
20、型 IP 建設、聊天機器人、營銷自動化、SocialSelling 等多項功能服務 資料來源:證券時報,萬科官網,和訊資訊,IT 之家,醫脈通,傲途,億邦動力,華西證券研究所 1.2.1.2.GPTGPT 模型在大陸模型在大陸仍為仍為稀缺資源,看好現有參與者稀缺資源,看好現有參與者 GPTGPT 模型權限仍是稀缺資源,模型權限仍是稀缺資源,看好現有看好現有參與者發揮其參與者發揮其先發優勢先發優勢。當前來看國內的商用 GPT 使用權限依然是稀缺資源,一方面Azure OpenAI 中 GPT-4 的價格是 GPT-3.5 的 15 倍起,另一方面目前 Azure OpenAI 服務主要面向已經與
21、 Microsoft 建立合 證券研究報告|行業點評報告 請仔細閱讀在本報告尾部的重要法律聲明 6 作關系、用例風險較低以及承諾融入緩解措施的企業客戶。此外,不僅是微軟對Azure OpenAI 的限制和監管手段,由于使用 Azure OpenAI 需要接入海外數據中心,數據出境在政策層面受到數據安全法等法規的嚴格限制。我們認為,短期內大陸 GPT模型使用權限具有稀缺性,現有的 Azure OpenAI 客戶憑借其率先開始軟件和服務適配以及相對成熟應對政策監管的能力,有望進一步鞏固在市場中的領先地位,構筑起競爭壁壘。表 3 Azure OpenAI 模型定價 類型類型 模型模型 定價定價 單位
22、單位 語言模型語言模型 Text-Ada$0.0004 每 1,000 個標記 Text-Babbage$0.0005 Text-Curie$0.002 Text-Davinci$0.02 Code-Cushman$0.024 Code-Davinci$0.1 ChatGPT(gptChatGPT(gpt-3.53.5-turbo)turbo)$0.002$0.002 GPTGPT-4 8K context4 8K context$0.03$0.03(輸入)(輸入)/$0.06/$0.06(輸出)(輸出)GPTGPT-4 32K context4 32K context$0.06$0.06(輸
23、入)(輸入)/$0.12/$0.12(輸出)(輸出)圖像模型圖像模型 DallDall-E E$2$2 每 100 張圖像 微調模型微調模型 Text-Ada$0.0004 每 1,000 個標記 Text-Babbage$0.0005 Text-Curie$0.002 Text-Davinci$0.02 Code-Cushman$0.024 Text-Ada$20 每計算小時訓練數 Text-Babbage$22 Text-Curie$24 Text-Davinci$84 Code-Cushman$26 Text-Ada$0.05 每小時托管數 Text-Babbage$0.08 Text-
24、Curie$0.24 Text-Davinci$3 Code-Cushman$0.54 嵌入模型嵌入模型 Ada$0.0004 每 1,000 個標記 Babbage$0.005 Curie$0.02 DavinciDavinci$0.2$0.2 2.2.技術層面來看技術層面來看大模型仍是海外大模型仍是海外巨頭巨頭更優更優 2.1.2.1.技術加速成熟下技術加速成熟下 AIGCAIGC 模型模型百花齊放百花齊放 ChatGPTChatGPT:ChatGPT 是一款基于人工智能技術的自然語言處理工具,由 OpenAI 與微軟合作于 2022 年 11 月推出,它能與用戶進行類似人類的對話,還能提
25、供更多功能。ChatGPT 是一個聊天機器人,針對對話進行了優化;而 GPTGPT 是一種語言模型,是是一種語言模型,是 證券研究報告|行業點評報告 請仔細閱讀在本報告尾部的重要法律聲明 7 ChatGPTChatGPT 背后的“大腦”背后的“大腦”,它可以定制以實現不同的功能,如文本摘要、文案撰寫、解析文本和翻譯語言等,此外,它還提供了一個開放的 API,讓任何人都可以利用GPT-3 或 GPT-4 構建自己的 AI 應用程序,并使用其功能。BardBard:谷歌的 Bard 是一個實驗性的對話式 AI 服務,由由 LaMDALaMDA(Language ModeLanguage Model
26、 l for Dialogue Applicationsfor Dialogue Applications)驅動驅動,目前已向部分測試者開放,Bard 的目標是整合世界各地的知識,以及大型語言模型的力量、智能和創造力。它從網絡上獲取信息,提供新穎、高質量的回答。文心一言:文心一言:百度文心一言(ERNIE Bot)是百度全新一代知識增強大語言模型,能夠與人對話互動,回答問題,協助創作,高效便捷地幫助人們獲取信息、知識和靈感。文心一言是知識增強的大語言模型,基于飛槳深度學習平臺和基于飛槳深度學習平臺和 E ERNIERNIE、PlatoPlato 模模型型,持續從海量數據和大規模知識中融合學習具
27、備知識增強、檢索增強和對話增強的技術特色。盤古:盤古:華為即將推出其最新的盤古大模型 4,將是超過任何其他類似應用的最先進、最強大的自然語言處理應用。根據華為云官網顯示,華為即將上線的“盤古系列AI 大模型”分別為:NLP 大模型、CV 大模型、以及科學計算大模型。其中,盤古“NLP 大模型”是被認為最接近人類中文理解能力的 AI 大模型,而盤古“CV 大模型”首次兼顧了圖像判別與生成能力。通義千問:通義千問:作為最早投入預訓練語言模型研究的團隊之一,阿里達摩院研發了阿里通義 AliceMind,該體系涵蓋預訓練模型、多語言預訓練模型、超大中文預訓練模型等,具備閱讀理解、機器翻譯、對話問答、文
28、檔處理等多種能力?;煸夯煸候v訊的混元 AI 大模型目前主要涵蓋自然語言處理(Natural language processing;NLP)、電腦視覺(Computer vision)、多模塊等基礎模型;預期未來將進一步結合音訊、影像、視訊等多模塊信息,打造更強大的多模塊 AI 大模型。表 4 中美主要語言大模型參數對比 ChatGPTChatGPT BardBard 文心一言文心一言 盤古盤古 通義千問通義千問 混元助手混元助手 所屬所屬公司公司 微軟/OpenAI 谷歌 百度 華為 阿里達摩院 騰訊 推出推出時間時間 2022/11/30 2023/2/6 2023/3/16 2021
29、/9/5 2023/4/7 即將推出 參數參數量量 1,750 億(GPT-3.5)1,370 億 2,600 億 2,000 億 超過 10 萬億 超過萬億 算力算力 英偉達 A100、H100 自研 TPU v4 昆侖芯 昇騰 910 含光 800 英偉達 A100(來自浪潮信息)算法算法 GPT-3.5,GPT-4 LaMDA ERNIE、PLATO NLP 大模型、CV 大模型、科學計算大模型 AliceMind HunYuan-NLP-1T 資料來源:華為云,界面新聞,IT 之家,谷歌,新京報,新浪,阿里云,第一財經,icspec,華西證券研究所 2.2.2.2.數據數據端:端:英文
30、英文天天然然數據優勢數據優勢,中文數據仍有改進空間,中文數據仍有改進空間 英文互聯網具備天生數據優勢,中文數據孤島化嚴重。英文互聯網具備天生數據優勢,中文數據孤島化嚴重。英文互聯網上的數據質量相對較高,清洗起來也相對容易,因為英文互聯網上有大量相對準確的知識類信息,這些信息可以用于模型訓練,故ChatGPT 能夠很好地回答問題。然而,盡管中文互聯網產生的數據量很大,但數據質量卻與英文數據存在一定差距,這可能會影響模型訓 證券研究報告|行業點評報告 請仔細閱讀在本報告尾部的重要法律聲明 8 練的效果,從而對中文大型語言模型的發展產生一定的制約。此外,中國國內的數據大量存儲于移動端 APP 中,并
31、且互聯網巨頭之間的數據相互封閉,導致數據孤島化現象嚴重,這使得數據抓取變得相對困難。這種情況可能會限制數據的共享與交流,進一步加大中美在大型語言模型發展方面的數據數量和質量差距。短期來看英文大模型仍占據數據資源優勢。短期來看英文大模型仍占據數據資源優勢。以復旦大學發布的語言模型 MOSS 為例,由于受到中文互聯網數據的限制,其模型基座學習了 3000 多億個英文單詞,中文詞語只學了約 300 億個,因此在英文上表現更好。為了縮小數據數量和質量的差距,中國的開發者需要構建更多高質量的中文數據集、優化數據清洗技術,且大廠需加強數據共享和交流,短期來看我們認為在數據資源上以英文為主的大模型仍占據著較
32、大的優勢。圖 2 MOSS 回答中文時更像“官方套話”圖 3 MOSS 能較好完成英文任務 資料來源:36 氪,華西證券研究所 資料來源:36 氪,華西證券研究所 2.3.2.3.算力算力端:端:進口受限,進口受限,海外海外巨頭仍將長期領先巨頭仍將長期領先 高端高端 GPUGPU 進口受限,進口受限,自研芯片是破局關鍵自研芯片是破局關鍵。GPU 是當前全球數據中心處理 AI 應用的標配,占據超九成市場份額。根據 BCG 數據,2018 年和 2019 年中國大陸在半導體制造業的市場份額正式超越美國,隨著中美博弈不斷激化、以及美國對中國半導體行業發展速度的警惕,2022 年 8 月,美國政府推出
33、的出口許可管制限制英偉達和 AMD向中國和俄羅斯銷售高端人工智能芯片,包括英偉達 A100、H100,AMD MI100、MI200 等,當前大陸的高端芯片均為存貨,剩余使用壽命在 4-6 年,主要的替代品為英偉達 A800 芯片,計算性能與 A100 基本相同,但數據傳輸速度被降低了 30%,且長期處于缺貨狀態??傮w而言,中國的 AI 大模型發展正受到算力“卡脖子”,更具確定性的解決方案還是依靠于自研芯片和服務器。證券研究報告|行業點評報告 請仔細閱讀在本報告尾部的重要法律聲明 9 圖 4 美國和中國大陸半導體制造業市場份額 資料來源:Semiconductor Industry Assoc
34、iation,BCG,華西證券研究所 國產芯片國產芯片參數參數仍有差距,仍有差距,預計海外巨頭仍將維持領先預計海外巨頭仍將維持領先。根據 Wccftech,2022Q3獨立 GPU 市場中英偉達和 AMD 分別占據 88%、8%市場份額。根據海光信息招股書公布技術指標數據,當前國內高端 GPU 相比國際巨頭在顯存頻率、帶寬等參數上還有一定差距,但在典型應用場景下,深算一號已基本能夠達到國際上同類型高端產品的水平。去年 8 月壁仞科技發布了首款通用 GPU 芯片 BR100,其稱已創出全球算力紀錄,但在一些關鍵參數上,仍難以超越英偉達最新的 H100 GPU,20 個 H100 GPU 便可承托
35、相當于全球互聯網的流量,使其能夠幫助客戶推出先進的推薦系統以及實時運行數據推理的大型語言模型。在國際市場上,英偉達和 AMD 在高性能計算和人工智能領域具有豐富的產品線和完善的生態系統,疊加長期積累的技術優勢和市場地位,預計仍將長期維持 AI 算力芯片領域的龍頭地位。表 5 國產 AI 芯片與 NVIDIA、AMD 高端產品技術規格對比 品牌品牌 海光海光信息信息 英偉達英偉達 AMDAMD 型號型號 深算一號 Ampere 100 MI100 生產工藝生產工藝 7nm FinFET 7nm FinFET 7nm FinFET 核心數量核心數量 4096(64 Cus)2560 CUDA pr
36、ocessors 120 CUs 640 Tensor processors 內核頻率內核頻率 Up to 1.5 GHz(FP64)Up to 1.53 GHz Up to 1.5 GHz(FP64)Up to 1.7 GHz(FP32)Up to 1.7 GHz(FP32)顯存容量顯存容量 32 GB HBM2 80 GB HBM2e 32 GB HBM2 顯存位寬顯存位寬 4096 bit 5120 bit 4096 bit 顯存頻率顯存頻率 2.0 GHz 3.2 GHz 2.4 GHz 顯存帶寬顯存帶寬 1024 GB/s 2039 GB/s 1228 GB/s TDPTDP 350
37、 W 400 W 300 W CPU to GPUCPU to GPU 互聯互聯 PCIe Gen4 x 16 PCIe Gen4 x 16 PCIe Gen4 x 16 GPU to CPUGPU to CPU 互聯互聯 xGMI x 2 NVLink Infinity Fabric x 3 Up to 184 GB/s Up to 600 GB/s Up to 276 GB/s 證券研究報告|行業點評報告 請仔細閱讀在本報告尾部的重要法律聲明 10 2.4.2.4.算法算法端端:英文語義測評英文語義測評海外模型占優,國產大模型有望在海外模型占優,國產大模型有望在中文領域突圍中文領域突圍 從
38、語義測評來看,從語義測評來看,國外頂級模型仍占據優勢國外頂級模型仍占據優勢。從排名數據來看,當前大模型在國內與國外的差距主要體現在綜合得分方面。在英文 GLUE 測評排名中,前十名得分均在 90 分以上,已經十分接近乃至超越人類平均水平,其中來自國內得分大模型僅有百度 ERNIE 及阿里 AliceMind,二者分別為文心一言、通義千問背后的語言模型;而國內中文 CLUE 測評中排名前五的得分在 86 分左右,在 1.1 測評中騰訊混元大模型和阿里 AliceMind 占據前兩名,而 1.0 測評中華為盤古模型占據第 6 名位置。雖然國內 AI 大模型在某些具體任務上已經取得了一定的成績,但總
39、體而言,國內大模型在與國外頂級模型的競爭中仍然存在一定差距,這主要是算力、數據質量以及技術研發等多方面因素綜合影響的結果,我們預計在英文回答水平上海外頂級模型仍占據絕對優勢,而國產大模型在攻克了數據和算力的難關后有望另辟蹊徑實現中文水平上的突破。表 6 GLUE 通用語言理解測評排名 排排名名 名稱名稱 模型模型 綜合得綜合得分分 CoLACoLA SSTSST-2 2 MRPCMRPC STSSTS-B B QQPQQP 1 Microsoft Alexander v-team Turing ULR v6 91.3 73.3 97.5 94.2/92.3 93.5/93.1 76.4/90.
40、9 2 JDExplore d-team Vega v1 91.3 73.8 97.9 94.5/92.6 93.5/93.1 76.7/91.1 3 Microsoft Alexander v-team Turing NLR v5 91.2 72.6 97.6 93.8/91.7 93.7/93.3 76.4/91.1 4 DIRL Team DeBERTa+CLEVER 91.1 74.7 97.6 93.3/91.1 93.4/93.1 76.5/91.0 5 5 ERNIE Team ERNIE Team-百度百度 ERNIEERNIE 91.191.1 75.575.5 97.897
41、.8 93.9/91.893.9/91.8 93.0/92.693.0/92.6 75.2/90.975.2/90.9 6 6 AliceMind&AliceMind&DIRL DIRL-阿里阿里 StructBERT+StructBERT+CLEVERCLEVER 9191.0 0 75.375.3 97.797.7 93.9/91.993.9/91.9 93.5/93.193.5/93.1 75.6/90.875.6/90.8 7 DeBERTa Team-Microsoft DeBERTa/TuringNLRv4 90.8 71.5 97.5 94.0/92.0 92.9/92.6 76
42、.2/90.8 8 HFL iFLYTEK MacALBERT+DKM 90.7 74.8 97 94.5/92.6 92.8/92.6 74.7/90.6 9 PING-AN Omni-Sinitic ALBERT+DAAF+NAS 90.6 73.5 97.2 94.0/92.0 93.0/92.4 76.1/91.0 10 T5 Team-Google T5 90.3 71.6 97.5 92.8/90.4 93.1/92.8 75.1/90.6 證券研究報告|行業點評報告 請仔細閱讀在本報告尾部的重要法律聲明 11 表 7 CLUE 中文語言理解測評排名(1.1 版及 1.0 版綜合得
43、分)排排行行 模型模型 研究機構研究機構 綜合綜合得分得分1.11.1 AFQMAFQMC C TNEWSTNEWS1.11.1 IFLYIFLYTEKTEK OCNLI_OCNLI_50K50K WSC1WSC1.1.1 CSLCSL CMRC2CMRC2018018 CHIDCHID1.11.1 C3 C3 1.11.1 1 1 HunYuanHunYuan-NLP 1TNLP 1T 騰訊混元騰訊混元 AIAI 大模型大模型 86.986.9 85.185.1 70.470.4 67.567.5 86.586.5 96.096.0 96.296.2 87.987.9 98.898.8 93
44、.793.7 2 2 通義通義-AliceMindAliceMind 阿里達摩院阿里達摩院 NLPNLP 86.786.7 84.184.1 73.573.5 67.467.4 85.985.9 94.394.3 95.095.0 86.886.8 99.299.2 94.094.0 3 HUMAN CLUE 86.7 81.0 71.0 80.3 90.3 98.0 84.0 92.4 87.1 96.0 4 CHAOS OPPO 研究院融智團隊 86.6 83.4 73.2 65.8 86.4 94.6 95.7 87.2 99.2 93.5 5 WenJin Meituan NLP 86
45、.3 84.5 73.0 64.4 86.2 94.4 95.7 86.3 98.9 93.4 排排行行 模型模型 研究機構研究機構 綜合綜合得分得分1.01.0 AFQMAFQMC C TNEWSTNEWS1.01.0 IFLYIFLYTEKTEK OCNLI_OCNLI_50K50K WSC1WSC1.0.0 CSLCSL CMRC2CMRC2018018 CHIDCHID1.01.0 C3 C3 1.01.0 1 ShenZhou QQ 瀏覽器實驗室 85.9 80.6 74.2 67.7 86.4 96.6 91.0 87.9 95.6 92.7 2 HUMAN CLUE 85.6 8
46、1.0 71.0 80.3 90.3 98.0 84.0 92.4 87.1 96.0 3 Mengzi 瀾舟科技-創新工場 84.9 81.8 75.1 65.1 82.6 96.6 89.9 84.0 96.0 92.4 4 Motian QQ 瀏覽器搜索 84.1 78.3 73.2 65.5 85.0 94.8 90.2 85.3 94.4 88.5 5 BERTSG Sogou Search 83.8 79.9 74.2 64.5 85.9 95.2 89.0 83.8 93.1 87.4 6 6 PanguPangu 華為云華為云-循環智能循環智能 83.083.0 78.178.
47、1 72.172.1 65.265.2 83.383.3 95.595.5 87.787.7 84.584.5 93.393.3 85.685.6 7 MT-BERTs Meituan NLP 81.1 77.4 70.0 64.3 83.5 89.7 87.4 83.2 89.8 80.3 8 LICHEE 騰訊看點 80.5 77.0 70.5 64.2 81.3 90.7 87.4 79.8 87.5 82.2 9 roberta_selfrun OPPO 小布助手 80.2 77.9 69.4 63.9 80.4 93.1 87.3 80.1 90.1 77.3 10 BERTs BE
48、RTs 80.2 76.8 69.9 63.9 82.9 89.0 86.8 80.5 89.5 78.4 3.3.AzureAzure OpenAIOpenAI 進駐進駐中國中國香港,香港,商業應用潛力有待發掘商業應用潛力有待發掘 3.1.3.1.AzureAzure OpenAIOpenAI 進駐進駐中國中國香港香港,大陸傳輸,大陸傳輸速度提升速度提升 中國香港開放中國香港開放 AzureAzure OpenAIOpenAI,大陸傳輸速度進一步提升。,大陸傳輸速度進一步提升。在 3 月 23 日的Microsoft AI Day 活動中,Microsoft 中國香港公布企業級 GPT 功能
49、開放給中國香港企業用戶使用,同時表示 4 月份正式開通 GPT-4 技術。中國香港作為國際金融和科技中心,擁有世界上最發達的互聯網基礎設施之一,Azure OpenAI 在中國香港實裝GPT-4 模型及 ChatGPT 后,大陸企業使用速度預計會有顯著提升。首先,從地理位置上看,中國香港距離大陸非常近,這意味著數據傳輸的延遲將降低,企業在使用Azure OpenAI 時將獲得更佳的用戶體驗;其次,中國香港擁有強大的數據中心資源,這將有助于提高大陸企業接入 Azure OpenAI 的穩定性和可靠性,并且由于中國香港政府對于數據隱私和安全的高度重視,這也將有助于保障大陸企業在使用 Azure O
50、penAI 時的數據安全。對于國內企業來說,此次 Azure OpenAI 在中國香港實裝 GPT-4 和 ChatGPT 意味著其可以更便捷地獲取和應用先進的 AI 技術,同時數據傳輸速度和安全性都有望大幅提升。證券研究報告|行業點評報告 請仔細閱讀在本報告尾部的重要法律聲明 12 表 8 中國大陸使用主流地區服務器網絡延遲 服務器位置服務器位置 大陸延遲大陸延遲 中國香港中國香港 深圳延遲深圳延遲 9ms9ms-20ms20ms,中部地區延遲為,中部地區延遲為3030-50ms50ms,東北延遲為,東北延遲為6060-80ms80ms 新加坡 中國香港的延遲為 32ms,廣東佛山延遲為44
51、ms 美國 最快的區域能達到 130ms,平均延遲在 180ms 左右 日本 上海為 38ms,江蘇 45ms 韓國 江浙滬地區能達到 30-40ms,周邊地區能達到40-70ms 資料來源:A5 互聯,華西證券研究所 3.2.3.2.A Azure OpenAIzure OpenAI 未來未來可可持續持續賦能眾多賦能眾多行業行業,能力上限取決于能力上限取決于企業本身企業本身 AzureAzure OpenAIOpenAI 服務在互聯網、游戲、金融、零售、醫藥乃至自動駕駛、智能制服務在互聯網、游戲、金融、零售、醫藥乃至自動駕駛、智能制造領域擁有著廣闊的應用前景。造領域擁有著廣闊的應用前景。Az
52、ure OpenAI 服務提供了有 SLA 保證的企業級服務和完善的安全防護措施,同時微軟也在積極支持各行業客戶,共同探索和開發基于OpenAI 的更多創新場景,并幫助企業打造自己專屬的業務創新解決方案及應用落地。目前微軟官方演示的商業應用案例主要有 Power Platform、Github Copilot、CarMax、Kepro,但這僅僅是冰山一角,以當前 Azure 的強大算力和 GPT-4 模型的能力,Azure OpenAI 的商業應用上限更多取決于企業和開發者的創意與需求。PowerPower PlatformPlatform:微軟已將 GPT 模型集成到其 Power Apps
53、 平臺中。這一舉措旨在幫助從無編程經驗的“公民開發者”到擁有深度編程專業知識的專業開發者構建提高業務生產力或流程的應用程序,而無需了解如何編寫計算機代碼或公式。在 Power Apps 中,GPT 模型可用于構建各種應用程序,如審查非營利性捐贈、管理新冠疫情期間的旅行或減少維護風力渦輪機所需的加班時間等。GithubGithub CopilotCopilot:GitHub Copilot 是一款人工智能輔助編程工具,OpenAI Codex 支持,能夠在用戶編寫代碼時提供類似自動補全的建議。用戶可以通過開始編寫所需的代碼或用自然語言撰寫注釋來描述期望代碼完成的任務,從而獲得 GitHub Co
54、pilot 的建議。CarMaxCarMax:在美國最大的二手車零售商 CarMax,購車者不再需要花費大量時間去查找并閱讀大量規格和評價。得益于強大的 AI 語言模型,潛在買家現在可以看到CarMax 銷售的每個品牌、型號和年份車輛的客戶評價摘要,這些摘要涵蓋了約45,000 輛車的龐大庫存中的約 5,000 種組合。在短短幾個月內,CarMax 便利用 GPT-3 模型生成了大量原創內容,這樣的速度以前是不可能實現的。KeproKepro:Kepro 使用了 Microsoft Azure 中針對醫療領域的 AI 產品:Text Analytics for health,以實現大規模臨床文
55、檔審查的自動化。公司利用自然語言處理技術快速準確地解析非結構化臨床文檔,并構建了神經網絡,分析多個專業的醫療文檔,且能自動填充針對 Medicare 和 Medicaid 審查員的 12 種不同文檔模板的表格。證券研究報告|行業點評報告 請仔細閱讀在本報告尾部的重要法律聲明 13 圖 5 Power Platform 幫助客戶構建應用程序 圖 6 Github Copilot 大幅提高開發者工作效率 資料來源:Github 官網,華西證券研究所 圖 7 CarMax 利用 OpenAI 將客戶評價總結為摘要 圖 8 Kepro 使用 Azure AI 優化臨床文檔 3.3.3.3.OpenAI
56、OpenAI 亞洲大規模封號,亞洲大規模封號,數據安全是未來數據安全是未來 AIGCAIGC 重要因素重要因素 OpenAIOpenAI 大規模封號,進一步利好已接入企業。大規模封號,進一步利好已接入企業。根據每日經濟新聞,OpenAI 官方從 3 月 30 號開始大面積封號,禁止使用亞洲節點登錄,OpenAI 還在短時間內無法注冊新賬號。此次出現大規模封號的原因可能在于,一是許多賬號是用程序批量注冊的,一臺機器用一個 IP 在短時間內注冊了大量賬號;二是出現 API 濫用的情況,例如,在不支持的地區使用了 ChatGPT API,或者利用多個賬號獲取 API 并對外提供服務。此次封號事件或許
57、意味著微軟和 OpenAI 開始更加嚴格地管理 GPT 賬號,當前對大陸企業來說,接入 Azure OpenAI 是唯一合法合規使用 GPT 模型的途徑,我們認為已經接入 Azure OpenAI 的企業可以在確保合規和安全性的前提下充分利用 GPT 模型,改進內部工作效率或為客戶提供可靠的 AI 服務。證券研究報告|行業點評報告 請仔細閱讀在本報告尾部的重要法律聲明 14 圖 9 部分 OpenAI 賬號于上月底被大規模封禁 政策方面政策方面仍需注意內外風險因素仍需注意內外風險因素。由于使用如 Azure OpenAI 等海外大模型需要將數據跨境傳輸,因此受到境內和境外的數據傳輸政策限制。內
58、部來看,內部來看,數據出境安全評估辦法于 2022 年 7 月 7 日公布,自 2022 年 9 月1 日起施行,使用 Azure OpenAI 涉及重要數據和個人信息的出境,必須接受安全評估,需要向網信部門申報。目前已有數家企業落地了 Azure OpenAI 的應用,但不排除后期數據出境限制更加嚴格,使得 GPT 模型使用受限。外部來看,外部來看,2019 年美國國家安全和個人數據保護法案(尚未生效),對于美國用戶數據出境,尤其是傳輸至中國進行明確的限制,旨在規制所有基于數據提供在線服務公司(包括“受管轄公司”),不得將任何用戶數據或解密該數據所需的信息直接或間接地傳輸到中國、俄羅斯等任何
59、“有疑慮國家”,而其定義的“受管轄公司”實際非常廣泛,大部分互聯網企業都可歸入其管制范圍。如果該法案最終通過,則會極大限制美國與中國間的數據傳輸。實踐上,自 2020 年以來,美國以用戶數據隱私和國家安全審查為由對 TikTok(抖音海外版)和微信國際版持續進行打壓,若企業使用海外大模型數據出境經由美國,則也需面對這方面的數據傳輸風險。證券研究報告|行業點評報告 請仔細閱讀在本報告尾部的重要法律聲明 15 表 9 數據出境安全評估辦法重點內容 具體事項具體事項 適用范圍適用范圍 數據處理者向境外提供在中華人民共和國境內運營中收集和產生的重要數據和個人信息的安全評估 須向網信部須向網信部門申報情
60、形門申報情形 數據處理者向境外提供重要數據 關鍵信息基礎設施運營者和處理 100 萬人以上個人信息的數據處理者向境外提供個人信息 自上年 1 月 1 日起累計向境外提供 10 萬人個人信息或者 1 萬人敏感個人信息的數據處理者向境外提供個人信息 國家網信部門規定的其他需要申報數據出境安全評估的情形 重點評估事重點評估事項項 數據出境的目的、范圍、方式等的合法性、正當性、必要性 境外接收方所在國家或者地區的數據安全保護政策法規和網絡安全環境對出境數據安全的影響;境外接收方的數據保護水平是否達到中華人民共和國法律、行政法規的規定和強制性國家標準的要求 出境數據的規模、范圍、種類、敏感程度,出境中和
61、出境后遭到篡改、破壞、泄露、丟失、轉移或者被非法獲取、非法利用等的風險 數據安全和個人信息權益是否能夠得到充分有效保障 數據處理者與境外接收方擬訂立的法律文件中是否充分約定了數據安全保護責任義務 遵守中國法律、行政法規、部門規章情況 國家網信部門認為需要評估的其他事項 評估部門評估部門 國務院有關部門、國家網信部門、省級網信部門、專業機構 4.4.投資建議投資建議 我們認為 AIGC 模型迭代正在加速,AI 發展日新月異,當前海外頂級模型仍占據領先地位,已接入 Azure OpenAI 獲得原生 GPT-4 和 ChatGPT 賦能的企業有著一定的先發優勢,可率先開始根據需求部署 AI 解決方
62、案和應用;同時,國內大模型有望在特定領域及中文處理上另辟蹊徑實現趕超。后續國內率先落地后續國內率先落地 Azure OpenAIAzure OpenAI 應用的應用的標的有望受益標的有望受益,包括萬科(2202.HK)、創夢天地(1119.HK)、醫脈通(2192.HK),以及國內已實現自研大模型的企業以及國內已實現自研大模型的企業,包括阿里巴巴(9988.HK)、騰訊(0700.HK)、百度(9888.HK)。表 10 受益標的 代碼代碼 簡稱簡稱 最新收盤最新收盤價(港價(港元)元)PEPE EPSEPS 2022A2022A 2023E2023E 2024E2024E 2022A2022
63、A 2023E2023E 2024E2024E 2202.HK2202.HK 萬科企業萬科企業 12.00 5.65 5.34 5.00 2.18 2.25 2.4 1119.HK1119.HK 創夢天地創夢天地 4.16 25.58 13.57-2.02 0.16 0.31 2192.HK2192.HK 醫脈通醫脈通 10.72 58.55 0.18 9988.HK9988.HK 阿里巴巴阿里巴巴-SWSW 97.75 56.47 16.21 13.85 6.09 7.12 0700.HK0700.HK 騰訊控股騰訊控股 385.40 17.50 20.06 17.68 22.12 19.1
64、9 21.78 9888.HK9888.HK 百度集團百度集團-SWSW 142.90 47.23 21.99 19.12 2.80 6.49 7.46 資料來源:Wind,華西證券研究所,數據截至 2023 年 4 月 7 日,盈利預測皆為 Wind 一致預測 證券研究報告|行業點評報告 請仔細閱讀在本報告尾部的重要法律聲明 16 5.5.風險提示風險提示 技術落地商業化不及預期;人工智能在部分領域應用的監管風險;數據出海的政策風險。證券研究報告|行業點評報告 請仔細閱讀在本報告尾部的重要法律聲明 17 分析師與研究助理簡介分析師與研究助理簡介 朱蕓:執業證書編號:S112052204000
65、1 海外首席分析師。北京大學碩士。曾任天有投資集團有限公司副總裁、浙商證券海外&教育首席分析師、西南證券海外&計算機首席分析師,2022年3月加入華西證券研究所。分析師承諾分析師承諾 作者具有中國證券業協會授予的證券投資咨詢執業資格或相當的專業勝任能力,保證報告所采用的數據均來自合規渠道,分析邏輯基于作者的職業理解,通過合理判斷并得出結論,力求客觀、公正,結論不受任何第三方的授意、影響,特此聲明。評級說明評級說明 公司評級標準公司評級標準 投資投資評級評級 說明說明 以報告發布日后的 6 個月內公司股價相對上證指數的漲跌幅為基準。買入 分析師預測在此期間股價相對強于上證指數達到或超過 15%增
66、持 分析師預測在此期間股價相對強于上證指數在 5%15%之間 中性 分析師預測在此期間股價相對上證指數在-5%5%之間 減持 分析師預測在此期間股價相對弱于上證指數 5%15%之間 賣出 分析師預測在此期間股價相對弱于上證指數達到或超過 15%行業評級標準行業評級標準 以報告發布日后的 6 個月內行業指數的漲跌幅為基準。推薦 分析師預測在此期間行業指數相對強于上證指數達到或超過 10%中性 分析師預測在此期間行業指數相對上證指數在-10%10%之間 回避 分析師預測在此期間行業指數相對弱于上證指數達到或超過 10%華西證券研究所:華西證券研究所:地址:北京市西城區太平橋大街豐匯園 11 號豐匯
67、時代大廈南座 5 層 網址:http:/ 證券研究報告|行業點評報告 請仔細閱讀在本報告尾部的重要法律聲明 18 華西證券免責聲明華西證券免責聲明 華西證券股份有限公司(以下簡稱“本公司”)具備證券投資咨詢業務資格。本報告僅供本公司簽約客戶使用。本公司不會因接收人收到或者經由其他渠道轉發收到本報告而直接視其為本公司客戶。本報告基于本公司研究所及其研究人員認為的已經公開的資料或者研究人員的實地調研資料,但本公司對該等信息的準確性、完整性或可靠性不作任何保證。本報告所載資料、意見以及推測僅于本報告發布當日的判斷,且這種判斷受到研究方法、研究依據等多方面的制約。在不同時期,本公司可發出與本報告所載資
68、料、意見及預測不一致的報告。本公司不保證本報告所含信息始終保持在最新狀態。同時,本公司對本報告所含信息可在不發出通知的情形下做出修改,投資者需自行關注相應更新或修改。在任何情況下,本報告僅提供給簽約客戶參考使用,任何信息或所表述的意見絕不構成對任何人的投資建議。市場有風險,投資需謹慎。投資者不應將本報告視為做出投資決策的惟一參考因素,亦不應認為本報告可以取代自己的判斷。在任何情況下,本報告均未考慮到個別客戶的特殊投資目標、財務狀況或需求,不能作為客戶進行客戶買賣、認購證券或者其他金融工具的保證或邀請。在任何情況下,本公司、本公司員工或者其他關聯方均不承諾投資者一定獲利,不與投資者分享投資收益,
69、也不對任何人因使用本報告而導致的任何可能損失負有任何責任。投資者因使用本公司研究報告做出的任何投資決策均是獨立行為,與本公司、本公司員工及其他關聯方無關。本公司建立起信息隔離墻制度、跨墻制度來規范管理跨部門、跨關聯機構之間的信息流動。務請投資者注意,在法律許可的前提下,本公司及其所屬關聯機構可能會持有報告中提到的公司所發行的證券或期權并進行證券或期權交易,也可能為這些公司提供或者爭取提供投資銀行、財務顧問或者金融產品等相關服務。在法律許可的前提下,本公司的董事、高級職員或員工可能擔任本報告所提到的公司的董事。所有報告版權均歸本公司所有。未經本公司事先書面授權,任何機構或個人不得以任何形式復制、轉發或公開傳播本報告的全部或部分內容,如需引用、刊發或轉載本報告,需注明出處為華西證券研究所,且不得對本報告進行任何有悖原意的引用、刪節和修改。