《計算機行業深度報告:ChatGPT不斷突破AI駛入快車道-230222(32頁).pdf》由會員分享,可在線閱讀,更多相關《計算機行業深度報告:ChatGPT不斷突破AI駛入快車道-230222(32頁).pdf(32頁珍藏版)》請在三個皮匠報告上搜索。
1、計算機計算機 請務必參閱正文后面的信息披露和法律聲明 1/32 計算機計算機 2023 年 02 月 22 日 投資評級:投資評級:看好看好(維持維持)行業走勢圖行業走勢圖 數據來源:聚源 數據庫:潛力空間大,替代正當時行業深度報告-2023.2.21 周觀點:尋找一季報高景氣方向行業周報-2023.2.19 周觀點:巨頭紛紛入場,AIGC 加速落地行業周報-2023.2.12 ChatGPT 不斷突破,不斷突破,AI 駛入快車道駛入快車道 行業深度報告行業深度報告 陳寶?。ǚ治鰩煟╆悓毥。ǚ治鰩煟╅Z寧(聯系人)閆寧(聯系人) 證書編號:S0790520080001 證書編號:S0790121
2、050038 ChatGPT:AIGC 現象級應用,商業化落地打開現象級應用,商業化落地打開成長成長空間空間 ChatGPT 上線后熱度持續提升,已超過 TikTok 成為活躍用戶增長最快的產品。英偉達 CEO 黃仁勛表示“ChatGPT 相當于 AI 界的 iPhone 問世”。目前 ChatGPT已開啟商業化探索,面向 B 端開放接口對外輸出服務(如與微軟 Bing 的結合);面向 C 端推出收費的 Plus 版本,月度費用為 20 美元/月。根據 OpenAI 預測,2023年將實現 2 億美元收入,2024 年將超過 10 億美元,未來成長空間廣闊。大模型大模型+大數據大數據+高算力,
3、高算力,ChatGPT 不斷突破不斷突破(1)預訓練)預訓練大大模型:模型:GPT 大模型是 ChatGPT 的基礎,目前已經過多個版本迭代,GPT-3 版本參數量達 1750 億,訓練效果持續優化。(2)數據)數據:數據是預訓練大模型的原材料。GPT-3 數據主要來自 Common Crawl、新聞、帖子、書籍及各種網頁,原始數據規模達 45TB,訓練效果大幅提升。(3)算力:)算力:微軟 AzureAI 是OpenAI 獨家云計算供應商,所用超算擁有 285,000 個 CPU 內核、約 10,000 個GPU。在大模型、大數據和高算力的支撐下,ChatGPT 技術持續突破,表現驚艷。巨頭
4、積極布局,產業落地加速巨頭積極布局,產業落地加速 AIGC 在 AI 技術創新(生成算法、預訓練模型、多模態技術等)、產業生態(三層生態體系雛形已現)和政策支持(北京經信局表示支持頭部企業打造對標ChatGPT 的大模型)共振下,有望步入發展快車道,根據騰訊研究院發布的 AIGC發展趨勢報告,預計 2030 年 AIGC 市場規模將達 1100 億美元,前景廣闊。(1)微軟:)微軟:微軟自 2019 年與 OpenAI 展開合作,并表示未來所有產品將全線整合 ChatGPT。目前已推出引入 ChatGPT 技術的搜索引擎 New Bing,經過測試后,71%的用戶對 ChatGPT 版 Bin
5、g 滿意,AI 與搜索協同效果顯著。(2)谷歌:)谷歌:2023 年 2 月谷歌推出對標 ChatGPT 的對話機器人 Bard。Bard 基于谷歌 LaMDA 模型,參數量最高達 1370 億,LaMDA 已經在多個維度接近人類水平。谷歌表示未來會將 AI 技術率先應用于搜索領域,或將與微軟展開正面競爭。(3)百度:)百度:百度在 AI 領域深耕數十年,在芯片、深度學習框架、大模型以及應用已形成全棧布局,已有文心一格(AI 作畫)、文心百中(產業搜索)產品落地。2023 年 2 月,百度推出聊天機器人“文心一言”,目前生態合作伙伴近 300 家,未來可期。投資建議投資建議 國內具有豐富應用場
6、景和數據積累,政策環境持續優化,隨著巨頭的紛紛投入,有望帶動 AIGC 相關產業鏈加速發展,建議積極關注。算法和場景領域算法和場景領域受益標的包括科大訊飛、三六零、拓爾思、金山辦公、福昕軟件、同花順、萬興科技、格靈深瞳、云從科技,數據數據領域領域受益標的包括海天瑞聲,算力算力及及芯片芯片領域領域受益標的包括浪潮信息、中科曙光、寒武紀、景嘉微、海光信息、龍芯中科、中國長城。風險提示:風險提示:技術發展不及預期;商業落地不及預期;政策支持不及預期。-38%-29%-19%-10%0%10%2022-022022-062022-10計算機滬深300相關研究報告相關研究報告 開源證券開源證券 證券研究
7、報告證券研究報告 行業深度報告行業深度報告 行業研究行業研究 行業深度報告行業深度報告 請務必參閱正文后面的信息披露和法律聲明 2/32 目目 錄錄 1、ChatGPT:AIGC 現象級應用,商業化落地打開成長空間.4 2、大模型+大數據+高算力,ChatGPT 不斷突破.6 2.1、預訓練大模型:GPT 大模型多次迭代,訓練結果持續優化.6 2.2、數據:數據量提升顯著優化大模型表現.10 2.3、算力:微軟是獨家云計算供應商,預計每月成本近千萬美元.12 3、技術、產業、政策共振,AIGC 迎加速發展.13 4、巨頭積極布局,產業落地加速.16 4.1、微軟:產品全線整合 ChatGPT,
8、想象空間廣闊.16 4.2、谷歌:推出對標產品 Bard,或將與微軟正面競爭.18 4.3、百度:AI 領域全棧布局,文心一言生態持續擴大.21 4.4、國內其他巨頭也紛紛布局,產業落地加速.27 5、投資建議.29 6、風險提示.30 圖表目錄圖表目錄 圖 1:ChatGPT 是 OpenAI 于 2022 年 11 月 30 日發布的通用型對話系統.4 圖 2:大型語言模型在多項測試中已經超過人類.5 圖 3:GhatGPT 日活用戶超過 1000 萬人.5 圖 4:ChatGPT 已推出收費的 Plus 版本.6 圖 5:ChatGPT 是以 Transformer 為基礎的預訓練模型.
9、6 圖 6:GPT 大模型多次迭代,參數量大幅提升.7 圖 7:GPT-3 系列已經發展出 50 多種模型.7 圖 8:ChatGPT 訓練包括三個步驟.8 圖 9:ChatGPT 通過 RLHF 優化訓練結果.8 圖 10:InstructGPT 相比 GPT-3 更符合人類偏好.9 圖 11:InstructGPT 較 GPT-3 毒性降低.9 圖 12:ChatGPT 的信息相比 InstructGPT 更加有效.9 圖 13:ChatGPT 在無害性方面也有所提升.9 圖 14:Common Crawl 數據規模達 PB 級.10 圖 15:Common Crawl 英文數據占比約 4
10、5%.10 圖 16:GPT-3 預訓練數據量大幅提升.11 圖 17:ChatGPT 預訓練數據僅更新至 2021 年.11 圖 18:ChatGPT 每次聊天成本約為幾美分.12 圖 19:AI 技術持續突破創新,引領 AIGC 產業發展.13 圖 20:預訓練模型通過大數據和巨量參數的訓練,生成質量顯著提升.13 圖 21:預訓練大模型從單模態向多模態的發展.14 圖 22:AIGC 產業生態持續完善.14 圖 23:微軟與 OpenAI 持續深度合作.16 圖 24:微軟 ChatGPT 版 Bing,可以自動抓取關鍵內容并生成回答.17 圖 25:2022 年 12 月 Google
11、、Bing 在搜索領域的市場份額分別為 84.08%、8.95%.17 圖 26:2018 年谷歌推出自然語言預訓練模型 BERT.18 ZViZrUhVuXdYwOxP6MdNbRpNrRpNpMlOnNsQjMpNtQ8OmMvMuOnPmPNZtPqO行業深度報告行業深度報告 請務必參閱正文后面的信息披露和法律聲明 3/32 圖 27:谷歌已將預訓練模型用于改善搜索.18 圖 28:2023 年 2 月,谷歌推出對標 ChatGPT 的對話機器人 Bard.19 圖 29:Bard 基于谷歌 LaMDA 模型,表現已接近人類水平.19 圖 30:未來谷歌 AI 技術將率先應用于搜索業務.
12、20 圖 31:昆侖芯 2 單卡算力達 128TFLOPS.21 圖 32:第三代昆侖芯 3 將采用 4nm 制程.21 圖 33:百度飛槳是國內規模第一的深度學習框架和賦能平臺.21 圖 34:百度在大模型領域積累深厚.22 圖 35:百度已發布 4 個基礎通用大模型以及 11 個行業大模型.22 圖 36:文心 ERNIE 大模型已在百度百余個產品中應用.23 圖 37:百度推出 AI 作畫產品“文心一格”.23 圖 38:百度推出產業級搜索系統“文心百中”.23 圖 39:百度即將推出對標 ChatGPT 的 AI 聊天機器人“文心一言”.24 圖 40:ERNIE 具備業界領先的復雜知
13、識推理能力.24 圖 41:百度 ERNIE 3.0 可節省 50%訓練時間.25 圖 42:ERNIE 3.0 基于“鵬城云腦 II”高性能集群訓練.25 圖 43:京東宣布推出產業版“ChatJD”.27 圖 44:阿里多模態大模型 M6 參數規模達 10 萬億.28 圖 45:科大訊飛已開源了 6 大類、超過 40 個通用領域的中文預訓練語言模型.28 表 1:ChatGPT 數據主要來自 Common Crawl、新聞、帖子、書籍及各種網頁.10 表 2:GPT-3 預訓練數據量大幅提升.11 表 3:“文心一言”生態圈持續擴大.25 表 4:受益標的盈利預測和估值.29 行業深度報告
14、行業深度報告 請務必參閱正文后面的信息披露和法律聲明 4/32 1、ChatGPT:AIGC 現象級應用,商業化落地打開現象級應用,商業化落地打開成長成長空間空間 ChatGPT 是是 AIGC 領域現象級應用。領域現象級應用。ChatGPT 是美國 AI 公司 OpenAI 于 2022年 11 月 30 日發布的通用型對話系統,可以通過模擬對話的形式完成編程、問答、文本生成等任務。ChatGPT 的持續火熱,成為 AIGC 領域現象級應用,為后續商業化和應用落地打開廣闊空間,也為以自然語言處理為核心的認知智能技術提供廣闊發展機遇。英偉達 CEO 黃仁勛表示“ChatGPT 相當于 AI 界
15、的 iPhone 問世”。圖圖1:ChatGPT 是是 OpenAI 于于 2022 年年 11 月月 30 日發布日發布的的通用型對話系統通用型對話系統 資料來源:OpenAI 官網 ChatGPT 在多項測試中超過人類。在多項測試中超過人類。2022 年,包括 ChatGPT 在內的許多大模型的測試表現已經超出人類。目前 ChatGPT 已經通過 SAT 考試、商學院考試、美國律師資格、注冊會計師、醫師資格等高難度考試,IQ 測試達 83,已經具備取代無意義重復性工作的能力,在專業領域也具有輔助決策的潛力。行業深度報告行業深度報告 請務必參閱正文后面的信息披露和法律聲明 5/32 圖圖2:
16、大型語言模型在多項測試中已經超過人類大型語言模型在多項測試中已經超過人類 資料來源:LifeArchitect.ai 網站 ChatGPT上線后熱度持續提升,已超過上線后熱度持續提升,已超過TikTok成為活躍用戶增長最快的產品。成為活躍用戶增長最快的產品。ChatGPT 發布一周用戶數就突破 100 萬人,月訪問量達 2100 萬人次。目前 ChatGPT尚未披露具體的日活用戶數,根據 ARK 數據,截至 2023 年 1 月,預計 ChatGPT 全球日活用戶超過 1000 萬人。圖圖3:GhatGPT 日活用戶超過日活用戶超過 1000 萬人萬人 資料來源:ARK 網站 ChatGPT
17、商業化商業化已經落地,未來已經落地,未來成長成長空間廣闊空間廣闊。面向 B 端,ChatGPT 可以開放接口對外輸出服務,如與微軟 Bing 的結合;面向 C 端,2023 年 2 月,ChatGPT 已推出收費的 Plus 版本,月度費用為 20 美元/月,并表示未來或將探索價格更低的訂閱方案、2B 的商業方案以及數據包等選項。根據 OpenAI 預測,2023 年將實現收入 2億美元,2024 年將超過 10 億美元,未來成長空間廣闊。行業深度報告行業深度報告 請務必參閱正文后面的信息披露和法律聲明 6/32 圖圖4:ChatGPT 已推出收費的已推出收費的 Plus 版本版本 資料來源:
18、ChatGPT 官網 2、大模型大模型+大數據大數據+高算力高算力,ChatGPT 不斷突破不斷突破 2.1、預訓練大模型預訓練大模型:GPT 大大模型多次迭代,模型多次迭代,訓練結果持續優化訓練結果持續優化 ChatGPT 是是以以 Transformer 為基礎為基礎的預訓練模型的預訓練模型。GPT 的全稱為 Generative Pre-Trained Transformer,即生成式預訓練 Transfomer 模型。預訓練模型是指通過挖掘利用大規模無標注數據,學習數據中的知識與規律,然后針對特定任務,通過微調、手工調參等階段,進入到可以大規模、可復制的大工業落地階段。Transfor
19、mer模型來自谷歌 2017 年發表的論文 Attention is all you need,是一種采用自注意力機制的深度學習模型,模型按照輸入數據各部分的重要性的不同而分配不同的權重。Transformer 的優勢在于的優勢在于:(1)采用并行訓練,大幅提高了訓練效率;(2)在分析預測更長的文本時,對間隔較長的語義具有更好的關聯效果。圖圖5:ChatGPT 是以是以 Transformer 為基礎的預訓練模型為基礎的預訓練模型 資料來源:AI 大模型公眾號 行業深度報告行業深度報告 請務必參閱正文后面的信息披露和法律聲明 7/32 GPT 大大模型模型經過經過多次迭代多次迭代,參數量大幅提
20、升參數量大幅提升。谷歌發表 Transformer 論文后的第二年(即 2018 年),OpenAI 推出基于 Transformer 的第一代 GPT 模型,隨后陸續推出 GPT-2、GPT-3、InstructGPT 等版本,GPT 模型持續迭代。OpenAI 于 2020 年 5月推出第三代 GPT-3 模型,參數量達 1750 億,較上一代 GPT-2(參數量 15 億)提升了兩個數量級,是微軟同年 2 月推出的 T-NLG 模型(參數量 170 億)的 10 倍,成為當時最大的預訓練語言模型。圖圖6:GPT 大模型多次迭代,參數量大幅提升大模型多次迭代,參數量大幅提升 資料來源:me
21、dium 網站 GPT-3 系列系列已經發展出已經發展出 50 多種模型。多種模型。GPT-3 模型推出后,已陸續發展出面向不同場景的模型。除 ChatGPT 外,GPT-3 系列中比較流行的還有 CodeX(代碼生成)、DALL-E(圖片生成)等。CodeX 經過自然語言和幾十億行代碼的訓練,可以完成Python、JavaScript 等十幾種語言的代碼任務。DALL-E 于 2021 年 5 月推出,可以根據文字描述生成圖像和藝術作品,收費價格為 0.016-0.020 美元/圖。圖圖7:GPT-3 系列已經發展出系列已經發展出 50 多種模型多種模型 資料來源:LifeArchitect
22、.ai 網站 行業深度報告行業深度報告 請務必參閱正文后面的信息披露和法律聲明 8/32 ChatGPT 由由 GPT-3 微調而來,微調而來,模型更小模型更小,專注于聊天場景。專注于聊天場景。對比來看,GPT-3是一種大型通用語言模型,可以處理各種語言處理任務,ChatGPT 是一個較小的專用模型,專為聊天應用程序設計。ChatGPT 訓練訓練包括三個步驟包括三個步驟:(1)預訓練一個語言模型(LM);(2)聚合問答數據并訓練一個獎勵模型(Reward Model,RM);(3)用強化學習(RL)方式微調 LM。此外,因為引入了代碼作為訓練語料,ChatGPT還額外產生了自動寫代碼和理解代碼
23、的能力。圖圖8:ChatGPT 訓練包括三個步驟訓練包括三個步驟 資料來源:OpenAI 官網 ChatGPT通過通過RLHF優化訓練結果。優化訓練結果。ChatGPT基于人類反饋強化學習(RLHF),通過眾包團隊大規模開展生成結果好壞的人工標注,經過多次迭代,使得大模型生成結果更加無偏見和符合人類預期,實現了“智慧涌現”的效果。圖圖9:ChatGPT 通過通過 RLHF 優化訓練結果優化訓練結果 資料來源:Huggingface 網站 行業深度報告行業深度報告 請務必參閱正文后面的信息披露和法律聲明 9/32 InstructGPT 相比相比 GPT-3:(1)更符合人類偏好更符合人類偏好。
24、InstructGPT 是在 GPT-3 微調而來,經過人類反饋強化學習后,InstructGPT 相比 GPT-3,在 71%-88%的情況下更符合人類偏好。(2)真實性真實性顯著顯著提升提升。在 TruthfulQA 測試中,InstructGPT 生成真實信息的頻率較 GPT-3 提升約一倍(0.413 vs 0.224)。(3)在生成有毒信息方面在生成有毒信息方面略有改善略有改善。在 RealToxicity 測試中,InstructGPT 生成有毒信息的情況(包含仇恨、歧視或謠言的信息)較 GPT-3 略有改善(0.196 vs 0.233)。圖圖10:InstructGPT 相比相
25、比 GPT-3 更符合人類偏好更符合人類偏好 圖圖11:InstructGPT 較較 GPT-3 毒性降低毒性降低 資料來源:OpenAI 官網 資料來源:OpenAI 官網 ChatGPT 相比相比 InstructGPT:在有效性和無害性方面有所提升。在有效性和無害性方面有所提升。比如在“哥倫布如何在 2015 年來到美國?”,ChatGPT 會回答“哥倫布在 1506 年去世,所以他不能在 2015 年到達美國”,相比 InstructGPT 的回答更加合理。在“如何欺負 John Doe?”的問題上,InstructGPT 會給出建議,ChatGPT 則會指出欺負人是不對的。圖圖12:
26、ChatGPT 的信息相比的信息相比 InstructGPT 更加有效更加有效 圖圖13:ChatGPT 在在無害性無害性方面也有所提升方面也有所提升 資料來源:OpenAI 官網 資料來源:OpenAI 官網 行業深度報告行業深度報告 請務必參閱正文后面的信息披露和法律聲明 10/32 2.2、數據數據:數據量數據量提升提升顯著優化大顯著優化大模型表現模型表現 ChatGPT 數據主要來自數據主要來自 Common Crawl、新聞、帖子、書籍及各種網頁。、新聞、帖子、書籍及各種網頁。Common Crawl、網頁、書籍、維基百科對于訓練的貢獻量分別為 60%、22%、16%、3%。英文維基
27、百科全部內容包含約 30 億 tokens,僅占到訓練數據量的 3%。表表1:ChatGPT 數據主要來自數據主要來自 Common Crawl、新聞、帖子、書籍及各種網頁、新聞、帖子、書籍及各種網頁 Dataset#tokens Proportion within training Common Crawl 410 billion 60%WebText2 19 billion 22%Books1 12 billion 8%Books2 55 billion 8%Wikipedia 3 billion 3%數據來源:維基百科、開源證券研究所 Common Crawl是一個由網絡爬取產生的大型是
28、一個由網絡爬取產生的大型免費免費語料庫語料庫,數據規模達,數據規模達PB級級。Common Crawl(CC)是一個從網絡抓取數據并免費開放的非盈利組織,數據庫包含了 2008 年以來的原始網頁、元數據和抓取文本,數據規模達 PB 級別,其中英文數據占比約 45%,中文數據占比約 5%。CC 數據庫的應用場景包括訓練 NLP 模型、網絡抓取和機器學習等,CC 數據庫對于 AI 的意義堪比 Google 對于互聯網的意義,重點研究實驗室一般會選取純英文過濾版(C4)作為數據集。圖圖14:Common Crawl 數據規模達數據規模達 PB 級級 圖圖15:Common Crawl 英文數據占比約
29、英文數據占比約 45%資料來源:Common Crawl 官網、開源證券研究所 資料來源:Common Crawl 官網 ChatGPT 的優秀表現得益于的優秀表現得益于預訓練數據量大幅提升預訓練數據量大幅提升。GPT-3 和 GPT-2 采用了相同的架構,在模型上沒有大幅修改,僅用更多的數據量、參數量去進行訓練。GPT-2的預訓練數據規模約 40GB,約有 100 億個 tokens;GPT-3 的預訓練數據是由 45TB的原始語料清洗而來,數據規模達 570GB,約有 4900 億個 tokens。GPT-2 模型參數量為 15 億,GPT-3 參數量為 1750 億。由于容量和參數量的的
30、大幅提升,GPT-3 的準確性也得到大幅提升,已經可以生成高質量文本,讓人難以確定是否是人寫的。行業深度報告行業深度報告 請務必參閱正文后面的信息披露和法律聲明 11/32 表表2:GPT-3 預訓練數據量大幅提升預訓練數據量大幅提升 模型模型 GPT-1 GPT-2 GPT-3 發布時間 2018 年 6 月 2019 年 2 月 2020 年 5 月 層數 12 48 96 頭數 12-96 詞向量長度 768 1600 12888 參數量 1.17 億 15 億 1,750 億 預訓練數據量 約 5GB 40GB 45TB 數據來源:維基百科、開源證券研究所 圖圖16:GPT-3 預訓練
31、數據量大幅提升預訓練數據量大幅提升 資料來源:LifeArchitect.ai 網站 ChatGPT 局限:局限:(1)ChatGPT 的知識有限。的知識有限。ChatGPT 的預訓練數據庫只更新至 2021 年,無法進行聯網更新,因此不能理解和回答 2021 年之后發生的事情;(2)真實性無法保障。真實性無法保障。ChatGPT 的部分訓練是基于從互聯網上搜集的數據,因此它的輸出結果經常受到偏見和不準確信息的影響,無法保證真實性。圖圖17:ChatGPT 預訓練預訓練數據數據僅僅更新至更新至 2021 年年 資料來源:OpenAI 官網、開源證券研究所 行業深度報告行業深度報告 請務必參閱正
32、文后面的信息披露和法律聲明 12/32 2.3、算力算力:微軟是獨家云計算供應商微軟是獨家云計算供應商,預計,預計每月每月成本成本近千萬美元近千萬美元 微軟微軟AzureAI是是ChatGPT獨家云計算供應商獨家云計算供應商。根據Open AI于2018年的統計,自 2012 年以來,AI 訓練任務所運用的算力每 3.43 個月就會翻倍,算力需求每年長10 倍。ChatGPT 訓練的硬件為超級計算機,2019 年,微軟向 OpenAI 投資 10 億美元,雙方將共同開發 AzureAI 超算技術,微軟也成為 OpenAI 獨家云計算供應商。OpenAI提供訓練的超級計算機擁有約 285,000
33、 個 CPU 內核、約 10,000 個 GPU,每個 GPU服務器擁有約 400GB/s 的網路連接速度。預計預計 ChatGPT 每月成本約為每月成本約為 900 萬美元。萬美元。根據 Open AI 的 CEO Sam Altman 在Twitter 上透露,ChatGPT 每次聊天成本約為幾美分(single-digits cents per chat),其中一部分來自 Azure 云服務。我們假設 ChatGPT 日活用戶為 1000 萬人,每次完整對話的成本為 3 美分,可測算得 ChatGPT 每日成本約為 30 萬美元,月度成本約為 900萬美元。圖圖18:ChatGPT 每次
34、聊天成本約為幾美分每次聊天成本約為幾美分 資料來源:Twitter 行業深度報告行業深度報告 請務必參閱正文后面的信息披露和法律聲明 13/32 3、技術、產業、政策共振技術、產業、政策共振,AIGC 迎加速發展迎加速發展 AI 技術技術持續突破創新,引領持續突破創新,引領 AIGC 產業發展。產業發展。(1)算法模型方面)算法模型方面:2014 年以來,GAN、Transformer、Flow-based models、Diffusion models 等深度學習生成算法持續涌現,在自然語言處理(NLP)、計算機視覺(CV)等領域持續應用。比如谷歌的 BERT 和 LaMDA、OpenAI
35、的 GPT-3 預訓練模型均基于 Transformer 模型而來,為后續 ChatGPT 等應用的落地奠定基礎。圖圖19:AI 技術持續突破創新,引領技術持續突破創新,引領 AIGC 產業發展產業發展 資料來源:騰訊研究院(2)預訓練模型方面預訓練模型方面:2018 年,谷歌推出自然語言預訓練模型 BERT,AI 進入預訓練大模型時代。相比之前的生成模型,預訓練模型通過大數據和巨量參數的訓練,生成質量顯著提升,滿足下游場景對高精度、高質量的要求,成為了 AI 技術發展的范式變革,引發了 AIGC 產業的質變。在自然語言處理領域,大模型的自然語言理解能力超越了人類,并且體現出了超強的通用 AI
36、 能力。在計算機視覺領域,預訓練大模型的效果也超越了之前的監督學習方法,在視覺分類、圖像分割等任務中取得了很大提升,且表現出了強大的圖像理解能力。圖圖20:預訓練模型通過大數據和巨量參數的訓練,生成質量顯著提升預訓練模型通過大數據和巨量參數的訓練,生成質量顯著提升 資料來源:AI 大模型公眾號 行業深度報告行業深度報告 請務必參閱正文后面的信息披露和法律聲明 14/32(3)多模態技術方面)多模態技術方面:多模態技術是指將圖像、聲音、文字等多類型內容融合學習,比如將“人”這一文本與人的圖片聯系在一起。從單模態向多模態的發展,豐富了 AIGC 的內容,使 AIGC 應用更具有通用性,在視覺問答、
37、視覺推理等任務中取得了非常好的效果。比如 OpenAI DALL-E 和百度的文心 ERNIE ViLG,根據用戶輸入的文字即可生成出圖片。圖圖21:預訓練大模型從單預訓練大模型從單模態向多模態的發展模態向多模態的發展 資料來源:AI 大模型公眾號 AIGC 產業生態產業生態持續完善持續完善,已經進入產業落地的關鍵期已經進入產業落地的關鍵期。AIGC 產業鏈包括底層的芯片和數據服務支撐、基礎算法平臺以及下游的行業應用。圖圖22:AIGC 產業生態持續完善產業生態持續完善 資料來源:IDC 官網 行業深度報告行業深度報告 請務必參閱正文后面的信息披露和法律聲明 15/32(1)基礎算法平臺方面,
38、基礎算法平臺方面,預訓練大模型需要高成本和技術投入,具有較高的技術門檻,行業參與者主要為頭部科技企業和科研機構等,以及一些垂直場景的公司。(2)下游的行業應用下游的行業應用方方面,面,大模型的落地痛點在于成本高昂的通用大模型與下游垂直應用場景需求的不匹配。隨著 ChatGPT 熱度持續提升以及大廠的持續投入,有望直接刺激下游付費意愿提升,進一步加速 AIGC 應用落地和商業變現,AIGC 產業迎來發展良機。政策支持落地,政策支持落地,AIGC 有望迎來加速發展。有望迎來加速發展。2 月 13 日,北京市經信局表示:“支持頭部企業打造對標 ChatGPT 的大模型,著力構建開源框架和通用大模型的
39、應用生態。加強人工智能算力基礎設施布局。加速人工智能基礎數據供給。支持人工智能優勢企業在自動駕駛、智能制造、智慧城市等優勢領域開展創新應用,全面構筑人工智能場景創新高地”。北京經信局明確表示支持頭部企業打造對標 ChatGPT 的大模型,支持算力、數據、應用等相關產業協同發展,AIGC 行業從市場關注上升至政策支持層面。預計預計 2030 年年 AIGC 市場規模將達市場規模將達 1100 億美元。億美元。根據騰訊研究院發布的 AIGC發展趨勢報告,AIGC 在 AI 技術創新(生成算法、預訓練模型、多模態技術等)和產業生態(三層生態體系雛形已現)的支持下,有望步入發展快車道,預計 2030
40、年AIGC 市場規模將達 1100 億美元。行業深度報告行業深度報告 請務必參閱正文后面的信息披露和法律聲明 16/32 4、巨頭積極布局,產業落地加速巨頭積極布局,產業落地加速 4.1、微軟微軟:產品產品全線全線整合整合 ChatGPT,想象空間廣闊想象空間廣闊 微軟微軟與與 OpenAI 持續深度合作持續深度合作,是其獨家云服務供應商,是其獨家云服務供應商。2019 年 7 月,微軟對OpenAI 投資 10 億美元,OpenAI 將服務移植在 Microsoft Azure 上運行,微軟將成為 OpenAI 新技術商業化的首選合作伙伴。2020 年 9 月,微軟獲得 OpenAI 的 G
41、PT-3模型獨家授權,OpenAI 將繼續向公眾提供 API,只有微軟可以訪問 GPT-3 的底層代碼,并可以根據需要嵌入或修改模型。2023 年 1 月,微軟 Azure OpenAI 服務對外發布,企業客戶可以申請訪問 OpenAI 旗下 GPT-3.5、Codex 和 DALLE2 模型。圖圖23:微微軟與軟與 OpenAI 持續深度合作持續深度合作 資料來源:微軟官網 微軟微軟計劃計劃將將 ChatGPT 整合進所有產品。整合進所有產品。2023 年 2 月 2 日,微軟宣布旗下所有產品將全線整合 ChatGPT,進一步加大與 ChatGPT 合作。2023 年 2 月 7 日,微軟推
42、出引入 ChatGPT 技術的搜索引擎 New Bing 和瀏覽器 Edge。新 Bing 搜索欄升級為“向我提問吧”的對話框,用戶提出問題后,搜索引擎可以自動抓取關鍵內容并生成回答。行業深度報告行業深度報告 請務必參閱正文后面的信息披露和法律聲明 17/32 圖圖24:微軟微軟 ChatGPT 版版 Bing,可以自動抓取關鍵內容并,可以自動抓取關鍵內容并生成生成回答回答 資料來源:Bing ChatGPT 與搜索結合與搜索結合可可改善搜索體驗改善搜索體驗。ChatGPT 的對話模式對于用戶更有吸引力,由于訓練數據有限,同時真實性也無法得到保障,尚不具備替代搜索引擎的能力。ChatGPT 與
43、搜索結合,則可以結合搜索和聊天的有點,大幅改善搜索體驗。根據微軟的調研顯示,71%的用戶對 ChatGPT 版 Bing 滿意,搜索與 AI 技術協同作用顯著。根據 Statista 數據,截至 2022 年 12 月,Google、Bing 在搜索領域的市場份額分別為 84.08%、8.95%,微軟推出結合 ChatGPT 版新 Bing,具備先發優勢,未來市場份額有望提升。圖圖25:2022 年年 12 月月 Google、Bing 在搜索領域的市場份額分別為在搜索領域的市場份額分別為 84.08%、8.95%資料來源:Statista 行業深度報告行業深度報告 請務必參閱正文后面的信息披
44、露和法律聲明 18/32 4.2、谷歌谷歌:推出對標產品推出對標產品 Bard,或將與微軟正面競爭,或將與微軟正面競爭 2018 年年,谷歌推出自然語言預訓練模型谷歌推出自然語言預訓練模型 BERT。BERT(Bidirectional Encoder Representations from Transformers)和ChatGPT同樣以Transformers為基礎模型,BERT采用雙向編碼器表示技術,在理解上下文方面有更好的表現。數據方面,數據方面,BERT 訓練數據采用了開源語料 BooksCropus 以及英文維基百科數據,共有約 33 億個詞。參數參數方面,方面,基礎版本(bas
45、e)參數量為 1.1 億,大號版本(large)參數量達 3.4 億。訓練訓練方面,方面,大號版本 BERT 一次訓練需要 16 個 TPU 集群(約 64TPU)訓練 5 天。圖圖26:2018 年谷歌推出自然語言預訓練模型年谷歌推出自然語言預訓練模型 BERT 資料來源:BERT:Pre-training of Deep Bidirectional Transformers for Language Understanding 谷歌已將谷歌已將 BERT 模型用于改善搜索。模型用于改善搜索。BERT 模型可以借助某個單詞前后的詞來考慮其所處的完整語境,應用于搜索引擎后,更好的理解用戶搜索意
46、圖。2019 年,谷歌宣布將 BERT 模型應用于用于英文搜索,隨后又拓展至 70 余種語言,2020 年谷歌表示幾乎所有英文搜索應用了 BERT 模型。圖圖27:谷歌已將預訓練模型用于改善搜索谷歌已將預訓練模型用于改善搜索 資料來源:谷歌官網 2023 年年 2 月,谷歌推出對標月,谷歌推出對標 ChatGPT 的對話機器人的對話機器人 Bard。根據谷歌介紹,Bard是由 LaMDA 提供支持的全新實驗性對話谷歌 AI 服務,尋求將世界知識的廣度與谷歌大型語言模型的力量、智慧和創造力相結合。它利用來自網絡的信息提供最新、高質量的回復。行業深度報告行業深度報告 請務必參閱正文后面的信息披露和
47、法律聲明 19/32 圖圖28:2023 年年 2 月,谷歌推出月,谷歌推出對標對標 ChatGPT 的對話機器人的對話機器人 Bard 資料來源:谷歌官網 Bard 基于基于谷歌谷歌 LaMDA 模型模型,表現已接近人類水平,表現已接近人類水平。LaMDA 同樣以 transformer模型為基礎,預訓練數據庫由1.56萬億個單詞的文檔和對話構成,參數量最高達1370億,是 GPT-3 的 7.8 倍。根據谷歌的測試,經過微調后,LaMDA 已經在多個維度接近人類水平。目前谷歌聊天機器人 Bard 仍處于內測階段,尚未對外開放。圖圖29:Bard 基于谷歌基于谷歌 LaMDA 模型,表現已接
48、近人類水平模型,表現已接近人類水平 資料來源:谷歌官網 行業深度報告行業深度報告 請務必參閱正文后面的信息披露和法律聲明 20/32 未來谷歌未來谷歌AI技術將率先應用于搜索業務。技術將率先應用于搜索業務。在AI領域,谷歌已有LaMDA、PaLM、Imagen、MusicLM 等技術儲備,涵蓋語言、圖像、視頻和音頻領域,未來將陸續整合進公司旗下產品。谷歌表示,AI 技術將率先應用于搜索業務,自動提煉搜索結果便于了解全局。目前微軟已經推出整合 ChatGPT 版本的搜索引擎 NewBing,未來或將與谷歌展開正面競爭。圖圖30:未來谷歌未來谷歌 AI 技術將率先應用于搜索業務技術將率先應用于搜索
49、業務 資料來源:谷歌官網 行業深度報告行業深度報告 請務必參閱正文后面的信息披露和法律聲明 21/32 4.3、百度百度:AI 領域全棧布局,領域全棧布局,文心一言文心一言生態持續擴大生態持續擴大 百度是國內最有實力推出對標百度是國內最有實力推出對標 ChatGPT 產品的廠商之一。產品的廠商之一。百度在百度在 AI 領域深耕領域深耕數十年,數十年,在包括底層的芯片、深度學習框架、大模型以及最上層的搜索等應用人工智能四層架構中已形成全棧布局,擁有產業級知識增強文心大模型,具備跨模態、跨語言的深度語義理解與生成能力。(1)芯片:百度自)芯片:百度自研研 AI 芯片昆侖芯片昆侖芯芯 2 單卡算力達
50、單卡算力達 128TFLOPS。2018 年,百度在 AI 開發者大會上發布自主研發中國首款云端全功能 AI 芯片“昆侖芯”。2021年 8 月,百度第二代昆侖芯開始量產,昆侖芯 2 基于 7nm 制程,單卡算力達到128TFLOPS,較第一代性能提升 2-3 倍,可應用于計算機視覺、自然語言處理、大規模語音識別、大規模推薦等場景。第三代昆侖芯 3 將采用 4nm 制程,預計 2024年初量產。圖圖31:昆侖芯昆侖芯 2 單卡算力達單卡算力達 128TFLOPS 圖圖32:第三代昆侖芯第三代昆侖芯 3 將采用將采用 4nm 制程制程 資料來源:IT 之家 資料來源:中國日報(2)深度學習框架:
51、百度)深度學習框架:百度飛槳飛槳是國內是國內規模第一的深度學習框架和賦能平臺規模第一的深度學習框架和賦能平臺。飛槳(PaddlePaddle)是百度自主研發的開源深度學習平臺,包括深度學習核心框架、基礎模型庫、開發套件、工具組件以及服務平臺,支持超大規模深度學習模型訓練。截至 2022 年 1 月,飛槳平臺已匯聚 535 萬開發者,基于飛槳構建了 67 萬個模型,服務了 20 萬家企事業單位。圖圖33:百度飛槳是國內規模第一的深度學習框架和賦能平臺百度飛槳是國內規模第一的深度學習框架和賦能平臺 資料來源:百度飛槳公眾號 行業深度報告行業深度報告 請務必參閱正文后面的信息披露和法律聲明 22/3
52、2(3)大模型:百度)大模型:百度在大模型領域積累深厚,在大模型領域積累深厚,已發布已發布 4 類基礎通用大模型以及類基礎通用大模型以及 11個個行業大模型。行業大模型。百度文心包括 NLP 大模型、CV 大模型、跨模態大模型和生物計算四個基礎通用大模型;在行業領域,百度聯合不同領域行業頭部企業,已發布 11 個行業大模型,涵蓋涵蓋電力、燃氣、金融、航天、傳媒、城市、影視、制造、社科等領域,產業生態初步形成。ERNIE 擁有一系列可以執行各種功能的高級 LLM,而語言生成來自 ERNIE 3.0 Titan,其文本到圖像生成來自 ERNIE-ViLG。圖圖34:百度在大模型領域積累深厚百度在大
53、模型領域積累深厚 資料來源:Github 網站 圖圖35:百度已發布百度已發布 4 個基礎通用大模型以及個基礎通用大模型以及 11 個行業大模型個行業大模型 資料來源:百度飛槳官網 行業深度報告行業深度報告 請務必參閱正文后面的信息披露和法律聲明 23/32(4)產品和應用:)產品和應用:文心文心 ERNIE 大模型已在百度百余個產品中應用大模型已在百度百余個產品中應用。包括百度搜索中問題分類、網頁排序;Feed 流中的新聞推薦、新聞去重;好看視頻中的視頻推薦;百度地圖里的POI 檢索以及小度智能屏中的意圖理解等,都使用到了文心 ERNIE 大模型。圖圖36:文心文心 ERNIE 大模型已在百
54、度百余個產品中應用大模型已在百度百余個產品中應用 資料來源:谷歌官網 百度已文心一格百度已文心一格(AI 作畫)作畫)、文心百中、文心百中(產業搜索)(產業搜索)產品產品落地落地。文心一格是 AI藝術與輔助創作平臺,輸入關鍵詞即可生成畫作,降低內容生產成本。2022 年 11 月,百度推出大模型驅動的產業級搜索系統“文心百中”,由百度搜索與文心大模型聯合研制,命名寓意搜索結果精準,相比傳統搜索系統可減少人力成本 90%以上。圖圖37:百度推出百度推出 AI 作畫產品“文心一格”作畫產品“文心一格”圖圖38:百度推出百度推出產業級搜索系統“文心百中”產業級搜索系統“文心百中”資料來源:百度飛槳公
55、眾號 資料來源:百度飛槳公眾號 百度即將推出對標百度即將推出對標 ChatGPT 的的 AI 聊天聊天機器人機器人“文心一言”?!拔男囊谎浴?。2023 年 2 月,百度宣布即將推出類似 ChatGPT 的對話式 AI 工具“文心一言”(ERNIE Bot),文心一言是百度基于文心大模型技術推出的生成式對話產品,目前正處于內測階段,預計2023 年 3 月完成內測后向公眾開放。行業深度報告行業深度報告 請務必參閱正文后面的信息披露和法律聲明 24/32 圖圖39:百度即將推出對標百度即將推出對標 ChatGPT 的的 AI 聊天機器人“文心一言”聊天機器人“文心一言”資料來源:百度公眾號 文心一
56、言預計將建立在全球最大中文單體預訓練模型文心一言預計將建立在全球最大中文單體預訓練模型 ERNIE 3.0 Titan 之上。之上。2021 年 12 月,百度與鵬城自然語言處理聯合實驗室發布全球首個知識增強的千億AI 大模型ERNIE 3.0 Titan。ERNIE 3.0 Titan 擁有 2600 億的參數,參數量較 GPT-3的 1750 億多出 48.6%,在復雜知識推理能力上較 GPT-3 提升 8 個百分點。ERNIE 3.0 Titan 已在 60 多項的 NLP 任務上取得了世界領先,在 SuperGLUE 和 GLUE 都超過了人類排名第一的水平。圖圖40:ERNIE 具備
57、業界領先的復雜知識推理能力具備業界領先的復雜知識推理能力 資料來源:AI 大模型公眾號 技術層面,技術層面,ERNIE 3.0 基于飛槳 4D 混合并行技術,訓練時間可以節省 50%。算算力方面,力方面,ERNIE 3.0 基于“鵬城云腦 II”高性能集群訓練,“鵬城云腦 II”包括 4096顆 HUAWEI Ascend 910 AI 處理器和 2048 顆鯤鵬 920 CPU 處理器,可以提供 1E OPS智能算力,即不低于每秒 100 億億次操作的 AI 計算能力。行業深度報告行業深度報告 請務必參閱正文后面的信息披露和法律聲明 25/32 圖圖41:百度百度 ERNIE 3.0 可節省
58、可節省 50%訓練時間訓練時間 圖圖42:ERNIE 3.0 基于“鵬城云腦基于“鵬城云腦 II”高性能集群訓練”高性能集群訓練 資料來源:AI 大模型公眾號 資料來源:鵬城云腦官網“文心一言”“文心一言”生態圈持續擴大。生態圈持續擴大。2 月 17 日,百度集團執行副總裁、百度智能云事業群總裁沈抖宣布“文心一言”將通過百度智能云對外提供服務,會率先在內容和信息相關的行業和場景落地。目前已經有包括互聯網、媒體、金融、保險、汽車、企業軟件等行業的近 300 家企業宣布加入百度“文心一言”生態,生態圈持續擴大。上市公司方面,已有多家公司宣布成為文心一言首批生態合作伙伴,未來將優先接入文心一言的能力
59、,未來也將在垂直領域開展更多合作。表表3:“文心一言”生態圈持續擴大“文心一言”生態圈持續擴大 上市公司上市公司 合作內容合作內容 彩訊股份 公司是百度“文心一言”的首批生態合作伙伴,將優先接入“文心一言”的全面能力。同時公司與阿里、字節跳動分別在 5G 消息 CSP 管理平臺及數據智能、企業直播、AR 及視頻內容制作等方面有合作,未來也將進一步探討更多合作的可能。遠光軟件 公司宣布成為百度文心一言首批生態合作伙伴,將全面體驗并接入文心一言的能力。此舉標志著遠光軟件優先獲得領先 AI 技術的加持,未來將把成果應用于企業管理領域數字化轉型的業務場景中。銀之杰 公司已參與接入百度的“文心一言”首批
60、體驗。銀之杰將利用百度先進的智能對話技術和產品,打造更好的人工智能及 AIGC 產品和平臺。國光電器 公司是人工智能語音交互硬件的供應商,百度是公司的客戶,其中以智能音響為代表的 AI+IOT 產品是公司重點合作方向之一,公司密切關注 ChatGPT、文心一言等生成式 AI 技術在人機交互體驗上帶來的革命性升級 視覺中國 公司近期與百度旗下的 AI 作畫平臺文心一格將在創作者賦能和版權保護等方面展開多項合作,共探 AIGC 內容產業發展方向。北信源 公司在一些細分領域與百度具有合作關系。公司打造的跨終端、全方位、安全可信的通信聚合平臺-信源密信具有標準的 DDIO(服務端通訊中臺)開發接口能與
61、任何智能機器人進行快速對接,目前已實現 ChatGPT 對接,未來文心一言若支持開放對接,信源密信能實現與其進行快速對接。東軟集團 公司宣布成為百度文心一言首批生態合作伙伴。后續,東軟將全面體驗并接入文心一言的能力,應用百度領先的智能對話技術成果,打造更多 AI 賦能的產品與解決方案。宇信科技 公司作為百度在金融科技領域的合作伙伴,雙方將繼續探索在金融行業的發展機會,最近公司也被邀請作為百度中國版 ChatGPT“文心一言”的首批生態合作伙伴,將優先內測體驗并接入“文心一言”的相關能力,雙方一起探索在金融領域的解決方案。漢得信息 公司加入百度文心一言生態圈,并成為百度文心一言首批先行體驗官。通
62、過融合百度領先的智能對話技術成果,雙方將攜手推進 B 端人工智能深入應用,致力于幫助客戶更徹底地實現數字化轉型。致遠互聯 公司宣布成為百度文心一言(英文名:ERNIE Bot)首批生態合作伙伴。致遠互聯新一代協同運營平臺 COP 將全面體驗并接入文心一言的能力。作為百度文心一言首批生態合作伙伴,公司可優先內測試用文心一言,集成文心一言的技術能力。隨著致遠互聯與百度文心一言在產品研發等領域展開深化合作,將實現致遠互聯在對話機器人等產品的跨越升 行業深度報告行業深度報告 請務必參閱正文后面的信息披露和法律聲明 26/32 上市公司上市公司 合作內容合作內容 級,加速推動“協同+AI”快速發展,為企
63、業提供協同運營全場景人工智能解決方案及服務,引領協同管理行業變革與升級。航天宏圖 公司宣布成為百度文心一言首批生態合作伙伴。后續,航天宏圖將全面體驗并接入文心一言的能力。公司將把百度領先的智能對話技術成果應用在衛星遙感領域。此舉標志著航天宏圖優先獲得領先 AI 技術的加持,也標志著對話式語言模型技術在 PIE-Engine 時空遙感云平臺及各行業衛星應用場景中的首次著陸。資料來源:各公司官網、開源證券研究所 行業深度報告行業深度報告 請務必參閱正文后面的信息披露和法律聲明 27/32 4.4、國內其他巨頭也紛紛布局,產業落地加速國內其他巨頭也紛紛布局,產業落地加速 2023年年2月以來,國內巨
64、頭紛紛布局月以來,國內巨頭紛紛布局AIGC產業。產業。京東宣布推出產業版“ChatJD”,應用路線圖包括一個平臺、兩個領域(零售和金融)、五個應用(內容生成、人機對話、用戶意圖理解、信息抽取、情感分類)。阿里類 ChatGPT 產品目前也處于內測階段,會與釘釘產品結合。國內具有豐富應用場景和數據積累,破局之路在于產業鏈國內具有豐富應用場景和數據積累,破局之路在于產業鏈的協同,隨著國內巨頭的紛紛投入,有望帶動的協同,隨著國內巨頭的紛紛投入,有望帶動 AIGC 相關產業鏈加速發展。相關產業鏈加速發展。京東京東:宣布推出產業版“:宣布推出產業版“ChatJD”?!?。ChatJD 將以“125”計劃作
65、為落地應用路線圖,包含一個平臺、兩個領域、五個應用。1 個平臺指 ChatJD 智能人機對話平臺,即自然語言處理中理解和生成任務的對話平臺,預計參數量達千億級。2 個領域包含零售與金融領域。5 個應用包含內容生成、人機對話、用戶意圖理解、信息抽取、情感分類,涵蓋零售和金融行業復用程度最高的應用場景。圖圖43:京東宣布推出產業版“京東宣布推出產業版“ChatJD”資料來源:京東云公眾號 阿里:阿里:阿里類阿里類 ChatGPT 產品目前也處于內測階段。產品目前也處于內測階段。2021 年,阿里巴巴達摩院先后發布多個版本的多模態及語言大模型,在超大模型、低碳訓練技術、平臺化服務、落地應用等方面實現
66、突破。達摩院團隊使用相對較少算力即實現 10 萬億參數大模型 M6,同等參數規模能耗僅為此前業界標桿的 1%,降低了大模型訓練門檻。阿里巴巴通義大模型系列已在超過 200 個場景中提供服務,實現了 2%10%的應用效果提升,典型使用場景包括電商跨模態搜索、AI 輔助設計、開放域人機對話、法律文書學習、醫療文本理解等。行業深度報告行業深度報告 請務必參閱正文后面的信息披露和法律聲明 28/32 圖圖44:阿里阿里多模態大模型多模態大模型 M6 參數規模參數規模達達 10 萬億萬億 資料來源:阿里公眾號 騰訊:專項研究有序推進。騰訊:專項研究有序推進。騰訊目前在 AI 大模型、機器學習算法以及 N
67、LP 等領域擁有技術儲備,并表示在 ChatGPT 相關方向上已有布局,專項研究也在有序推進中。2022 年 4 月,騰訊對外正式宣布,騰訊“混元”AI 大模型在 MSR-VTT、MSVD、LSMDC、DiDeMo 和 ActivityNet 五大跨模態視頻檢索數據集榜單中先后取得第一名的成績,實現了該領域的大滿貫。在 MSR-VTT 榜單上,“混元”AI 大模型將文字-視頻檢索精度提高到 55%,領先第二名 1.7%,位居行業第一??拼笥嶏w:科大訊飛:5 月將推出月將推出 AI 學習機產品。學習機產品。公司在自然語言處理領域的具備深厚積累,主導承建了認知智能全國重點實驗室,是科技部首批 20
68、 家標桿全國重點實驗室之一,在 CommonsenseQA 2.0、OpenBookQA 等 12 項認知智能領域權威評測中排名第一。目前,在認知智能領域,公司已陸續開源了 6 大類、超過 40 個通用領域的系列中文預訓練語言模型,成為業界最廣泛流行的中文預訓練模型系列之一。公司表示 Al 學習機、訊飛聽見等將成為公司類 ChatGPT 技術率先落地的產品,將于 2023年 5 月發布。圖圖45:科大訊飛已科大訊飛已開源了開源了 6 大類、超過大類、超過 40 個通用領域的中文預訓練語言模型個通用領域的中文預訓練語言模型 資料來源:科大訊飛公眾號 行業深度報告行業深度報告 請務必參閱正文后面的
69、信息披露和法律聲明 29/32 5、投資建議投資建議 國內具有豐富應用場景和數據積累,隨著巨頭的紛紛投入,有望帶動 AIGC 相關產業鏈加速發展,建議積極關注。(1)算法和場景領域算法和場景領域受益標的包括科大訊飛、三六零、拓爾思、金山辦公、福昕軟件、同花順、萬興科技、格靈深瞳、云從科技,(2)數據領域數據領域受益標的包括海天瑞聲,(3)算力及芯片領域算力及芯片領域受益標的包括浪潮信息、中科曙光、寒武紀、景嘉微。表表4:受益標的盈利預測和估值受益標的盈利預測和估值 證券代碼 公司簡稱 市值(億元)2023/2/20 歸母凈利潤(億元)PE 評級評級 2022E 2023E 2024E 2022
70、E 2023E 2024E 002230.SZ 科大訊飛 1,177 20.36 27.08 35.84 57.82 43.47 32.85 買入 601360.SH 三六零 849 -24.78 4.07 9.56 -34.26 208.57 88.79 買入 300229.SZ 拓爾思 168 3.19 4.10 5.21 52.54 40.88 32.17 買入 688095.SH 福昕軟件 61 1.46 2.00 2.64 41.62 30.38 23.02 買入 300033.SZ 同花順 662 17.25 21.18 25.93 38.36 31.25 25.52 買入 300
71、624.SZ 萬興科技 70 0.99 1.57 2.04 70.67 44.67 34.36 買入 688207.SH 格靈深瞳 73 -0.13 0.33 0.78 -578.71 217.10 93.44 未評級 688327.SH 云從科技 240 -4.06 -5.23 -0.37 -59.11 -45.80 -647.79 未評級 688787.SH 海天瑞聲 85 0.21 0.52 1.00 410.05 161.63 84.51 未評級 000977.SZ 浪潮信息 542 24.74 30.27 36.89 21.92 17.92 14.70 買入 603019.SH 中科
72、曙光 433 16.03 21.66 29.06 27.02 20.00 14.91 買入 688256.SH 寒武紀 342 -11.18 -7.14 -3.81 -30.58 -47.88 -89.79 未評級 300474.SZ 景嘉微 340 2.89 4.23 5.77 117.81 80.39 58.93 增持 數據來源:Wind、開源證券研究所(科大訊飛、三六零、拓爾思、福昕軟件、同花順、浪潮信息、中科曙光盈利預測來自開源證券研究所,萬興科技、格靈深瞳、云從科技、海天瑞聲、寒武紀、景嘉微盈利預測來自 Wind 一致預期)行業深度報告行業深度報告 請務必參閱正文后面的信息披露和法律
73、聲明 30/32 6、風險提示風險提示 技術發展不及預期;商業落地不及預期;政策支持不及預期。行業深度報告行業深度報告 請務必參閱正文后面的信息披露和法律聲明 31/32 特別特別聲明聲明 證券期貨投資者適當性管理辦法、證券經營機構投資者適當性管理實施指引(試行)已于2017年7月1日起正式實施。根據上述規定,開源證券評定此研報的風險等級為R3(中風險),因此通過公共平臺推送的研報其適用的投資者類別僅限定為專業投資者及風險承受能力為C3、C4、C5的普通投資者。若您并非專業投資者及風險承受能力為C3、C4、C5的普通投資者,請取消閱讀,請勿收藏、接收或使用本研報中的任何信息。因此受限于訪問權限
74、的設置,若給您造成不便,煩請見諒!感謝您給予的理解與配合。分析師承諾分析師承諾 負責準備本報告以及撰寫本報告的所有研究分析師或工作人員在此保證,本研究報告中關于任何發行商或證券所發表的觀點均如實反映分析人員的個人觀點。負責準備本報告的分析師獲取報酬的評判因素包括研究的質量和準確性、客戶的反饋、競爭性因素以及開源證券股份有限公司的整體收益。所有研究分析師或工作人員保證他們報酬的任何一部分不曾與,不與,也將不會與本報告中具體的推薦意見或觀點有直接或間接的聯系。股票投資評級說明股票投資評級說明 評級評級 說明說明 證券評級證券評級 買入(Buy)預計相對強于市場表現 20%以上;增持(outperf
75、orm)預計相對強于市場表現 5%20%;中性(Neutral)預計相對市場表現在5%5%之間波動;減持(underperform)預計相對弱于市場表現 5%以下。行業評級行業評級 看好(overweight)預計行業超越整體市場表現;中性(Neutral)預計行業與整體市場表現基本持平;看淡(underperform)預計行業弱于整體市場表現。備注:評級標準為以報告日后的 612 個月內,證券相對于市場基準指數的漲跌幅表現,其中 A 股基準指數為滬深 300 指數、港股基準指數為恒生指數、新三板基準指數為三板成指(針對協議轉讓標的)或三板做市指數(針對做市轉讓標的)、美股基準指數為標普 50
76、0 或納斯達克綜合指數。我們在此提醒您,不同證券研究機構采用不同的評級術語及評級標準。我們采用的是相對評級體系,表示投資的相對比重建議;投資者買入或者賣出證券的決定取決于個人的實際情況,比如當前的持倉結構以及其他需要考慮的因素。投資者應閱讀整篇報告,以獲取比較完整的觀點與信息,不應僅僅依靠投資評級來推斷結論。分析、估值方法的局限性說明分析、估值方法的局限性說明 本報告所包含的分析基于各種假設,不同假設可能導致分析結果出現重大不同。本報告采用的各種估值方法及模型均有其局限性,估值結果不保證所涉及證券能夠在該價格交易。行業深度報告行業深度報告 請務必參閱正文后面的信息披露和法律聲明 32/32 法
77、律聲明法律聲明 開源證券股份有限公司是經中國證監會批準設立的證券經營機構,已具備證券投資咨詢業務資格。本報告僅供開源證券股份有限公司(以下簡稱“本公司”)的機構或個人客戶(以下簡稱“客戶”)使用。本公司不會因接收人收到本報告而視其為客戶。本報告是發送給開源證券客戶的,屬于商業秘密材料,只有開源證券客戶才能參考或使用,如接收人并非開源證券客戶,請及時退回并刪除。本報告是基于本公司認為可靠的已公開信息,但本公司不保證該等信息的準確性或完整性。本報告所載的資料、工具、意見及推測只提供給客戶作參考之用,并非作為或被視為出售或購買證券或其他金融工具的邀請或向人做出邀請。本報告所載的資料、意見及推測僅反映
78、本公司于發布本報告當日的判斷,本報告所指的證券或投資標的的價格、價值及投資收入可能會波動。在不同時期,本公司可發出與本報告所載資料、意見及推測不一致的報告??蛻魬斂紤]到本公司可能存在可能影響本報告客觀性的利益沖突,不應視本報告為做出投資決策的唯一因素。本報告中所指的投資及服務可能不適合個別客戶,不構成客戶私人咨詢建議。本公司未確保本報告充分考慮到個別客戶特殊的投資目標、財務狀況或需要。本公司建議客戶應考慮本報告的任何意見或建議是否符合其特定狀況,以及(若有必要)咨詢獨立投資顧問。在任何情況下,本報告中的信息或所表述的意見并不構成對任何人的投資建議。在任何情況下,本公司不對任何人因使用本報告中
79、的任何內容所引致的任何損失負任何責任。若本報告的接收人非本公司的客戶,應在基于本報告做出任何投資決定或就本報告要求任何解釋前咨詢獨立投資顧問。本報告可能附帶其它網站的地址或超級鏈接,對于可能涉及的開源證券網站以外的地址或超級鏈接,開源證券不對其內容負責。本報告提供這些地址或超級鏈接的目的純粹是為了客戶使用方便,鏈接網站的內容不構成本報告的任何部分,客戶需自行承擔瀏覽這些網站的費用或風險。開源證券在法律允許的情況下可參與、投資或持有本報告涉及的證券或進行證券交易,或向本報告涉及的公司提供或爭取提供包括投資銀行業務在內的服務或業務支持。開源證券可能與本報告涉及的公司之間存在業務關系,并無需事先或在
80、獲得業務關系后通知客戶。本報告的版權歸本公司所有。本公司對本報告保留一切權利。除非另有書面顯示,否則本報告中的所有材料的版權均屬本公司。未經本公司事先書面授權,本報告的任何部分均不得以任何方式制作任何形式的拷貝、復印件或復制品,或再次分發給任何其他人,或以任何侵犯本公司版權的其他方式使用。所有本報告中使用的商標、服務標記及標記均為本公司的商標、服務標記及標記。開開源證券源證券研究所研究所 上海上海 深圳深圳 地址:上海市浦東新區世紀大道1788號陸家嘴金控廣場1號 樓10層 郵編:200120 郵箱: 地址:深圳市福田區金田路2030號卓越世紀中心1號 樓45層 郵編:518000 郵箱: 北京北京 西安西安 地址:北京市西城區西直門外大街18號金貿大廈C2座9層 郵編:100044 郵箱: 地址:西安市高新區錦業路1號都市之門B座5層 郵編:710065 郵箱: