《計算機行業深度研究:“文心一言”發布國內應用預計加速-230316(16頁).pdf》由會員分享,可在線閱讀,更多相關《計算機行業深度研究:“文心一言”發布國內應用預計加速-230316(16頁).pdf(16頁珍藏版)》請在三個皮匠報告上搜索。
1、 敬請參閱最后一頁特別聲明 1 投資邏輯 百度于 2023 年 3 月 16 日召開關于“文心一言”的主題發布會,“文心一言”作為國內首款正式發布的生成式語言大模型,擁有文學創作、商業文案創作、數理邏輯推算、中文理解、多模態生成等功能。文心平臺依托于百度自研的產業級深度學習平臺飛槳(PaddlePaddle)打造,致力于為用戶提供一站式 AI 開發服務:AI 大模型與行業大模型:文心平臺提供 NLP、CV、跨模態、生物計算四大主流 AI 研究領域的多個基礎大模型,多個模型在技術層面實現突破創新,處于世界領先水平。其中,NLP 領域的 ERNIE 3.0 Zeus 采用自回歸網絡和自編碼網絡,能
2、夠兼顧自然語言理解和生成功能;CV 領域的 VIMER-UFO 2.0 使用超網絡結構,推理時僅需激活總參數量的 1/30;ERNIE-ViLG 2.0 引入基于語言和圖像的知識增強算法,在文本圖像生成任務中的表現已經超越了 OpenAI 旗下的 DALLE-2。文心平臺與各行業企業聯手打造行業大模型,目前已覆蓋能源、金融、航天、制造、傳媒、城市、社科、電影等 8 個領域。目前已有 650 余家知名企業宣布接入“文心一言”,涵蓋企業服務、金融 IT、汽車、傳媒、教育、家電、金融等 10 余個行業。一站式開發平臺與開發工具:開發平臺方面,文心面向專業知識有限的 AI 應用開發者提供零門檻平臺 E
3、asyDL,面向專業開發者提供全功能平臺 BML。目前這兩個平臺均僅支持使用百度文心的云端算力,可采用公有云、私有化離線、軟硬一體等部署方式。開發工具方面,文心提供 ERNIEKit 自然語言處理開發工具及 PaddleFleetX全流程開發套件。此外,現階段文心平臺還向開發者免費提供大模型 API。產品與社區:百度文心通過構建產品與社區經營,對外展示生成式模型的強大性能,以此吸引愛好者投入創作,進而構筑成熟的 AIGC 社區,可在實踐中探索 AI 商業化模式。目前除“文心一言”外,文心平臺提供產業級搜索系統“文心百中”、藝術創意輔助平臺“文心一格”,以及采用眾創模式的旸谷社區。目前百度文心生
4、成式語言大模型在參數規模、技術創新、應用落地方面均在國內同業中處于領先水平。3 月 16 日起,“文心一言”首批用戶可通過邀請測試碼接入體驗,同時百度智能云將面向企業客戶開放“文心一言”API 調用接口,有望進一步豐富百度 AI 生態,賦能更多行業伙伴。投資建議 相較于 ChatGPT 等海外模型存在連接限制,百度文心平臺可以為國內用戶提供更便捷的技術入口?!拔男囊谎浴钡陌l布將極大加速國內生成式 AI 模型的落地應用節奏,有望幫助生態伙伴實現用戶體驗提升和生產降本增效。建議關注接入“文心一言”生態的公司,如恒生電子、用友網絡、漢得信息、凌志軟件、宇信科技等。風險提示 海外基礎軟硬件使用受限;應
5、用落地不及預期;行業競爭加劇風險。行業深度研究 敬請參閱最后一頁特別聲明 2 內容目錄內容目錄 1.百度文心平臺可提供一站式 AI 開發服務.3 2.文心平臺提供四大主流領域 AI 大模型及行業大模型.3 3.文心平臺提供一站式開發平臺與工具.9 4.文心平臺提供搜索、創作等產品.12 5.國內其他生成式語言模型.14 6.投資建議.14 7.風險提示.14 圖表目錄圖表目錄 圖表 1:百度文心平臺全景圖.3 圖表 2:文心 NLP 大模型可支持語言理解、語言生成等功能.3 圖表 3:ERNIE 3.0 Zeus 創新性地提出知識增強方法.4 圖表 4:文心 NLP 大模型技術演進可劃分為 3
6、 條主線.5 圖表 5:文心 CV 大模型可支持一站式視覺任務定制和應用服務.5 圖表 6:VIMER-UFO 2.0 采用超網絡結構.6 圖表 7:文心跨模態大模型支持多場景應用.6 圖表 8:ERNIE-ViLG 2.0 模型引入知識增強算法.7 圖表 9:文心生物大模型在多任務中已達到世界領先水平.7 圖表 10:文心行業大模型擁有豐富的合作案例.7 圖表 11:文心行業大模型融合知識增強技術.8 圖表 12:已有 650 余家公司接入百度“文心一言”.9 圖表 13:EasyDL 提供一站式零代碼 AI 模型開發.10 圖表 14:EasyDL 可支持多場景任務.10 圖表 15:BM
7、L 全功能 AI 開發平臺架構概覽.11 圖表 16:EasyDL 與 BML 提供的模型部署方式.11 圖表 17:EasyDL 與 BML 提供的模型部署方式.11 圖表 18:百度文心提供大模型 API.12 圖表 19:文心百中使用流程簡單.13 圖表 20:文心一格收費價格 0.2-0.8 元/張.13 圖表 21:旸谷社區部分創意應用.13 圖表 22:國內主流生成式語言模型對比.14 qQoPYUdUaYcWvZcVzW8OaO8OoMqQmOtQfQpPmPlOoPpQbRpPwPxNtRmPvPoOtN行業深度研究 敬請參閱最后一頁特別聲明 3 1.百度文心平臺可提供一站式
8、AI 開發服務 百度于 2023 年 3 月 16 日召開關于“文心一言”的主題發布會,“文心一言”作為國內首款正式發布的生成式語言大模型,可支持文學創作、商業文案創作、數理邏輯推算、中文理解、多模態生成等功能。文心平臺依托于百度自主研發的產業級深度學習平臺飛槳(PaddlePaddle)打造,集先進的全領域 AI 大模型、全面的 AI 算法集、端到端開發套件和平臺化服務于一體,致力為用戶提供一站式 AI 開發服務。圖表圖表1:百度文心平臺全景圖百度文心平臺全景圖 來源:百度文心,國金證券研究所 2.文心平臺提供四大主流領域 AI 大模型及行業大模型 文心大模型是百度文心平臺的核心,包括自然語
9、言處理(NLP)、計算機視覺(CV)、跨模態、生物計算四個主流 AI 研究領域下的多個基礎大模型,此外百度文心還基于基礎大模型與各行業企業深度合作、通過學習行業特色數據與知識而形成多個行業大模型。2.1 文心文心 NLP 大模型大模型 文心 NLP 大模型是百度文心著重布局的領域,其主要面向語言理解、語言生成等 NLP 場景,包含一系列在功能和應用場景上各有側重的語言大模型。圖表圖表2:文心文心NLP大模型大模型可支持語言理解、語言生成等功能可支持語言理解、語言生成等功能 模型名稱模型名稱 應用場景應用場景 特點特點 ERNIE 3.0 Zeus 問答、智能創作、情感分析等各類自然語言理解和生
10、成任務 文心旗下最先進的自然語言大模型,參數規模達千億級,創新地采用知識增強方法。在各類真實場景的生成準確性、流暢性、相關性上全面領先業界其他大模型。ERNIE 3.0 Tiny 各類自然語言理解和生成任務 ERNIE 3.0 的輕量級版本,應用模型壓縮技術大幅降低了推理算力需求,在效果和 ERNIE 3.0 持平的情況下獲得數十倍至上百倍的速度提升。ERNIE-Finance 金融場景相關的NLP任務 在海量金融領域文本和通用文本上進行訓練,具備豐富的金融領域知識,在金融問答,金融信息抽取等任務上表現較好 ERNIE-Health 醫療場景相關的NLP任務 學習了海量的醫療專業術語和醫療專業
11、問答數行業深度研究 敬請參閱最后一頁特別聲明 4 模型名稱模型名稱 應用場景應用場景 特點特點 據,以超越人類醫學專家水平的成績登頂中文醫療信息處理權威榜單 CBLUE ERNIE-Code 自然語言代碼生成 采用多語言多任務聯合訓練的方式,支持 100 多種自然語言和 15 種編程語言。ERNIE-UIE 產品反饋分析、服務質量評測、輿情監測等信息抽取場景 用戶可以使用自然語言自定義抽取目標,無需訓練即可抽取輸入文本中的對應信息。ERNIE-M 跨語言的各類任務 突破了語料規模對多語言模型的學習效果限制,能夠從單語語料中學習語言間的語義對齊關系 ERNIE-Search 檢索場景的多種任務
12、以領先搜索能力登頂段落排序榜單 MS-MARCO。ERNIE-Sage 搜索、推薦、問答等任務 能夠同時對文本語義與圖結構信息進行建模,顯著提升了其在推薦場景的表現 PLATO 對話場景 全球首個基于隱變量方式對話大模型,具備接近真人水平的多輪流暢對話能力,對話效果達到世界領先水平 來源:百度文心,國金證券研究所 ERNIE 3.0 Zeus 是目前百度文心旗下最先進的自然語言大模型,發布于 2022 年 5 月。在架構設計上,ERNIE 3.0 Zeus 采用 Transformer 作為骨干網絡,并創新性地融合了自并創新性地融合了自回歸網絡和自編碼網絡回歸網絡和自編碼網絡,使得模型同時具備
13、了自然語言理解和自然語言生成能力。目前,以 ChatGPT 為首的大規模生成式預訓練語言模型均僅基于自回歸網絡進行訓練,導致這類模型在自然語言理解任務上表現較弱。在模型訓練上,ERNIE 3.0 Zeus 在 GPT-3 等傳統大規模語言模型上做出了突破,創新性地提出了知識增強方法,在海量文本數據之外,將大規模知識圖譜也引入模型訓練過程,并持續對百余種不同形式的任務數據進行學習,實現了任務知識增強。相比于僅使用文本數據進行訓練的傳統大規模生成式預訓練語言模型,ERNIE 3.0 Zeus 對常識知識掌握更好,具備更強的知識推理能力。圖表圖表3:ERNIE 3.0 Zeus創新性地提出知識增強方
14、法創新性地提出知識增強方法 來源:百度文心,國金證券研究所 文心 NLP 大模型在技術演進上可以劃分為 ERNIE 模型迭代、在多模態領域的進展、PLATO 模型迭代三條主線。主線一:文心 ERNIE 的版本迭代。一方面,從 2019 年的文心 ERNIE1.0 到 2022年的 ERNIE 3.0 Zeus 的版本迭代中,文心 NLP 大模型在參數規模上實現了指數級行業深度研究 敬請參閱最后一頁特別聲明 5 增長,最新的 ERNIE 3.0 Zeus 在參數規模上已與國際先進水平到達同一量級。另一方面,百度文心在 NLP 大模型研發的四年中,創新性地提出了知識增強方法,這使文心 NLP 大模
15、型具備比 ChatGPT 等同類語言模型更強的常識掌握和知識推理能力,并在 SuperGLUE 和 GLUE 等復雜語言理解榜單中多次登頂。主線二:文心 ERNIE 在跨模態、跨語言任務方面的進步。一方面,跨語言學習任務的突破打破了語料規模對多語言模型的學習效果限制。長久以來,互聯網中存在的高質量中文文本數據顯著低于英文文本,跨語言學習使得模型可以從英文數據中學習到適用于中文文本的語言聯系,大大降低了模型訓練對海量中文訓練數據的要求。另一方面,跨模態學習任務的突破為百度文心 NLP 大模型的發展奠定了良好的技術基礎。百度文心在 ERNIE-Sage 首次對圖結構進行了學習,使 AI 模型獲得了
16、同時學習文本信息和圖結構的能力。知識增強技術是百度文心 NLP 大模型的核心技術路線之一,而知識圖譜作為知識增強技術的實現方式同樣采用圖結構??缒B學習任務的突破將推動百度文心知識增強方法的演進,未來有望實現圖結構和文本信息對齊,使得 AI 具備常識掌握能力。主線三:對話生成大模型文心 PLATO 迭代演進。一方面,從 2019 年的 PLATO 到2021 年的 PLATOXL,文心語言大模型實現了參數規模的迅猛增長,這使得文心語言大模型的智能水平出現了較為顯著的提高。另一方面,PLATO 在技術路線上創新性的采用了基于隱變量的模型構建方式,使得模型在不降低魯棒性的前提下,開放域對話生成能力
17、進一步增強。圖表圖表4:文心文心NLP大模型技術演進大模型技術演進可劃分為可劃分為3條主線條主線 來源:百度文心,AI 大模型公眾號,國金證券研究所 2.2 文心文心 CV 大模型大模型 文心 CV 大模型基于領先的視覺技術,利用海量的圖像、視頻等數據訓練,致力于為企業和開發者提供強大的計算機視覺基礎模型,以及一站式視覺任務定制與應用服務。圖表圖表5:文心文心CV大模型大模型可支持一站式視覺任務定制和應用服務可支持一站式視覺任務定制和應用服務 模型名稱模型名稱 應用場景應用場景 特點特點 VIMER-UFO 2.0 智慧城市 視覺多任務統一大模型,可針對特定任務抽取輕量級小模型,兼顧大模型效果
18、和小模型推理性能,能夠有效減少推理算力消耗,易于落地部署 VIMER-CAE 圖像分類、圖像檢測、圖像分割 先進的視覺自監督預訓練模型,在圖像分類、目標檢測、語義分割等達到世界領先水平 VIMER-StrucTexT 2.0 OCR 文字識別 端到端文檔 OCR 表征學習預訓練模型,在 5 項不同文檔圖像理解任務上刷新記錄 VIMER-UMS 商品識別、多模態搜索與推薦、零售快消數字化等 基于海量的互聯網商品圖文信息訓練,顯著改善商品視覺檢索和商品多模態檢索體驗 來源:百度文心,國金證券研究所 VIMER-UFO 2.0 是目前百度文心旗下最先進的視覺大模型,其創新性的提出了視覺多任行業深度研
19、究 敬請參閱最后一頁特別聲明 6 務的超網絡與訓練方案,使模型無需對下游任務進行微調,便可直接應用處理多個任務,以智慧城市場景為例,VIMER-UFO 2.0 可以用單模型實現人臉識別、人體和車輛多重識別等場景任務。VIMER-UFO 2.0 在底層架構上采用超網絡結構,超網絡結構是一種稀疏神經網絡,模型在進行推理時只需激活對應的部分參數,為每個獨立任務自動分配各自特定的參數路徑和共享路段,可有效減少推理算力消耗。VIMER-UFO 2.0 模型參數為 170 億,而在進行任務推理時只需激活部分參數,實際計算量僅約為 6 億參數,加速比接近 30 倍。圖表圖表6:VIMER-UFO 2.0采用
20、超網絡結構采用超網絡結構 來源:百度文心,國金證券研究所 超網絡的結構設計還使得模型具備靈活、可伸縮的彈性部署能力,當用戶僅需處理單個場景任務時,可以根據具體任務獨立抽取對應的子網絡進行部署,而無需部署完整大模型,大大降低了 AI 的落地成本。2.3 文心跨模態大模型文心跨模態大模型 文心跨模態大模型基于知識增強技術,對跨模態語義信息理解較好,可實現跨模態檢索、圖文生成、圖片文檔的信息抽取等跨模態場景應用的快速搭建,助力 AI 技術產業化落地。圖表圖表7:文心文心跨模態大模型支持多場景應用跨模態大模型支持多場景應用 模型名稱模型名稱 應用場景應用場景 特點特點 ERNIE-ViLG 2.0 圖
21、像生成、藝術創作、虛擬現實、AI 輔助設計等 百度文心旗下最先進的 AI 畫圖模型,在文本生成圖像任務中刷新世界最好效果 ERNIE-ViL 視覺常識推理、視覺問答、跨模態檢索、引用表達式理解等 業界首個融合場景圖知識的多模態預訓練模型,在多項經典多模態任務中刷新了世界紀錄 ERNIE-Layout 文檔分類、信息抽取、文檔問答等 采用文檔布局知識增強技術,在 4 項文檔理解任務上刷新世界紀錄 ERNIE-SAT 語音編輯、語音生成、語音克隆等語言-文本跨模態場景 采用語音-文本聯合訓練,同時支持中文和英文 ERNIE-GeoL 地理-語言跨模態場景 模型充分學習地理和語言之間的關聯,已在百度
22、地圖 POI 檢索等場景實現落地 來源:百度文心,國金證券研究所 文心跨模態大模型繼承了文心語言大模型的技術路線,將知識增強算法引入跨模態大模型中,使模型具備了更加精確的語義理解能力。其中,ERNIE-ViLG 2.0 作為百度文心旗下行業深度研究 敬請參閱最后一頁特別聲明 7 最先進的 AI 畫圖模型,基于混合降噪專家網絡構建,在圖像生成中的不同階段選擇不同的專家網絡,有效地解決了 AI 作圖中不同階段對模型能力要求不一致的問題。ERNIE-ViLG 2.0 還引入了基于語言和圖像知識的知識增強算法,使模型更關注圖像與文本中的主體要素,大大提升了生成圖像的質量。ERNIE-ViLG 2.0
23、在文本圖像生成任務中表現已超越了 OpenAI 于 2022 年 4 月推出的 DALL-E 2。圖表圖表8:ERNIE-ViLG 2.0模型模型引入知識增強算法引入知識增強算法 來源:百度文心,國金證券研究所 2.4 文心生物計算大模型文心生物計算大模型 文心生物計算大模型融合了自監督和多任務學習方法,將生物領域中化合物分子、蛋白分子等研究對象的特性融入模型,構建了先進的生物計算領域預訓練模型,有望賦能生物醫藥行業。圖表圖表9:文心文心生物生物大模型大模型在多任務中已達到世界領先水平在多任務中已達到世界領先水平 模型名稱模型名稱 應用場景應用場景 特點特點 HelixGEM-2 小分子藥物研
24、發 業界首個考慮原子間多體交互、長程相互作用的模型,在量子化學屬性預測和虛擬篩選雙場景上達到領先效果 HelixFold-Single 蛋白質結構預測 業界首個開源的基于單序列語言模型的蛋白結構預測大模型,預測效果達世界領先水平 HelixFold 蛋白質結構預測 全國產化軟硬件適配的高效蛋白質結構分析大模型,在精度持平的情況下,模型性能顯著優于 AlphaFold 來源:百度文心,國金證券研究所 HelixGEM-2 是業界首個考慮原子間多體交互、長程相互作用的模型,創新性地采用多軌機制對化合物的不同階的多體集合進行長程建模,在量子化學屬性預測和虛擬篩選雙場景上達到領先效果。2021 年 1
25、1 月,百度文心與國際知名生物制藥公司賽諾菲達成合作協議,賽諾菲將利用百度文心生物計算平臺在生物計算領域相關技術,優化與加速 mRNA 疫苗和藥物的設計研發工作。2.5 文心行業大模型文心行業大模型 文心行業大模型是文心大模型與各行業企業聯手,在通用大模型的基礎上學習行業特色數據與知識,建立的具有行業特色的 AI 基礎設施。目前,文心行業大模型已成功與 11 家企業或部門完成合作,各自形成了具有行業特色、性能優良、有落地潛力的行業大模型,涵蓋能源、金融、航天、制造、傳媒、城市、社科、電影 8 個行業領域。圖表圖表10:文心行業大模型文心行業大模型擁有豐富的擁有豐富的合作案例合作案例 合作案例合
26、作案例 行業行業 合作對象合作對象 應用場景應用場景 國網-百度文心 能源電力 國家電網 設備技術標準知識庫、電力知識問答系統、電力文檔智能分析等多個能源行業應用場景 行業深度研究 敬請參閱最后一頁特別聲明 8 合作案例合作案例 行業行業 合作對象合作對象 應用場景應用場景 浦發-百度文心 金融 浦發銀行 智能對話、智能文檔分析、智能雙錄等多個金融行業應用場景 航天-百度文心 航天 中國航天與探月工程 航天故障部位信息抽取、航天工程文獻情報分類、航天技術文獻檢索與摘要生成等多個航天領域應用場景 人民網-百度文心 傳媒 人民網 新聞內容分類、新聞情感分析、新聞摘要生成等多個媒體場景 冰城-百度文
27、心 城市管理 哈爾濱市政府 市長熱線工單分類、投訴工單信息抽取 電影頻道-百度文心 電影 中央電視臺電影頻道 視頻修復及清晰度提升 深燃-百度文心 能源 深圳燃氣 燃氣行業中的場站槽車安全作業、園區安全生產、營業廳著裝規范、安全隱患預警等 吉利-百度文心 汽車 吉利汽車 智能客服系統、車載語音系統、領域知識庫構建等汽車行業應用場景 TCL-百度文心 制造 TCL 電子制造行業各種不同產線工藝場景的缺陷檢測 辭海-百度文心 社科 上海辭書出版社 知識挖掘、詞條管理、版權保護等人文社科行業應用場景 來源:百度文心,國金證券研究 通過與各行各業攜手構建文心行業大模型,百度文心積累了旗下文心 NLP
28、大模型、文心CV 大模型、文心跨模態大模型在多個行業、多種應用場景中落地的相關經驗,形成了較為成熟的 AI 賦能模式。圖表圖表11:文心行業大模型文心行業大模型融合知識增強技術融合知識增強技術 來源:百度文心,國金證券研究所 行業深度研究 敬請參閱最后一頁特別聲明 9 隨著百度新一代生成式對話機器人“文心一言”開放測試,AI 大模型落地進程將有望大大加速。目前已有 650 余家知名企業宣布接入文心一言,涵蓋企業服務、金融 IT、汽車、傳媒、互聯網、教育、電器、金融等十余個領域。此外,百度自身主流業務也將接入文心一言,包括百度搜索,以及基于百度智能云的智能語音助手小度、智能駕駛 Apollo 等
29、。3月 16 日起,“文心一言”首批用戶可通過邀請測試碼接入體驗,同時百度智能云將面向企業客戶開放“文心一言”API 調用接口,有望進一步豐富百度 AI 生態,賦能更多行業伙伴。圖表圖表12:已有已有650余家公司接入余家公司接入百度“文心一言”百度“文心一言”領域領域 百度“文心一言”合作公司百度“文心一言”合作公司 企業企業 服務服務 致遠互聯、金蝶國際、明源云、用友網絡、福昕軟件、漢得信息、慧博云通、東軟集團、遠光軟件、彩訊股份、北信源、競業達、飛天云動、悅商集團、力龍信息、愛點擊、神思電子、榮聯科技、金財互聯、華宇軟件、利歐股份等 金融金融 IT 恒生電子、宇信科技、凌志軟件、京北方、
30、軟通動力、博彥科技、銀之杰、科藍軟件、信雅達、新致軟件、中科金財、新晨科技、艾融軟件等 汽車汽車 吉利汽車、東風汽車、長城汽車、長安汽車、海馬汽車、零跑汽車、紅旗汽車等 傳媒傳媒 風語筑、太平洋網絡、超媒體控股、財訊傳媒、華策影視、藍色光標、天娛數科、視覺中國、36 氪、浙文互聯、汽車之家、中原網、金融界、值得買、百姓網、新浪新聞、迪生數字、凡拓數創、返利科技、博瑞傳播等 互聯網互聯網 愛奇藝、前程無憂、智聯招聘、掌閱科技、巨人網絡、攜程、Soul 等 教育教育 博瑞傳播、高頓教育、高途、學大教育、昂立教育、達內教育等 電器電器 聯想集團、四川長虹、TCL、美的集團、國光電器、海信視像、創維數
31、字等 金融金融 郵儲銀行、興業銀行、中信銀行、江蘇銀行、廣發證券、長江證券、國海證券、泰康保險、重慶銀行等 算力算力 浪潮信息、中科曙光、紫光股份、光環新網等 其他其他 航天宏圖、綠地控股、孩子王等 來源:iFind,各公司公眾號,國金證券研究所 3.文心平臺提供一站式開發平臺與工具 工具與平臺層是百度文心平臺生態構建中的重要一環,百度文心以 AI 落地為導向,為不同領域中的各級用戶提供包括 AI 開發平臺、AI 開發工具、大模型 API 在內的一站式 AI開發服務。3.1 AI 開發平臺開發平臺:零門檻平臺:零門檻平臺 EasyDL 及全功能平臺及全功能平臺 BML AI 應用開發者和 AI
32、 專業開發者是 AI 落地環節中的兩個典型角色:前者對 AI 底層算法和編程知識了解較為有限,希望能以高效、簡單的方式應用 AI 技術為所屬行業賦能;后者則專注于底層算法等 AI 專業領域,要求開發平臺的功能強大且完善。為滿足各級用戶的使用需求,百度文心采用客戶分級設計,向產業鏈上的不同客戶提供功能各有側重的 AI開發平臺,包括零門檻 AI 開發平臺 EasyDL 以及全功能 AI 開發平臺 BML。零門檻 AI 開發平臺 EasyDL 專為 AI 應用開發者打造,用戶可以在不了解技術細節的前提下,以零代碼、零門檻的方式快速實現 AI 模型的開發與部署。行業深度研究 敬請參閱最后一頁特別聲明
33、10 圖表圖表13:EasyDL提供一站式零代碼提供一站式零代碼AI模型開發模型開發 來源:百度文心,國金證券研究所 EasyDL 為用戶提供了自然語言處理、圖像、跨模態三個領域下的多種任務的一站式模型定制服務,并提供了工業制造、智慧城市、電子商務等多個真實場景下的 AI 開發范例,用戶在進行 AI 模型開發時,僅需準備好場景數據集并依照提示操作,即可迅速完成模型的訓練與部署。圖表圖表14:EasyDL可支持多可支持多場景任務場景任務 領域領域 任務類型任務類型 應用場景應用場景 自然語言處理 文本創作 文本分類 情感分析 文本實體抽取 文本實體關系抽取 評論觀點抽取 文本相似度計算 廣告創意
34、、文學創作 新聞推薦、評論分類 輿情分析 金融研報信息識別、法律案件抽取 行業知識圖譜構建、行業知識問答 輔助消費決策、輿情分析 推薦系統 圖像 圖像分類 物體檢測 圖像分割 圖片內容檢索、制造業分揀或之間 醫療診斷、工業檢測 醫學圖像分析、衛星圖像分析 跨模態 圖文匹配 圖文素材推薦 來源:百度文心,國金證券研究所 BML 全功能 AI 開發平臺主要面向 AI 專業開發者打造,為 AI 專業開發者提供了從數據處理、模型訓練、模型管理、模型部署與應用的生命周期管理服務,幫助用戶更快、更好地構建、訓練和部署 AI 模型。通過使用 BML 平臺,開發者無需再關注底層資源的管理和維護,能夠大大開發效
35、率,加速 AI 賦能千行萬業。行業深度研究 敬請參閱最后一頁特別聲明 11 圖表圖表15:BML全功能全功能AI開發平臺架構概覽開發平臺架構概覽 來源:百度文心,國金證券研究所 EasyDL 和 BML 兩個平臺目前在訓練階段僅支持使用由百度文心提供的云端算力。目前,百度文心提供的公有云定價較高,以 GPU 提供的算力性能為標準統一計算,百度文心公有云的定價約為 Microsoft Cloud 的 6.3 倍。圖表圖表16:EasyDL與與BML提供提供的模型部署方式的模型部署方式 算力集群配置算力集群配置 價格價格 GPU:NVIDIA Tesla P4 8G CPU:12 核 內存:40G
36、 13.4 元/小時 GPU:NVIDIA Tesla P4 24G CPU:12 核 內存:40G 17.3 元/小時 GPU:NVIDIA Tesla V100 16G CPU:12 核 內存:56G 21.6 元/小時 GPU:NVIDIA Tesla V100 32G CPU:8 核 內存:32G 24 元/小時 來源:百度文心,國金證券研究所 EasyDL 和 BML 兩個平臺在模型部署階段靈活性較強,用戶可以根據自身需要,靈活選擇模型的部署方式,以滿足不同開發者對價格、數據安全性、數據私密性等因素的個性化需求。圖表圖表17:EasyDL與與BML提供的模型部署方式提供的模型部署方式
37、 部署方式部署方式 特點特點 公有云部署 模型部署于飛槳公有云平臺,按需按時獲取算力資源,性價比高,適合中小型企業 私有化離線部署 模型以私有化軟件方式交付,客戶可將模型部署于自有服務器或終端設備中,保障企業核心數據的私密性與安全性,能依據客戶需要實現高級定制功能,適合大型企業 行業深度研究 敬請參閱最后一頁特別聲明 12 部署方式部署方式 特點特點 軟硬一體部署 模型部署至百度自研的軟硬一體人工智能應用平臺飛槳一體機中,飛槳一體機適配主流國產 AI 芯片與國產操作系統,支持自主可控,適合大型企業 來源:百度文心,國金證券研究所 3.2 AI 開發工具套件開發工具套件 AI 開發工具套件是百度
38、文心生態構建中的基礎環節,是百度文心旗下 AI 開發平臺靈活易用、性能強大的基礎,完善的 AI 開發工具生態將顯著減少開發過程中“重復造輪子”的行為,加速 AI 開發與落地進程。ERNIEKit 是百度文心專門面向自然語言處理領域研發的大模型開發工具,主要面向 NLP工程師,提供全流程語言大模型開發與部署工具集,以全方位發揮語言大模型效能。PaddleFleetX 覆蓋大模型環境部署、數據處理、預訓練、微調、模型壓縮、推理部署全流程,并支持語言、視覺、多模態等多個領域的前沿 AI 算法。ERNIEKit 和 PaddleFleetX 兩種 AI 開發工具工具套件的優勢在于以下幾點:簡單易用,性
39、能優異:用戶能夠以簡單的方式利用 AI 開發工具套件的分布式運算能力,從而為模型訓練和模型推理提供有力的算力支持。模型訓練、壓縮、推理一體化:AI 開發工具工具套件支持模型訓練、壓縮、推理一體化等模型小型化策略,能夠實現 AI 終端設備上的輕量化部署,大大降低部分場景下的AI 落地成本。多硬件支持,自主可控:AI 開發工具工具套件不僅支持 NVIDIA GPU 等主流的 AI 芯片,還支持多款主流國產 AI 芯片。3.3 大模型大模型 API 除 AI開發平臺與 AI開發工具外,百度文心還通過大模型 API向用戶提供開發服務。目前,百度文心各模型 API 尚處于起步階段,均免費向 AI 開發者
40、提供。圖表圖表18:百度文心百度文心提供大模型提供大模型API 模型名稱模型名稱 應用領域應用領域 API 開放模式開放模式 ERNIE-ViLG AI 畫圖 收費調用,價格約為 0.15 元/張 PLATO AI 聊天機器人 限量開放內測 ERNIE 3.0 Zeus 文本理解與創作 免費申請調用 來源:百度文心,國金證券研究所 4.文心平臺提供搜索、創作等產品 產品與社區層建立于先進的百度文心大模型之上,是百度文心生態中的頂層,其旨在對外展示生成式模型的強大性能,并以此吸引愛好者投入創作,構建成熟的 AIGC 社區,助力AI 模型迭代升級,并在實踐中探索未來 AI 的商業化模式。4.1 產
41、業級搜索系統產業級搜索系統文心百中文心百中 文心百中是百度文心基于旗下語言大模型開發的產業級搜索系統,基于文心 ERNIE 模型構建,目前已對外開放測試。相比傳統搜索引擎,文心百中架構簡單,且支持對多種類型的異構數據進行搜索??梢詽M足開發者和企業用戶的多種垂直搜索、企業搜索需求。文心百中具有極簡的邏輯架構以及強大的語義理解能力,可以極大降低搭建垂直搜索帶來的數據成本與人力成本。行業深度研究 敬請參閱最后一頁特別聲明 13 圖表圖表19:文心百中使用流程簡單文心百中使用流程簡單 來源:百度文心,國金證券研究所 通過使用文心百中,用戶可以通過輸入行業、企業知識庫的方式以極低的成本構建所屬領域的搜索
42、系統,從而實現企業內搜、知識搜索、知識推薦等搜索場景的相關任務。4.2 AI 藝術和創意輔助平臺藝術和創意輔助平臺文心一格文心一格 文心一格是百度文心基于旗下文圖生成跨模態大模型搭建的 AI 藝術和創意輔助平臺,目前已向用戶開放,用戶可以通過文心一格體驗 AI 作畫,并將優秀畫作于平臺中公開、分享創作經驗,為其他用戶提供創意與創作經驗,由此形成平臺的正向循環。在版權方面,文心一格允許用戶將 AI 生成所得圖片用于商業用途。文心一格旨在構建成熟的 AI 藝術和創意輔助平臺,為畫師、設計師等視覺內容創作者提供靈感、創意和創作輔助,為媒體、作家等文字創作者提供海量的高質量圖片。文心一格目前采用收費調
43、用模式,根據用戶需求不同提供了多種生成模式。圖表圖表20:文心一格收費價格文心一格收費價格0.2-0.8元元/張張 服務名稱服務名稱 服務內容服務內容 價格價格 普通 AI 作畫 自定義圖片描述、風格 0.2 元/張 高級 AI 作畫 自定義圖片描述、風格、尺寸,多個可供選擇的 AI 畫師,可上傳參照圖 0.2-0.8 元/張 AI 畫作二次編輯 通過描述詞實現圖像內容刪減 0.2 元/張 來源:百度文心,國金證券研究所 4.3 大模型創意社區大模型創意社區旸旸谷社區谷社區 旸谷社區是百度文心基于旗下多領域文心大模型構建的創意社區,旨在探索大模型的在各個領域與場景中的創意應用模式,旸谷社區采用
44、眾創模式,鼓勵個人開發者基于文心大模型 API 針對特定場景訓練 AI 模型,訓練得到的優質模型將由百度文心收錄并向全體用戶開放使用,旸谷社區有望助力 AI 大模型的應用探索。圖表圖表21:旸旸谷社區谷社區部分創意應用部分創意應用 創意應用創意應用 應用場景應用場景 文本處理系統 面向日常辦公場景,基于 PaddleOCR 中 OCR 技術,可將拍攝到的圖片進行文字提取的同時,借助 ERNIE 3.0 Zeus 對 OCR 識別的文字進行二次修正,避免出現因 OCR 而產生的文檔錯誤。聽故事畫圖 面向幼教場景,利用語音轉文字技術和ERNIE 3.0 Zeus 提取故事摘要,并借助 ERNIE-
45、ViLG 實現 AI 作圖。裝修設計 面向室內設計場景,可選擇多種裝修風格一鍵生成裝修效果圖,可輔助室內設計師與裝修客戶溝通。來源:百度文心,國金證券研究所 行業深度研究 敬請參閱最后一頁特別聲明 14 5.國內其他生成式語言模型 我們梳理了百度文心外,其余國內廠商在生成式語言模型領域的最新研究成果。文心ERNIE 3.0 Zeus 大模型在參數規模、技術創新、應用落地方面均在國內同業中處于領先水平。圖表圖表22:國內主流生成式語言模型對比國內主流生成式語言模型對比 廠商廠商 百度百度 阿里巴巴阿里巴巴 華為華為 清華大學清華大學 模型 名稱 ERNIE 3.0 Zeus PLUG 盤古 Ch
46、atGLM 發布 日期 2022 年 5 月 2021 年 4 月 2021 年 4 月 2023 年 3 月 參數 規模 千億級 240 億 1100 億 1300 億 模型 結構 Transformer Encoder-Decoder Transformer Encoder-Decoder Transformer Encoder-Decoder Transformer Encoder-Decoder 訓練 數據 海量文本數據與知識圖譜 1TB 以上的高質量中文文本訓練數據,涵蓋新聞、小說、詩歌、問答等廣泛類型及領域 40TB 的行業文本數據和 400 萬小時的行業語音數據 海量中、英文本
47、信息 特點 創新型提出知識增強方法,參數規模處于世界領先水平 基于純中文文本訓練 融合行業知識,基于大量行業語音和文本數據訓練,采用了人類反饋強化學習方法 來源:百度文心,阿里巴巴,騰訊,華為,清華大學,國金證券研究所 6.投資建議 相較于 ChatGPT 等海外 AI 模型存在連接限制,百度文心平臺可以為國內用戶提供便捷的技術入口?!拔男囊谎浴钡陌l布將極大加速國內生成式 AI 模型的落地應用節奏,有望幫助生態伙伴實現用戶體驗提升和生產降本增效。建議關注接入“文心一言”生態的公司,如恒生電子、用友網絡、漢得信息、凌志軟件、宇信科技等。7.風險提示 海外基礎軟硬件使用受限 若因國際關系等原因,高
48、算力 GPU 等基礎硬件或計算框架等基礎軟件使用受限,可能會對國內人工智能算法應用產生影響。應用落地不及預期 若相關應用公司不能找到人工智能算法較好的商業應用落地場景,或相關場景客戶沒有較強的付費意愿,可能算法應用落地會不及預期。行業競爭加劇風險 若相關企業加快技術迭代和應用布局,整體行業競爭程度加劇,將會對行業內已有企業的業績增長產生威脅。行業深度研究 敬請參閱最后一頁特別聲明 15 行業行業投資評級的說明:投資評級的說明:買入:預期未來 36 個月內該行業上漲幅度超過大盤在 15%以上;增持:預期未來 36 個月內該行業上漲幅度超過大盤在 5%15%;中性:預期未來 36 個月內該行業變動
49、幅度相對大盤在-5%5%;減持:預期未來 36 個月內該行業下跌幅度超過大盤在 5%以上。行業深度研究 敬請參閱最后一頁特別聲明 16 特別聲明:特別聲明:國金證券股份有限公司經中國證券監督管理委員會批準,已具備證券投資咨詢業務資格。本報告版權歸“國金證券股份有限公司”(以下簡稱“國金證券”)所有,未經事先書面授權,任何機構和個人均不得以任何方式對本報告的任何部分制作任何形式的復制、轉發、轉載、引用、修改、仿制、刊發,或以任何侵犯本公司版權的其他方式使用。經過書面授權的引用、刊發,需注明出處為“國金證券股份有限公司”,且不得對本報告進行任何有悖原意的刪節和修改。本報告的產生基于國金證券及其研究
50、人員認為可信的公開資料或實地調研資料,但國金證券及其研究人員對這些信息的準確性和完整性不作任何保證。本報告反映撰寫研究人員的不同設想、見解及分析方法,故本報告所載觀點可能與其他類似研究報告的觀點及市場實際情況不一致,國金證券不對使用本報告所包含的材料產生的任何直接或間接損失或與此有關的其他任何損失承擔任何責任。且本報告中的資料、意見、預測均反映報告初次公開發布時的判斷,在不作事先通知的情況下,可能會隨時調整,亦可因使用不同假設和標準、采用不同觀點和分析方法而與國金證券其它業務部門、單位或附屬機構在制作類似的其他材料時所給出的意見不同或者相反。本報告僅為參考之用,在任何地區均不應被視為買賣任何證
51、券、金融工具的要約或要約邀請。本報告提及的任何證券或金融工具均可能含有重大的風險,可能不易變賣以及不適合所有投資者。本報告所提及的證券或金融工具的價格、價值及收益可能會受匯率影響而波動。過往的業績并不能代表未來的表現??蛻魬斂紤]到國金證券存在可能影響本報告客觀性的利益沖突,而不應視本報告為作出投資決策的唯一因素。證券研究報告是用于服務具備專業知識的投資者和投資顧問的專業產品,使用時必須經專業人士進行解讀。國金證券建議獲取報告人員應考慮本報告的任何意見或建議是否符合其特定狀況,以及(若有必要)咨詢獨立投資顧問。報告本身、報告中的信息或所表達意見也不構成投資、法律、會計或稅務的最終操作建議,國金
52、證券不就報告中的內容對最終操作建議做出任何擔保,在任何時候均不構成對任何人的個人推薦。在法律允許的情況下,國金證券的關聯機構可能會持有報告中涉及的公司所發行的證券并進行交易,并可能為這些公司正在提供或爭取提供多種金融服務。本報告并非意圖發送、發布給在當地法律或監管規則下不允許向其發送、發布該研究報告的人員。國金證券并不因收件人收到本報告而視其為國金證券的客戶。本報告對于收件人而言屬高度機密,只有符合條件的收件人才能使用。根據證券期貨投資者適當性管理辦法,本報告僅供國金證券股份有限公司客戶中風險評級高于 C3 級(含 C3 級)的投資者使用;本報告所包含的觀點及建議并未考慮個別客戶的特殊狀況、目
53、標或需要,不應被視為對特定客戶關于特定證券或金融工具的建議或策略。對于本報告中提及的任何證券或金融工具,本報告的收件人須保持自身的獨立判斷。使用國金證券研究報告進行投資,遭受任何損失,國金證券不承擔相關法律責任。若國金證券以外的任何機構或個人發送本報告,則由該機構或個人為此發送行為承擔全部責任。本報告不構成國金證券向發送本報告機構或個人的收件人提供投資建議,國金證券不為此承擔任何責任。此報告僅限于中國境內使用。國金證券版權所有,保留一切權利。上海上海 北京北京 深圳深圳 電話:021-60753903 傳真:021-61038200 郵箱: 郵編:201204 地址:上海浦東新區芳甸路 1088 號 紫竹國際大廈 7 樓 電話:010-85950438 郵箱: 郵編:100005 地址:北京市東城區建內大街 26 號 新聞大廈 8 層南側 電話:0755-83831378 傳真:0755-83830558 郵箱: 郵編:518000 地址:中國深圳市福田區中心四路 1-1 號 嘉里建設廣場 T3-2402