《中國移動:我國人工智能大模型發展動態(2023)(12頁).pdf》由會員分享,可在線閱讀,更多相關《中國移動:我國人工智能大模型發展動態(2023)(12頁).pdf(12頁珍藏版)》請在三個皮匠報告上搜索。
1、我國人工智能大模型發展動態我國人工智能大模型發展動態中國移動研究院2023 年 4 月2/12摘要摘要國內大模型研發應用領域熱潮持續高漲。據不完全統計,目前國內至少有 19 家企業及科研院所涉足人工智能大模型訓練,主要分為大型科技公司、科研院校和初創科技團隊三類。從大模從大模型的布局體系來看型的布局體系來看,百度、阿里、華為等大型科技公司從算力層、平臺層、模型層、應用層進行了四位一體的全面布局,科研院校及初創科技公司主要以研發大模型算法及細分領域應用為主;從從大模型參數量看大模型參數量看,大型科技公司的參數量遠大于科研院所,但基本都處于千億及以上規模;從大模型應用方向看從大模型應用方向看,大部
2、分企業前期以內部應用為主,后續主要向 B 端企業拓展服務,預計少數企業將在 C 端市場形成規模??傮w來說總體來說,業界普遍認為國內大模型與 GPT-3 的水平相當,與 GPT-4 仍有較大差距。3/12一、一、我國人工智能大模型總體情況我國人工智能大模型總體情況據不完全統計,截止到 2023 年 4 月 18 日,國內至少有 19家企業及科研院所涉足人工智能大模型訓練,主要分為大型科技公司、科研院校和初創科技團隊三類。具體來看:百度、阿里等12 家大型科技公司和中國科學院、清華大學等 3 家科研院校已經提供開放測試,或有明確的推出時間計劃;字節跳動、搜狗創始人王小川、美團創始人王慧文、創新工場
3、創始人李開復等則是最近對外宣布組建團隊,進軍大模型研發領域。其中,字節跳動旗下火山引擎于 4 月 18 日發布自研 DPU(數據處理器)等系列云產品,推出新版機器學習平臺,可以支持萬卡級大模型訓練、微秒級延遲網絡,為預訓練模型提供強大的算力支持。從大模型的布局體系來看從大模型的布局體系來看,科技大廠在算力層科技大廠在算力層、平臺層平臺層、模模型層型層、應用層進行了四位一體的全面布局應用層進行了四位一體的全面布局。百度、阿里、華為三家均從芯片到應用進行自主研發的全面布局,如百度的“昆侖芯+飛槳平臺+文心大模型+行業應用”、阿里的“含光 800 芯片+M6-OFA 底座+通義大模型+行業應用”、華
4、為的“昇騰芯片+MindSpore 框架+盤古大模型+行業應用”。垂直行業科技企業和科研院校,主要以研發大模型算法及細分領域應用為主,自有算力相對薄弱,很少涉及芯片領域自主研發。從大模型參數量看從大模型參數量看,科技大廠的參數量遠大于科研院所科技大廠的參數量遠大于科研院所??萍即髲S的大模型參數量較大:阿里通義千問大模型參數在 10 萬億級以上、騰訊混元大模型和華為盤古大模型參數量均在萬億級4/12以上、百度文心一言大模型參數量在 2 千億級以上、京東言犀大模型的參數量為千億級;垂直行業科技企業已經上線的參數量普遍在千億級以上;而科研院校大模型的參數量在千億級及以下。從大模型應用方向看從大模型應
5、用方向看,大部分企業前期以內部應用為主大部分企業前期以內部應用為主,后后續主要向續主要向 B B 端企業拓展服務端企業拓展服務,預計少數企業將在預計少數企業將在 C C 端市場形成規端市場形成規模模。目前,百度文心大模型、華為盤古大模型、中國科學院紫東太初大模型均在 B 端垂類市場積累了標桿應用案例,騰訊混元大模型、阿里通義大模型則更多聚焦公司自身業務。而在 C 端市場應用方面,百度文心一言、阿里通義千問、騰訊混元助手三類大模型最有可能向此方向拓展,但目前只有百度文心一言大模型正在進行友好客戶測試,阿里通義千問大模型則計劃在今年 9 月份進行公測,騰訊混元助手大模型則處于計劃開發狀態。從大模型
6、業界評估看從大模型業界評估看,國內大模型與國內大模型與 GPT-4GPT-4 有較大差距,但有較大差距,但科技大廠具備追趕實力??萍即髲S具備追趕實力。目前國內大模型處于百花齊放的狀態,但業界普遍認為,第一梯隊當屬百度第一梯隊當屬百度、阿里巴巴阿里巴巴、騰訊騰訊、華為四華為四家家。綜合實力方面,四家企業在大模型研發投入、技術能力和人才團隊實力較強;商用推進方面,四家企業均依托現有業務領域更容易形成大模型應用規模效應。5/126/12二、二、典型企業的大模型發展情況典型企業的大模型發展情況針對第一梯隊整體布局的百度、阿里、華為、騰訊四家公司,以及垂直領域入局的商湯公司的進一步分析,發現各家企業在大
7、模型領域探索路徑各有特色。(一)(一)百度文心大模型:早布局,內外雙向發力百度文心大模型:早布局,內外雙向發力1 1、總體概況總體概況百度是國內領先布局百度是國內領先布局 AIAI 領域的科技大廠,也是我國最早發領域的科技大廠,也是我國最早發布知識增強大語言模型產品的企業布知識增強大語言模型產品的企業。2010 年,百度成立了人工智能自然語言處理部,是中國最早布局 AI 的企業之一。據百度披露,其在 AI 領域累計投入研發總額超過千億元,專利數量連續五年居全國第一。早在 2019 年,百度就發布文心大模型 ERNIE(以下簡稱文心大模型),目前已迭代至千億級參數的 ERNIE 3.0 Zeus
8、。2023 年 3 月,百度相繼發布了知識增強大語言模型產品“文心一言”和企業級產品“文心千帆”,可以為多個行業提供 API 接口及相應的開發工具鏈百度以百度以“昆侖芯昆侖芯+飛槳平臺飛槳平臺+文心大模型文心大模型+行業應用行業應用”在算力在算力層層、平臺層平臺層、模型層模型層、應用層具備完整布局應用層具備完整布局。在算力層在算力層,算力基礎設施均由百度智算中心支持,昆侖芯二代(百度持股 70%)已廣泛應用在文心大模型,預計昆侖芯三代將于 2024 年初量產;在在平臺層平臺層,百度飛槳 PaddlePaddle 是其自主研發的深度學習平臺,文心大模型通過百度飛槳平臺,實現模型訓練、推理部署和場
9、景7/12應用;該平臺對外部 535 萬開發者提供 EasyDL、BML 等開發工具和各種 API;在模型層,在模型層,文心大模型具備自然語言處理、計算機視覺、多模態以及生物計算四大類能力;在應用層在應用層,文心大模型將應用在電力、燃氣、金融、生物醫藥、航天、傳媒、城市、影視、制造、社科等多個行業。2 2、市場應用和推廣情況市場應用和推廣情況百度文心大模型積極拓展內外部應用百度文心大模型積極拓展內外部應用,目前面向公眾和企業目前面向公眾和企業用戶同時進行開放測試用戶同時進行開放測試。內部應用層面內部應用層面,文心大模型已經率先應用于百度搜索、信息流、智能駕駛、百度地圖、小度智能屏等內部重要產品
10、上;外部應用層面外部應用層面,文心大模型在金融、能源、制造、城市、傳媒、互聯網等行業有標桿應用案例,實現真實場景應用的同時獲取大量行業數據反哺大模型的優化。據媒體公開信息顯示,目前 600 多家企業宣布加入文心大模型生態。3 3、內外部評估情況內外部評估情況百度 CEO 李彥宏在 3 月對外宣稱,文心一言和 GPT-3 版本相相差一兩個月差一兩個月的時間。目前文心一言是業界唯一一個對大眾用戶開放測試的知識增強大語言模型產品,根據研究團隊最新測試,文心一言的文本生成能力較強,針對 3 月份業界質疑的“文生圖不達中文意境”的問題已經進行了修正,但仍存在常識性錯誤、“一本正經地胡編亂造”等現象。8/
11、12(二)(二)阿里通義大模型:建生態,率先內部應用阿里通義大模型:建生態,率先內部應用1 1、總體概況總體概況阿里以阿里以“含光含光 800800 芯片芯片+M6-OFA+M6-OFA 底座底座+通義大模型通義大模型+行業應用行業應用”成為大模型全部環節的重要參與者成為大模型全部環節的重要參與者。2019 年,阿里達摩院開啟大模型研究。2022 年 9 月,阿里正式發布通義大模型,包括通義M6 多模態模型、通義 AliceMind 自然語言處理模型、通義視覺計算機視覺模型。2022 年 11 月,阿里推出 AI 開源社區“魔搭”(ModelScope),旨在打造下一代“模型即服務”的共享平臺
12、,整合業界多方模型提供者,為開發者提供預訓練基礎模型和 API 接口。目前該平臺已有超過 300 個開源模型,包括阿里自有的通義大模型系列以及瀾舟科技孟子系列模型等外部資源和能力。2023年 4 月,阿里正式發布了“通義千問”產品,該產品基于 10 萬億級參數的大模型底座 M6-OFA,未來將具有多輪交互及復雜指令理解、可多模態融合、支持外部增強 API 等多種能力。另外,阿里不僅擁有最多的英偉達 A100 芯片,還擁有自研芯片含光 800、倚天 710 芯片,共同為人工智能大模型提供算力。2 2、市場應用和推廣情況市場應用和推廣情況通義通義大大模型模型將全面支撐阿里系所有產品將全面支撐阿里系
13、所有產品。目前阿里通義大模型主要定向邀請企業用戶測試主要定向邀請企業用戶測試,尚未向公眾尚未向公眾客戶客戶開放開放。內部應用內部應用層面層面,阿里已宣布旗下所有產品未來將全面改造接入通義大模型,包括天貓、釘釘、高德地圖、淘寶、優酷、盒馬等;外部應用外部應用層層9/12面面,阿里通義大模型目前正探索與 OPPO、太平洋保險、吉利汽車電子等企業,在電子、金融、汽車等領域開展合作。3 3、內外部評估情況內外部評估情況根據對阿里專家的調研,通義千問大模型主要偏向文本主要偏向文本,但但目前還不具備圖片、視頻生成能力;目前還不具備圖片、視頻生成能力;在預訓練語料數據集方面,其質量和規模上都遜于 Open
14、AI 和百度,總體相當于總體相當于 GPT-3GPT-3,與,與百度文心百度文心一言一言效果相近效果相近。而外部業界測試顯示,通義千問大模型在文字創作領域,尤其在語言翻譯領域表現較為出色,但在復雜理科計算方面仍有提升空間。(三)(三)華為盤古大模型:全棧式服務,深耕行業應用華為盤古大模型:全棧式服務,深耕行業應用1 1、總體概況總體概況華為打造了華為打造了“昇騰芯片昇騰芯片+MindSpore+MindSpore 框架框架+盤古大模型盤古大模型+行業應行業應用用”四位一體的完整體系,主要面向企業市場提供全棧式服務四位一體的完整體系,主要面向企業市場提供全棧式服務。2020 年,華為啟動研發盤古
15、大模型。2021 年 4 月,華為正式發布盤古大模型,包括自然語言處理、計算機視覺、科學計算等大模型。其中,盤古自然語言處理大模型可應用于智能文檔搜索、智能 ERP、小語種大模型等領域;盤古計算機視覺大模型則聚焦分類、分割、檢測等視覺場景,可應用于工業質檢領域;科學計算大模型則主要用于解決各種科學問題,如氣象預報、海浪預測等。另外,華為盤古大模型依托自研的昇騰 910、920 系列芯片,與 MindSpore 框架形成一個整體,為企業提供全棧式的應用服務。10/122 2、市場應用和推廣情況市場應用和推廣情況據華為公開信息顯示,盤古大模型盤古大模型在能源、零售、金融、工業、醫療、環境、物流等
16、100100 多個行業完成場景驗證多個行業完成場景驗證。但截止 2023年 4 月 16 日,華為云官網尚未尚未顯示盤古大模型上線上線狀態。3 3、內外部評估情況內外部評估情況據華為公開信息顯示,在醫藥領域,利用盤古藥物分子大模型讓先導藥的研發周期從數年縮短至一個月,研發成本降低 70%;在氣象領域,依托盤古氣象大模型,可提供秒級全球氣象預報,預測速度提高萬倍以上,臺風軌跡預測準確度世界第一,相比歐洲氣象局提升約 20%;在工業領域,盤古機器視覺大模型使樣本篩選效率提升約 30 倍,篩選質量提升約 5 倍,開發成本降低 90%。另外,外部評估暫無最新信息。(四)(四)騰訊混元大模型:練內功,高
17、度適配自有業務騰訊混元大模型:練內功,高度適配自有業務1 1、總體概況總體概況騰訊構建騰訊構建了了“太極機器學習平臺太極機器學習平臺+混元大模型混元大模型”,同時騰訊啟同時騰訊啟動了動了“混元助手混元助手”知識增強大語言模型項目知識增強大語言模型項目。2016 年,騰訊成立了 AI Lab 實驗室。2022 年 4 月,騰訊對外披露了混元大模型,涉及自然語言處理、計算機視覺、多模態等多個領域。騰訊自研的太極機器學習平臺為混元大模型提供算力,可支持 10TB 級模型訓練、TB 級模型推理計算能力等。另據媒體報道,2023 年 3月,騰訊對標 ChatGPT 已成立“混元助手”戰略級項目組。11/
18、122 2、市場應用和推廣情況市場應用和推廣情況混元大模型目前主要服務于騰訊內部業務?;煸竽P湍壳爸饕沼隍v訊內部業務。截止 2023 年 4月 16 日,騰訊混元大模型尚未對企業和公眾客戶開放測試。內內部應用層面部應用層面,混元大模型已成功應用應用于騰訊廣告于騰訊廣告,將全面接入微將全面接入微信端信端、QQQQ 端端和王者榮耀、英雄聯盟游戲端游戲端,提供智能聊天、內容推薦、情感分析、故事生成、角色塑造等功能;外部應用層面外部應用層面,業界推測騰訊混元大模型將在游戲、社交、金融、教育、醫療等領域發展生態,但騰訊尚未公開其明確的行業應用方向。3 3、內外部評估情況內外部評估情況據騰訊公開信息
19、顯示,混元大模型精準地把廣告投放給特定人群,相比以前的小模型算法,騰訊混元大模型已累計給廣告主帶來 15%的 GMV 提升。另外,外部評估暫無最新信息。(五)(五)商湯日日新大模型:目標成為通用人工智能新基建商湯日日新大模型:目標成為通用人工智能新基建1 1、總體概況總體概況商湯以商湯以“AIAI 大裝置大裝置 SenseCoreSenseCore 算力平臺算力平臺+新新 SenseNovaSenseNova 大模大模型型”為企業提供模型訓練基地。為企業提供模型訓練基地。2018 年,商湯啟動大模型研究。2022 年,商湯推出了 320 億參數量的通用視覺模型,在自動駕駛、工業質檢、醫療影像等多個領域落地應用。2023 年 4 月,商湯發布大模型“日日新 SenseNova”,推出自然語言處理、內容生成、自動化數據標注、自定義模型訓練、模型研發功能等多種能力。另外,商湯的 AI 大裝置“SenseCore”是亞洲最大的算力平臺之12/12一,可以同時支持 20 個千億級參數的大模型訓練,最高可支持萬億參數超大模型的訓練。2 2、市場應用和推廣情況市場應用和推廣情況日日新大模型目前已已面向政企客戶開放面向政企客戶開放測試測試。在應用層面,根據其官方網站顯示,該模型計劃支持智能汽車、智慧生活、智慧商業、智慧城市等業務板塊。