《中國信通院:人工智能發展報告(2024年)(64頁).pdf》由會員分享,可在線閱讀,更多相關《中國信通院:人工智能發展報告(2024年)(64頁).pdf(64頁珍藏版)》請在三個皮匠報告上搜索。
1、No.202409中國信息通信研究院2024年12月人工智能發展報告人工智能發展報告(2022024 4 年年)版權聲明版權聲明本報告版權屬于中國信息通信研究院,并受法律保護。轉載、摘編或利用其它方式使用本報告文字或者觀點的,應注明“來源:中國信息通信研究院”。違反上述聲明者,本院將追究其相關法律責任。本報告版權屬于中國信息通信研究院,并受法律保護。轉載、摘編或利用其它方式使用本報告文字或者觀點的,應注明“來源:中國信息通信研究院”。違反上述聲明者,本院將追究其相關法律責任。更名聲明更名聲明原“集智”白皮書更名為“集智”藍皮書?!凹恰彼{皮書將繼續秉承原有的編撰理念和高質量標準,致力于提供有價
2、值的信息和洞見。原“集智”白皮書更名為“集智”藍皮書?!凹恰彼{皮書將繼續秉承原有的編撰理念和高質量標準,致力于提供有價值的信息和洞見。前言前言人工智能浪潮席卷全球,正以前所未有的速度、廣度和深度改變生產生活方式,對全球經濟社會發展和人類文明進步產生深遠影響。近年來,語言大模型、多模態模型、智能體和具身智能等領域不斷出現突破性創新,推動人工智能邁向通用智能初始階段。與此同時,人工智能的工程化持續加速推進,新產品新模式層出不窮,行業應用走深向實。特別是過去一年,全球大模型井噴式發展。技術層面,縮放定律(Scaling Law)依然有效,語言大模型技術多維度能力持續進化,視覺大模型和多模態模型加速
3、迭代,探索交叉模態融合處理。計算平臺與模型創新緊密耦合,大規模分布式訓練成為框架的新發力點,分布式訓練支持、混合精度計算支持、高速互聯通信等新要求驅動計算底座迭代升級。軟件工具鏈全面優化升級,加速模型生產質效變革、提升模型部署推理效能、助力智能應用快速部署。高質量多模態數據集成為推動模型能力提升的關鍵,高水平數據標注和合成數據等新技術取得快速發展和突破。應用層面,專用智能應用逐步成熟,通用智能落地前景廣闊。重點行業人工智能應用走深向實,貫穿產品研發設計、生產制造、營銷服務、運營管理全流程,在提質增效的同時,逐步滲透并引導產業變革。從產業鏈各環節應用來看,大模型落地呈現“兩端快、中間慢”的階段特
4、征?!斑x、建、用、管”體系化推動落地應用成為加速人工智能走向實用化、普惠化的行業共識。安全方面,人工智能技術應用帶來自身安全、衍生安全兩大類風險挑戰,各國治理進程不斷提速,全球人工智能治理正處于“從原則走向實踐”的關鍵階段。展望未來,引入強化學習等技術來增強大模型能力仍是近期技術演進的重點方向,多模態模型、智能體有望加速突破,具身智能成為邁向通用人工智能的重要一步。面向中遠期,類腦智能等顛覆性技術的成熟,有可能為人工智能發展帶來更廣闊的想象空間。隨著人工智能賦能新型工業化向縱深發展,人工智能在實體經濟中的應用場景將進一步拓展,加速向生產制造環節滲透,加速邁向全方位、深層次智能化轉型升級新階段。
5、在此背景下,我院發布人工智能發展報告(2024年),旨在總結梳理人工智能技術創新方向、產業升級重點、行業落地趨勢和安全治理進展,展望人工智能發展機遇,以期與業界分享,共同推動人工智能產業蓬勃發展。目錄一、總體態勢.1(一)人工智能技術演進走向新范式.1(二)人工智能工程化邁向新階段.2(三)人工智能安全治理工作緊密推進.4(四)人工智能產業穩中有進迎來新動能.5二、技術創新.8(一)基礎模型仍在快速演進迭代.8(二)計算平臺與模型創新緊密耦合.16(三)工具鏈不斷完善加速大模型研發應用.21(四)高質量多模態數據集成為模型能力提升的關鍵.26三、應用賦能.32(一)人工智能賦能階段性特征顯現.
6、32(二)重點行業人工智能應用走深向實.36(三)體系化推動人工智能落地應用成為共識.38四、安全治理.44(一)人工智能技術應用帶來多重挑戰.45(二)全球人工智能安全治理正處于“從原則走向實踐”的關鍵階段.47五、發展展望.54圖目錄圖 1 全球人工智能產業規模(單位:億美元).6圖 2 全球生成式人工智能投融資規模(單位:億美元).7圖 3 語言、視覺和多模態三類基礎模型布局.8圖 4 大模型工具鏈架構圖.22圖 5 不同階段的具體數據需求情況.26圖 6 基于百個優秀案例統計的 AI 應用產業鏈分布.35圖 7 人工智能風險管理體系.44圖 8 人工智能風險示例.45表目錄表 1 語言
7、大模型演進迭代情況.10表 2 語言大模型調整及解決方案.12表 3 多模態模型技術路線表.15人工智能發展報告(2024 年)1一、總體態勢人工智能浪潮席卷全球,正以前所未有的速度、廣度和深度改變生產生活方式。世界主要國家紛紛將推進人工智能技術創新與應用作為國家戰略的重要方向,我國高度重視人工智能在培育新質生產力、塑造新動能方面的重要作用。習近平總書記指出,人工智能是新一輪科技革命和產業變革的重要驅動力量,將對全球經濟社會發展和人類文明進步產生深遠影響。2024 年 1 月,國務院常務會議研究部署推動人工智能賦能新型工業化有關工作,強調以人工智能和制造業深度融合為主線,加快重點行業智能升級,
8、大力發展智能產品,高水平賦能工業制造體系。當前,人工智能正處于邁向通用智能的初始階段,并成為推動經濟社會持續發展的關鍵動力。(一)人工智能技術演進走向新范式(一)人工智能技術演進走向新范式以Transformer架構為基礎的大模型不斷取得新突破,在大數據、大算力加持下,逐漸實現從單任務智能到可擴展、多任務智能的跨越。這一關鍵突破,標志著人工智能技術發展走向新范式。以大模型為代表的人工智能技術展現出了類人智能的“涌現”能力,呈現規??蓴U展、多任務適應及能力可塑三大特征。一是規??蓴U展。模型的規??蓴U展性不僅體現在參數的擴大,更依賴高質量數據集的供給以及大規模算力集群能力的增強。當前在模型參數保持
9、不變的情況下,提高數據質量、擴大數據集規?;蛱嵘懔σ幠K?,人工智能發展報告(2024 年)2都能夠顯著增強模型的復雜性和處理能力。二是多任務適應。大模型支持多任務多模態能力持續增強,可執行任務已經從文本對話拓展到多模態理解、多模態生成等場景。三是能力可塑。通用大模型在訓練階段通過結合增量預訓練、有監督微調、知識圖譜等方法,實現將專業數據和知識注入模型中,提升大模型在專業領域的應用能力;在推理階段,通過引入檢索增強生成、提示詞工程和智能體等技術,將更豐富的上下文信息和專業知識引入模型推理過程,解決更復雜的推理任務,優化模型表現。具體從大模型算法演進態勢看,深挖現有體系架構潛力,以實現理解推理
10、能力和訓練效率倍增仍是當前發展主線。模型研發主體紛紛圍繞算法理論融合(如 Transformer 架構與其他路線結合)和模型改造(如擴大上下文窗口、思維鏈復雜推理、優化注意力模塊、網絡架構稀疏化、多模態特征對齊與統一理解等)展開創新升級,從而提高模型性能表現。近期 OpenAI o1 模型通過模仿人腦思考的思維過程,顯著提升數學、物理、編程等復雜任務的性能水平。與此同時,非 Transformer 模型的底層算法也在不斷創新。例如,基于圖神經網絡的 GraphCast、GNoME 在氣象和材料領域已取得重大突破,基于物理約束的 PINN 網絡、基于算子學習的 DeepONet 和基于傅里葉變換
11、的FNO 網絡已成為求解偏微分方程(PDEs)的重要手段。(二)人工智能工程化邁向新階段(二)人工智能工程化邁向新階段工程化技術是推動人工智能從實驗室走向生產環境的關鍵橋梁,人工智能發展報告(2024 年)3也是人工智能在垂直行業應用落地的必經之路。在此過程中,人工智能工具鏈發揮著核心作用,其覆蓋數據處理、模型訓練微調、部署推理、應用開發、監控運維和安全可信全流程,是實現智能化轉型的基礎設施和加速器。當前,人工智能工程化的重點逐漸從大模型的訓練微調向應用開發和落地轉變,構建起圍繞大模型及其應用的工具鏈,標志著人工智能工程化進入了新的產業化階段。開發工具鏈加速大模型技術迭代速度。開發工具鏈作為連
12、接算法、數據與應用場景的關鍵紐帶,對大模型的訓練和推理至關重要。在訓練方面,開發工具圍繞分布式訓練持續優化,顯著提升了大模型的訓練效率,如 DeepSpeed、Megatron-LM 等分布式訓練框架通過支持更豐富的并行策略,以及更豐富的計算加速策略,有效支持產業界超大規模模型的預訓練。同時,訓練框架圍繞參數高效微調等方面的技術創新,可以有效降低計算和存儲成本。在推理方面,開發工具鏈聚焦優化量化、剪枝等壓縮技術持續突破,加速推理過程并降低部署成本。同時,開發工具通過完善并行推理、混合精度推理、推理緩存等技術,可以有效降低計算資源消耗,提升推理服務速度。應用工具鏈拓展大模型應用廣度。大模型應用工
13、具主要圍繞Agent(智能體)、多模型編排、大小模型協同、知識庫集成、檢索增強生成(RAG)及多組件融合等核心要素持續創新。Agent 的引入,實現了復雜任務的自動化執行與智能決策;多模型編排則有效人工智能發展報告(2024 年)4解決了單一模型局限性問題,通過靈活組合大小模型提升系統性能;大小模型協同機制,在確保精度的同時優化了計算資源利用;知識庫與 RAG 技術的結合,極大增強了模型的知識推理與生成能力,確保結果的精確性;多組件的融合應用,則進一步豐富應用場景,提升了系統的靈活性與可擴展性。應用工具鏈不僅極大降低了大模型應用的開發門檻,還顯著提升了智能應用的性能與用戶體驗。(三)人工智能安
14、全治理工作緊密推進(三)人工智能安全治理工作緊密推進在人工智能飛速發展的浪潮下,全球人工智能治理合作持續升溫,各國政府、國際組織、私營部門及社會各界攜手并進,各主要經濟體治理體系日漸明晰,產研合作愈發緊密。各類安全治理框架、安全治理工具日新月異,標志著全球人工智能治理跨入更加成熟的新階段,以應對人工智能技術快速發展帶來的機遇與挑戰。全球人工智能安全治理合作愈發緊密,各主要經濟體治理體系漸趨明晰。國際合作方面,交流合作更加頻繁,強調“負責任”、普惠發展理念。聯合國在全球人工智能治理中發揮主渠道作用,二十國集團、七國集團等密集推出人工智能治理舉措,人工智能安全峰會聚焦安全議題提供全球對話平臺。與此
15、同時,全球積極推動人工智能普惠發展。聯合國大會通過了關于人工智能的里程碑式決議加快實現可持續發展目標,我國發起“一帶一路”倡議、搭建“數據絲路”、成立中國-金磚國家人工智能發展與合作中心,并在“人工智能能力建設國際合作”高級別會議上提出人工智能能力建設人工智能發展報告(2024 年)5普惠計劃,都致力于讓人工智能為全人類帶來“惠益”。治理體系方面,各主要經濟體治理體系漸趨明晰,旨在維護本土產業發展需要。我國兼顧人工智能發展與安全,提出建立人工智能安全監管制度,發布 全球人工智能治理倡議 人工智能安全治理框架(1.0版)。歐盟出臺人工智能法案構建統一治理格局,美國發布拜登行政令推行行業自律的治理
16、架構,英國、新加坡、日本等國加速構建立足本土產業發展需求的安全治理方案。人工智能安全前瞻研究和產業實踐深度結合,安全技術應用能力明顯提升。前瞻研究方面,麻省理工學院、伯克利大學和南洋理工大學等研究機構提出模型間對抗新范式,深入探索人工智能模型自身安全邊界。清華大學、北京大學和騰訊等機構積極開發新型模型水印算法,增強人工智能應用的安全可追溯性。產業實踐方面,各國推動安全治理走深向實。美國打造 Dioptra 測試平臺評估人工智能安全可靠性,英國人工智能安全研究所推出 Inspect 工具集評估模型能力和整體模型安全,新加坡迭代 AI Verify 工具箱以期提升人工智能可信度,中國推出大模型公共
17、服務平臺,集成數字內容水印、生成內容檢測、不良信息識別等技術工具,提升大模型的安全合規能力。(四)人工智能產業穩中有進迎來新動能(四)人工智能產業穩中有進迎來新動能全球人工智能產業保持高速增長。據 IDC 預測,2024 年全球人工智能產業規模將達到 6233 億美元,同比增長 21.5%1。具體來看,1IDC人工智能發展報告(2024 年)6有兩個方面的重要原因。一是大模型涌現式發展,為人工智能產業高速增長提供了核心動力。自 2023 年起,全球基礎模型數量快速增加,相較于 2022 年增長數量翻倍;2024 年以來全球基礎模型新增或迭代近百個,保持了較強的創新態勢2。二是生成式人工智能技術
18、加速產業化進程,促進全球人工智能規?;l展。據 Gartner 預測,到2026 年,超過 80%的企業將使用生成式人工智能 API,或部署生成式人工智能的應用程序。來源:IDC圖 1 全球人工智能產業規模(單位:億美元)大模型領域拉動全球人工智能投融資金額上揚。2024 年上半年,全球人工智能投融資金額達 316 億美元,同比上升 84%。在全球融資緊縮的背景下,受益于大模型發展和企業融資帶動,人工智能領域融資占全行業融資比例持續上升,從 2022 年的 4.5%上升至 2024年上半年的 12.1%。2023 年,生成式人工智能投融資規模達 252 億美元,約為 2022 年的 9 倍,占
19、 2023 年所有人工智能相關投資的約2基于斯坦福大學 Ecosystem Graphs 數據及頭部企業發布事件統計人工智能發展報告(2024 年)7四分之一3。2024 年上半年,全球金額最大的 10 筆融資事件中有 6筆為大模型企業融資,金額總計達 135 億美元。來源:The AI Index 2024Annual Report圖 2 全球生成式人工智能投融資規模(單位:億美元)人工智能創業企業發展持續創新高。人工智能創業企業是智能化時代影響技術產業格局的生力軍,也是推動全球人工智能產業生態繁榮的重要力量。截至 2024 年第二季度末,全球共有人工智能獨角獸企業 242 家,其中 202
20、4 年上半年新增 15 家,占所有新增獨角獸企業的 40%。獨角獸企業業務分布廣泛,2024 年新增獨角獸企業業務領域涵蓋生物制藥(如 Xaira Therapeutics)、軟件開發(如CognitionAI)、數據平臺(如 Weka)、搜索問答(如 Perplexity)、科研寫作(如 SakanaAI)等。部分獨角獸企業商業模式逐漸清晰,技術實力和發展前景已獲得市場認可,其中 Astera Labs、出門問問等已于 2024 年上半年成功上市。隨著大模型應用落地門檻的持續降低,各行業也將涌現出更多人工智能創業企業,垂直行業賽道成為未來創新涌現的重要場景。3TheAI Index 2024
21、Annual Report人工智能發展報告(2024 年)8二、技術創新(一)基礎模型仍在快速演進迭代(一)基礎模型仍在快速演進迭代縮放定律驅動下的模型能力持續提升,基礎大模型的語言、視覺和多模態能力快速迭代。從時間維度來看,2022 年 ChatGPT 的出現引領大模型浪潮興起;2023 年國內大模型呈井噴式爆發態勢,能力快速迭代,模態持續拓展;2024 年大模型推理理解能力躍遷,并開始探索垂類領域應用落地。OpenAI 等基于大量工程實驗和反復驗證提出縮放定律,揭示了模型能力與計算能力、參數量和數據量間的定量關系,業界也遵循該定律指導資源要素投入、推動模型創新發展,近年來在模型技術能力、通
22、用泛化水平等方面取得一系列突破性進展。目前,大模型支持模態已逐步從自然語言處理拓展到多模態理解和生成等場景。來源:中國信息通信研究院圖 3 語言、視覺和多模態三類基礎模型布局1.語言大模型:技術能力演進加速,在幻覺、成本等人工智能發展報告(2024 年)9問題上仍面臨挑戰從 2023 年至今的基準測試結果來看,全球大模型能力已經出現階躍式提升。語言大模型能力提升主要體現為以下四方面。一是上下文窗口長度擴展,提升全局能力。大模型的上下文窗口長度是指模型在執行文本生成任務時,能夠處理的前置文本的數量或長度,決定了模型對信息的理解深度和廣度,對于理解和生成連貫、一致且準確的文本具有重要意義。當前,國
23、內外主流大語言模型均具備128k 以上的上下文長度處理能力,可一次性處理數十萬單詞或漢字。二是知識密度增強,儲存更多知識。隨著數據、算力、算法協同發展,大模型知識密度持續增強,平均每 8 個月翻一番。2020 年 6 月發布的 GPT-3 大模型有 1750 億個參數,2024 年 2 月面壁智能發布MiniCPM-2.4B 模型在實現同等性能的同時,參數規模降至 24 億,相當于知識密度提高了約 86 倍。三是 MoE 混合專家架構能夠容納更多知識,精準刻畫任務。MoE 稀疏激活多個專家子模型支路,加權融合多個子模型結果,實現更加準確的輸出,提高推理計算效率。目前,谷歌的 Gemini-1.
24、5 Pro、MistralAI 的 8x7B 與 8x22B、阿里云Qwen-1.5 MoE、階躍星辰 Step-2 等頭部大模型均采用 MoE 架構,已 成 為 當 前 大 模 型 的 重 要 演 進 趨 勢。四 是 通 過 強 化 學 習(Reinforcement Learning,RL)將思維鏈(Chain of Thought,CoT)內化進模型,提升復雜推理能力。2024 年 9 月 OpenAI 發布的 o1 系列模型在后訓練(Post-Training)階段采用強化學習和思維鏈的技術人工智能發展報告(2024 年)10方案,不僅在“慢思考”后回答復雜問題的表現優異(尤其是在 S
25、TEM領域的推理能力顯著增強),還具有了自我反思與錯誤修正能力,使自博弈強化學習有望成為提升語言大模型邏輯推理能力的技術新范式。表 1 語言大模型演進迭代情況公司公司模型模型上下文長度上下文長度MetaAILlama 28kLlama 3.1128kOpenAIGPT-432kGPT-4 Turbo128ko1/o1 mini128kAnthropicClaude 3.5200k阿里云Qwen8kQwen-1.532kQwen-2.5128k百度ERINE 4.08kERINE 4.0 Turbo128k上海 AI 實驗室書生浦語8k書生浦語 2.0200k谷歌Gemini-1.032kGem
26、ini-1.51000k(100 萬)語言大模型雖然在文本理解與生成、復雜邏輯推理任務上取得了突破,但在幻覺問題、訓練成本方面仍然面臨挑戰。一是復雜邏輯推理和泛化能力仍需強化。以 OpenAI o1 系列模型為例,雖然OpenAI 通過強化學習和思維鏈等技術方案使得 o1 系列模型在STEM 領域的推理能力得到大幅提升,但在開放性、復雜度更高的人工智能發展報告(2024 年)11問題和場景中泛化能力仍然不強。一方面,可以通過在特定領域的數據集上進行微調,提高模型在該領域的邏輯推理能力。另一方面,可以將知識圖譜與大模型結合使用,提供額外的結構化知識,幫助模型實現更準確地理解和推理。二是幻覺問題無
27、法徹底消除。當前語言大模型在生成文本或理解信息時,可能會產生不準確或完全虛構的內容,影響生成內容的可靠性與安全性。當前業界在以下三個方面試圖降低幻覺:提升訓練數據質量,對訓練數據進行清洗和驗證,以去除錯誤、不一致或誤導性信息,確保訓練數據的準確性和可靠性是預防幻覺問題的關鍵;使用檢索增強(RAG)技術,RAG模型結合了檢索機制和生成機制,能夠從大量外部數據庫中檢索相關信息,并結合這些信息進行生成,從而提高內容的準確性;增強長上下文處理能力,大模型通過處理長文本信息,更好地理解上下文及復雜的邏輯關系和情境,減少生成幻覺的風險。三是訓練成本仍然偏高。當前大模型的訓練成本仍然偏高,這主要體現在數據需
28、求、算力消耗及基礎架構上。在數據層面,大模型需要大量的數據來進行有效的預訓練,數據的收集、標注、清洗和預處理都需要大量的時間和資源。此外,高質量數據往往需要人工標注,不僅耗時而且成本高昂,尤其是在需要專業知識的領域。在算力層面,訓練大模型需要巨大的計算資源,通常需要使用 GPU 集群高性能計算設備,目前這些設備的使用成本仍然較高。在算法層面,當前基礎單元架構的改進關注特定任務或條件下單一維度性能的提升,通常會人工智能發展報告(2024 年)12以犧牲其他方面性能為代價,如計算效率、內存占用等,目前還沒有出現一種能夠全面超越現有 Transformer 架構的基礎單元。表 2 語言大模型調整及解
29、決方案挑戰方向挑戰方向主要解決思路主要解決思路復雜推理問題合成推理數據、類推提示法、過程監督、拒絕采樣微調等幻覺問題信息檢索增強技術、調整解碼策略以及完善預訓練和對齊策略等方式等訓練成本問題更加高效的優化器和提升訓練框架的穩定性,合成數據和自動標注提升訓練數據的構建效率2.視覺大模型:Transformer 賦能圖像理解,擴散模型實現圖像生成視覺 Transformer 模型(Vision Transformer,ViT)將 Transformer架構從自然語言擴展到視覺領域,成為判別式視覺任務的主流架構。2020 年,谷歌發布的 ViT 模型首次將圖像適配到 Transformer 架構,在
30、 ImageNet 數據集上取得了超過 CNN 的表現,從此奠定了 ViT 在視覺領域基礎架構的地位。目前,業界主要聚焦模型結構和下游任務兩方面對 ViT 模型進行改進。在模型架構改進方面,微軟的 SwinTransformer、Meta 的 MAE、DeiT、SAM、DINO2、蘇黎世聯邦理工學院的 PVT、McGill 大學的 CvT 等模型從多尺度、知識蒸餾、自編碼等方向改進 ViT 網絡結構,在圖像分類、目標檢測與分割、圖像檢索、深度估計等傳統視覺任務上取得突破。與此同時,以 ViT為代表的判別式視覺大模型仍面臨以下幾個方面的挑戰。一是計算人工智能發展報告(2024 年)13資源需求高
31、,基于 Transformer 架構的視覺大模型在計算上具有二次復雜度,對計算資源有較高要求。二是訓練數據依賴性強,ViT 等視覺大模型需要大規模數據集進行預訓練以獲得更好的性能,在小數據集上的表現可能不佳。三是自監督學習挑戰,自監督學習是視覺大模型訓練的關鍵環節,但如何有效地設計自監督任務以充分挖掘數據特性與模型潛力仍然是一個開放性問題。四是模型部署與推理加速,為了在實際應用中部署視覺大模型,需要有效的模型壓縮和加速技術,以減少模型大小并提高推理速度。擴散模型成為圖像生成領域的主流方案,展現巨大應用潛力。擴散模型(Diffusion Models)基于馬爾科夫鏈的擴散過程逐步從噪聲中重構出所
32、需的數據,廣泛應用于高質量圖像與視頻的生成、編輯與修復等場景。擴散模型相較傳統生成模型在以下三方面展現優勢:一是高質量樣本生成,擴散模型能夠生成高分辨率、高保真度的圖像,視覺效果逼真。二是訓練穩定性,與生成對抗網絡(GAN)等傳統生成模型相比,擴散模型的訓練過程更為穩定,減少了模式崩潰的風險。三是靈活性與可控性,擴散模型允許通過條件輸入(如文本描述、草圖等)來引導圖像的生成方向和風格,支持生成多樣化的圖像樣本,包括藝術創作、風格遷移等多種創新應用。目前頭部人工智能廠商聚焦通過擴散模型持續提升圖像生成能力,包括StabilityAI 的 Stable Diffusion、OpenAI 的 DAL
33、L E、谷歌的 Imagen等。與此同時,以擴散模型為代表的生成式視覺大模型仍面臨以下人工智能發展報告(2024 年)14三個方面的挑戰:一是推理速度,擴散模型的推理過程需要多個步驟迭代生成,導致推理時間較長。二是幻覺問題,當前模型存在生成圖像內容與客觀事實不符的情況。三是評估指標,當前擴散模型生成樣本的評估主要基于 FID 分數,這一指標反映圖像全局的表征能力,無法全面反映樣本的細節恢復效果和多樣性。3.多模態模型:四種實現方式探索交叉模態處理多模態大模型融合了多種感知途徑與表達形態,能夠同時處理文本、圖像、語音等多種數據,并進行深度的語義理解和交叉模態處理,具備深度人機交互和全面智能應用的
34、潛力,是通用智能的重要實現路徑。多模態大模型主要有四種實現方式,按模型實現功能可以分為理解類與生成類兩條主要路徑。一是多模態理解模型。多模態理解模型對齊視覺特征與文本特征實現跨模態的統一理解,分為以下兩類技術路線。一方面,基于語言大模型底座,配合多類外部專家模型共同實現多模態處理。如微軟的 Visual ChatGPT 模型將 OpenAI 的 ChatGPT 與 22 種不同的視覺基礎模型(VFM)相結合,使用戶能夠超越語言限制,實現多模態交互,如聊天交互、圖像編輯等任務。谷歌的 PaLM-E 模型利用現有 LLM 和語言嵌入方法解決多模態問題,將連續具體的多模態輸入轉化為 LLM 可識別的
35、向量特征,用于大模型訓練,實現語言問答、視覺問答等任務。另一方面,通過跨模態特征對齊學習,實現多模態輸入的統一和融合。OpenAI 的 CLIP 模型通過對比學習,將圖像人工智能發展報告(2024 年)15與文本通過各自的預訓練模型獲得的編碼向量在向量空間上對齊,從而理解和推理圖像和文本之間的關系,被廣泛用于圖像檢索、視覺問答、圖像生成等領域。二是多模態生成模型。多模態生成模型基于對不同模態信息的理解,具備文本、圖像、視頻、語音信息的生成能力,能夠根據輸入指令創造新的數據內容或增強現有數據的表達能力,分為以下兩類技術路線。一方面,DiT(Diffusion Transformer)結合擴散模型
36、與Transformer 優勢,成為視頻生成模型主流架構。DiT 架構用Transformer 代替了傳統擴散模型中基于卷積網絡的 U-Net。Transformer 具有更強的上下文處理能力和理解生成能力,擴展能力更強、收斂效率更好。OpenAI 的 Sora、谷歌的 Veo、快手的可靈大模型均具備超一分鐘長時長、1080P 高清視頻生成能力。另一方面,端到端統一多模態架構,實現跨模態生成與實時交互響應。OpenAI的 GPT-4o 和谷歌的 Gemini 均采用了端到端單體模型的方式學習文本、視覺、語音等不同模態的統一表征,實現跨模態實時交互相應。GPT-4o 能夠根據手機拍攝視覺信息與用
37、戶對話交互實現多模態統一理解,具備“聽、看、說”的多模態交互能力,平均響應速度 320ms,達人類對話水平。表 3 多模態模型技術路線表類型類型路線路線典型典型多模態理解語言大模型調度微軟 Visual ChatGPT谷歌 PaLM-E跨模態特征對齊OpenAI CLIP人工智能發展報告(2024 年)16微軟 KOSMOSDeepMind FlamingoSalesforce BLIP多模態生成擴散模型Stability AI Stable DiffusionOpenAI DALLEOpenAI Sora快手 KLINGRunway Gen-3端到端理解與生成架構谷歌 GeminiOpenA
38、I GPT-4o(二)計算平臺與模型創新緊密耦合(二)計算平臺與模型創新緊密耦合1.模型創新依賴計算平臺,協同價值凸顯以大模型為代表的通用智能范式正在驅動人工智能計算平臺升級。當前,“大模型+大算力+大數據”成為可能實現通用智能的主要路線之一,基礎大模型底座的智能水平與迭代速度成為各國科技競爭的戰略焦點。然而,大模型目前仍是一種實驗科學裝置,升級迭代需反復實驗,是復雜的系統工程。以 Llama 3.1-405B 為例,使用 1.6 萬張 NVIDIA H100 GPU,在 15.6T token 數據上預訓練需 54天4,期間經歷 466 次工作中斷,這種工程實驗科學裝置更加依賴先進、高效、可
39、靠的軟硬件系統支持。相比專用算法,大模型的創新與基礎軟硬件體系正加速耦合。一味追求算力規模擴張無法滿足大模型創新需求,而是要更加強調應用、算法、關鍵軟件棧、底層硬件全方位協同發展,實現系統收益最大化。但這也對軟硬件協同水平提出了新挑戰,中國信通院 AISHPerf5基準測試表明,軟硬件系統4The Llama 3 Herd of Models,Meta Llama Team.5AISHPerf:Performance Benchmarks ofArtificial Intelligence Software and Hardware人工智能發展報告(2024 年)17正面向大模型訓練、推理需求
40、加速迭代升級,模型輕量化部署、混合精度計算、分布式訓練策略優化等新特性是近期軟硬件產品升級迭代重點,廠商積極推動不同模型網絡架構與硬件的深度適配。大模型技術的原始創新和應用迭代落地高度依賴先進的軟硬件協同技術生態體系。一方面,模型原始創新與底層硬件協同顯著加強,構建新的模型結構與組件往往需考慮底層硬件的支持程度,如針對模型架構優化的 Flash Attention、Flash Decoding 等創新技術。另一方面,面向差異化的賦能場景,需要軟硬件系統結合場景需求特點在訓練、推理等環節高度協同,從算力集群調度、框架分布式訓練能力、端側推理加速等方面系統提升模型調優速度、任務精度,降低訓練推理成
41、本,提升人工智能賦能傳統行業質量和效率。2.框架關鍵技術能力持續提升,大模型加速框架成為新發力點PyTorch 引領框架發展,國產框架快速崛起。從全球來看,目前,基礎通用框架兩強并立局面被打破,PyTorch 已主導學術界,使用占比持續提升。PapersWithCode 數據顯示,PyTorch 框架在論文中使用比例從 2020 年 9 月的 51%穩步提升至 2023 年 9 月的 60%,而同期TensorFlow 則從 20%驟降至 3%左右。從技術能力來看,2022 年底發布的 PyTorch2.0 將計算圖捕獲正確率從 50%提升至 99%,解決其上一版本動態圖編譯困難的致命缺陷,同
42、時將 2000 余算子整合優化至 250 個左右,僅需一行代碼即可實現 1.5 到 2 倍的 Transformers人工智能發展報告(2024 年)18模型訓練加速,大幅提升大模型支持能力,編譯效率大幅提升,受到業界廣泛歡迎,逐漸擴大與 TensorFlow 的競爭優勢,先前持續數年的框架兩強并立局面被打破。從我國來看,國產框架技術能力不斷完善,基于國產框架的行業解決方案正在向垂直領域快速滲透。近年來國內涌現了一批如百度飛槳、華為昇思、一流 OneFlow、之江天樞等開發框架,支撐構建一批更加符合本土產業特色和場景需求的解決方案。隨著人工智能進入大規模賦能新型工業化階段,國產深度學習框架迎來
43、新一輪發展機遇,向行業融合滲透不斷加強。如百度飛槳已凝聚 1070 萬開發者,基于飛槳創建了 86 萬個模型,服務 23.5 萬家企事業單位;華為 Mindspore 社區用戶達到 780 萬,總 PR 數達到 97.7k,已在互聯網、醫療、安防、政府、科學計算領域廣泛落地應用。大規模分布式訓練成為框架的新發力點,一批大模型加速框架顯現。當前,開發框架主要面向大模型分布式訓練異構資源管理調度、多節點任務調度等方面完成優化,呈現兩種發展路線,一是基于原有框架實現分布式訓練功能,例如,微軟 DeepSpeed、英偉達Megatron 基于 PyTorch 強化大模型分布式支持能力、提升訓練效率。其
44、中,微軟 DeepSpeed 針對分布式訓練中計算資源稀缺問題,提升異構硬件統籌調度能力,豐富計算資源供給。DeepSpeed 在多 GPU系統上展現出較好的分布式擴展性,相較于 Megatron,其應用更為廣泛,包括計算機視覺、自然語言處理、推薦系統等,旨在提高大人工智能發展報告(2024 年)19模型的訓練速度和效率。二是集成分布式能力的一體化通用發展路線,例如,百度飛槳框架原生支持超大規模分布式訓練能力,推出端到端自適應分布式訓練技術,實現了低成本自動并行開發、最優并行策略自動選擇和異步流水調度,突破了模型結構和硬件環境多樣導致的分布式訓練策略開發復雜、訓練性能調優難的技術瓶頸。3.大模
45、型訓推需求推動芯片加速迭代,各類市場主體差異化創新大模型熱潮進一步推動計算底座迭代升級。大模型計算特性對硬件要求極高,帶來分布式訓練支持、混合精度計算支持、高速互聯通信等新要求新挑戰,驅動計算底座迭代升級,呈現三大趨勢特點:一是芯片架構向定制化演進,迎合 Transformer 計算特性。如英偉達自 Hooper 架構引入 Transformer 引擎提升算法計算性能,并利用啟發式算法實現數據精度動態切換(Blackwell 架構二代Transformer 引擎已支持 FP8、FP6、FP4 等多種低精數據),在保證性能的前提下降低計算總量;芯片創業公司 Etched 推出僅支持Transfo
46、rmer 架構的 Sohu 芯片,犧牲編程能力提升計算速度,推理吞吐量達到 H100 的 20 倍。二是存儲與互聯重要性日益提升。隨著大模型參數持續增長、輸入輸出數據長度快速提升,模型參數和計算緩存 kv 值消耗的內存空間呈指數級增長,存儲和互聯成為主要瓶頸,在芯片單位面積算力接近天花板且性能相對過剩的背景下,頭部硬件廠商創新升級重點從卷算力向卷內存、卷互聯轉變,如 AMD人工智能發展報告(2024 年)20MI300X 宣傳時已淡化算力色彩,重點突出顯存和互聯指標,英偉達B200 顯存容量和顯存帶寬提升幅度(240%H100),均超過算力提升幅度(220%H100 FP16)。三是強調軟硬協
47、同升級釋放硬件計算潛力。如 AMD ROCm 6.2 更新擴展了專為語言大模型所設計的 vLLM 庫支持,提升了 Instinct 系列加速器的 AI 推理能力;英偉達參與 FlashAttention 3 注意力算法設計,充分利用 H100 芯片動態warp 寄存器分配、FP8 精度支持等特性,相比 FlashAttention 2 速度提升 1.5-2 倍。多方試圖破局,出現三類挑戰者。盡管目前英偉達壟斷人工智能計算生態,但面對高昂的采購成本和龐大的市場空間,各方持續尋找替代英偉達的解決方案,出現三類挑戰者。一是以 AMD、英特爾為代表的半導體巨頭,憑借深厚技術積累、龐大資金支持和市場渠道
48、優勢,推出面向大模型和人工智能的高性能計算產品,如 AMDInstinct MI325X 芯片、英特爾 Gaudi2 芯片等,在內存容量、存儲帶寬、性價比等方面形成差異化競爭優勢。二是以 Cerebras、Groq、d-Matrix、Graphcore 等為代表的芯片初創企業,嘗試通過超大尺寸芯片、存內計算、近存計算等非常規技術路線取得突破,已獲得OpenAI、微軟、三星等行業巨頭投資。三是以微軟、Meta 等為代表的互聯網巨頭加快自研芯片進程,試圖擺脫對英偉達依賴,提升議價能力,如谷歌 TPU 已更新至第五代(TPU v5p),支持多模態大模型 Gemini 訓練;微軟推出 MAIA100,
49、采用 5nm 工藝,服務微軟人工智能發展報告(2024 年)21云大模型訓推;Meta 發布首款自研推理芯片 MTIAv1,基于 7nm 工藝 ASIC 芯片,與自身 PyTorch 框架高度適配。此外,量子、類腦、光計算等前沿顛覆式路線也加緊與大模型應用結合,規模商用雖有差距,但為復雜高效計算系統實現開辟新路徑,如清華大學光計算芯片“太極”實現 160TOPS/W 的超高能效,能夠以更低的資源消耗和更小的邊際成本支撐大模型訓練推理。(三)工具鏈不斷完善加速大模型研發應用(三)工具鏈不斷完善加速大模型研發應用大模型工具鏈是指一系列集成化的軟件工具和平臺,旨在支持大模型開發構建、訓練優化、應用開
50、發、部署推理和運維管理全流程。工具鏈的持續升級對于大模型開發和應用至關重要,是構建模型服務體系(Model as a Service,MaaS)的平臺能力支撐,目標是靈活便捷供給大模型服務。首先,工具鏈不斷升級,能夠有效應對大規模模型訓練的復雜性挑戰,提高訓練效率和推理效能。其次,工具鏈的集成和易用性降低了模型開發部署門檻,縮短了開發周期,加速實現一站式模型部署。最后,工具鏈不僅可以集成 Agent 框架、檢索增強生成(RAG)等新技術,還能支持靈活的模型與組件調用,促進智能應用的快速構建和部署。人工智能發展報告(2024 年)22來源:中國信息通信研究院圖 4 大模型工具鏈架構圖1.模型訓練
51、工具:加速模型生產質效變革訓練工具能力全面升級,有效支撐大規模訓練任務。一方面,為了更加高效地完成大模型訓練任務,涌現出多種訓練加速技術。一是計算資源優化技術,如PyTorch支持的混合精度訓練、Adafactor、FlashAttention 等技術,能夠通過減少計算和存儲需求,提升模型效率。目前,谷歌、微軟、騰訊、螞蟻等頭部企業廣泛采用混合精度訓練等技術減少顯存占用并提升訓練速度。二是應用計算優化策略來提升模型的執行效率,如 DeepSpeed 支持的算子融合、梯度積累技術等技術,能夠在資源有限的情況下,通過優化計算策略,加速計算過程。此外,收斂性優化技術通過提高模型的收斂速度,提升模型訓
52、練效率,并提高模型的泛化能力。目前,主流的深度學習訓練框架均支持收斂性優化技術,如 DeepSpeed、PyTorch、JAX 等均支持 Adam、Adagrad 等自適應學習率優化器,能夠在訓練過程中動態調整學習率,使模型能夠更快地收斂。另一方面,為提升大模型人工智能發展報告(2024 年)23在特定場景的適應性,業界推出多種微調技術以提升訓練效率。目前主流微調技術分為全量微調和參數高效微調(PEFT)技術。全量微調精度高、泛化能力強,但計算成本較高,一般適用于精度需求較高的復雜任務場景。參數高效微調能夠顯著節省訓練時間和計算資源,適用于資源受限或者需要快速部署迭代的場景,已經成為產業實踐的
53、主流選擇。主流的參數微調方法包括低秩適應(LoRA)、前綴調優(Prefix Tuning)、提示調優(Prompt-Tuning)等,當前產業主流的訓練工具套件,如百度千帆大模型平臺、阿里百煉大模型平臺均支持上述微調技術。2.模型推理工具:提升模型部署推理效能推理工具能力不斷升級優化,為大模型落地提供高效支撐。一是模型壓縮工具持續整合更多壓縮技術。大模型通常需經過模型壓縮以適應更廣泛更多樣化的部署環境,如何兼顧壓縮比例與性能損耗是關鍵。以量化、剪枝為代表的壓縮技術持續演進,通過低比特量化、稀疏化、模型結構搜索、參數自動尋優等方式實現模型訓練中、訓練后的低損與高效壓縮。如百度的模型自動化壓縮工
54、具 ACT(Auto Compression Toolkit)可實現壓縮流程自動化6,商湯的神經網絡量化工具 PPQ 通過圖優化等技術實現高效的壓縮能力7。二是國內外機構專注于大模型推理引擎的研發創新。推理引擎針對大模型6PaddleSlim/example/auto_compression at develop PaddlePaddle/PaddleSlim()7openppl-public/ppq:PPL Quantization Tool(PPQ)is a powerful offline neural network quantization tool.()人工智能發展報告(2024
55、年)24推理場景的低時延、高吞吐要求,從顯存優化、高性能算子、服務調度等多個維度進行優化設計,已成為當前大模型部署推理的主要工 具,如 伯 克 利 大 學 LMSYS ORG(Language Model SystemsOrganization)vLLM、英偉達 TensorRT-LLM、HuggingFaceTGI(TextGeneration Inference)、微軟 DeepSpeedDeepSpeed-MII 等。我國科技企業也紛紛布局該領域,如騰訊一念 LLM 同時支持英偉達 GPU和華為 NPU 卡8,阿里魔搭 DashInfer 支持 CPU 卡上的高效推理9,螞蟻 GLake
56、 通過對鍵值對緩存實現透明管理和存算解耦,進一步提升了推理性能和兼容性10。三是模型與推理工具之間呈現高度融合與協同優化的趨勢。如百度文心一言大模型結合飛槳框架協同優化,使得推理性能提升百余倍;騰訊太極平臺通過顯存+主存統一存儲管理技術,并通過模型算子之間的顯存共享和優化,使端到端推理性能提升至業界平均水平的 2.3 倍。3.應用開發工具:助力高效打造 AI 應用大模型服務化供給加速了智能技術的普惠化落地,激發了基于大小模型的智能應用開發需求。與傳統應用軟件開發相比,智能應用開發在應用模式方面轉變為以模型為核心,在開發方式方面演變成零代碼、低代碼等多種形式,以滿足不同技術能力的用戶群體需求。以
57、上變化對模型應用的開發提出了新的要求,一方面,開發所8https:/ 年)25依賴的能力框架、工具鏈條等需適應大模型應用的開發需求。Agent、RAG 等框架成為常用 AI 應用開發框架,大小模型組合成為應用落地的主要技術方式。同時,搜索、格式轉化等工具插件將模型的能力進行延伸,在應用中扮演著越來越重要的作用。另一方面,快速變化的市場需求對應用開發效率的提高更為迫切。面對新需求與新變化,模型應用開發工具逐步走向市場,并幫助用戶快速搭建豐富的模型應用。大模型應用開發工具趨于平臺化,不僅整合了必要的開發工具、框架與服務,還極大地簡化了從模型調用到應用部署的全過程,為開發者提供了高效、便捷的創新環境
58、。一方面,國內模型應用開發平臺整合了軟件開發的全流程工具,并提供了大量 AI 能力組件。例如,百度智能云千帆 AppBuilder 面向不同開發能力的用戶和開發場景,分別以零代碼態、低代碼態、代碼態的產品形態,幫助開發者構建 AI 原生應用。字節跳動扣子應用開發平臺集成了超過 60 款各類型的插件,可以極大地拓展 AI Bot 的能力邊界,并且提供了簡單易用的知識庫能力和數據庫長期記憶功能。另一方面,國外模型應用開發平臺集成了很多開源框架,并提供了豐富的 API 和工具,滿足各種應用場景的需求。例如,谷歌的 VertexAI 中包括 TensorFlow、Keras、Colab 等在內的開源框
59、架,提供了模型訓練和部署的 API,能夠快速實現基于大模型的應用解決方案。人工智能發展報告(2024 年)26(四)高質量多模態數據集成為模型能力提升關鍵(四)高質量多模態數據集成為模型能力提升關鍵大模型發展已經進入多模態融合階段,作為人工智能學習、訓練和驗證的“燃料”基礎,大規模、高質量、多模態數據集對于多模態大模型能力提升愈加重要,以數據為中心的人工智能時代正在加速到來。近期,由華盛頓大學、Salesforce Research 和斯坦福大學等機構聯合團隊推出的包含萬億 token 的史上最大多模態開源數據集 MINT-1T(Multimodal INTerleaved)正式發布,經驗證以
60、該數據集為基礎預訓練的 XGen-MM 模型在視覺描述、視覺問答、多圖像推理等基準性能方面取得了顯著提升。為加速構建人工智能高質量數據集,面向大模型的新一代數據工程成為核心技術手段。大模型的數據工程涵蓋訓練數據集的數據采集、數據預處理、數據標注、質量評估、數據合成、開放共享等全生命周期,不僅需要保證數據的數量和多樣性,更要強調數據的質量和有效性,并通過嚴格的數據治理和管理,確保數據的安全性和合規性,降低數據使用中的風險。來源:中國信息通信研究院圖 5 不同階段的具體數據需求情況人工智能發展報告(2024 年)271.數據預處理:多模態詞元融合和實時處理成為主要發展方向數據預處理技術正朝向多模態
61、融合、智能化、實時性全面進化的方向發展。一是多模態詞元化序列向量有效融合。隨著大模型向多模態方向發展,預處理技術逐漸整合文本、圖像、音頻、視頻等多種類型的數據,探索建立模型識別的多模態統一詞元序列空間方法,實現高效、一致、標準的預處理流程,以支撐模型對復雜多源信息的理解和生成能力。比如,OpenAI 的 GPT-4o 模型實現了圖像、文本和音頻等不同多模態的詞元向量統一對齊,平均反應時間僅有320 毫秒,與人類的對話反應速度已經不相上下。二是自動化與智能化程度持續提高。當前數據預處理過程更加依賴自動化工具和算法,未來亟需利用 AI 技術自我優化預處理步驟,減少人工處理過程干預,提升效率和精確度
62、,比如自動識別數據模式、智能選擇預處理策略。三是實時處理與流式數據處理能力不斷增強。面對大規模實時數據流,預處理技術創新側重于低延遲處理技術,比如流式計算、實時分析和即時反饋機制,確保模型能夠及時響應最新數據。四是利用邊緣計算加速處理效率的趨勢逐步顯現。為了應對大模型數據量的指數級增長,預處理技術更加傾向于利用邊緣計算和分布式處理架構,減少數據傳輸成本,提高處理效率和響應速度。比如使用 ApacheSpark 等分布式計算框架,在集群中并行處理數據,可有效提升數據預處理效率。人工智能發展報告(2024 年)282.數據標注:新一代高水平數據標注提升高質量數據集供給能力大模型發展需要新一代高水平
63、數據標注。當前,隨著深度學習和人工智能模型的復雜度提升,對高質量、精細化標注數據的需求愈發迫切,這不僅要求數據標注技術能夠高效處理大規模數據集,還需要具備對多模態數據(如圖像、語音、視頻及文本)和跨領域數據綜合處理的能力,數據標注逐漸向專業化、智能化、多模態方向發展。一是自動化與智能化標注工具創新成為焦點。當前,基于計算機視覺、自然語言處理等技術的自動標注工具快速涌現,這些工具利用算法初步完成標注,再由人工進行校驗和修正,可大幅提高標注效率,降低成本。比如國內數據標注企業海天瑞聲已建成一體化智能數據處理服務平臺,可實現語音、圖像、視頻以及文本等全領域數據的自動標注處理。二是多模態數據標注技術的
64、融合逐漸成為趨勢。隨著 AI 應用向更復雜的場景拓展,單模態數據已無法滿足需求,跨領域的多模態標注技術,結合圖像、聲音、文本和視頻的多模態聯合標注,正在成為數據標注的新趨勢。例如,由 HumanSignal 開發的 Label Studio 開源數據標注工具,可支持文本、圖像、語音等多模態數據標注,廣泛應用于 NLP、CV、語音識別等領域,顯著提高了 AI 模型訓練效率。三是持續學習與反饋機制引入促進數據標注質量和效率雙重提升。通過將標注后的數據反饋給 AI 模型,不斷訓練和優化模型性能,形成標注-訓練-反饋的閉環,不僅能提升人工智能發展報告(2024 年)29模型精度,還能指導標注策略的動態
65、調整,確保標注工作更加高效和具有針對性。四是跨學科融合深度和廣度進一步拓展。隨著人工智能技術的不斷發展,越來越多的重點行業領域開始應用數據標注技術,不同行業領域的數據標注需求呈現多樣化和專業化的特點,需要跨領域的專業知識和技術支持。3.質量評估:數據質量評估和模型反饋機制共同推動數據質量不斷提升當前,人工智能數據集質量評估需求體現在完整性、準確性、一致性、時效性和可解釋性等多個方面,評估技術發展趨勢主要聚焦以下幾個關鍵方向:一是質量評估與反饋機制深度融合。數據質量評估引入客觀的數據質量評估指標和模型反饋機制,使得數據使用者可以評價數據集的實際綜合表現,并反饋給數據提供者以改進數據采集和處理流程
66、。2024 年 6 月,OpenAI 推出了 CriticGPT,旨在幫助人類評估和檢測大型語言模型(LLM)生成的代碼輸出中的錯誤,CriticGPT 通過訓練生成自然語言反饋,可以評估出代碼中的質量問題,并且在檢測自然發生的 LLM 錯誤時,其生成的評審比人類評審更受歡迎,準確率高達 63%。二是多模態數據質量評估框架快速發展。針對圖像、語音、文本等多種類型數據,設計發展了綜合評估模型,確??缒B數據的一致性和互補性。通過融合計算機視覺、自然語言處理和語音識別技術,實現多維度數據質量的全面評估。三是偏差與公平性評估成為數據質量評估重要組成部分。鑒人工智能發展報告(2024 年)30于 AI
67、 系統易受偏見數據影響,數據質量評估技術致力于檢測并量化數據集中存在的偏差,確保訓練數據的均衡性和代表性,減少模型輸出的不公平性。通過算法審計和統計測試,系統性地識別并糾偏,保障 AI 應用的公正性。四是動態數據質量監控體系逐步完善。利用實時分析和流處理技術連續評估數據質量,即時反饋數據問題,支持快速響應。這不僅有助于維護數據的時效性和準確性,也確保了AI 模型在數據變化時的穩定表現。4.數據合成:合成數據有望解決大模型潛在數據瓶頸當前,大模型的訓練數據嚴重依賴現有的互聯網公開數據。有研究預測,到 2026 年大型語言模型的訓練就將耗盡互聯網上的可用文本數據,未來需要借助合成數據解決大模型的數
68、據瓶頸。目前,合成數據正迅速向金融、醫療、零售、工業等諸多產業領域拓展應用。根據 Gartner 預測,到 2024 年,60%用于 AI 開發和分析的數據將會是合成數據,到 2030 年,合成數據將成為 AI 模型所使用數據的主要來源11。2024 年 6 月,英偉達正式發布全新開源模型Nemotron-4 340B,具體包括基礎模型 Base、指令模型 Instruct 和獎勵模型 Reward 共三個模型。其中,指令模型 Instruct 的訓練僅依賴大約 2 萬條人工標注數據,其余用于監督微調和偏好微調的 98%以上訓練數據都是通過 Nemotron-4 340B SDG Pipeli
69、ne 專用數據管道合成。11Gartner,Maverick Research:ForgetAbout Your Real Data-Synthetic Data ls the Future ofAl,Leinar Ramos,JitendraSubramanyam,24 June 2021人工智能發展報告(2024 年)31當前,合成數據技術創新主要呈現以下幾大趨勢:一是合成數據模型走向深度進化。傳統的數據合成方法多依賴統計學和機器學習的基本原理,當前數據合成技術聚焦于深度學習算法模型,特別是生成對抗網絡(GANs)的廣泛應用。GANs 通過一對競爭性神經網絡生成器和判別器的博弈過程,實現了
70、前所未有的數據真實度與多樣性,諸如 StyleGAN、BigGAN 等高級變種網絡技術,極大拓寬了數據合成的應用邊界。二是多模態合成能力不斷突破。多模態合成技術通過整合不同模態的特征表示,能夠同時生成聲音、視頻、3D 模型等多種類型的數據,不僅豐富了合成數據的維度,也促進了多模態理解和生成任務的進步,為復雜場景應用(如自動駕駛、虛擬現實等)提供了重要的技術支持。三是強化學習與合成數據逐漸融合發展。近期數據合成技術開始與強化學習算法深度融合,用于模擬復雜環境下的交互數據,幫助智能體在安全、成本效益高的虛擬環境中學習策略。這種結合不僅解決了現實世界數據獲取難、風險高等問題,還極大地提升了智能體的學
71、習效率與適應能力,尤其是在自動駕駛、機器人導航等領域展現出巨大潛力。四是隱私保護與合規性技術不斷增強。面對日益嚴格的個人數據保護法規,數據合成技術創新性地提供了隱私保護解決方案差分隱私、聯邦學習與合成數據的結合,使得在不暴露原始敏感信息的前提下,也能生成可用于訓練的高質量數據集,這不僅保障了用戶隱私,也為金融機構、醫療保健等行業利用 AI 技術創造了條件。人工智能發展報告(2024 年)32三、應用賦能隨著大模型時代到來,人工智能技術能力快速迭代,持續推動各行各業的發展路徑變革,全面帶動大規模產業升級。在傳統專用智能應用基礎上,大模型通過進一步提供智能對話、文本創作、圖像生成和視頻生成等通用能
72、力,提升賦能經濟發展、民生服務、科學發現等各領域的深度和廣度,將對全球經濟社會發展和人類文明進步產生深遠影響。(一)人工智能賦能階段性特征顯現(一)人工智能賦能階段性特征顯現專用智能應用逐步成熟,通用智能落地前景廣闊。一方面,專用小模型與行業場景融合深入。通常來看,小模型包括傳統結構小模型及小參數預訓練模型兩類。其中,傳統結構小模型網絡結構以卷積神經網絡、循環神經網絡等為核心,在圖像識別、語音識別等任務中接近到人類水平,由于其規模較小,訓練及推理成本低,目前已在實際生產中廣泛部署應用。隨著人工智能技術需求增長,長尾場景增多,小規模預訓練模型也可一定范圍內解決多個下游任務。另一方面,隨著全球掀起
73、大模型應用探索熱潮,大模型憑借更強大的分析、預測和交互能力,以及對場景任務的適應性,將有望帶動工業技術產業實現創新性變革。短期看,大模型將重點賦能通用性較強或具備充足數據的場景,以提升執行效率為主。長期看,隨著大模型不斷向研發、生產管控等核心環節深度賦能,將顯現變革效應,影響底層邏輯、產品形態甚至整個產業體系。值得探討的是,人工智能發展報告(2024 年)33大模型的價值并非“替代”傳統小模型,未來人工智能應用將呈現“大小模型協同”發展態勢。面向企業側和消費側的應用展現出不同的發展態勢。面向企業側,大模型應用更注重專業定制和效益反饋。我國提倡在社會生產領域和大眾消費領域共同推進人工智能發展,這
74、與我國產業結構特征密切相關。隨著“人工智能+”行動等政策深入推進,大模型在多個行業成效顯現,盡管各行業成熟度高低有別,但整體表現出較高的探索積極性。在以軟件開發為代表的生產性服務業領域,部分行業具備相對良好的數據基礎,實用效益的顯現吸引了更多參與者加入,部分應用能夠實現全流程優化,大模型應用成熟度較高。在交通、醫療等社會民生關鍵領域,大模型信控方案、無人駕駛、智慧診療等,已經實現點狀場景的示范應用。在制造業領域,研發生產提質增效成為當前大模型落地的主要訴求。目前,在藥物/材料研發和工業設計等研發設計環節、在安全巡檢和質量監測等生產環節、以及在統計圖表生成等經營管理環節,大模型均有應用落地,展現
75、出巨大變革潛力。然而,由于線下生產流程的復雜性、嚴謹性和專業化要求,大模型在實時生產環節應用進展相對較慢。面向消費側,大模型應用更強調普惠適用和創意生成。消費側大模型應用百花齊放,對話助手類產品熱度不減,創新應用不斷涌現并逐漸成為用戶使用的重點。根據相關統計數據,截至 2024 年 7 月,聊天助手類產品以 24 億的流量位居首位,但流量環比降低超 15%;相比之下,圖人工智能發展報告(2024 年)34像設計類產品流量環比上升了 16.83%。與此同時,用戶需求不再局限于文字生成,創新生成式工具成為當前最具吸引力的功能。據知名投資機構 8 月發布的Top100 消費級生成式 AI 應用榜單顯
76、示,有 52%的公司專注于圖像、視頻、音樂、語音等多種模式內容的生成或編輯,且新上榜的 12 家公司中有 58%屬于創意工具領域。大模型應用在產業鏈各環節分布呈現“兩端快、中間慢”特征,即產業鏈兩端的研發設計和運營服務等知識密集型、服務密集型環節落地相對較快,生產制造等中間環節相對較慢。從兩端環節看,一方面,科學研究、研發設計等知識密集型場景理論基礎堅實,且普遍擁有高質量數據集,大模型賦能科研(科研智能,AI for Researchand Development)的作用得以充分發揮。例如,某藥物分子大模型可以減少新藥研發中對小分子化合物的人工篩選計算量,使先導藥的研發周期從數年縮短至數月,研
77、發成本降低約 70%。另一方面,營銷、運營等服務密集型場景跨行業通用性較強,成為大部分行業企業首選的大模型“試點”場景。以某醫療大模型為例,在診前階段,數字人就醫助手能提供 724 小時的智能客服及專業科普服務,在分診、導診環節輔助人工服務,極大提升診療效率。從中間環節看,大模型在生產、制造等低附加值場景的落地存在一定局限性,面臨場景選擇難、低時效性、低可信度等問題。但在視覺等領域也出現了成熟的應用模式,如 TCL 通過視覺技術實現液晶面板缺陷檢測,準確率超 90%、生產周期縮短了 60%。人工智能發展報告(2024 年)35來源:中國信息通信研究院圖 6 基于百個優秀案例統計的 AI 應用產
78、業鏈分布總體而言,當前大模型技術條件下,落地應用并非適用所有場景。目前大模型適用的場景側重于對話交互、創意生成、知識管理類,而對于可解釋要求高、確定性要求高、實時性要求高、場景動態性高、樣本數據不易獲取的場景,大模型如何有效應用還需要進一步探索。因此,大模型賦能需要針對具體應用場景合理選擇。如,在產品設計、技術研發、知識管理、仿真驗證等語料豐富、問題邊界清晰的領域,大模型能發揮強大的自然語言處理能力能,極大提升勞動者的生產效率和創造力,從而推動工業技術產業實現創新性變革。而在實時生產中,由于對質量管理和流程精的高度要求,以及高質量專業數據獲取的現實困難,尚不能采用大模型生成的“弱解釋性”結果直
79、接指導生產現場。綜上所述,數據規模與質量、場景核心業務邏輯與大模型的創意生成和交互能力之間的匹配度,是選擇的重要考慮因素。人工智能發展報告(2024 年)36(二)重點行業人工智能應用走深向實(二)重點行業人工智能應用走深向實裝備行業重點關注研發與制造流程優化、產品智能化升級等方向,逐步滲透并重塑生產模式。一是優化智能制造流程。人工智能技術通過與工業軟件、工業控制系統等關鍵工業要素的深度融合,能夠結合市場需求、物料儲備和設備狀態實現工業生產的智能調度,形成生產過程的高效協同機制,支撐工業企業實現生產的智能決策。例如,AnyLogic 仿真平臺通過強化學習降低重型機械運動,實現制造產線優化,協調
80、對象的數量增加 66%,運動次數減少 11%。二是提升智能產品與服務價值。汽車、軌道交通、工程機械等裝備逐步向智能化產品演進,基于視覺的環境識別成為目前主要探索方向。航空和交通領域成為開展增值服務的重點行業,如國外某航天公司飛行器座艙內的 AI 驅動系統可以通過評估和通知燃油水平、系統狀態、天氣狀況和其他基本參數來幫助優化實時飛行路徑。三是產品設計與仿真優化。人工智能輔助設計軟件能夠根據市場需求快速迭代產品設計、大幅提升仿真效率,有利于增強市場競爭力。例如,北汽福田應用 AI 找到最佳的設計路徑,消除原結構太重和產品質量缺陷帶來的問題,零部件從最初的 4 個零件變為 1 個,重量減輕70%,強
81、度增強 18.8%。四是助力環保與可持續發展。人工智能在節能減排、廢棄物管理等方面發揮重要作用,通過優化生產流程、提高資源利用效率,減少環境污染。此外,人工智能還能助力綠色產品研發,推動裝備制造業向低碳、循環方向發展。人工智能發展報告(2024 年)37消費品行業聚焦產品創新與智能化營銷管理,正逐步改變消費者的購物習慣與體驗,推動行業向更加個性化、智能化的方向發展。一是新產品研發快速響應市場變化。人工智能技術助力消費品企業快速響應市場變化,開發具有創新性和差異化優勢的新產品。以智能家居為例,小米生態鏈中的產品,如智能燈泡、智能門鎖等,通過集成人工智能技術實現了語音控制、場景聯動等多種功能,提供
82、了更加便捷、舒適的生活體驗。二是精準營銷與智能客服。一方面,人工智能通過分析消費者的購買歷史、瀏覽行為等數據,預測消費者偏好、購買趨勢,幫助企業定義目標用戶并生成專屬營銷方案,實現精準營銷和個性化產品推薦。例如,銜遠科技的 ProductGPT 營銷大模型,結合商品特性與熱門趨勢,可在幾分鐘內生成富有創意的營銷內容,利用率高達 80%。另一方面,基于自然語言處理技術提供面向顧客的智能聊天與推薦等服務,替代傳統的人工客服 24 小時不間斷地為用戶提供咨詢解答、訂單跟蹤等服務,提升服務效率與用戶體驗。三是供應鏈管理智能化。人工智能的應用使消費品供應鏈變得更加智能與透明,從原材料采購到生產、物流、銷
83、售等各環節的信息都可以被追蹤,并基于 AI 分析預測市場需求以制定合理的生產計劃。例如,京東物流利用大模型的數智化供應鏈技術,聚焦從智能規劃到智能倉儲與運配,再到智能客服與營銷的全鏈路降本增效,實現采購自動化率超過 85%,平均現貨率超過 95%,庫存周轉天數降至近 30 天。人工智能發展報告(2024 年)38原材料行業聚焦生產過程管控優化,利用人工智能技術逐步改變傳統的資源開發、加工和利用方式。一是資源勘探與開發智能化。人工智能結合地質學、遙感技術等多領域知識,提高礦產資源勘探的精度和效率。例如,加拿大的 GoldSpot Discoveries 公司使用機器學習算法分析地質數據,成功預測
84、了多個金礦的位置,提高了勘探的成功率。二是生產流程優化與節能減排。人工智能在工業生產過程中實現精準控制,優化工藝流程,降低能耗和排放。例如,在鋼鐵行業中,寶鋼股份利用人工智能技術實時監控高爐運行狀態,通過調整操作參數,提高了冶煉效率和產品質量,減少了能源消耗和環境污染。三是廢棄物管理與資源回收。人工智能通過圖像識別、物聯網等技術手段,實現廢棄物的精準分類與回收。例如,瑞典的Recycleye 公司開發了一套基于人工智能的廢物分類系統,能夠準確識別不同類型的廢棄物,并進行分類處理。同時,還可以利用人工智能分析廢棄物成分,探索其再生利用途徑,促進循環經濟發展。(三)體系化推動人工智能落地應用成為共
85、識(三)體系化推動人工智能落地應用成為共識當前,人工智能應用持續走深向實,行業大模型已在金融、醫療、教育、零售、能源等多個行業領域實現了初步應用,并產生了明顯的經濟效益和社會效益。通過總結多方案例,大模型在落地應用通常涵蓋需求分析、模型選型、中臺建設、模型應用、運維管理、風險管理等重點環節,體系化推動落地應用成為引導人工智能技術實用化、普惠化發展的行業共識。人工智能發展報告(2024 年)391.開展戰略需求分析是企業布局大模型的前提大模型作為引領時代發展的戰略性技術,已成為各行各業競相發展的焦點。企業希望通過布局大模型對傳統的業務流程、組織架構和經營模式進行全面升級和改造,以提升運營效率、降
86、低成本、增強市場競爭力,并更好地滿足客戶需求。在布局大模型之前,企業通常全方位開展戰略需求分析,統籌規劃大模型所需各類資源,進而為大模型落地應用提供有利支撐。比如,思必馳科技股份有限公司在深入分析軌交領域的智慧乘客服務、智慧運營運維需求后,將自研 DFM-2 行業大模型與智慧軌交方案相結合,協助蘇州軌交打造軌道交通多線路中心級語音平臺,為乘客提供智慧出行新體驗。多方案例表明,需求分析可以有效地幫助企業全方位探索借助大模型實現產品迭代和服務升級的有效途徑,為后續的決策制定、資源配置和研發測試提供堅實的基礎,助力企業在智能化轉型中行穩致遠。2.明確選型方案是企業研發大模型的關鍵一步大模型的能力構建
87、是一項復雜的系統性工程,往往牽一發而動全身,根據自身切實需求明確大模型技術選型可以為企業后續模型研發和應用夯實基礎。通過分析百度“文心一言”、阿里“通義千問”等通用大模型和度小滿“軒轅”、中石油“昆侖”等行業大模型的構建研發過程,大模型技術選型通常包括模型生態、模型部署、模型協同、算力推算等方面。企業在選擇開源或閉源兩類模型生態時,通常綜合評估自身開發成本、開發周期、性能、安全性等要求,人工智能發展報告(2024 年)40基于所選模型生態通過搭配標準化的接口和豐富的工具包可以進一步提高模型開發的質量。合理的模型部署策略是模型穩定可靠運行的基礎。公有云或私有云部署策略的選擇涉及企業自身數據敏感性
88、、數據規模、算力規模等要素。在模型部署過程中,企業通??紤]大模型在不同操作系統和平臺上部署的高度兼容性,從而保證大模型穩定運行。模型協同是實現模型高效應用的重要手段。企業通過整合自身大小模型資源,構建大小模型協同鏈路,充分融合大小型模型的優勢,進而提高模型性能以適應不同的應用場景。比如,部分企業將大模型部署在云端以處理大規模計算任務,將小模型部署在終端設備,如智能手機上,以實現快速響應和低延遲。開展模型推理算力評估可以提高企業資源配置效率。企業進行算力需求估算需要綜合考慮模型大小、量化方式、訪問并發量,并結合 AI 芯片顯存大小推算所需芯片數量。一般情況下,如果任務對生成、理解、推理、決策的要
89、求較高,推理算力充足,可以選擇較大的模型,如Qwen-72B、Llama-3 70B;對于準確度要求不高的較簡單的任務,推理算力有限,或在邊緣設備及端側部署,可選擇十億級別的模型,如 Qwen-7B、Llama-3 8B。3.建設企業人工智能能力平臺是工程落地的核心人工智能能力平臺正在成為企業全面智能化轉型的基礎底座。AI 能力平臺通過統一管理算法、數據、計算資源和模型,以標準化的方式優化這些關鍵資源,幫助企業降低技術門檻,縮短開發周期,人工智能發展報告(2024 年)41并提升智能應用的構建、部署和維護效率,從而推動企業全面智能化。通常來看,AI 能力平臺的核心功能包括統一納管計算資源、高效
90、開發流水線、統一管理運營 AI 資產等。對于初創企業,AI 能力平臺的構建應聚焦核心業務,利用云服務和開源工具快速搭建基礎設施。通過敏捷開發模式,企業能夠在短期內推出最小可行產品(MVP),并使用容器化技術如 Docker 和 Kubernetes 簡化部署,確保 AI 服務靈活支持業務需求。在有限資源條件下,初創企業可以通過這種方式快速構建可復用和擴展的 AI 能力平臺。對于大中型企業,AI 能力平臺建設需要深度整合已有的大模型平臺、數據能力平臺和業務系統。企業應通過梳理業務邏輯,使 AI 能力最大化賦能業務流程;技術上,則需構建高效的數據整合和模型管理平臺,通過微服務架構提供低延遲、高可用
91、的模型服務,提升業務運營效率。中國工商銀行通過大小模型協同,構建了統一的 AI 能力平臺,廣泛應用于智慧服務、產品創新、風險防控等多個領域,顯著提升了業務創新效率,實現了 AI 能力平臺通過標準化開發和管理,加速智能應用的落地,并為金融行業提供了成功路徑。4.構建智能體應用進一步釋放大模型應用潛能智能體作為將大模型轉變為生產力的主要應用形態,通過智能體工具調用、智能體工作流、智能體人機交互等方式,能夠快速理解和響應產業需求,拓寬大模型應用場景,為企業的數字化轉型和智能化升級提供強大助力。智能體工具調用有效解決大模型“有腦人工智能發展報告(2024 年)42無手”的問題。大模型在感知、認知、推理
92、等方面表現出色,但仍缺乏將決策轉化為實際行動的能力。智能體可以實現意圖理解、任務分解、任務規劃,可通過調用小模型、實用工具或檢索數據庫等完成具體任務。智能體工作流進一步推動模型高質量輸出。智能體工作流在任務執行過程中可以將任務拆分為不同步驟,通過合理規劃和多次迭代,實現更高質量的模型輸出,確保任務順利完成。比如,在評測大模型代碼生成能力的 HumanEval 數據集上,GPT-3.5(零樣本)的正確率為 48.0%,GPT-4(零樣本)的正確率為 67.0%,遠遠高于 GPT-3.5。如果在 GPT-3.5 上搭配智能體工作流,GPT-3.5的推理表現將超過 GPT-4。智能體人機交互實現人類
93、和智能體的優勢互補。人類在模糊概念理解、創造性思維、情感判斷等方面具有特定優勢,智能體在數據處理、任務規劃、推理決策等方面更具優勢。通過交互式學習,智能體可以逐步積累更多的人類經驗,實現更高的魯棒性和適應性。5.打造運維管理體系助力 AI 生產過程規范化機器學習研發運營體系(MLOps)作為一種系統性方法論,在傳統機器學習領域引起了廣泛關注。市場上涌現了眾多 MLOps 工具和平臺,如 TensorFlow Extended(TFX)、MLflow、Kubeflow 等,這些工具提供了數據工程、模型訓練、模型部署與交付、模型監控與運營等模型生產全流程的支持。通過將 MLOps 納入機器學習工作
94、流中,打造模型研發運營管理體系,實現模型的快速迭代、持續交付人工智能發展報告(2024 年)43和持續運營,提高業務響應速度,從而系統性解決模型煙囪式生產周期長、生產過程和資產管理欠缺、跨團隊協作難等問題。而大模型時代的 MLOps,基于流程化、自動化、持續迭代、可管理等原則,提升大模型的可修正和可運營能力,加速大模型規?;涞夭椒?,提升運營管理效率,打造價值閉環。例如,某金融機構的反欺詐場景,通過 MLOps 體系管理和運營 AI 模型,可從每筆交易中動態學習,從而提高檢測可疑活動的能力,顯著增強欺詐檢測能力。某企業物流場景,通過 MLOps 管理網絡路線規劃的模型,實現交通和天氣數據不斷實
95、時更新,從而實現更高效的路線交付和更優的客戶滿意度。6.注重風險管理為大模型落地保駕護航人工智能技術的應用場景持續拓寬的同時,新型人工智能技術應用風險持續涌現,全球將人工智能安全治理列為“優先議題”。對于產業界而言,亟需從風險管理和流程管控的角度出發,構建一套精準識別、全面防范、有效管控人工智能風險的治理落地方案。在風險管理方面,構建“風險識別-風險評估-風險應對”的風險管理鏈路,結合 ISO/IEC 42001人工智能管理體系等國際標準架構,立足我國產業實踐提出風險管理方案。目前,已有百度、阿里云等企業推動構建基于風險的全生命周期合規化管理體系。首先,從技術、應用和管理等多維度進行風險識別,
96、找準風險點;其次,對風險進行分析和評價,確認風險的危害程度;最后,根據特定風險類別實施對應的風險應對方案。例如,通過對人工智能模型的關鍵核人工智能發展報告(2024 年)44心資產進行全流程加密,對模型生成內容進行評估測試以及對惡意內容進行過濾等方式應對人工智能安全風險。在流程管控方面,打通“技術提供方、應用提供方、應用使用方”全鏈條風險管理鏈路,將風險治理理念及人工智能治理要求貫穿于人工智能規劃設計、數據處理、模型建設、測試驗證和部署上線等各類活動的全流程,滿足不同技術領域、不同業務規模的產業實踐需要。產業界也有頭部企業積極開展面向流程的實踐,如中國移動編制人工智能安全風險防控工作指引,依托
97、“技術提供方、應用提供方、應用使用方”三類角色并圍繞平臺、數據、模型算法、業務服務、人員組織等治理要素,推動落實相應安全措施。來源:中國信息通信研究院圖 7 人工智能風險管理體系四、安全治理人工智能在服務經濟社會發展的同時,也誘發出數據安全、隱人工智能發展報告(2024 年)45私保護、虛假信息傳播、勞動力取代、科技倫理挑戰等諸多風險。為尋求應對策略,全球紛紛調整人工智能安全治理布局??v覽全球舉措,國際合作愈發緊密,各國治理進程不斷提速,產業組織發揮重要作用,安全技術體系逐步完善,全球人工智能安全治理正處于“從原則走向實踐”的關鍵階段。各國積極構建人工智能治理體系,建設標準體系,提升技術安全能
98、力,加強社會參與和提升公眾素養,旨在實現安全與性能平衡發展,讓人工智能駛向更加有序、普惠全人類的未來。(一)人工智能技術應用帶來多重挑戰(一)人工智能技術應用帶來多重挑戰得益于算法不斷突破、預訓練大模型迅猛發展、多模態技術融合應用,人工智能技術產業發展進入快車道。作為未來顛覆性技術,人工智能在催生新產業、新模式、新動能,成為新質生產力的同時,也引發多維度的安全挑戰,包括自身安全和衍生安全風險。來源:中國信息通信研究院圖 8 人工智能風險示例人工智能發展報告(2024 年)46人工智能的自身安全主要是人工智能技術系統的安全問題,涉及技術系統部署所依賴的傳統基礎設施,以及模型、框架等人工智能系統特
99、有的部分。因此,人工智能技術系統一方面面臨傳統的信息安全問題,如網絡釣魚、DDoS 攻擊及網站篡改等網絡威脅;另一方面面臨一些新問題,如算法模型可解釋性不足、框架安全漏洞、數據標注不規范等挑戰。算法模型方面,由于深度神經網絡存在非線性、大規模特點,導致在理論上難以證明其行為,同時因“模型幻覺”造成生成內容不可信。人工智能框架方面,安全漏洞可能遭到惡意利用。據報道黑客利用開源人工智能框架 Ray 的安全漏洞,數千家網絡服務器遭受攻擊,超過10億美元算力遭到“劫持”12。數據標注方面,標注數據的不準確和不一致將導致模型在訓練過程中學習到錯誤知識,生成錯誤、歧義或不符合語境的內容。人工智能的衍生安全
100、問題主要是由于技術系統風險管控不當,以及技術系統被濫用、誤用或遭到外部攻擊,對個人組織、國家社會,乃至全人類造成的安全問題。一是對個人組織產生隱私、生命、財產、倫理等風險。隨著人工智能技術的發展和應用,人工智能已經潛移默化地融入了個人和組織的生產生活中,技術被濫用或失控后,個人和組織的切身利益會遭到侵害。2023 年以來,全國已經發生多起不法分子利用人工智能換臉、換聲技術實施詐騙的案例,涉12https:/www.oligo.security/blog/shadowray-attack-ai-workloads-actively-exploited-in-the-wild人工智能發展報告(20
101、24 年)47案金額高達百萬元人民幣13。二是對國家社會帶來政治、文化、經濟、軍事、網絡空間等方面的風險。近年來,人工智能技術已經被用于軍事等領域,用于降低軍事投入和開辟數字戰場。如以色列軍隊利用人工智能技術打擊了加沙地帶 1.1 萬多個目標,一天內發現并摧毀了 150 個隧道14。三是對全人類造成不可持續、不可控的風險。人工智能模型性能突破需大量、高效的算力支持,但模型訓練導致大量資源浪費,抬高碳排放水平。以 GPT 訓練為例,1750 億個參數的GPT-3 模型能耗相當于 1287 兆瓦時的電力,還產生了 552 噸二氧化碳15。在未來,前沿人工智能模型在化學、生物、放射性物質、核武器(C
102、BRN)領域還可能造成不可控的極端風險。聯合國秘書長古特雷斯多次警告人工智能的快速發展可能會導致嚴重的意外后果,并將其與核武器比肩16。(二)全球人工智能安全治理正處于“從原則走向實踐”的關鍵階段(二)全球人工智能安全治理正處于“從原則走向實踐”的關鍵階段1.國際層面推動形成治理共識,圍繞安全議題合作愈發緊密國際組織推動形成共識文件。聯合國成立“人工智能高級別咨詢機構”,負責分析人工智能國際治理并提出政策建議。2024 年,聯合國大會先后通過抓住安全、可靠和值得信賴的人工智能系統13https:/ 年)48帶來的機遇,促進可持續發展,以及中國主提的加強人工智能能力建設國際合作決議,為全球提供制
103、度藍圖。同時,不斷推動將治理落在實處,2024 年 9 月聯合國人工智能高級咨詢機構發布最終報告為人類治理人工智能,為應對人工智能相關風險和治理差距提出具體建議。經濟合作與發展組織(OECD)于 2024 年 5 月更新人工智能治理原則,推動人工智能重要定義達成共識。金磚國家于 2023 年 8 月,已經同意盡快啟動人工智能研究組,推動建立有共識的治理框架和標準規范。全球圍繞安全議題開展緊密合作。2023 年 11 月,英國舉辦全球人工智能安全峰會,28 國及歐盟簽署布萊切利宣言。2024 年 5月,韓國和英國共同主辦人工智能首爾峰會,27 國及歐盟簽署首爾宣言,將“安全、創新、包容”列為三項
104、原則。此外,英、美、歐盟等 11 個國家和地區簽署 首爾人工智能安全科學國際合作意向聲明,各國將依托人工智能安全研究所,強化前沿人工智能系統研究合作,促進技術資源、大模型信息、測評數據共享,推進人工智能安全科學研究。2024 年 11 月,美國于舊金山召開國際人工智能安全研究所網絡成立會議,以推進人工智能安全方面的全球合作和知識共享。2.全球主要經濟體完善治理體系,安全落地實踐成為重要抓手人工智能發展報告(2024 年)49歐盟采取統一立法治理架構,布局風險管理等標準配套舉措。體系上,采取風險分級的基本治理框架。2024 年 5 月,歐盟理事會正式批準人工智能法案,按照人工智能潛在的不同風險級
105、別,劃分為不可接受風險、高風險、有限風險、低風險四種風險等級,并引入不同的規則來解決這些風險。舉措上,通過加強管理、產業標準化等手段尋求人工智能安全配套方案。歐盟成立專門的人工智能辦公室,以監管人工智能的發展,支持可信人工智能的使用,并防范人工智能風險。2023 年 5 月,歐盟委員會發布支持歐盟人工智能政策的標準化請求,包含人工智能系統風險管理、符合性評估和質量管理在內的 10 余項標準已正式成為下一步工作計劃。2024 年 9月,100 多家人工智能相關方簽署 人工智能公約,通過自愿承諾、互助合作,如分享信息和資源等方式,共同應對未來可能出現的挑戰。美國沿襲行業自律治理方案,開展安全測試夯
106、實技術監管。架構上,統籌監管資源促進行業自律。2023 年 10 月,美國總統拜登簽署關于安全、可靠和值得信賴地開發和使用人工智能的第 14110號行政令,發布全面的人工智能治理方法,明確了各監管機構的行動目標與期限。截至 2024 年 11 月,促使 16 家領先公司自愿承諾推動安全、可靠和可信的人工智能發展的工作。行動上,政府積極推動安全測試。第 14110 號行政令明確提出由美國國家標準與技術研究院(NIST)負責標準研制工作。同時,美國商務部將通過 NIST人工智能發展報告(2024 年)50制定指導方針和最佳實踐,以促進開發和部署安全、可靠和值得信賴的人工智能系統的行業共識標準,包括
107、創建評估和審計人工智能能力的基準、開展“兩用基礎模型”的紅隊測試等。2024 年 8 月,美國加利福尼亞州發布第 1047 號 前沿人工智能模型安全可靠創新法案,明確各類測試、安全和執法標準。英國治理方案注重“促進創新”,開發開源平臺推進安全實踐。方案上,營造有利于創新的政策環境。2023 年 3 月,英國發布促進創新的人工智能監管方法提出優先考慮指導、資源措施等較輕的干預手段,強調監管的合比例性,釋放人工智能創新活力。手段上,推出開源安全評估平臺掌握模型安全性。2024 年 5 月,英國人工智能安全研究所推出開源的“Inspect”人工智能模型安全評估平臺,幫助產業評估人工智能模型的核心知識
108、儲備量、推理能力與自主能力等性能,提高人工智能模型透明度及可重復性。新加坡實施溫和干預方案,打造可驗證的安全測試機制。體系上,不斷完善人工智能治理框架。2019 年 1 月,新加坡發布人工智能治理模型框架,為新加坡系統化探索可信人工智能生態系統奠定重要基礎。2024 年 5 月,新加坡迭代發布生成式人工智能治理模型框架,聚焦于生成式人工智能特點,細化相關原則,為企業提供詳細的指導和建議。實踐上,推動人工智能測試工具集建設。2022 年 5 月,新加坡發布人工智能治理工具包“人工智能驗證”(AI人工智能發展報告(2024 年)51Verify),結合技術測試和基于流程的檢查方法,幫助企業對自身的
109、人工智能系統進行評估。2024 年 5 月,新加坡在 AI Verify 中再添“登月計劃”(Moonshot),包含基準測試、紅隊測試、測試基線,幫助開發人員根據風險基線測試人工智能模型,推動人工智能安全應用。我國展現新型舉國體制治理優勢,著重保障人工智能應用安全。整體上,從框架規范到精準治理的體系建設。我國遵循新一代人工智能治理原則發展負責任的人工智能新一代人工智能倫理規范勾勒出的基本框架和行動指南,秉持科技向善的基本理念,出臺關于加強科技倫理治理的意見 科技倫理審查辦法(試行)等文件,加強科技倫理審查和監管。與此同時,延續人工智能治理領域精細化的立法特征,出臺互聯網信息服務深度合成管理規
110、定生成式人工智能服務管理暫行辦法,發布人工智能生成合成內容標識辦法(征求意見稿),聚焦互聯網信息服務等重點領域的監管。措施上,通過安全評估、備案等舉措,保障信息服務領域安全。2024 年 4 月,國家網信辦發布首批生成式人工智能服務已備案信息的公告,截至 8 月,國內已有近 1919 個深度合成算法、190個生成式人工智能服務在國家網信辦完成備案,形成良好示范效應。3.產業組織發揮技術研究和治理協同優勢產業組織積極發揮技術研究和治理協同優勢,通過發布治理框架,制定標準規范等多種形式促進人工智能治理。人工智能發展報告(2024 年)52治理框架方面,2023 年 1 月,NIST 發布人工智能風
111、險管理框架(AIRMF1.0),提供了一套組織流程和活動來評估和管理風險。2023 年 8 月,美國 AI Now 研究所等機構聯合發布“零信任人工智能治理”框架,為政策制定者提供一套治理路線圖。2023 年 12 月,中國信息通信研究院依托中國人工智能產業發展聯盟(AIIA)籌建安全治理委員會,發布“人工智能風險管理體系”,旨在持續推動人工智能安全治理技術能力提升和安全應用落地。標準規范方面,ISO、IEC、IEEE、CEN-CENELEC、SAC-TC28-SC42 等國內外標準組織在 2022-2023 年就人工智能安全已開展大量標準化工作。2023 年 2 月,ISO 和 IEC 聯合
112、發布人工智能風險管理指南,指導企業有效實施和整合人工智能風險管理的流程。5 月,歐盟委員會要求 CEN 和 CENELEC 起草新的歐洲標準,以支持人工智能法案實施。近年,我國人工智能標準化工作不斷提速,2024 年 6 月,工業和信息化部等四部委聯合印發國家人工智能產業綜合標準化體系建設指南(2024 版),加快構建滿足人工智能產業高質量發展和“人工智能+”高水平賦能需求的標準體系。安全技術方面,2024 年 1 月,NIST 發布了關于對抗性機器學習攻擊的報告,總結提出了包括數據投毒、模型竊取、成員推斷和屬性推斷攻擊等多種攻擊方法。2024 年 4 月,MLCommons 制定基準測試 v
113、0.5 驗證評估 AI 模型的安全性,使用超 43,000 個測試提示詞、人工智能發展報告(2024 年)53Meta 的 Llama Guard 來評估大模型對危險提示的響應。7 月,MLCommons AI Safety 工作組發布 v1.0 測試版本,構建相對全面的方法來衡量大型語言模型的安全性,其中包括部分未公開狀態的“隱藏測試”,以確保測試的安全可信性。2024 年 4 月,中國信通院依托中國人工智能產業發展聯盟發起大模型安全基準測試 AI SafetyBenchmark。在內容維度,整理了 50 余萬條測試輸入,涵蓋了底線紅線、信息泄露和社會倫理等風險類型。在模型安全維度,結合了1
114、6 種新型的模型攻擊方法,設計了 80 余種攻擊模板。截至 8 月,已經對國內外 25 家開閉源大模型進行了安全測試,初步摸清當前大模型的安全邊界。4.企業積極開展負責任的技術研發與應用為應對人工智能在當下遇到的可信問題與挑戰,企業積極探索應對人工智能風險的新方案,從管理和技術兩個維度落實自律。管理體系更加重視全流程管控。一方面,企業設置內部治理組織,統籌人工智能治理工作。IBM、微軟、谷歌、LucidAI、百度、商湯、阿里、螞蟻、曠視等多家科技公司設立了倫理委員會,并統籌推動對相關產品實施倫理審查。另一方面,發布倫理準則指引,指導企業具體實踐。IBM、微軟、谷歌、百度、騰訊、阿里、商湯、36
115、0 等國內外多家企業推出企業人工智能原則,包括對社會有益、安全、保護隱私、公平、透明、可解釋、可控、負責任等方面。人工智能發展報告(2024 年)54安全技術方案向一體化、定制化發展。一方面,安全技術方案整體涵蓋了風險識別、評估、防御等多個環節。風險識別和評估方面,微軟推出風險識別工具 PyRIT,可評估大模型生成內容的安全性,推動了風險識別的自動化和智能化。谷歌與 Jigsaw 發布的 PerspectiveAPI,可實時識別、評估和過濾網絡有害言論。風險評估和防御方面,奇安信集團發布 AI 安全整體應對方案,包括 AI 安全框架、解決方案、評估服務和測試工具等,可對大模型內容安全、科技倫理
116、等風險進行綜合防范。另一方面,安全技術方案開始支持個性化的配置。以微軟Azure AI Content Safety 為代表的安全解決方案不僅實現了對有害內容的自動識別與干預,還賦予開發者自定義過濾規則的能力,與用戶的定制化需求深度融合,進一步增強了內容的合規性。五、發展展望當前,人工智能正處于邁向通用智能時代的初始階段,技術體系和產業生態正在加速構建。近期來看,人工智能重要發展方向包括:一是增強語言大模型能力仍是技術升級的重點方向之一,推理或將獲得更多關注和資源投入。通過探索精細化的 Scaling Law,提升數據的數量和質量,不斷提升模型的復雜邏輯推理能力,降低成本、減少幻覺,推動語言大
117、模型成為未來通用人工智能的中樞?!奥伎肌蹦芰Ω鼜姷?o1 系列大模型發布,預示著自博弈強化學習有望成為提升語言大模型邏輯推理能力的技術新范式;在預訓練階段邊人工智能發展報告(2024 年)55際效益遞減、后訓練縮放定律(Post-Training Scaling Law)顯現的背景下,未來可能有更多算力被投入到后訓練和推理階段。二是多模態模型有望加速突破,從以語言大模型為骨干的多模態模型,向原生多模態模型演變,提升圖文理解和跨模態交互能力。三是智能體憑借其強大的環境交互、任務執行、自我優化等能力,將進一步拓寬人工智能的應用場景,大幅提升用戶體驗和工作效率,為人工智能賦能千行百業夯實基礎。四是
118、具身智能為智能體賦予“身體”,使其能夠與物理世界交互、探索、獲取經驗并改進自身行為,實現思維智能與行為智能的有機融合,成為邁向通用人工智能的重要一步。中遠期來看,與當前數字芯片不同的模擬計算、量子計算芯片等硬件或將逐步成熟,在此基礎上發展的類腦智能等顛覆性技術,將為人工智能發展帶來更廣闊的想象空間。人工智能的技術浪潮將推動更大范圍的行業轉型升級,助力行業邁向智能化新階段。大模型展現出的巨大潛力不僅將促使人工智能產業迎來重要的拐點,還將進一步推動我國生產力和生產關系的深刻變革。在行業大模型發展方面,其演進將聚焦于三個核心維度:一是增強行業通用性,隨著行業數據集的完善,針對特定行業的通用型大模型將
119、逐步涌現。企業可在此基礎上通過定制化開發滿足不同需求,降低成本,促進智能化普及。二是提升模型的專業穩定性與準確性,確保經過行業專家優化的模型得到持續關注和應用,形成穩定可靠的應用模式,通過多模態數據處理,提升人工智能的決人工智能發展報告(2024 年)56策效率和準確性。三是更多元化的人機交互方式,人與大模型的交互方式將從文本向語音、視頻甚至腦機接口等方式轉變。新興的交互方式將使大模型更易于使用,降低技術門檻,促進人工智能技術的廣泛應用。在賦能應用場景方面,行業大模型應用在提升文檔檢索、操作指導、設計圖生成和智能客服等基礎功能之上,還將深入到生產流程優化等核心環節。通過綜合分析業務和生產環節中
120、的多模態數據,以數據驅動的方式優化決策過程,推動行業向更高層次的智能化發展。未來,大模型行業賦能的趨勢將從當前提高交互能力的階段,逐步向提高業務創新和集成發展的階段邁進,最終實現與產業深度融合,推動行業變革,邁向通用智能時代。人工智能安全治理工作邁向深水區,探索切實有效、多方共治、敏捷應對的落實方案成為全球共同議題。面向人工智能的下一個時代,人工智能產業生態正在加速形成和發展,全球人工智能安全治理不僅是搶占戰略制高點和發展機遇的“關鍵點”,也是全球和人類需要共同應對的“必答題”。未來,人工智能安全治理的深化和落實更需多元協同共治。一是加速完善人工智能安全風險識別方法論,隨著人工智能技術日益融入
121、經濟社會發展各領域全過程,其安全風險面不斷擴大,更加敏捷、精準的安全風險識別機制仍需持續探索。二是不斷強化風險評估與防范策略,重點從人工智能基礎設施、算法模型、上層應用以及產業鏈等方面進行評估,形成切實有人工智能發展報告(2024 年)57效、動態迭代的風險識別與應對策略。三是持續加強人工智能安全技術治理,加強對算法模型毒性、魯棒性、公平性等方面的評測技術工具研究,強化技術治理能力。四是推動開放協同的國際合作,中國需要與全球共同努力,開展人工智能安全治理的基礎理論研究和共性技術研發,推動技術標準和指引的深入實踐與應用,加強安全治理國際交流與合作,達成更廣泛的共識,共同釋放人工智能潛力,有效防范和應對治理風險。中國信息通信研究院地址:北京市海淀區花園北路 52 號郵編:100191電話:010-62302914傳真:010-62304980網址: