1、 6G 網絡原生 AI 技術需求白皮書 6GANA TG1 2022/1/20 摘要 新一代 6G 移動新系統,旨在支撐和實現未來 6G 時代的萬物智連、萬務智聯和智能普惠,未來它將成為支撐和賦能各行各業更強大的智能基礎設施和平臺。伴隨著各級消費者和各行各業數字化、智能化應用的發展和深入,業界對6G新網絡原生/內生AI能力和服務的需求日臻強烈。本白皮書將基于未來 6G 新業態、新行業場景用例、新技術等方面需求和趨勢,系統地分析提煉原生/內生 AI 設計的技術需求和影響(例如:在能力,服務,架構,標準化等方面),從而有力地支撐 6G 新網絡原生/內生 AI 相關技術方案的設計實現和最終落地。 參
2、與本白皮書撰寫的單位,包括但不限于:中興通訊,中信科移動,華為,中國移動,中國電信,中國聯通,上??萍即髮W,重慶郵電大學,上海諾基亞貝爾,維沃,紫金山實驗室,亞信,愛立信,大連海事大學,鵬城實驗室。謹此衷心地感謝和致敬各個單位的貢獻和輸出。 目錄 摘要 . 2 目錄 . 2 1. 前言 . 5 2. AI 與 5G 通信系統的結合應用 . 5 2.1 AI For 5G 發展現狀 . 6 2.2 5G For AI 發展現狀 . 6 2.3 “5G 網絡 AI”發展現狀 . 7 2.4 AI 和 5G 移動系統結合應用面臨的挑戰 .11 3. AI 與 6G 新系統內生融合機理 .11 3.1
3、 必要性分析 .12 3.2 可行性分析 .12 3.3 增益性分析 .13 3.4 新特征新范式分析 .14 4. AI 和 6G 新系統內生融合的技術需求 .15 4.1 能力需求(功能,性能等方面) .15 4.1.1 算力能力需求 . 15 4.1.2 算法能力需求 . 16 4.1.3 數據能力需求 . 17 4.1.4 其它能力需求 . 18 4.2 服務需求(對內,對外等方面) .19 4.2.1 算力服務需求 . 19 4.2.2 算法服務需求 . 20 4.2.3 數據服務需求 . 21 4.2.4 其它服務需求 . 23 4.3 架構需求(產品,部署等方面) .24 4.3
4、.1 算力架構方面 . 24 4.3.2 算法架構方面 . 27 4.3.3 數據架構方面 . 28 4.3.4 其它架構方面 . 31 5. 技術需求和原則總結 .31 6. 參考文獻 .32 7. 附錄 .33 定義和縮寫 .33 文檔作者列表: 貢獻者 單位 楊立,謝峰,康紅輝,薛妍,王夢涵,牛嬌紅 中興通訊股份有限公司 艾明,段小嫣,孫萬飛,舒敏 中信科移動 彭程暉,劉哲,王君,王飛 華為技術有限公司 李剛,溫子睿 中國移動 夏旭,于夢晗,王恒,齊文 中國電信 黃兵明,廖軍 中國聯通 楊旸,吳連濤,李凱,鞏宸宇,馬牧雷 上??萍即髮W 梁承超,唐倫,柴蓉、王國仲 重慶郵電大學 沈鋼,葉晨
5、暉,張凱賓,顧方方 上海諾基亞貝爾 袁雁南,孫布勒 維沃移動通信有限公司 李蘭蘭,尤建潔 紫金山實驗室 歐陽曄,王達,柏楊,趙燕 廣州亞信技術有限公司 蘇苓, 郝丹丹 愛立信 楊婷婷,寧嘉鴻,崔正琦 大連海事大學/鵬城實驗室 1. 前言 原生/內生 AI 被業界認為是未來 6G 移動新系統的核心架構特征之一【1】。AI 科技和應用發展日新月異,其相關的科學理念、范式模式、算法模型、方法手段等,不僅要能更緊密、更深層次地內嵌融合到 6G 新系統的架構、網元和功能流程之中,它們還要能憑借未來 6G 更強大泛在的電信基礎設施平臺之優勢,更大地彰顯出 AI 效能增益和價值,全面助力實現未來 6G 時代
6、“萬物智連”、“萬務智聯”、“智能普惠”等美好愿景。本白皮書將先簡要介紹原生/內生 AI 的相關背景和動機,再力求全面系統地分析闡述:6G 移動新系統在原生/內生 AI 的設計過程中,所涉及到的諸多技術需求(例如:功能、性能、服務、架構等方面),全面涵蓋 AI 算力,AI 算法,AI數據三大 AI 基本元素;進一步地,基于最新的研究業態進展,我們還將繼續分析匯煉原生/內生AI 對 6G 移動新系統架構和標準化等方面的綜合影響和需求。 2. AI 與 5G 通信系統的結合應用 AI(特別是機器學習 ML 和深度學習 DL)與移動通信系統的結合應用,始于第五代移動通信系統 5GS(由 3GPP 標
7、準化定義),但 5GS 系統在設計之初(我們稱之為原生階段),并沒有充分地考慮 AI 業務應用和其相關能力服務,例如:如何基于 AI 新范式去改善優化某種通信類工作機制。雖然 5GS 移動系統已有著向云原生化 Cloud Native,和 IT 軟件定義、服務虛擬化方向演進的趨勢(例如:已支持服務化的核心網 SBA CN 和核心網云化部署等功能),同時 O-RAN、OpenRAN 等聯盟組織,也在積極地推動無線網絡的開放化、云化、虛擬化等工作,但受限于技術成熟度、安全性、系統運維復雜度等多方面的條件制約,5GS 無線接入側 NG-RAN 子系統總體上仍然保留著過去傳統“煙囪式CT化基站架構”和
8、相對固化的RAN協議棧模型。伴隨著AI功能和業務的逐步滲入且價值彰顯,5GS 只能在既定的系統架構和協議棧體系中,通過在核心網側引入新邏輯功能節點 NWDAF 和各式各樣模塊級“外掛疊加式”的 AI 功能,來進一步增強優化系統自身各方面的性能和對外服務能力。每個“外掛疊加式”的 AI 功能模塊,基本都是針對已識別且特定的通信類問題(例如:切片質量保障、用戶 QoE 優化、移動性預測、故障定位、網規網優運維等),主要旨在提升 5GS 系統性能、優化無線傳輸效率和簡化網絡管控運維等目的。 2.1 AI FOR 5G 發展現狀 大量實踐已證明:AI/ML/DL 等方法是針對傳統無線通信中多維復雜且計
9、算密集型問題求解的可行高效手段。當前,AI/ML/DL 已在 5GS 系統內的多個層面和多業務領域,進行了初步的應用嘗試和價值驗證,例如:通過智能化平臺輔助簡化 5GS 系統運維、優化服務場景識別、網絡異常檢測、故障根因分析和提升系統節能效果,通過智能化模塊去優化網絡的策略資源部署和參數設值的精準度,通過智能壓縮 CSI 反饋信息資源開銷和智能調制編碼去提升空口的資源利用率,通過智能模式去識別預測網絡流量分布、用戶軌跡行為,以提升用戶業務體驗等【2】。上述這些實例應用都可被稱為 AI for Network(AI4NET),即體現了 AI 作為先進技術手段,對 5GS 系統某些方面賦能提質、優
10、化增效的價值。在 5GS 系統中,各種 AI 算法模型,基本都是針對特定已識別通信問題的應用和改善,即已經過大量專門的線下訓練和效果驗證,這類似“頭痛醫頭,腳痛醫腳”,但它確實可一定程度地提升通信業務性能,降低系統運維成本??傮w上,當前的AI4NET 仍然缺乏系統性、周密性、全局性、可解釋性方面的考慮,較大限制了 AI 能力可拓展性、迭代增強性和 AI 模型泛化應用能力等。此外,當前 5GS 系統中的各種 AI 資源和能力(涵蓋AI 算力,AI 算法和 AI 數據方面)并不具備開放和服務化的特征,大部分僅僅限于系統內被利用和應用。 2.2 5G FOR AI 發展現狀 當前,AI 各種移動應用
11、(例如:語音、圖像、視頻、數據的 AI 識別歸類和處理等)主要還是通過終端本地化或集中式云 AI 的服務模式(例如:以亞馬遜 AWS、微軟 Azure、谷歌云、阿里云為代表的公有云服務體系)提供給終端用戶,因此 5GS 系統更多地扮演著底層數據傳輸管道的角色。5GS 系統把 AI 模型訓練和 AI 業務應用相關的數據流,都當成一般的用戶業務數據進行傳輸;云 AI 模型訓練所需的大量樣本數據,也通常通過應用層數據的形式,在 5GS 系統中端到端的傳輸流轉。另外一方面,3GPP Rel-16 定義了 NWDAF 以及其相應的交互接口,致力于在網絡內部實現一些智能化應用以及對內對外的 AI 賦能,進
12、而減輕對傳統云 AI 的依賴。上述這些方面可被稱為 Network for AI (NET4AI),即體現了 5GS 系統對 AI 業務和服務的價值。面向NET4AI 智能類應用,當前 3GPP TS22.261【3】已開始制定一些特定場景下相應的網絡 KPI 連接性能要求。然而,在上述 NET4AI 移動應用例子中,上層云 AI 模式所有的操作對于 5GS 系統幾乎都是透明的,并沒能實現上層 AI 應用和下層網絡管道之間的跨層深度融合或配合;同時,5GS 系統內的各種通信、感知和計算資源能力和數據,對上層云 AI 應用服務器或者 NWDAF 等智能網元的開放度和被利用度也不夠,也沒能做到和上
13、層 AI 業務應用的最佳適配。從 5GS 網絡整體看,其內的各個邏輯網元節點所涉及和擁有的算力,算法和數據資源,并沒能被外部 AI 功能實體充分地調度和利用,它們中大部分僅僅受限服務于傳統通信業務目的,或時常處于低效閑置無用的狀態,例如:基站中大量基帶算力和無線數據。未來,如何更大程度且更優地去利用好6G 新網絡中的各種算力,算法和數據資源和能力,賦予其更大的業務服務價值,進一步拓展移動運營商的盈利體系,這都需要 6G 移動新系統去原生地實現。 2.3 “5G 網絡 AI”發展現狀 5G 網絡在設計之初,雖然沒有原生地考慮 AI,但是 5G 網絡在如何與 AI 相結合互利即“5G Networ
14、k AI”方面,卻在不斷地探索和演進。在“5G Network AI”探索中,3GPP、ITU-T、ETSI 和 TMF 等標準化組織或者論壇都取得了一定的進展。 3GPP 在“5G Network AI”方面進行了初步的探索,其狀況與進展如下: 3GPP Rel-16 在 5GS 網絡架構中,引入了新的邏輯功能實體 NWDAF,如圖 1 即網絡數據分析功能(具體參見 TS 23.288【4】)。NWDAF 通過與 5GC 中其它功能實體(例如:AF、PCF、AMF、SMF 等)交互,提供多種網絡數據分析服務,包括:接收核心網各個功能實體 NF 的網絡數據分析請求,基于該請求采集相應的網絡數據
15、;利用 AI 算法對采集數據進行分析推理,得到網絡分析結果信息;再將網絡分析結果信息提供給請求的 NF 實體。進而,各個 NF 利用NWDAF 提供的網絡分析結果信息,對 5GS 網絡和終端工作狀態進行監控,并對通信業務進行閉環控制優化。截至 Rel-17,NWDAF 已支持對網絡業務體驗、網絡性能、切片負載、NF 負載、終端移動性/通信/異常事件、服務質量(QoS)可持續性、用戶數據擁塞情況等進行分析。 圖 1: 基于 NWDAF 的 5G 網絡數據分析架構(參考 3GPP TS 23.288) Rel-17 對 5GS 網絡數據分析架構和功能進行了增強,包括:NWDAF 的邏輯功能拆分及邏
16、輯功能間的交互、多 NWDAF 實例如何協作數據訓練和模型共享、引入新功能實體以提高數據收集效率、增強實時性。它主要包括以下特征: -NWDAF 實體部署更加靈活,支持中心式、分布式、中心與分布結合式幾種方式; -支持多個 NWDAF 實體之間的協作(例如:分析聚合、分析轉移、共享 AI 數據/模型等); NnwdafAny NFNWDAF-將 NWDAF 功能進一步分解為 MTLF(模型訓練邏輯功能)與 AnLF(分析邏輯功能),其中MTLF 可向其它 NWDAF 實體提供 ML 模型; -引入 DCCF(數據采集控制功能)、ADRF(分析數據存儲功能)和相關數據采集優化流程; -支持 NW
17、DAF 實體從 UE 采集數據; -支持針對邊緣計算業務體驗和網絡性能的分析; -支持對 UE/會話相關的切片負載、數據/信令的離散分布、WLAN 性能、用戶面性能、會話擁塞控制、冗余傳輸等方面分析。 Rel-17 還對 5GS 系統管理面的智能化,進行了研究和相關標準化工作,如圖 2 即引入管理數據分析(MDA: Management Data Analytics),具體參見 TS 28.104【5】。MDA 采集與網絡和服務事件及狀態相關的數據,包括:網絡性能測量、Trace/MDT/QoE 等報告、警報、配置數據、網絡分析數據和 AF 服務體驗數據等。MDA 基于特定 AI 算法進行相應
18、的數據分析,生成分析結果報告,基于分析結果報告進行網絡管理操作,從而實現網絡管理運維的自動化與智能化。 圖 2: MDA 功能與服務框架(參考 3GPP TS 28.104) Rel-17 對無線接入網 RAN 智能化的研究也正在展開,具體可參見 TR 37.817【6】,其潛在應用場景包括:網絡節能、負載均衡、終端移動性管理等方面。 MDA Management FunctionMDA (Internal business logic)MDA MnS ConsumerOther MDA MnS ProducerMnSProducerNWDAFNon-3GPP management syste
19、mMDAS (MDA MnS)MnSMDAS (MDA MnS)NnwdafNon-3GPP management data Rel-18 繼續對 AI/ML 模型在 5GS 系統中傳輸的性能需求指標進行了研究,具體參見 TS 22.261【3】。5GS 系統將會依據 AI/ML 業務或應用需求,為相關 AI/ML 模型數據的傳輸提供QoS 保障。5GS 系統還可對 AI/ML 模型數據的傳輸狀態(例如:傳輸速率、時延、可靠性)進行監控,并上報給 AI 應用服務器,以供 AI 應用服務器據此監控信息調整 AI 應用層參數。 目前,3GPP SA2 正處于 Rel-18 新立項討論階段,網絡智能
20、化主要從下面兩個角度考慮: AI for Network 方面:聚焦 5GC 網元相關分析、研究潛在的架構增強、新場景等。例如:研究是否及如何增強 5GC 架構以支持聯邦學習和在線學習、UPF 業務數據上報 NWDAF 用于智能分析、UE 是否及如何使用來自 NWDAF 的分析建議、數據收集和數據存儲增強、NWDAF 輔助的 URSP 等; Network for AI 方面:聚焦基于 SA1 Rel-18 AI/ML 模型數據傳遞性能要求,研究 5GS輔助的 AI/ML 業務傳輸;支持 AI/ML 模型分發、傳遞、訓練;用于不同 AI 應用視頻/語音識別、機器人控制、汽車等方面。例如:研究支
21、持應用層 AI/ML 可能的架構和功能擴展、研究可能的 QoS 及策略增強、研究 5GS 如何輔助 UE 客戶端和 AS 之間的聯邦學習等。 ITU-T SG13 也進行了 5G 網絡與 AI 結合的相關探索工作。2017 年 11 月 SG13 成立了包括5G 在內的未來網絡機器學習(ML5G)焦點組,2020 年 7 月 ML5G 焦點組結束了第二階段的工作,并向 SG13 提交了關于 AI 用例、架構框架、智能級別、數據處理、機器學習功能編排器、服務框架等的十項技術規范。此外,ML5G 焦點組還提出一套針對機器學習的管理子系統,針對機器學習全生命周期中各個階段所需的不同功能,提出了跨多域
22、、多云、不同層級的多層級 ML 工作流。 ETSI 在 ICT 系統與 AI 結合的領域開始相關探索的時間較早,2017 年 2 月即成立了體驗式網絡智能行業規范小組(Experiential Networked Intelligence Industry Specification Group,ENIISG)。ENIISG 定義了一種用于網絡運維、業務編排、網絡保障等應用,提供智能化服務的人工智能引擎,其功能架構【7】如下圖 3 所示。 圖 3:ENI 功能架構 ENI 系統目前包含:知識管理、模型管理、策略管理等模塊,通過對數據進行處理,經過 AI模塊后,可以自動化地為網絡提供服務運營和保
23、障,以及提供切片管理和資源編排。目前,ENI的功能還在不斷地演進豐富,例如:支持基于意圖驅動的網絡等。 TMF 組織在 5G 網絡與 AI 結合的相關工作中,主要聚焦于 OSS/BSS 網管方面的探索。當前TMF 正在開展人工智能與數據分析(AI and Data Analytics,AIDA)項目,該項目主要從架構、用例、AI 術語、數據處理、AI 訓練等方面進行研究,研究方向與具體內容【8】如下表 1 所示。 表 1:TMF AI&DA 項目主要工作 2.4 AI 和 5G 移動系統結合應用面臨的挑戰 5GS 網絡希望能更好地利用 AI 能力進行自我增強和支持 AI 類業務應用,尤其首先是
24、在核心網側,進而擴展到無線接入網 RAN 側。Rel-16 引入的 NWDAF 功能,其主要目的就是為了提升AI 數據采集和分析能力,例如:NWDAF 可為其他核心網功能 NF 和終端 UE 提供分析結果信息,輔助優化相應的網絡業務發放。NWDAF 還支持從 5GS 網絡運維網管系統中采集數據,為此NWDAF 還提供了專門服務,用于相應網絡功能的注冊和元數據開放。盡管如此,5GS 系統與 AI的結合應用還面臨著如下挑戰和缺陷: 數據源有限:NWDAF 實體采集和分析的數據主要是 5GC 核心網功能接收的數據,但并沒有充分考慮來自無線側基礎設施、環境、終端和各類傳感器的廣義數據,因此在 AI 數
25、據樣本方面存在不足。 傳輸帶寬消耗:無論集中式或分布式 NWDAF 部署,為了收集 AI 數據,都需要消耗大量的傳輸帶寬資源。當數據源離 NWDAF 實體較遠的時候,還會造成數據更新時延的問題。 缺少數據隱私保護:NWDAF 偏集中式數據采集分析,數據源通常主要來自同一業務領域,因此架構設計中數據隱私的保護考慮不足,容易泄露用戶隱私。 不支持對外 AI 服務:NWDAF 是 5GC 核心網內部功能,主要用于增強優化 5GS 系統自身,外部 AI 應用不能直接在 5GC 核心網或無線接入網 RAN 的 AI 功能體系中被服務和受益。 基礎設施利用不充分:網絡切片功能、超高可靠低時延通信 URLL
26、C、 海量機器類通信mMTC 等 5G 關鍵功能特性,在架構設計上都只是為了性能、功能和運營角度滿足垂直行業需求,但都未專門考慮原生/內生 AI 的支持(如:數據治理和服務、分布式架構等),網絡基礎設施中的各種資源(或低效或閑置),并沒被業務應用充分地利用和價值轉換。 數據治理和服務缺失:AI 不只是涉及到數據采集訓練和分析推理兩個方面。為了提供 6G原生/內生 AI 的支持,還需要專門對 AI 數據治理和服務的架構進行系統性設計,而這并不在5GS 系統當初的考慮范圍之內。數據服務的價值未來有待更大地彰顯。 3. AI 與 6G 新系統內生融合機理 ODICT 業界普遍認為:原生/內生智能(N
27、ative AI)將成為未來 6G 移動新系統的核心特征之一【1】,因此 6G 新系統將從一開始的需求和架構設計階段,全面充分地考慮如何和 AI 深度融合。較大區別于當下 5GS 系統通過 AI 功能疊加、補丁、外掛等方式的結合應用,原生/內生智能的目標,將會對 6G 新系統設計帶來諸多的深刻影響和挑戰,因此本章節將先剖析闡述 6G 原生/內生智能的動機和理由(例如:內生AI為何能更好地適配未來6G新場景、新用例,如何帶來新業態和新價值增益等方面)。 3.1 必要性分析 面向未來移動網絡的演進,網絡管理運維需要從降本增效的局部智能化運營,向端到端的高水平網絡自智自治邁進。但是,現有網絡 AI
28、用例的研發,普遍采用了打補丁,外掛,煙囪疊加等方式進行,缺乏統一的系統框架。大部分 AI 模型應用效果缺乏有效的驗證和 QoS 質量保障手段。AI 模型訓練學習和分析推理在時間上解耦,AI 模型效果驗證只能在事后進行,對現網影響大,無法實現高水平的網絡自智自治,無法實現 AI 模型效果預驗證、在線評估和全自動的閉環快速優化。此外,AI 模型(再)訓練需要大量的樣本數據,而集中式采集數據困難,導致網絡傳輸開銷大,AI 模型迭代更新的周期較長,訓練開銷較大、收斂慢、AI 模型泛化性差等。因此 6G 新系統需要進一步改善 AI 模型的訓練和應用性能,提升網絡自智自治水平。 面向各個垂直行業用戶,助力
29、千行百業的數智化轉型,探索新的智能化商業模式,提供 6G新場景和新能力都是內生智能的重要驅動力。在保護垂直行業數據隱私、數據不出園區的前提下,6G 新系統需能提供分布式、區域性算力資源、平臺和服務,實現“隨時隨地”智能化能力的按需靈活供應,實現“以數據為中心的計算”。這相比傳統云 AI 服務供應商,可提供更高的實時性、隱私性、性能更優的智能化能力和服務;另外,6G 內生智能還可提供行業間的聯邦智能,促進實現跨域、跨行業的智慧融合和數智共享 。 面向未來智能終端的演進,海量終端將產生更大量的數據,終端的計算和智能能力也越來越強,6G 內生智能需能協同好網絡 AI 和終端 AI,為 ToC 用戶提
30、供極致的業務體驗和更高價值的新型 DICT 業務服務 。此外,保障未來網絡安全可信也是重要的研究課題,內生智能可促進實現網絡內生安全可信,可自主檢測和主動防御各種潛在的攻擊和威脅等。 3.2 可行性分析 5GS 系統和 AI 的成功結合應用,已一定程度地證明了網絡智能化的可行性,本章節將從 AI三要素的角度,分析未來 6G 新系統原生/內生 AI 深度融合的可行性。 算力:由于時延、可靠性和數據安全隱私保護等方面的要求,在 5G 時代,計算能力和算力資源的下沉部署已成為趨勢。到了 6G 時代,數據的連接和計算可能進一步融合,例如:出現通信連接計算融合的雙基礎設施,這為內生 AI 融合設計提供了
31、計算服務相關的條件基礎。 算法:雖然當前將各種數據集中到 AI 云,在 AI 云中進行集中式處理的方式有其優勢,但在數據隱私、極致性能和計算能耗等方面,一直存在其難以解決的問題。如果未來 6G 新系統能做到將算法模型和智能能力融合到網絡中,無論數據和任務在哪里、數據和任務的智能處理就能在那里,這將成為一種有效替代選項。因此,AI 算法模型將由于數據和計算資源能力的下沉,也將同時被下沉到網絡邊緣(例如:邊緣節點,無線基站)來執行和維護。 數據:傳統通信網絡主要是數據傳輸的管道,除了網絡自身的管理運營數據,一般自身是不主動產生和處理業務相關的數據。由于數據方面的限制,這可能是 5G 將 AI 的重
32、點放在網絡自身性能提升優化和管理運維自動化的原因。到了 6G 時代,由于各種感知技術、行業數字化、邊緣計算等走向成熟,6G 新網絡本身就是巨大的無線傳感器網絡,它將具備主動產生和處理海量異構數據的能力,這也就為 6G 原生/內生 AI 融合設計提供了數據服務相關的基礎,例如:大量訓練樣本采集和預處理,數據資產按需流轉等。 3.3 增益性分析 “6G 原生/內生智能”將極大強化 AI 相關資源(包含 AI 算力、AI 算法、AI 數據)和 6G 移動新系統之間的耦合,從過去的所謂“通算智三張薄皮”耦合進化升級為“通算智一張厚皮”,從而 6G 新系統內的各種資源的集成復用率、利用效率、綜合性能等方
33、面會被提升優化,進而實現更高的系統成本和業務應用之間的性價比,普通消費者也能享受到更泛在、更廉價的算智類業務服務。 相比于傳統集中式的云 AI 服務器和邊緣智能節點工作模式,原生/內生 AI 模式使得 AI 資源能夠更廣泛、均衡地、更靈活按需地分布部署在 6G 新系統泛在基礎設施平臺之中,AI 算智類操作將更貼近數據源、任務源和終端用戶,且更能高效適配空口的動態狀況(例如:用戶環境和信道變化,網絡拓撲和資源更新等),因此 6G 新系統(特別是基站)將更易面向用戶的動態環境進行快速而精準的閉環優化、更實時地進行策略調整和趨勢預測。 在以聯邦學習為代表的分布式 AI 機器訓練模式下,去集中化的內生
34、 AI 模式更有利于用戶數據的隱私保護,分攤數據和算力任務的壓力,強化(子)網絡本地安全自治。在 AI 相關數據(算法模型、訓練樣本、基本參數、特征參數等)的采集處理和傳輸流轉方面,內生 AI 將可能依托于6G 新系統專門的“數據面”和“智能面”等邏輯功能,進行更高效靈活且魯棒的數據流轉和共享,進而帶來更低的 AI 數據傳輸延時,更少的傳輸資源消耗和系統能耗。 通過將 6G 原生/內生 AI 技術進一步標準化,還可促進 ODICT 異廠家之間的通算智類設備、功能模塊和 AI 任務流程的對接協作,甚至帶來未來新業態和新商業模式的重構。這還將進一步促進更多的參與方去聯合構建更廣泛、安全可信的 AI
35、 智能資源能力服務平臺,從而實現 6G“泛在AI”和“智能普惠”的愿景。 3.4 新特征新范式分析 未來 6G 移動新系統要實現原生/內生 AI,將會面臨相當大的技術挑戰,具體如下: 1)高度差異化的智能服務質量 QoAIS 需求 ,一方面無線網絡工作狀態波動大,用戶和業務需求動態性高,尤其是垂直行業用戶的需求變化更大 ;另一方面當前移動系統尚缺少對 AI 服務質量 QoAIS 系統性的評估和保障體系。 2)有限的通信和計算資源,網絡邊緣節點設備上的算力和智能不足,存儲能力弱,無線接入節點與邊緣設備之間的傳輸帶寬有限 ;當前缺少對 AI 服務相關的異構資源系統性管控和調配,比如:算力,數據,連
36、接等方面。 3)當前缺乏擬真的 AI 訓練與驗證環境,一方面擬真環境的實現對同步數據的實時性和數據量要求極大;另外在擬真環境下,為了避免 AI 功能啟用后對真實物理網絡帶來的潛在負面影響,如何實現 AI 模型應用效果的預驗證和保障。 4)面向垂直行業需求,內生 AI 需能提供 AI 資源、功能、服務的按需靈活編排到端-邊-網-云各種節點之中,提供端網緊密協作的分布式 AI 架構和 AI 服務質量評估和保障體系。此外,內生 AI 需使能行業間跨域的聯邦學習、知識經驗數據共享框架,促進與行業業務邏輯映射的數字孿生網絡的融合。 5)面向未來網絡自治自智 ,內生 AI 需能實現網絡自治自智所需的自發現
37、、自編排、自配置、自優化、效果自評估、多域閉環,AI 效果預驗證、在線評估和閉環快速優化,通信-存儲-計算多維異構資源融合,更充分高效地利用網絡內各種資源 ,支持安全可信的網絡自治自智方案。 6)面向普通終端用戶, 內生 AI 需能對終端數據和算力資源進行智能感知,利用海量終端的大量數據和算力資源,實現端網融合的分布式 AI 架構 ,并且需對用戶數據進行脫敏、關聯聚合,保障用戶數據隱私安全。 從上述若干技術挑戰可看出:6G 原生/內生智能不僅要能實現高水平的網絡自治自智,也要能為眾多的垂直行業用戶和普通終端用戶,提供更高質量有保障的 AI 服務。6G 移動新系統至少需具備如下新技術范式特征:
38、1)端到端 AI 服務質量的全生命周期編排和管控 ,構建 AI/ML 服務質量評估和保障體系,實現全生命周期編排 AI/ML 算法模型,算力,數據等資源。 2)基于內生 AI 的計算和通信深度融合 ,在網絡內數據、算力、帶寬資源和傳輸時延都受限的場景下,內生 AI 需考慮計算和通信資源的聯合編排 ,6G 將能重構網絡架構、協議編排和功能流程,全面適應 6G 空口和網絡側傳輸特性,優化內生 AI/ML 模型性能。 3)內生 AI 要能與數字孿生融合 ,內生 AI 可給數字孿生網絡提供所需的 AI/ML 模型,實現數據增廣和自生成,降低數字孿生網絡對物理網絡數據采集的需求,數字孿生網絡可對 AI/
39、ML 工作流或 AI 模型效果可進行預驗證和優化,避免 AI/ML 功能后續引入后對現網的負面影響。 4. AI 和 6G 新系統內生融合的技術需求 4.1 能力需求(功能,性能等方面) 未來,6G 新系統將會是深度融合了“通”、“感”、“算”、“智”、“存”于一體的超級無線基礎設施平臺,它對內將同時具備“通信”、“感知”、“計算”、“智能”和“存儲”等方面更強大的能力,例如:更多的特征功能和更好的 KPI 性能;同時它對外也將能更強地提供“通信”、“感知”、“計算”、“智能”和“存儲”等方面的綜合業務、服務和應用,例如:面向普通 ToC 消費者,ToB 類用戶或第三方客戶。因此 6G 新系統
40、既是超級的無線通信傳輸管道,又會是巨大的分布式雷達傳感網絡、泛在算力和 AI 智能服務器陣列等。6G 內生智能和上述 6G系統特征息息相關,下面我們首先將從“算力”,“算法”和“數據”三大主要方面闡述 6G 內生 AI 在基本能力方面的需求。 4.1.1 算力能力需求 算力作為 6G 智能原生平臺的新生產力,是支撐一切數據能力和服務的堅實基礎?,F階段 5G、大數據、AI 等技術的高速發展,不斷推動著數據的爆炸式增長和 AI 算法的復雜程度不斷提高,從而帶來了對算力規模、算力能力等方面需求的快速提升。對于融合了計算、通信、感知和AI 能力的新一代 6G 算網融合系統,算力的發現、感知、度量、按需
41、調度利用和最大化開放成為未來移動網絡發展的重要趨勢之一。 算力資源發現能力:6G 新系統涉及云計算、霧計算、邊緣計算等多層次技術之間的相互協作。這些計算技術的能力特點和覆蓋范圍不同,例如:可以分別針對區域級別、本地級別和設備級別的物聯網應用和服務。6G 新網絡需具備及時的多層次異構算力發現和注冊能力,以支持實時的數據感知處理、控制執行等基本功能。算力發現注冊能力作為 6G 新系統的基礎功能,起到橋梁的作用,是算力服務的基礎。 算力需求感知能力:隨著越來越多數據的產生以及更強大復雜的算力算法運用,6G 新系統的算力感知能力需要變得越來越智能。典型的算力服務需求也從簡單的數據感知、收集和表示轉向算
42、力服務需求信息的提取和分析。未來,6G 新系統可廣泛地應用于環境監測、城市管理、醫療健康等場景。6G 新系統帶來的觸覺網絡將助力對算力需求的實時感知,實現高效的數據處理、信息提取和分析決策。 算力統一度量能力:6G 新系統涉及的算力主要包括:邏輯運算能力(一種通用的基礎運算能力,硬件芯片代表是 CPU)、并行計算能力(一種專門為了加速處理圖形圖像等數據類型統一的高效計算能力,硬件芯片代表是 GPU)和神經網絡計算能力(一種用來針對機器學習、神經網絡等進行加速的計算能力,硬件芯片代表是 NPU)三大類【9】。對于提供異構算力的各種設備和平臺而言(不同廠商芯片,不同計算類型,以及不同用戶的計算算力
43、需求),如何對異構算力資源進行統一量化,這是算力調度和使用的基礎。這就需要 6G 新系統能提供將各自異構算力資源映射到統一量綱的度量函數或方法。 算力按需調度能力:6G 原生算網融合系統結合了邊緣計算、霧計算、網絡云化以及智能控制的優勢,通過強大的網絡連接,實現了更廣泛的算力資源的管控和動態按需調度。區別于傳統云計算資源納管采用集中式的資源管理或者集約化的資源提供,在 6G 原生算網融合的資源管理體系中,更多考慮了網絡狀態(如:空口信息、網絡延時、網絡損耗等)對于分布式算力資源調度方面的影響,以達到綜合性能和資源最優化。因此 6G 新網絡的核心能力是提高泛在分布式計算效率,算網融合正是為了提高
44、智能計算、通信和 AI 服務的工作效率。 算力開放交易能力:6G 新系統算網融合下的原生算力,將不再單純地由移動運營商或者云服務提供商所提供。只要能夠貢獻閑散算力的節點,比如:基站、手機終端、電腦、游戲機、企業空閑的小型數據中心等,都可成為新模式的算力資源??紤]到安全、經濟、高效、可靠等因素,6G 新系統需要定義合理的機制,例如:區塊鏈技術,對泛在算力資源進行管理和開放交易【10】。 4.1.2 算法能力需求 作為 AI 三要素之一的算法(模型)是 6G 新網絡實現內生智能和提供各類 AI 服務的決定性因素之一,6G 內生 AI 算法能力需求至少包括如下幾個方面: AI 算法指標需求:目前 A
45、I 算法和模型門類眾多,且迭代發展極快,不同 AI 算法模型可以實現的功能性能,所需要的執行時間、運算復雜度等方面差異性較大。從 6G 新網絡內生智能和對外 AI 服務質量的角度,6G 需要規范化定義出 AI 算法的指標需求和所包含的指標內容,并面向不同 AI 服務給出各個指標的量化范圍。例如:可從 AI 算法模型的增益、運算復雜度、網絡種類、執行時間、輸入輸出需求、數據依賴性和泛化能力等角度,去綜合刻畫算法能力需求。不易量化的 AI 算法指標可以分級描述。 AI 模型訓練需求:通常 AI 模型需要基于大量數據,進行較長時間多次的訓練才能收斂。在6G 內生 智能系統中,特定 AI 模型訓練的具
46、體模式,需要根據系統數據收集量、計算資源、隱私保障等客觀需求,和系統當下的通信計算等資源狀態來進行實時的決策,潛在的訓練模式可能包括:離線訓練、在線訓練、聯邦訓練等。AI 模型訓練要能最優地匹配 6G 系統的實時資源狀態。 AI 模型描述與交互需求:6G 新系統中將會有非常多種類的 AI 模型,服務于不同的 AI 用例和業務,它們需要能在不同網絡架構的各個網元節點之間進行交互和共享利用。對此,6G 需要定義出 AI 算法模型的描述語言(或方法),并通過統一定義的流程,保障任何 AI 算法模型的可交互與可執行。 AI 算法演進需求:無線通信和 AI 算法是兩條飛速發展的快車道,因此 AI 算法模
47、型的架構和能力均需具備前向可演進的能力。AI 算法演進可以是參數層面的更新演進(性能自優化),也可以是模型架構結構層面的革命演進(架構自生長)。 4.1.3 數據能力需求 6G 新網絡內生智能的實現主要是基于數據驅動,因此具備完善且高效的數據能力至關重要。從 AI 數據需求的角度出發,6G 至少需要具備以下幾個關鍵能力: 數據收集能力:未來網絡中的數據資源非常豐富,包括:基礎設施的資源信息,業務支持系統中的客戶、伙伴等信息,行業通信系統中的各行各業相關信息,以及終端用戶和環境信息等。要想更高效安全的收集這些數據,需要相應的網絡數據收集功能去支持。網絡數據收集的過程包括:與各種數據源建立安全連接
48、,確定收集范圍和方式,把收集到的數據(經過預處理)存儲在數據庫中,并對數據庫進行相關操作維護等。 數據分析能力:面對豐富的數據資源,使用數據挖掘、機器學習等方法對收集來的大量數據進行分析提煉,以求最大化地開發數據的功能,挖掘出關鍵的信息和知識,給客戶提供所需要的數據服務。例如:根據歷史數據統計特征實現對網絡故障和業務損傷的自主檢測,識別網絡異常等,并能通過用戶數據去預測未來事件,分析用戶行為和偏好,以更好地為用戶服務。數據分析和挖掘的算法多種多樣,且不同算法面對不同的數據類型也會呈現出不同特點,6G 新網絡內生AI 需要能根據不同的業務數據類型,來選擇最合適的分析和挖掘算法。 數據隱私安全保護
49、能力:收集和存儲敏感類數據涉及到隱私風險,需要承擔隱私保護的責任。數據脫敏是回應隱私關切、實現法律遵從的重要動作,這對于在 6G 新系統中實現安全的 AI數據服務尤為重要。AI 模型訓練和推理過程中的數據脫敏技術一直備受關注,近年來關于 AI 中的差分隱私,同態加密,多方安全等技術領域都有著大量的研究工作。 數據存儲能力:未來數據存儲由核心向邊緣轉變,將會分布式地存儲在云、邊、端各節點中,并且需要支持非結構化、半結構化和結構化的多元數據存儲架構。6G 新系統需能將數據按照分層分域的方式進行存儲,提供多層次的容錯和冗余能力。例如:云端可存儲高價值明細數據及必要的輕度匯總數據,而邊端可存儲低價值明
50、細數據、輕度匯總數據。以邊端場景為例,利用本地存儲的明細數據完成快速處理,賦能本地應用;處理后的結果數據,會根據存儲及使用規范,向云端或其它的邊緣節點傳輸。 數據開放能力:將匯聚后的內外數據通過融合加工、去隱私化處理、標準化地進行封裝,形成對外數據服務,以標準化的數據服務方式(包括數據集、AI 模型數據、預測服務等),向 6G內生 AI 網絡及外部第三方用戶提供開放服務。數據服務類型可結合 6G 實際應用場景,進行規范化分類,例如:人聯網類(用戶位置類、用戶上網行為類、用戶通信掉話率類等)、物聯網類(終端類、設備類、車類等)及其它各種分類。 4.1.4 其它能力需求 除了上述 AI 算力,AI
51、 算法和 AI 數據三大基本要素能力方面的需求,6G 內生智能還要能進一步促進 6G 新系統內生安全(主動免疫)的實現,例如:在面對未來更多未知和不確定的業務場景和用戶環境下,6G 新系統要能基于內生 AI 能力,實時地感知分析、推理和預測出各種潛在的威脅和風險、實現全面自主免疫、主動防御和多網元節點之間協作聯合的安全防御策略等?;?6G 新網絡內生智能的自學習訓練和推理,各種新式變種的安全威脅和風險,都將可能被盡早地識別判定出,從而在 6G 全網內實時地做到安全認知和經驗同步,形成無死角的聯合協同防御并消滅任何的風險后患。 當前,5GS 系統已通過外掛式 AI 的輔助手段,實現了不錯的系統
52、節能增益。例如:對某區域 5G 網絡,每萬站點可實現年節電 2000 萬度,顯著節省了電費支出,同時網絡 KPI 和用戶感知也基本保持平穩【11】。盡管如此,未來 6G 新系統仍然有不小的能耗冗余壓縮空間。未來,6G 內生智能還需能進一步促進 6G 新系統實現能效和節電方面持續地提高,和更大的節能增益綠色減排,以有力支撐國家新能源和“雙碳”發展策略。 4.2 服務需求(對內,對外等方面) 相對于 6G 新系統的內在 AI 相關能力,6G 內生 AI 新系統對外所能呈現的業務和服務,對于用戶和客戶更為重要和彰顯價值。未來,6G 新系統服務的多主體對象領域從小到大大致可分為:個人(ToC),家庭(
53、ToH),企業(ToB),行業(ToI),社會(ToS)等;每個不同的主體領域或層級,對 6G 內生 AI 業務和服務的需求都會有所差異,例如:AI 性能方面,其背后也會對應著上述 4.1 章節中不同的 AI 能力需求。下面我們還是從算力,算法和數據三大基本要素方面展開闡述。 4.2.1 算力服務需求 AI 密集型計算需求的高速增長,進一步催生了 6G 新系統算力服務的快速發展。未來,6G新系統需要提供內部和外部 AI 業務應用所需的算力服務、數據服務和算法服務,實現系統算力開放共享和智能 AI 服務。多層算網融合作為未來新一代網絡架構,其設計需協同考慮網絡和計算融合的演進需求。實現泛在的算力
54、連接和 AI 算力在網絡中的全局優化包括:算力的按需靈活調度使用,算力服務的合理分布。多層算網融合的目標是:1. 網絡可以感知和管控無處不在的計算服務,而用戶無需關心網絡中的計算資源狀態。2. 算力靈活動態地部署,靈活調度算力到有計算需求的服務上。根據上述總體要求,6G 新系統算力服務主要要能提供以下服務類型。 1.時延敏感型服務:通過 6G 新系統的智能感知和決策,實時為用戶 AI 服務提供充沛的算力支持,加速傳輸和計算效率,從而達到較短時延。相比于移動云計算 MCC 所需要的 100 毫秒量級時延,基于多層算網融合體系的 6G 新系統,可滿足 110 毫秒量級的超低時延服務要求。應用場景例
55、如:沉浸式虛擬現實 XR。 2.能耗敏感型服務:用戶或客戶可通過 6G 新系統的算力調配,將高能耗型的 AI 計算任務遷移到 6G 新網絡中,進行分布式并行計算,從而避免本地計算帶來的巨大能耗。應用場景例如:搶險救援,智能穿戴設備等。 3.隱私敏感型服務:與傳統集中式計算相比,6G 新系統內的用戶數據信息不再需要經過復雜的核心網到達云端數據中心。用戶無需上傳私密數據,可通過 6G 新系統算力調度和分配進行安全可靠高隱私的計算。應用場景例如:普惠金融,數據孤島等。 4.服務體驗敏感型任務:由于多層算網融合與用戶的近距離優勢,可通過 6G 新系統智能感知更準確地預測和判斷出用戶的計算行為和需求,從
56、而提早合理地調度算力,提供更實時有效的計算服務。應用場景例如:沉浸式虛擬現實 XR、感官互聯等。 4.2.2 算法服務需求 6G 新網絡通過 AI 算法(模型)來實現對內和對外的內生智能服務,AI 算法品質決定了內生智能應用的質量和性能。6G 新網絡對外提供的 AI 算法(模型)服務至少需要支持以下特性: 規范化 AI 算法模型描述和存儲:AI 算法模型種類眾多,面向不同的場景用例有很大的差異。6G 新系統需要給出規范化的算法模型(服務)描述,在統一的框架下用規范化描述語言來定義算法模型和其相關服務,且該描述是可解釋的。每種 AI 算法模型需給出配置參數和配置文件,且支持內容更改。算法描述文件
57、能針對算法的定義、配置、使用、性能、適用場景等給出解釋。 AI 算法分類索引和服務接口:對于 AI 算法模型給出分類和索引,通過格式化標準化的接口使用 AI 算法服務,支持關鍵詞等多種方式的檢索利用。6G 新系統需支持單個 AI 算法部署和多個 AI 算法堆疊聯合部署。在部署 AI 算法模型的時候,能自定義地修改調整算法,但修改后的算法如果要作為 6G 新網絡智能內生算法,必須經過嚴格認證。 AI 算法認證:對外提供服務的 AI 算法模型必須經過認證后,才能作為 6G 新網絡智能內生的適用算法。該認證需要能給出測試驗證并確認其性能。認證結果信息需包含在算法描述文件中,包括但不限于:應用場景、性
58、能、數據安全性、數據隱私性、資源開銷等。只有經過嚴格認證的 AI 算法模型,才能在 6G 智能內生網絡中被檢索,部署和使用等。 AI 算法訓練:也稱作算法建模,根據提供的數據集尋找模型的最優參數。需要在描述文件中提供 AI 算法訓練的信息,包括但不限于:訓練數據,訓練環境,訓練資源開銷、測試結果信息等。AI 算法訓練作為 Network AI 的服務之一,在 6G 新系統分配指定的資源中運行,使用指定的訓練數據集,訓練過程可監測可控制。 AI 算法復用:6G 新系統如果對每一個不同的 AI 用例請求都獨立配置內生 AI 算法或模型,將會產生巨大的成本開銷。為此,6G 新系統應支持復用網絡中已存
59、在或已訓練好的 AI 模型,來應對需求較相似的多個場景用例。具體的復用機制可以按照不同的需求,從 AI 算法模型框架、算法模型超參數,算法模型具體參數等多個級別由淺入深地進行。 AI 算法測試:在測試數據集上進行測試,評估 AI 模型的泛化能力和其它性能。測試指標包括但不限于:準確率、召回率等。6G 新系統需要能提供完整的測試環境和測試結果,當測試結果不合格時,該 AI 模型不能被部署使用。AI 算法測試作為 Network AI 的服務之一,在 6G 新系統分配指定的資源中運行,使用指定的測試數據集,測試過程可監測可控制。 AI 算法推理:算法模型經過認證后,可用于新的數據推理和決策。通過規
60、范化的服務接口提供 AI 算法推理服務,該服務由經認證的用戶使用。AI 算法推理的結果可用于進一步修正算法模型。 4.2.3 數據服務需求 未來,6G 新網絡的作用之一就是創造一個“智慧泛在互聯”的世界,基于無處不在的大數據,將 AI 能力和服務賦予各個領域應用。6G 新網絡將在設計之初,就充分考慮與人工智能和大數據技術融合,將 AI 和大數據的應用融入到網絡的基因當中,形成一個端到端的完備體系架構。為了實現這一目標,6G 新網絡可支持獨立的數據面功能,通過構建架構級的數據服務框架,在確保數據安全和隱私的基礎上,建立起支撐內生智能的知識圖譜,以滿足全網中數據采集、機器學習、智能服務和應用賦能的
61、全網全域內生智能需求,進而提供更高的數據傳輸速率和更可靠的傳輸鏈路,滿足未來更多種業務類型增長和更嚴苛 QoS 要求。 AI 應用的本質就是:基于不斷增強的算力對大數據中蘊含的價值,進行充分挖掘與持續學習的過程。6G 內生 AI 要以大數據為基礎【12】,通過網絡和終端泛在地“收集”、“處理”、“傳輸”和“使用”數據的四大基本步驟,不斷推動 6G 新技術和新業務的發展。圍繞 AI 數據處理過程,上述四個基本步驟可進一步分解為:數據發現,采集,預處理,傳輸,流轉,訓練,處理,分析,推理,決策,挖掘,增廣,交易,存儲,隱私保護等諸多動作,而這些動作貫穿在大數據處理和應用的流程中,具體如圖 4 所示
62、【13】, 上述這些數據動作即可對應著各個 AI 數據功能和服務。 圖 4: 大數據處理和應用 在大數據技術的加持之下,人工智能技術取得了快速發展,AI 對數據的質量、規模和個性化等方面的要求也越來越高,需要場景化、領域化的數據。這就需要增強傳統大數據流程中各環節的處理能力,比如:在數據采集、標注和特征提取等方面進一步提升【14】。在使用深度學習或機器學習構建 AI 分析模型的過程中,數據集從各種數據來源收集獲得,如:文件、數據庫、傳感器等。但是,收集的原始數據并不能直接用于執行分析過程,需要對原始數據進行預處理。為了能從機器學習和深度學習應用模型中獲得更好的結果,數據的格式也必須以適當的方式
63、進行表達和存放。某些特定的機器學習和深度學習模型需要特定格式的信息,例如:隨機森林算法不支持空值,因此要想順利地執行隨機森林算法,必須從原始數據集中管理空值。在數據處理過程中,數據增廣是智能網規網優常用的技巧之一,主要用于增加訓練數據集,彌補采集樣本數據不足的問題,讓訓練數據集盡可能的多樣化,使得訓練的AI模型具有更強的泛化能力【15】。特征提取是從收集到的初始數據開始,構建有信息性和非冗余性的特征值,從而促進后續的機器學習和泛化步驟。當 AI 算法輸入數據太大而無法處理且存在冗余時,可將復雜的特征數據轉化為一組簡化的特征。針對不同的使用場景,從相應的數據集數據中提取特征,經過語法處理和語義分
64、析得到滿足對應場景使用主題的特征數據【16】。 基于前述的各個內生 AI 數據功能,6G 新系統還要能對外按需地提供各類 AI 數據服務,這既包含 AI 數據(源樣本、數據集、特征集、模型文件、評估效果等)自身,也包含各個 AI 數據功能所對應的數據服務項目。通過合理地布局網絡架構中的存儲功能模塊和數據傳輸方式,可保證AI數據在網絡中高可靠低時延的傳輸,滿足AI算法模型訓練,驗證和推理決策等過程的需求。反之,AI 技術以智能方式支持多種數據服務。 AI模型訓練AI模型推理決策交易行為描述影響評估數據可視化模型估計模型檢驗模型評估數據預處理數據清洗數據轉換數據增廣數據源數據應用數據分析數據建模數
65、據管理DMRS數據倉庫社交網絡數據發現數據采集 4.2.4 其它服務需求 對應于傳統通信業務的 QoS 和 QoE 概念,為了能更精準的評判、度量和保障 6G 內生 AI 系統所能提供 AI 業務服務的質量等級,6G 新系統還需能提供完備的智能服務質量,即 QoAIS 評估和保障體系。具體地,QoAIS(Quality of AI Service)是對 AI 業務服務質量,進行系統性評估和保障的一套指標體系【17】。6G 新網絡將構建內生于網絡的 AI 能力,形成一套可服務于多種智能應用場景的能力服務體系,即 AIaaS??紤]到不同的智能應用場景(如:網絡高水平自治,行業用戶智能普惠,用戶極致
66、業務體驗,網絡內生安全等)對 AI 業務服務的質量有著不同的需求,因此需要一套指標體系,通過量化或分級的方式表達用戶層面的需求,以及網絡編排管控AI 各要素(包括算法、算力、數據等)的綜合效果。 6G 新網絡內生 AI 服務可以大致分為 AI 數據類、AI 訓練類、AI 推理類和 AI 驗證類,每一類 AI 服務均需要一套自己的 QoAIS。傳統通信業務的 QoS 主要考慮了傳輸時延和吞吐率(MBR、GBR 等)與連接相關的性能指標,而 QoAIS 需要能涵蓋 AI 工作性能、開銷、安全、隱私和自治等多個方面,需從連接、算力、算法、數據等多個維度,來綜合評估網絡內生 AI 的服務質量,因此 Q
67、oAIS 指標體系首先需從內容上進行擴展。表 2 示意了 AI 訓練類的一些指標需求。 表 2. AI 訓練類服務的 QoAIS 指標體系 AI 服務類型 評估維度 QoAIS 指標 AI 訓練類 性能 性能指標界、訓練耗時、泛化性、可重用性、魯棒性、可解釋性、損失函數與優化目標的一致性、公平性 開銷* 存儲開銷、計算開銷、傳輸開銷、能耗 安全* 存儲安全、計算安全、傳輸安全 隱私* 數據隱私等級、算法隱私等級 自治 完全自治、部分人工可控、全部人工可控 注*:不同類型 AI 服務間的共同評估指標 QoAIS 是 6G 新網絡內生 AI 編排管理系統和控制功能的重要輸入參數,網絡內生 AI 管
68、理編排系統需要對頂層的 QoAIS 指標進行分解,再轉化映射到對數據、算法、算力、連接等要素各方面的 QoS 具體要求上。 為了能夠最大化有效地利用各行各業的知識、經驗和數據等資源,6G 新系統還需能提供單個行業內和跨不同行業間的聯邦學習機制和跨行業數據、知識經驗等共享的對外服務體系。 4.3 架構需求(產品,部署等方面) 基于前述的 6G 內生 AI 在能力和服務方面的需求,為了能實現和確保滿足這些需求,6G 內生 AI 需要具備不同于傳統以通信業務為中心的移動系統架構和功能體系,例如:6G 內生 AI 架構將更強調系統功能和數據的自生成、自優化和強利用,實現以數據為中心的計算,突出系統分布
69、式、協作式和以任務/項目為中心的網絡操作,任何一個智能網元節點都可成為智能業務服務的發起者或終結者等。下面我們還是從算力,算法和數據三大基本要素方面展開闡述。 4.3.1 算力架構方面 近年來,人工智能技術取得了飛躍式的進步,應用程序逐漸向智能化和復雜化的趨勢發展。6G 提出的沉浸式云 XR、感官互聯、智慧交互等新型應用場景,對經典移動通信網絡也提出了諸多挑戰,例如:各種終端設備海量接入,網絡規模日益膨脹,這對傳統網絡的運維、管理是極大挑戰。過去計算和通信各行其道,傳統移動網絡對算力資源和通信資源之間,缺乏有效的管理和融合利用手段;未來外部的安全威脅日益嚴重,傳統移動網絡對細粒度安全防護束手無
70、策;未來6G 各種業務部署要求更迅速敏捷,而傳統網絡的業務部署、迭代升級耗時耗力。 6G 新網絡在構建部署的同時,除了要考慮傳統的運維問題,還應該考慮到對邊緣算力資源的最大化利用??梢云诖氖?未來 6G 新網絡應當具備通過分發各個服務節點的算力信息、存儲信息、算法信息等,結合網絡信息(如路徑、時延等),針對用戶需求,提供最佳的資源分配和網絡連接方案,并實現整網資源最優化使用能力。通過結合多智能體感知,云原生計算,數字孿生等技術,提升網絡的通算一體化感知能力. 以上網絡面臨的本身系統管理擴展,通算一體化調度,以及極致用戶體驗和安全等方面問題,都迫切要求一個新的 6G 新網絡架構出現。 圖 5:
71、多層算網融合系統部署架構 如圖 5 所示,未來的 6G 新網絡將是一個云-網-邊-端混合的多層算網融合系統【18】,將采用計算、通信、控制、存儲融合度更高的新型架構。算網融合系統是一個多層的網絡,其中的計算和通信網元節點可以提供內生在網算力。計算和通信融合可以更好地發揮出計算和通信能力。算網融合可支持各種應用和組件,一方面通過算力調度功能對各種計算資源進行合理地分配,另一方面提供網絡算力和通信服務并管理這些服務,包括:控制物理設備以實現特定所需的網元邏輯功能、處理和轉發從云層到邊緣層的控制命令等。算力架構可以包括:云層、算網融合系統(包含邊緣層)和端層,具體如下: - 端層是用戶終端設備層,即
72、用戶任務發起層,通常包括:個人電腦、手機、可穿戴設備和物聯網設備等。先進的終端(例如:功能強大的智能手機和嵌入式單板計算機)可以實現本地網關和簡單組網功能。 - 邊緣層是算網融合系統的最底層,接受端層發起的任務,根據調度策略進行本地計算或向高層節點轉發,這些邊緣節點可以是環境中部署的設備。一般認為應在邊緣設備附近實現實時控制和操作功能,即:對低延遲有較高要求的操作,通常是在算網融合系統的邊緣層實現的。 - 云層是算網融合系統之上的最頂層,提供與終端用戶的應用層接口、控制命令和特定領域的應用。它將網絡功能與后端應用集成在一起,實現算網融合系統與上層應用層的互通。 上述多層算網融合系統部署架構,可
73、使我們能夠開發出算力與通信融合的各種創新服務和應用。特別地,算力可以由網絡中心/高層(即云層、算網融合)遷移到更接近用戶的位置(即:邊緣層、端層),以獲得以下增益: (1). 最小化延遲: 一部分業務應用只涉及基本的控制循環; 換句話說,要能在一定的時間條件下,觸發一定的動作。然而,這些控制回路通常對時間非常敏感。在本地或靠近數據源的地方分析并做出快速決策,可以極大地減少那些控制循環的延遲,因為遠程的云層可能無法對數據進行實時處理并存在額外的傳輸延遲。 (2). 提高可靠性: 網絡會將傳感器數據用于公共安全或控制關鍵基礎設施。通向遠處的云層的上行鏈路很容易被破壞,因此將本地處理作為備用選項,或
74、完全使用本地處理是很有價值的。例如:在工業控制回路或應急響應系統中,利用邊緣計算進行本地處理,可以提高業務安全性和可靠性。 (3). 解決隱私問題: 一些用戶數據是敏感數據,或是一些法律要求不能存儲在特定地理邊界之外的數據。雖然云服務提供商通常被認為是可信的,但用戶無法知曉和控制自己的數據實際存儲在哪里,以及誰可以訪問它。而本地網關和邊緣節點則處于本地操作員的控制之下,可以提供更好的信任。 (4). 節約帶寬: 網絡中的上行帶寬通常受到限制,將大量數據從邊緣設備傳輸到云服務器并不總是可行的。在本地先執行數據(預)處理,再將聚合和過濾后的數據發送到云端,可以顯著減少上行傳輸帶寬的消耗。 (5).
75、 跨云邊端協同:系統根據業務邏輯,實際資源等情況,為完成服務而跨云-邊-端進行協同調度操作,至少包括:端-端協同,云-邊協同,端-云協同等不同方式。在實際生產生活場景下,云邊端彼此之間的概念,其實并不存在非常具體絕對的劃分,云邊端之間的界限可相對模糊,并且可根據實際服務內容有所改變。 在多層算網融合系統部署架構中,網絡中的各級算力資源得到系統的管理和有效的調度利用,并能夠和通信資源進行聯合地調度或獨立調度,最大化地滿足用戶業務/應用對算力和通信性能的不同需求,從而提高用戶體驗和資源的利用效率。 4.3.2 算法架構方面 通信網絡,特別是移動通信網絡,由于其具有非常復雜的網絡體系、分布式的部署方
76、式、極大規模的節點分布、穩定的系統運行要求等特性,因此針對 6G 新網絡原生/內生 AI 算法架構的設計,應當充分考慮通信網絡不同特性對 AI 算法與算法架構的需求和影響,從 6G 新系統架構的角度設計 AI 算法,實現網絡 AI 系統(network AI system)。6G 新網絡的原生/內生 AI 算法架構應當至少滿足如下需求: 穩定性(Stability):由于電信級移動網絡需要非常穩定地運行,因此對 AI 算法運行和維護的穩定性也提出了較高的需求,AI 算法架構需要具備較為穩定的結構與系統化設計,并能夠提供較強的容錯能力。 實時可管可控(Real-time manageable a
77、nd controllable):原生/內生 AI 算法架構需支持網絡信息的智能化實時監控、實時管理與實時控制。AI 算法架構在設計時,應充分考慮電信網絡實時性需求與業務實時性保障。 安全與隱私保護(Safety and privacy):AI 算法架構應當原生地支持不同算法模塊、算力設備之間參數傳遞的安全和隱私保護。 中心化和分布式混合層級設計(Hybrid and layered design):電信移動網絡在不同層級具有分布式和中心化的多重混合式部署。部署原生 AI 算法在架構層面,應當支持分布式部署、分布式運行、以及多層靈活混合式部署和運行,從而可支持電信網絡不同層級的需求。 算網一體
78、化(In-network computing):隨著算網融合概念與研究工作不斷地深入,算網一體化協同將會是未來 6G 新網絡的重要特性之一。因此,原生/內生 AI 算法應當充分考慮算網一體這一網絡特性,在架構設計上體現出算網深度協同的需求。 模型與數據劃分(Distribution of model and data):由于網絡中算力設備能力的不同及設備部署方式的差異,分布式算法架構需要充分考慮通信網絡 AI 模型、網絡數據的劃分與分布式訓練與存儲,從而可更好滿足部署需求和算網一體化需求。 模型通信方式(Model exchange):分布式或混合式 AI 架構需要不同層級/功能/區域間對計算
79、模型的交互,因此 AI 模型傳輸(通信)的模式的定義與設計,也決定了分布式 AI 算法模型的性能。AI 算法架構根據不同的算法和場景,應當支持同步/異步/混合式模型通信交互方式。 數據與模型雙重驅動 (Model and data-driven):傳統知識模型驅動的電信移動網絡設計,在多個方面具有較大的優勢,可彌補僅依靠數據驅動的機器學習算法所伴隨的泛化性、可解釋性缺乏等弊端。因此,AI 算法架構應當原生地滿足數據與模型雙重驅動的需求。 數據異構(Heterogeneous data):AI 算法架構還需要考慮無線數據的特殊性和異構性。 通信效率(Efficiency):原生/內生 AI 算法
80、架構在設計時,應充分考慮通信網絡效率的需求,需要減低模型進度,壓縮模型更新,改進通信調度等。同時,AI 算法模型的收斂性和泛化能力對通信效率也有較大影響,因此在 AI 算法架構設計時也需重點考慮。 可演進與自演進(Evolvable):AI 算法架構還應當具有較強的可演進性,以充分應對網絡技術發展和新業務不斷變化。 4.3.3 數據架構方面 數據是 AI 算法模型的基礎,對于要支持原生/內生 AI 能力服務的 6G 新網絡,AI/ML 相關的數據管理功能,可以被認為是與移動性管理、會話/任務管理重要性相并列的基本控制功能。因此數據管理的邏輯架構對于 6G 新網絡架構至關重要,它主要體現在對各個
81、數據功能實體的組織編排方面。 圖 6:6G 數據管理邏輯架構示例 1 圖 6 是一種可能的 6G 數據管理邏輯架構,其中邏輯功能實體主要包括: - 數據開放功能 DEF (Data Exposure Function):用于向應用功能 AF 開放 6G 網絡數據相關服務(DaaS: Data as a Service)。DEF 可基于 AF 提供的數據業務需求和/或服務等級協議數據收集功能DCF數據分析功能DAF數據存儲功能DSF數據安全管理功能DSMF應用功能AF數據開放功能DEF數據資源編排功能DROFSLA,將 6G 網絡數據進行去隱私化、聚合等處理,作為數據服務提供給外部/第三方 AF
82、 或系統內部 AF。 - 數據收集功能 DCF (Data Collection Function):用于采集 6G 新系統內的網絡、業務和終端數據等,供 DAF 實體使用。 - 數據分析功能 DAF (Data Analytics Function):用于基于 DCF 采集的數據,進行AI/ML 模型訓練,進而利用 AI/ML 算法得到和網絡、業務和終端相關的分析結果信息。DAF 邏輯功能又可細分為模型訓練子功能 MTLF 和分析推理子功能。 - 數據存儲功能 DSF (Data Storage Function):用于存儲 AI/ML 相關的數據。 - 數據安全管理功能 DSMF (Dat
83、a Security Management Function):用于面向 AI/ML相關數據進行隱私保護和安全管控。DSMF 與用戶簽約與授權管理功能 USAM (User Subscription and Authorization Management Function)、其它數據管理功能(DCF、DAF、DSF、DEF)之間相互交互,實現對用戶數據處理(例如:收集、分析、存儲)的授權許可、修改和撤銷的檢查和事件通知,從而控制其它數據管理功能對用戶數據的使用和處理(例如:在用戶數據使用授權撤銷后,終止對該用戶數據采集和分析,刪除存儲的數據等)。 - 數據資源編排功能 DROF (Data
84、Resource Orchestration Function):用于管理(例如:分配、調度、刪除)AI/ML 數據處理相關的資源。DROF 本身也可基于 AI/ML 算法(例如:深度強化學習),對這些數據處理資源進行動態智能的編排和管理。 圖 7:6G 數據管理邏輯架構示例 2 DMF3數據管理功能DMF1DMF2數據安全管理功能DSMF應用功能AF數據開放功能DEF數據資源編排DROF圖 7 是另一種可能的 6G 數據管理邏輯架構。它與圖 6 相似,該架構也包含 DEF、DSMF 和DROF 功能實體。但與圖 6 的不同之處在于,該架構定義了數據管理功能 DMF(Data Manageme
85、nt Function),DMF 實體包含了數據收集 DCF、分析 DAF 和/或存儲 DSF 功能。因此,圖 7 中架構示例可視為圖 6 中架構的一種變體。 圖 6 和圖 7 中數據管理相關的功能實體可采用集中式或分布式部署: - DEF 實體可以部署在云端或邊緣網絡,用于向云端應用服務器/AF 或邊緣網絡中的本地應用服務器/AF 提供數據服務。 - DMF 可以部署在云端或邊緣網絡,亦可在 6G 網絡內部分布式部署,從而支持網絡中泛在的 AI 能力,以及與其它 DMF 之間的多點協作。 - DCF、DAF 和 DSF 也都可在云端、邊緣網絡或在 6G 網絡內部分布式部署。 - DSMF 可
86、在云端、邊緣網絡或在 6G 網絡內部分布式部署,以滿足網絡中不同區域對AI/ML 相關數據的隱私保護與安全管控的不同需求。 - DROF 可在云端、邊緣網絡或在 6G 網絡內部分布式部署,以滿足面向數據處理資源管理的實時性和本地化需求等。 上述 DEF、DSMF、DMF、DCF、DAF 和 DSF 都屬于控制面功能實體,DEF、DSMF 一般部署在核心網(或與其它核心網功能實體共址),而 DMF、DCF、DAF 和 DSF 可以部署在核心網或無線接入網(或與其它核心網或無線接入網功能實體共址)。DROF 則屬于管理面功能實體。 在上述 6G 數據管理邏輯架構中,“數據”包括但不限于以下類型:
87、- 用于 AI 分析推理的輸入數據,例如:網絡數據、業務數據、終端數據; - AI/ML 模型信息,包括:模型(超)參數、模型描述文件信息(例如:該模型適用于哪種分析類型、該模型的應用條件/狀態)等。 - AI 分析結果信息,即基于 AI 輸入數據、AI/ML 模型算法得到的分析結果,例如:對網絡或終端未來行為、狀態的預測信息,或當前行為、狀態的統計判斷信息等。 云邊協同:要能實現數據的分布式協同采集、處理與治理。云端負責統一采集調度入口,邊端執行具體采集任務;云端負責統一數據處理入口,與邊端協同計算引擎配合,實現協同計算邏輯的調度與控制,邊端負責下推算子的執行;云端負責統一數據治理入口,云端
88、負責不同類型表的統一元數據注冊與統計分析、規則配置等,邊端完成數據治理執行。 4.3.4 其它架構方面 6G 要做到原生/內生 AI,需要主動擁抱比傳統通信網絡更廣闊的生態,因為 AI 三要素算力、算法、數據都很難完全由一方來全部提供,很多 AI 場景用例需要由多方協作來共同完成的,例如:通過 6G 新網絡實現多家企業在不直接共享其物聯網終端數據的情況下,實現可信的聯邦訓練等。因而,6G 新網絡將 AI 作為其內生能力和服務,需要在算力、算法、數據多個架構層面上,原生支持多方共同協作參與機制,實現多方可以簡單的、透明的、公平的、可信的方式,參與到某個具體的 AI 訓練、驗證或推理過程中,包括但
89、不限于: 1)算力:即 6G 新網絡的異構算力資源可以是由多方共建、共享、共維護的,用戶和客戶可以將其擁有的空閑算力資源,基于 6G 內生 AI 架構透明公平地進行分享利用。 2)算法:6G 新網絡內的 AI 算法,包括網絡自用 AI 或第三方 AI 應用,其來源可以是多樣的,6G 內生 AI 架構需要支持對相關算法庫的高效管理運營,支持對多方 AI 算法的可信驗證等,支持多方參與不同類型的分布式 AI 訓練和決策。 3)數據:6G 新網絡 AI 數據源可以來自任何第三方,6G 內生 AI 架構需要原生地支持相關多方數據的安全隱私保護,例如:當用戶參與到 6G 某個聯邦訓練任務時,不會因為訓練
90、過程中的梯度同步過程,而造成用戶隱私泄露。 5. 技術需求和原則總結 本白皮書簡要地回顧了 AI 和 5G 移動系統結合應用的歷史和現狀,分析了未來 AI 和 6G 移動新系統原生內生融合應用的基礎和變革趨勢。在這條充滿挑戰的演進發展之路上,業界必須對6G 原生/內生 AI 在能力,服務,架構技術需求方面,先有著較為完整且統一的認知和共識,進而在此基礎之上形成原生/內生 AI 能力,服務,架構體系和具體內容的構建和拓展。6G 原生/內生AI 的實現,在其能力,服務,架構技術需求方面都會涉及到“算力”,“算法”和“數據”三要素方面,而這些技術影響和需求和今日以云 AI 為代表的集中式 AI 體系
91、有著許多不同,原生/內生AI 總體呈現出“泛在式”、“分布式”、“本地式”、“協同式”、“魯棒式”、“隱私式”、“開放式”等特征。除此之外,未來為了能支持可差異化、定制化的 AI 能力和服務應用,6G 原生/內生 AI 還需要支持所謂 QoAIS 類的廣義服務質量保障和評估機制,以支撐對應的 AI 商業模式新應用。6G 原生/內生 AI 需能支撐和構建比傳統 ICT 網絡更廣闊的業態,其不僅可擁有更廣闊安全可信的“算力”,“算法”和“數據”來源提供者,更能更廣、更深、更厚地賦能和造福更多的行業客戶和用戶。 6. 參考文獻 【1】IMT-2030 網絡組. 6G 網絡架構愿景與關鍵技術展望白皮書
92、R,IMT-2030 中國 6G 大會, 2021. 【2】中國移動研究院等. 5G 無線網絡智能化研究R,CCSA TC5 WG9, 2021. 【3】3GPP. 3GPP TS 22.261: Service requirements for the 5G system(Release 17)S, 2021. 【4】3GPP. 3GPP TS 23.288: Architecture enhancements for 5G System (5GS) to support network data analytics services(Release 17)S, 2021. 【5】3GPP.
93、 3GPP TS 28.104: Management and orchestration; Management Data Analytics(Release 17)S, 2021. 【6】3GPP. 3GPP TR 37.817: Study on enhancement for data collection for NR and ENDC(Release 17)S, 2021. 【7】歐陽曄, 王立磊, 楊愛東,等. 通信人工智能的下一個十年J. 電信科學, 2021, 37(3):36. 【8】程強, 劉姿杉. 電信網絡智能化發展現狀與未來展望J. 信息通信技術與政策, 2020(9
94、):7. 【9】中國聯通. 中國聯通異構算力統一標識與服務白皮書R, 2021 【10】中國聯通. 中國聯通云網融合向算網一體技術演進白皮書R, 2021 【11】中興通訊. 中興通訊自主進化網絡白皮書R, 2020. 【12】Mohammad Sultan Mahmud,Joshua Zhexue Huang, etal. A survey of data partitioning and sampling methods to support big data analysisJ, Big Data Mining and Analytics, vol.3, issue:2, pp85-10
95、1, 2020. 【13】彭進香,張莉. 大數據處理技術與應用M, 清華大學出版社,2020. 【14】Yongyong Ge. A Survey on Big Data in the Age of Artificial IntelligenceC, pp.72-77, 2019 6th International Conference on Information, Cybernetics, and Computational Social Systems (ICCSS) 【15】Jinkang Zhu, Chen Gong, Sihai Zhang, Ming Zhao, Wuyang Z
96、hou. Foundation study on wireless big data: Concept, mining, learning and practicesJ, China Communications , vol.15, issue:12, pp.1-15, 2018. 【16】Yuanwei Liu, Suzhi Bi, Zhiyuan Shi, and Lajos Hanzo, When machine learning meets big data a wireless communication perspectiveJ, IEEE Vehicular Technology
97、 Magazine, vol.15, issue:1, pp.63-72, 2020. 【17】劉光毅,鄧娟,鄭青碧,李剛,孫欣,黃宇紅.6G 智慧內生:技術挑戰、架構和關鍵特征J.移動通信,2021,45(04):68-78. 【18】Y. Yang, “Multi-tier computing networks for intelligent IoT,” Nat. Electron., vol. 2, pp. 45, Jan. 2019. 7. 附錄 定義和縮寫 縮略語縮略語 英文全稱英文全稱 中文全稱和說明中文全稱和說明 3GPP 3rd Generation Partnership P
98、roject 第 3 代合作伙伴項目 5GC 5G Core 5G 核心網 5GS 5G Mobile System 第 5 代移動通信系統 ADRF Analytic Data Repository Function 分析數據存儲功能 AI Artificial Intelligence 人工智能 AI4NET AI for Networking 通過 AI 輔助提升優化網絡 AN Access Network 接入網 AnLF Analytic Logic Function 分析邏輯功能 CN Core Network 核心網 CSI Channel state information 信
99、道狀態信息 DaaS Data as a Service 數據相關服務 DAF Data Analytics Function 數據分析功能 DCCF Data Collection Control Function 數據采集控制功能 DCF Data Collection Function 數據收集功能 DEF Data Exposure Function 數據開放功能 DL Deep Learning 深度學習 DMF Data Management Function 數據管理功能 DROF Data Resource Orchestration Function 數據資源編排功能 DSF
100、 Data Storage Function 數據存儲功能 DSMF Data Security Management Function 數據安全管理功能 MCC Mobile Cloud Computing 移動云計算 MDT Minimize Driving Test 最小化路測 MEC Mobile Edge Computing 移動邊緣計算 ML Machine Learning 機器學習 mMTC Massive Machine Type Communication 海量機器類通信 MTLF Model Training Logic Function 模型訓練邏輯功能 NET4AI
101、Network for AI 通過網絡提供 AI 業務服務 NF Network Function 網絡功能 NWDAF Network Data Analytic Function 網絡數據分析功能 OAM Operation and Maintain 運維網管 ODICT Operation Data Information Communication Technology 運營數據信息通信技術 QoAIS Quality of AI Service 智能服務質量 QoE Quality of Experience 用戶業務體驗 QoS Quality of Service 用戶業務質量
102、RAN Radio Access Network 無線接入網 RL Reinforcement Learning 強化學習 SBA Service Based Architecture 基于服務的架構 SLA Service Level Agreement 服務等級協議 ToB To Business 面向商業對象 ToC To Customer 面向普通消費者 URLLC Ultra-Reliable Low-Latency Communication 超高可靠低時延通信 URSP UE Route Selection Policy 用戶終端路由選擇策略 USAM User Subscription and Authorization Management Function 用戶簽約與授權管理功能 XR X Reality 擴展現實