《中國移動研究院:通算融合共生:關鍵技術和系統設計思考(2023)(14頁).pdf》由會員分享,可在線閱讀,更多相關《中國移動研究院:通算融合共生:關鍵技術和系統設計思考(2023)(14頁).pdf(14頁珍藏版)》請在三個皮匠報告上搜索。
1、通算融合共生:關鍵技術和系統設計思考中國移動研究院李男業務和技術雙重驅動無線接入網演進業務和技術雙重驅動無線接入網絡架構不斷演進業務需求技術趨勢架構演進2G 3G 4G 5G 5G-A/6G IP化云化(SDN,NFV,MEC)服務化(SBA)、智能化(AI/ML)、通算融合共生語音移動互聯網定位視頻直播URLLC:車聯網eMBB:XR智慧泛在通感一體mMTC:工業互聯網數字孿生無線接入網基站和終端設備向算力化演進基站設備向異構算力方向演進加速板方式1方式2通用算力1.方式1:專用硬件擴展通用算力板卡,算力卡+軟件包形式提供通算融合服務2.方式2:通用服務器擴展5G加速卡,服務器+軟件包 形式
2、提供通算融合服務空間池化業務池化1:N 算力資源插花組網多站復用算力資源時間池化基站算力資源池化可提升硬件基礎設施利用效率,節約建設投資、復用運維資源,已成為無線產品演進方向基站服務能力軟件快速重構硬件資源時分復用CT+IT+OT融合部署運維形成邊緣云網一體服務終端呈現海量、多樣化、輕量化特點,部分終端算力快速增強個人終端(1Tops1000+Tops)(十億級:手機,億級:PC/平板,千萬級:智能車)家庭終端(10Tops)(億級:網關,千萬級:攝像頭、路由器)行業終端(1Tops1000+Tops)(百萬級:工業網關、邊緣設)備通算融合潛在應用場景2C2B基站算力池化組網,運維優化AI下沉
3、,業務體驗保障,增強感知能力p關鍵業務體驗保障:基于基站本地業務識別,優化和保障關鍵業務體驗(如:醫院場景中的支付應用、醫院自由應用app的業務體驗保障)p基站AI優化:基于信道的基站定位計算,實現精細化網絡覆蓋感知和優化p網絡AI運維下沉:智能故障與隱患識別、高負荷小區優化p基站/網絡協作AI(如:分布式推理、協同推理、聯邦學習等)、空口協作AI面向2B本地化場景的通信計算業務一體服務,靈活敏捷,降低綜合成本服務能力拓展網絡智能增強p園區:工業視覺AI檢測(智能終端協作的分布式學習)、智能安防、智能巡檢等p車聯網:智能碰撞預測、路口視覺融合、自動駕駛仿真等p無人機:路徑管理、入侵檢測等基站邊
4、緣云服務可復用大網運維資源,通過大網服務體系降低邊緣云運維成本,實現云網一體運維,基站算力池化共享組網滿足極低時延/大帶寬應用本地計算需求p基于大模型的內容生成和個人AI代理p虛擬環境構建:XR本地業務渲染、元宇宙等p新型服務模式:云手機、云游戲、手勢/動作識別、軌跡追蹤等網絡智能化是通算融合的重要場景,產業鏈條較短,較容易實現運營商內部閉環,可作為通算融合應用突破口基于基站的2C/2B算網業一體服務也是重要的拓展場景生成式人工智能成為下一代通信服務的核心場景無線網絡與智能終端的通信和計算協同將助力打開新型信息服務產業價值空間個人專屬AI代理用戶場景化數據和AI大模型在網絡中頻繁交互多模態內容
5、生成成本趨近于0的生成內容在網絡中爆發位置信息用戶習慣信息歷史對話信息環境/場景信息生成式AI涌現,逐步向個性化服務演進*Tesla FSD HW4.0,單片約 200TOPS 手機大模型推理能力加速增強 智能體間協作控制需求擴大 智能汽車*人形機器人*家庭終端 AI原生可穿戴形態產品涌現高通驍龍8Gen3AI處理器HexagonNPUAI算力超過73TOPS。運行100億參數大模型每秒處理20 Tokens0.6秒生成Stable Diffusion圖片聯發科天璣9300AI處理器APU 790運行330億參數模型內存硬件壓縮技術AIGC端側LoRA融合秒級文生圖 智能可穿戴設備作為AI代理
6、實體,依靠網絡或云端實時計算推理 具有多模態數輸、低延遲、個性化、低功耗的需求胸針眼鏡吊墜 將涌現大量的低時延的多智能體間協作 結合網絡提供的計算能力和通感服務,確定性的端到端時延保障 端側推理需要網絡提供穩定大模型文件傳輸 端側可支撐分布式模型學習或端/邊/云協同學習終端能力快速增強,形態多樣化生成式AI大規模應用帶來的業務需求從內容數據傳輸到10GB-100GB體量大模型的傳輸LLAMA2-13B 模型文件13GB,Stable Diffusion模型幾GB到十幾GB不等低延時和個性化的AI代理服務帶來跨應用、場景化的信息收集和頻繁大模型微調多智能體協作和AI原生可穿戴設備要求靠近用戶的A
7、I計算和低時延高可靠通信*Nvidia Drive Orin自動駕駛芯片,單片254 TOPS核心技術難點和系統設計問題通算資源角度:如何發揮泛在無線接入網基礎設施價值,以有效滿足技術發展需求?無線通算融合異構平臺網絡功能角度:面向無線網絡高動態環境、計算能力的空時波動和碎片化等特性,及通算資源受限約束,如何實現通算智一體服務和保障?計算感知的無線協議功能和接口流程設計通感算智多維資源一體調度和控制無線用戶面動態虛數據擬錨點和轉發無線封閉數據的實時/按需/跨域采集、關聯挖掘和安全開放服務能力角度:如何實現無線通信、計算和智能資源/功能/服務協同動態按需編排和開放?RAN domain的通算智服
8、務編排、開放機制及與中心編排系統的協同系統設計問題核心技術難點通算融合性能指標體系面向通信計算融合的無線系統,除了網絡通信指標外,如何考量系統的計算性能?通算融合的系統架構高動態多設備協作組網針對無線系統通信環境變化和計算資源的不同狀態,如何設計合理的計算協同模式,高效執行計算任務?如何在連接的基礎上,基于統一系統架構彈性高效實現對多種計算業務(如AI訓練/推理業務、感知類業務的支持?技術探索1-1:無線通算融合異構基礎設施平臺Communication-Aware Orchestration of ComputeHARDWAREX86ARMRISC-VFPGADPUIPUGPUOthers:
9、Switch/Router,RU,etcSmartNICLINUX KERNELOPERATINGSYSTEM&DRIVEROtherDriverGPUDriverDPUDriverIPUDriverFPGADriverSmartNICDriverPhyiscal Infrastructure ManagerVIRTUALIZATIONLAYERHypervisorContainer Runtimecoroutine/thread managementPluginsAgentsvDriversOthersVirtual Infrastructure ManagerSERVICEPaaS VMV
10、MContainerCoroutine/Thread.SERVICE FaaSSERVICETaaS FunctionTASKTASKTASKDesignFrameworkFunctionFunctionFunctionFunctionFunctionRANaaSSDN Controller with SRv6Cloud ManagerCoroutine/ThreadvDUService Mesh Observibility ToolsCode/ImageRepovCURICxAppContainerAIaaSXaaSXaaSXaaSXaaS122234構建適配無線網絡和多樣化業務需求的高效異
11、構平臺,對無線算力資源實時共享、分配和管理硬件抽象和虛擬化:針對CPU、GPU和DPU等異構硬件的資源管理和調度 服務擴展:從物理和虛擬資源到FaaS/TaaS,構建無線領域的FaaS/TaaS數據平面增強:基于算力路由和微服務,通過軟硬件卸載來加速service-mesh性能云管和調度:利用分布式/混合/邊緣設備云管系統和插件,支撐通信和計算聯合調度技術探索1-2:基于業務模型的無線算力度量無線通算融合網絡功能層計算任務實時控制與調度計算性能映射模型任務生成服務拆解無線網絡功能無線基礎設施GPU1VendorAGPU2VendorBGPUnVendorNGPU3VendorCSSD ResN
12、et-34 training渲染、定位.無線通算聯合編排與服務開放操作系統Hypervisor/Container Runtime虛機/容器編排管理通算聯合調度AI服務請求Inception V3 Inference度量方式1:基于硬件資源模型的度量,可增加擴展考慮能耗因素示例1:2 CPU cores,4G memory,128GStorage,2*10GE Server configuration:Skylake-D 2177 etc.示例2:GPU TF32 120TFLOPS,CPU 795GFLOPS度量方式2:業務模型或原子功能驅動的計算能力度量示例1:AI Training 48
13、30 Samples per second示例2:LDPC decoding capability 20Gbps不同業務應用在不同計算硬件的計算能力有較大差異,算力資源調度需考慮業務模型與計算硬件的適配能力多種AI模型在不同硬件的推理處理能力測試多種AI模型在不同硬件的模型訓練處理能力測試技術探索2-1:計算能力/任務的實時感知及控制無線接入網擴展對終端和基站的計算能力和任務實時感知,通信計算資源聯合控制保障用戶體驗問題:傳統面向移動性管理保障通信的連續性,通算融合場景,還要考慮計算任務的連續性和任務多維度質量要求技術方向:多維要素考量:相鄰小區通信狀態,例如,用戶數,信道環境,業務負載;算力
14、資源狀態,例如任務所需算力資源,基站/終端可用資源等決策錨點選擇:分布式站間CCF協商、集中式如無線算力池內CCF,核心網決策問題:AI、感知等新服務能力,需要本地化的網絡計算功能支持技術方向:基站擴展計算控制功能(CCF),實現終端算力資源感知和計算任務感知,同時支持計算執行CCF可接入核心網總線,使能核心網感知無線基站和終端算力信息核心網Loop2:站間計算感知Loop3:終端/基站/核心網計算感知Loop1:終端基站計算感知計算也切CCF1控制無線算力池CCF間協商完成任務遷移核心網CN控制任務在CCF1和CCF2遷移計算控制功能CCF通算實時感知任務實時控制通算資源聯合調度控制面用戶面
15、SRB 04DRBSRB*SRB 04DRBCRBOpt1:SRB*承載算力和計算任務信息Opt2:CRB承載算力和計算任務信息算力類型多樣網絡高動態變化通信和計算聯合決策連接和計算任務按需解耦遷移,保障業務端到端體驗連接切,計算不切連接切4312計算控制CCF計算執行技術探索2-2:通算資源一體調度典型用例面向VR場景的無線通算一體編排終端和基站協同AI推理IoV場景下的通算聯合調度目標:最大化系統AI推理精度基站的算力和帶寬約束通信:基站時頻資源分配比例因子通信:基站時頻資源分配比例因子推理:模型退出點模型切分:模型切分點和退出點目標:最大化滿足端到端延遲要求的VR用戶數量通信需求 計算需
16、求 通信和計算約束設置業務幀率60、90、120FPS&背景用戶數50,幀壓縮后2Mb,無線環境設置UMa場景時,無線算網聯合編排算法相比于VR用戶就近接入方式提升60FPS接入VR用戶數10%以20個AI推理任務為例,覆蓋較好場景下(SNR20dB到30dB),相比基準算法至少可以提升0.4%系統推理精度,系統可以提升11%的AI推理任務數,至少提高28%的譜效率目標:最大化工作完成率,最小化總體低時延和成本變量:子任務與計算節點的適配關系約束:傳輸速率和計算資源約束以隨機任務依賴關系模型為例,當到達8個工作(每個工作中包含5個子任務)時,所提方法的工作完成率可以提高7%,但時延和成本至少分
17、別降低19%和14%N.Li,Q.Sun,X.Li,et al.,“Towards the Deep Convergence of Communication and Computing in RAN:Scenarios,Architecture,Key Technologies,Challenges and Future Trends,China Communications,2023.技術探索2-3:無線計算數據轉發和路由縱向封閉管道式的用戶面機制已無法滿足計算數據需求,用戶面泛在開放、動態路由、一體服務能力將成為演進方向典型場景:高移動性,高可靠性計算任務,如車聯網增強方向:增強RAN對
18、計算數據實時路由決策能力典型場景:云/邊/端協同計算,如XR、AI等增強方向:終端、基站數據和業務體驗等數據按需采集、存儲和共享,可綜合參考無線資源、傳輸資源、計算資源、業務需求,考慮面向網絡AI的數據服務機制,如數據服務總線Bearer and DataFlowData Offloading Anchor PointCompute Data BusCompute Data Tunnel典型場景:大規模無線數據本地處理、超低時延工業控制增強方向:非單一數據卸載錨點,數據按需就近轉發開放技術探索3:通算智資源/功能/服務協同編排和開放從傳統網絡管理向通算資源/功能/服務協同編排演進,助力面向業務
19、意圖/需求的閉環保障和智能自治跨域設備:終端,基站多維資源:通信資源、計算資源RAN通算資源統一管理RAN通算服務自動化編排業務驅動:面向業務意圖閉環保障:面向連接+計算綜合服務智能自治:基于AI/ML的意圖轉譯、故障/性能預測、智能決策開放能力類型:RAN管理編排能力、用戶/切片/應用級通算服務定制、RAN算力開放對象:跨域編排器/第三方App開放方式:管理編排層、協同核心網/RAN能力開放RAN通算服務能力開放RAN通算服務按需編排場景示意通算服務需求通算能力開放本地應用跨域編排器通算管理與編排通算聯合編排業務編排通算能力開放RAN FCAPS多維數據統一管理通算功能與資源聯合編排RAN
20、功能LCMRAN異構計算資源管理計算拓撲管理計算資源性能故障管理算力度量AI/ML管理AI/ML模型管理AI/ML模型訓練AI/ML模型性能監測業務/服務編排通算功能與資源聯合編排SLA模板/意圖統一基礎設施通算一體,一網多能服務/功能按需編排DeviceAIAIAIRANEdge Cloud通算資源上報通算策略/配置無線通算融合技術探索與實踐 面向無線AI應用,建立無線基站算力池實現跨站算力協同基于宏站的無線算力編排云小站剩余算力資源部署輕量5GC、IMS、咪咕AR業務等應用基于云小站的無線算力共享 咪咕AR業務編排至云小站,總耗時降低46%、傳輸耗時降低70%高清場景卡頓現象,較公網中心云
21、部署方案明顯降低 構建宏基站算力池,跨基站算力借閑補忙的算力互助,部署智能AMC應用獲得穩定的增益效果,下行中遠點吞吐量提升10%,頻譜效率提升4%*數據依據:64Rx*2Tx*1632RE 836KBytes,每5ms 最大2用戶,連續上報,平均每用戶3小區分布式高精定位大容量場景下業務體驗保障無線協議棧彈性擴展痛點:海量信道數據處理導致傳輸資源受限解決方案:基站本地算力預處理信道數據,主服務小區進行定位計算,相比原始數據傳輸,帶寬需求從1GBps降至19KBps*痛點:高負載和智能化需求下,單站算力受限解決方案:自適應算力調度、資源共享異構算力補充,提升站點可用算力;智能識別、分層調度,保
22、障差異化業務需求痛點:小基站無法動態適配業務量,算力共享效率低解決方案:容器化無線協議棧彈性設計,自動執行通算協同策略,動態調度無線算力,實現最優算力使用,提升資源效率聯合產業界開展外場實驗,初步驗證無線通算融合的技術可行性和價值持續深挖無線通算融合高價值場景,2C精確保障業務體驗,2B助力行業數智化轉型【廣東/河北】【安徽】【廣東】產學研協同推進無線通算融合共生技術發展基礎理論和關鍵技術研究 國家自然科學基金企業聯合基金 清華/北郵/東南-中國移動研究院聯合創新中心 鵬城實驗室-中國移動開放創新平臺國內/國際標準預研和制定 IMT2030/CCSA 無線通算融合共生架構/關鍵技術預研 適時發起國際標準推進,將體系架構中成熟部分在5G-Advanced中引入,并為6G網絡設計奠定重要技術基礎測試驗證和落地應用 以網絡智能化和行業應用為突破口,聯合產業伙伴開展通算融合共生技術創新驗證,加速無線通算融合共生技術的成熟與應用 共同探索新的商業模式和應用場景