《中國移動研究院:打造創新技術策源高地推動算力網絡縱深發展(2023)(14頁).pdf》由會員分享,可在線閱讀,更多相關《中國移動研究院:打造創新技術策源高地推動算力網絡縱深發展(2023)(14頁).pdf(14頁珍藏版)》請在三個皮匠報告上搜索。
1、打造創新技術策源高地推動算力網絡縱深發展中國移動 黃宇紅2023.08 2算力是數字經濟的核心生產力網算水電 事關核心生產要素升級過去十年,數據中心用電量以每年超10%速度遞增,2020年約占全社會用電量的2.71%1.47%1.76%1.86%1.96%2.16%2.42%2.71%0.00%0.50%1.00%1.50%2.00%2.50%3.00%010000200003000040000500006000070000800002014201520162017201820192020數據中心耗電量全社會用電量數據中心耗電量占比我國算力規模平均每增長一個百分點,帶動數字經濟和GDP將分別增
2、長1.6和0.800.511.52環境和公共設施管理環境和公共設施管理文教衛生與社會服務文教衛生與社會服務住宿餐飲業住宿餐飲業科研和技術服務科研和技術服務能源供應能源供應金融業金融業互聯網、軟件和信息服務互聯網、軟件和信息服務批發零售業批發零售業其他制造業其他制造業計算機等設備制造計算機等設備制造直接帶動產出直接帶動產出間接帶動產出間接帶動產出 事關數字經濟增速 事關雙碳目標實現資料來源:國家統計局中國信息通信研究院中國數據中心耗電量及占全社會電量比算力網絡發展回顧3算力網絡體系架構4算網一體的基礎設施融數注智的算網大腦融合統一的運營服務算網基礎設施層OTN/OXCOTN/OXCOTN/OXC
3、編排管理層運營服務層綠色算網運營算網大腦算網底座TaaS算力并網MaaS統一運營意圖感知能力開放數據湖 基礎算網管理 人工智能引擎 算網統一編排算網智能化一體編排泛在調度算力解構數字孿生意圖網絡算網自智統一IP算網底座全光底座分布式算力(邊)分布式算力(端)分布式算力(中心)分布式算力(中心)分布式算力(邊)分布式算力(端)安全算力網絡發展路徑52021-2023 2024-20252025十四五階段 十五五階段及更長期起步階段:泛在協同發展階段:融合統一跨越階段:一體內生智能編排算網融合智慧內生算網一體協同編排網隨算動算+網 互調(算網協同的資源式服務)大腦對算網等能力編排調度(多要素融合的
4、任務式服務)算網從協議和系統層面開始融合(極致體驗的智能化服務)算力網絡發展主線6中國移動從算網基礎設施構建、業務融合創新、創新技術引領等多方面系統化推進算力網絡建設和發展主線三面向創新技術引領主線一面向算網基礎設施構建主線二面向業務融合創新物理空間、邏輯空間、異構空間、多主體算力融通“4+N+31+X”布局,1000邊緣節點構建E級超大規模單體智算中心打造20ms、5ms、1ms三級時延圈實現算網高效協同,支持CHBN業務融合發展,打造算網全新生態產品算力化和算力產品化創新服務體系,發布算網服務1.0構筑融數注智算網大腦實現創新技術引領,打造算力網絡原創技術策源地三橫兩域體系架構創新提出十大
5、技術發展方向布局攻關三十二大核心技術7構建核心技術體系,打造創新技術高地提出十大技術發展方向和三十二大核心技術算力網絡核心技術體系加強關鍵核心技術攻關和原創技術突破算力網絡創新技術突破運營服務層編排管理層算網基礎設施層算力交易數據流通方向七:可信共享算網服務 方向一:泛在智能新型算力泛在調度算網原生編排智能網絡調度算網數據感知多要素融合編排算網智能化方向六:融數注智算網大腦方向三:光電聯動全光網算力原生算力卸載存算一體智能算力算力度量云原生空天地一體在網計算算力路由PON超寬全光接入400G/800G全光高速互聯OTN光電聯動算網SPN切片承載SRv6/G-SRv6確定性網絡應用感知新一代SD
6、-WAN綠色安全芯片節能服務器節能數據中心節能低碳能源全程可信安全編排隱私計算 方向八:端到端綠色低碳 方向九:能力內生新安全方向四:確定性IP網絡方向五:算網深度融合方向二:多樣性計算架構方向十:空天地星云算網2022年6月發布中國移動持續推動算力網絡技術的創新突破,構建算力網絡核心技術體系,打造原創技術策源高地存算一體:突破馮氏架構算力原生:融通異構生態算力路由:突破互聯網架構協議通算一體:無線通算融合共生新型智算:NICC新型智算中心架構存算新型智算中心GPU算力原生通用數據中心邊算力算力路由算力路由通算一體通算一體通算一體智算設施智算原生ROCmCUDACANNTesnsorFlowP
7、yTorchPaddlePaddleDeepspeed九天文件對象塊多元融合存儲GPU集群算力CPUGPU高速無損網絡高性能全以太RoCE液冷整機柜高效供電智算基建冷卻水系統智算框架AI 應用使能.跨架構編譯器算力抽象運行時“芯合”算力原生智算運營編排調度計量計費算力交易能力開放算力管理存儲管理網絡管理FCAPS管理日志管理資產管理裸金屬實例虛擬機實例容器實例異構算力池化算存網管效制定扣卡服務器的統一技術和評測標準,構建多樣性算力格局,豐富產業生態創新提出多元融合存儲技術方案,實現塊、文件和對象三種存儲方式統一,降低成本,提升存儲效率原創提出全調度以太網GSE技術,打造開放解耦、高性能的數據中
8、心無損網絡創新基于API轉發的GPU池化方案,實現資源的細粒度分配和跨資源池一體調度,提升智算資源分配靈活性和利用率1、新型智算:構建新型智算中心技術體系,打造算力高峰面向基礎通用大模型孵化,中國移動構建NICC新型智算中心技術體系,圍繞存、算、網、管、效五大核心技術特征全面推進,打造標準統一、技術領先、兼容開放的新型智算底座引入服務器冷板式液冷方案,推進服務器和機柜的解耦,有效降低數據中心PUENICC新型智算中心技術體系重點工作算存網管效82、算力原生:智算應用跨架構遷移部署9中國移動原創提出算力原生技術,打造“芯合”算力原生跨架構平臺,目標打破“框架+工具鏈+硬件”緊耦合的智算生態,屏蔽
9、底層硬件差異,實現智算應用的跨架構遷移部署。繁冗開發、復雜適配、各自為棧一次開發、一次封裝、跨芯遷移 發布面向智算的算力原生白皮書 原創提出“兩層架構”和“四大核心技術”OIF成立開源工作組,牽頭國內外多項標準立項 打造“芯合”算力原生原型平臺beta版,進行技術理念驗證實現視頻分析、圖像識別兩類智算應用在GPU T4、MLU 370間的跨架構部署遷移牽頭在OIF成立算力原生子工作組牽頭在ITU、CCSA進行標準立項三階段發展路徑:異構算力資源池化-應用跨架構遷移-全局泛在融通硬件層應用層oneAPICUDANeuWareROCmPytorchCANN無法互識跨架構流轉框架層工具鏈XXXX算力
10、原生層跨架構流轉的原生程序原生運行時 編程模型轉換、編譯、優化程序加載動態鏈接oneAPICUDANeuWareROCmCANN硬件層應用層框架層工具鏈Pytorch統一編程模型及源源轉換 基于SYCL的單源編程模型范式跨架構綜合編譯機制 多級IR互轉,圖算數融合編譯優化原生程序格式規范Host側、Device側指令元語及執行策略的一體承載原生運行時算力抽象跨廠商運行時接口/指令集的可變粒度映射機制3、通算一體:無線算網融合共生10從“煙囪式設計”到“網絡平臺化”從“單一能力”到“服務多樣化”從“功能獨立、資源隔離”到 “通算共生化”SaaS中心云基站智能終端智能終端協同協同協同聯合編排聯合編
11、排聯合編排基礎設施層連接計算數據模型虛擬資源網絡功能層計算面功能計算執行計算控制AI推理計算應用xAI訓練.算力感知通算QoS監控通算聯合調度需求感知能力開放連接用戶面功能連接控制面功能管理編排層RANFCAPS管理服務編排數據管理服務注冊/發現/開放無線計算資源編管通算聯合編排無線系統核心網絡算網大腦本地服務開放應用AI編管邊緣云 聯合產業開展面向5G-A和6G的標準研究,凝聚產業共識,推進技術方案標準化 聯合產業界開展無線通算融合外場實驗,初步驗證無線通算融合技術的可行性和價值基于宏站的無線算力編排,下行中遠點吞吐量提升10%,頻譜效率提升4%基于云小站的無線算力共享,業務總耗時降低46%
12、、傳輸耗時降低70%發表/錄用多篇SCI論文,提出無線通算融合共生的新型無線網絡架構和關鍵技術體系 CCSA TC5 WG6立項業界首個無線算力網絡項目,開展應用場景、關鍵技術和參考架構研究 IMT-2030,面向6G無線網絡設計,無線通算融合的技術特征寫入6G無線系統總體概念4、算力路由:推動算網一體創新發展11中國移動創新提出算力路由體系,將算力信息引入路由域,通過統一控制和調度進行算網資源全局優化,實現用戶體驗、資源利用率和網絡效率的最優組合CA-BGP-LS:出口節點向算力控制節點通告算力狀態信息CA-BGP:采集算力信息,通過擴展BGP協議進行通告CA-OSPF:在域內泛洪算力信息為
13、路由提供參考CA-Restful/json:通過restful協議接口收集Json消息算力信息CA-Netconf/yang:通過Netconf協議下發Yang模型算力配置算力路由協議簇算力路由組網架構歷時4年推動IETF成立算力路由工作組CATS,中國移動擔任主席20192022年5次研討會2023年3月 CATS WG成立暨首次會議,是路由域最受歡迎的工作組之一算力路由的提出發現問題云邊以及邊邊調度之間出現“性能反轉”問題本質計算和網絡是獨立系統算的負載和網的擁塞信息沒有產生關聯解決思路在路由中引入計算信息,進行聯合調度工作組范疇和計劃5、存算一體:突破馮氏架構,實現極致算效傳統架構AI芯
14、片能耗問題日益嚴峻,存算一體新范式突破訪存瓶頸,有望實現計算能效百倍提升,可中國移動積極攻關存算一體技術,構建存算一體產業生態攻關存算電路、芯片架構、軟件工具、算法模型、應用場景等存算一體關鍵技術,發布業界首個存算一體白皮書張量單元向量單元標量單元寄存器buffer緩存控制指令接口SDK仿真模擬算法模型應用場景實現SRAM、RRAM、NOR FLASH等存內計算,保證最優計算能效設計芯片架構及SoC方案,提供大算力芯片研發SDK、仿真模擬等軟件,推動軟件生態鏈適配AI算法模型,提升產品能力,加快生態構筑搭建應用場景并驗證,護航產品化落地與應用推廣聯合清華大學共同研發業內首款基于憶阻器的存算一體
15、SoC芯片,大幅提升芯片算效比基于憶阻器的存算一體SoC芯片SoC芯片(集成300萬個憶阻器)SoC芯片測試系統12可穿戴智能攝像頭移動終端數據中心端低功耗、高算力,支持AI模型本地化部署,有效保護終端隱私邊解決復雜邊緣計算場景散熱需求,提升邊緣系統的智能化程度云自動駕駛邊緣網關/5G云小站1024Tops1Tops5Tops1050Tops高算力有望實現AI運算能效提高12個數量級,大幅降低電力成本低算力“1+9+9”節點布局北方國際信息港廣東江蘇浙江山東河南山西甘肅內蒙古貴州9個集團級節點福建北京湖南四川新疆云南重慶河北寧夏9個省級節點1個中樞節點形成覆蓋廣泛、融通東西、多節點互聯的創新試
16、驗基礎設施科學裝置,打造算力網絡科學裝置啟動科學裝置建設:2022年中國移動攜手鵬城實驗室、中國科學院計算技術研究所共同啟動“大規??萍佳邪l基礎設施算力網絡科學裝置合作”,以構筑公共基礎實驗平臺類國家重大科技基礎設施為目標,為算網基礎科學研究及應用提供關鍵實驗平臺和測試支撐構建創新試驗網CFITI,打造科學裝置13總結與展望141、算力網絡發展的基礎在于“技術策源”,聯合業界加強算力原生、算力路由、存算一體、量子計算等跨學科交叉技術的研究,打造算力網絡原創技術新高地2、算力網絡發展的重點在于“繼往開來”,在做好技術原創的基礎上,還要解決好科學的工程化問題,以打造新型信息基礎設施為目標,全面支撐國家東數西算等重大工程向縱深發展3、算力網絡發展的核心在于“產業共贏”,凝聚產學研用力量,加快構建統一技術路線與標準體系,促進新技術轉化和產品落地