《中國移動:算力網絡使能邊緣計算快速發展-2022開放數據中心峰會(18頁).pdf》由會員分享,可在線閱讀,更多相關《中國移動:算力網絡使能邊緣計算快速發展-2022開放數據中心峰會(18頁).pdf(18頁珍藏版)》請在三個皮匠報告上搜索。
1、算力網絡算力網絡使能邊緣使能邊緣計算計算快速快速發展發展演講人:李鍇演講單位:中國移動研究院一、中國移動算力網絡新發展一、中國移動算力網絡新發展二、算力網絡對邊緣算力提出新要求二、算力網絡對邊緣算力提出新要求三、面向算力網絡的計算方案新實踐三、面向算力網絡的計算方案新實踐新發展:算力是數字經濟發展的新引擎數字經濟發展水平與算力規模密切相關,算力對數字經濟的發展有顯著的帶動作用,數據的高效處理決定數字經濟高質量發展,需做好算力的建設布局和技術革新預計到2025年,各個國家的數字經濟占GDP的比重持續提升到41.4%,發達國家的數字經濟占GDP比重明顯高于發展中國家,但發展中國家數字經濟占比增速略
2、高于發達國家算力指數的分布分為領跑者、追趕者、起步者三個梯度國家,由算力指數的提升所帶來的經濟增長情況發現,三個梯隊國家算力指數的劃分點分別出現在60分和40分來源:IDC 20212016-2025年樣本國家數字經濟占比趨勢各國計算力指數及排名來源:IDC 2021指數排名新發展:中國移動提出算力網絡發展戰略中國移動以網強算提出“算力網絡”新理念,以算力服務為中心、網絡服務為根基,網、云、數、智、安、邊、端、鏈(ABCDNETS)等要素深度融合,提供一體化服務的新型信息基礎設施2021年11月,中國移動合作伙伴大會中國移動算力網絡發展倡議白皮書2021年11月2022年6月發布算力網絡白皮書
3、發布算力網絡技術白皮書新發展:中國移動持續優化算力網絡資源布局,支持多業務節點提供邊緣服務中國移動持續完善“4+3+X”算力資源布局,推進邊緣算力覆蓋,加快泛在算力基礎設施服務供給一、中國移動算力網絡新發展一、中國移動算力網絡新發展二、算力網絡對邊緣算力提出新要求二、算力網絡對邊緣算力提出新要求三、面向算力網絡的計算方案新實踐三、面向算力網絡的計算方案新實踐新要求:算力網絡業務繁多,對邊緣底層算力提出多樣性要求邊緣業務繁榮共生,決定邊緣算力呈現資源多樣化、算網共生、智算融合的特征,“通用”+“異構”+“網絡”等資源支撐邊緣計算業務分布在各個領域,其應用場景對算力的功能、性能要求差異化明顯,提供
4、算力服務的時候需重點考慮多樣性算力資源供給,在網絡性能要求高的領域應重點考慮對低時延友好的無損網絡環境新要求:邊緣算力應能適應新型算力發展要求Chiplet:使用相對成本可控的積木式模塊化,設計計算平臺SoC芯片異構多芯片:硬件乘法器,用來快速實現數字信號處理算法,在多媒體、工控領域大量使用 利用異構資源完成特定領域定制加速,實現更高性耗比新型封裝技術:2.5D、3D封裝主要驅動力技術驅動力:傳統單功能芯片向多異構芯片集成方式演進,豐富的指令集滿足更加多樣化的場景要求從計算向計算+連接方向發展,例如多die的UCIe連接,多層次連接等市場驅動力:邊緣側計算密集型業務,如AI推理、媒體、安全、區
5、塊鏈等制造技術升級高端制造技術:DUV光刻機多重曝光、新型FinFET、GAAFET使用推動向3nm以下發展技術架構改進圖片來源:互聯網圖片來源:互聯網圖片來源:互聯網新要求:算力網絡業務對邊緣算力提出極致的性能需求邊緣計算業務“極致”性能要求,推動新型邊緣基礎設施算力釋放 數據、控制平面可編程 數據卸載、靈活處理 裸金屬智能管理 標準操作系統和工具 故障域和安全隔離 RoCE、IB等高速網絡互聯 計算/內存/存儲池 400G/800G以太網 緩存一致性數據處理單元(DPU)通用計算單元(CPU)極致虛擬化能力(NFV)眾多核心覆蓋(100+)處理器訪存能力(1nm)網絡轉發能力(100%)通
6、用計算能力(300+)網絡/互聯/池化并行計算單元(GPU/AI)大量訓練樣本,修正模型 利用模型進行推理預測 圖像渲染性能 編解碼性能 功耗、穩定性高低低+=極致吞吐時延功耗性能新要求:邊緣計算業務對算力圍繞單核心架構和多中心對等架構有長期共存需求單核心架構:標準通用性高、開發難度低、易錯率低、緩存一致性、效率偏低多中心對等架構:運行效率高、跨NUMA訪問、緊耦合異構總線難編程、太多Cores浪費在I/O路徑、系統優化難 CPU、DPU、IPU、GPU、FPGA各自存在內存的分離,存在各自的分支跳轉;操作系統面臨巨大挑戰,傳統OS kernel無法完成,當前生態鏈差,技術壁壘高;解決后摩爾C
7、MP多核心的問題,包括功耗、暗硅、跨NUMA;各個cache一致性數據共享問題;需要考慮解決的問題:高主頻無法維系單核性能天花板CMP并行多核架構Dennard縮放異構時代 圍繞單核心架構多中心對等架構暗硅多流水線、超標量、多發射、亂序CPU(x86)系統互聯Local MemoryLocal MemoryLocal MemoryGPU(CUDA)Accelerators(Arm)新要求:架構層面,馮諾依曼架構面臨存儲墻問題,后摩爾定律時代的計算效率需要突破計算與存儲物理分離,指令與數據統一譯碼,各模塊相對獨立演進,產生額外的數據搬運;硅基材料基于電子移動,晶體管柵極電壓控制機制,單芯片效率不
8、高;隨著Dennard縮放定律的限制,封裝內的TDP熱功耗高,片內Cache材料的容量很難繼續擴展;使用新型非易失材料規避“內存墻”,存算一體等體系結構減少數據搬移產生的能耗;后摩爾時代通過3D堆疊、Chiplet等技術擴展計算密度和增強計算性能;定制DSA、異構計算設計針對指令、微架構、連接總線特定領域進行定制增強;通過不同指令集、體系結構的協同完成轉發、計算等加速;解決邊緣裸金屬資源管理,以及一些數據傳輸問題,將計算和轉發逐步從標卡向DPU演進;數據的大量搬移,需要多Die互聯及封裝協議;新要求:配套層面,業務在邊緣側更加立體泛在,硬件需能應對復雜環境的挑戰邊緣算力承載在多種環境中,邊緣硬
9、件需要綜合考慮供電、散熱、空間、環境、安全等多方面因素形成硬件標準化,擴大規模效應,降低建設成本,便于運維一、中國移動算力網絡新發展一、中國移動算力網絡新發展二、算力網絡對邊緣算力提出新要求二、算力網絡對邊緣算力提出新要求三、面向算力網絡的計算方案新實踐三、面向算力網絡的計算方案新實踐新實踐:制定智算產品評估方案,構建跨架構開發平臺加速構建智算基礎設施開放、成熟的生態環境,開展GPU卡和服務器開展評測,構建以AI框架、硬件編譯協同的跨架構開發平臺,屏蔽硬件差異,最大化使能異構算力對產業內多種規格(包括OAI/OAM、PCIe)的GPU卡和服務器開展評測,推動產品落地與發展面對日益割裂的智算生態
10、,構建以AI框架、硬件編譯協同的跨架構開發平臺,屏蔽硬件差異,最大化使能異構算力加速硬件模塊標準化開發框架標準化算力抽象接口標準化新實踐:制定統一評測標準,打造“芯巢”多樣性算力孵化平臺,賦能中心、邊緣性能釋放甄選各芯片高性能、易使用的產品,以高要求業務牽引芯片能力迭代,高效促進跨行業開放協作系統化跨架構處理器高性能評測體系邊緣場景GPU/AI加速卡高計算評估標準服務器網卡數據包低時延轉發評測體系內存與SSD硬盤多場景高吞吐評測體系對x86、Arm等高性能處理器計算、訪存、數據包處理等方面進行評測;對計算、訪存、處理等多維度進行性能對標;對數據包多隊列、無狀態網絡卸載等極致性能對標;涵蓋虛擬化
11、、裸金屬多個智能網卡應用評測;人工智能加速卡高帶寬方案評估標準;涵蓋裸機、虛擬機、容器,整張或虛擬化AI加速卡全能力;隨機IOPS、時延、順序帶寬、QoS全方位高性能評測;多平臺兼容性適配,為自主可控平臺保駕護航;服務器內存向DDR5/6轉型,提升內存的容量、帶寬、速率新實踐:構建多種計算模式,探索多計算芯片、內存池化技術演進軟硬件生態系統逐漸完善緩存一致性協議,可為邊緣異構計算和多主機聯合解決時延和帶寬問題提供較優路徑數據中心將會通過CXL等技術,實現串形鏈路內存子系統的擴展,提高內存的容量和帶寬數據中心將計算、內存、存儲等資源將池化,按照工作負載的具體需求,將資源定向分配和重分配,資源的池
12、化可以將資源的利用率大幅度提高新實踐:依托標準和開放實驗室構建DPU領域開放生態,支持高效的邊緣服務圍繞管理、網絡、存儲、計算、安全五大軟件系統,定義DPU軟件功能要求和交互接口建立DPU開放實驗室,錨定業務場景孵化器、技術方案實驗床、產業聚合平臺三大定位,推進DPU產業穩步健康發展針對DPU引入優先推進服務器整機硬件標準化,掃清多產品適配問題,在邊緣計算領域探索硬件規模應用新實踐:打造便攜式5G算網一體機,推動邊緣算網服務便捷高效集輕量化核心網、智簡無線、邊緣算力于一身的小型一體化5G算網融合設備,功能完備、靈巧便攜、開機即用,可廣泛用于現場級算網服務,實現網絡無所不達、算力無所不在網算2 臺核心設備1 條數據連線0 人工配置10 分鐘開機即用便攜面向專網及邊緣定制OTII服務器 可擴展GPU增強邊緣智算能力內置面向不同場景的邊緣應用可連接企業內網或互聯網算力完整5G核心網功能,按需配置策略 自帶一體化基站,可擴展其它基站支持各類商用5G終端直接連接可通過CPE擴展其他設備類型