《中國移動:算網一體定義算力網絡未來(2023)(18頁).pdf》由會員分享,可在線閱讀,更多相關《中國移動:算網一體定義算力網絡未來(2023)(18頁).pdf(18頁珍藏版)》請在三個皮匠報告上搜索。
1、段曉東中國移動算網一體定義算力網絡未來算網一體定義算力網絡未來2通信網絡正加速向新型信息通信網絡演變通信網絡正加速向新型信息通信網絡演變技術范式技術范式產業范式產業范式資源范式資源范式通信網絡通信網絡新型信息通信網絡新型信息通信網絡架構范式架構范式算力算力為核心的信息數據處理為核心的信息數據處理提供計算、感知、智能、安全等一體化的提供計算、感知、智能、安全等一體化的新一代信息通信服務新一代信息通信服務網絡網絡為核心的信息交換為核心的信息交換提供語音、短信、提供語音、短信、移動移動寬帶等寬帶等通信服務通信服務23中國移動算力網絡發展歷程中國移動算力網絡發展歷程中國移動算力網絡白皮書中國移動算力網
2、絡白皮書算力網絡是以算為中心、算力網絡是以算為中心、網為根基網為根基 ,網、云、數、,網、云、數、智、安、邊、端、鏈智、安、邊、端、鏈(ABCDNETSABCDNETS)等深度融合、)等深度融合、提供一體化服務的新型信提供一體化服務的新型信息基礎設施。息基礎設施。楊杰董事長提出“算力網絡”概念與愿景成為“5G+算力網絡+能力中臺”新型信息基礎設施的關鍵一環發布算力網絡技術白皮書,提出十大技術方向提出新概念提出新概念發布中國移動算力網絡白皮書和發展倡議發布新理念發布新理念融入新戰略融入新戰略開創新方向開創新方向算力網絡子鏈組建14支攻關戰隊聯合攻關產業問題組建新戰隊組建新戰隊5G5G智慧智慧中臺
3、中臺算力算力網絡網絡發布算力網絡科技創新成果,CFITI試驗網與中國算力網、中科院信息高鐵聯合打造科學裝置構建新裝置構建新裝置中國移動深刻把握算力時代發展脈搏中國移動深刻把握算力時代發展脈搏,發揮運營商網絡領先優勢,發揮運營商網絡領先優勢,以網強算以網強算提出提出“算力網絡算力網絡”全新理念。全新理念。兩年來,繼往開來、開拓創新,全力推進算力網絡發展兩年來,繼往開來、開拓創新,全力推進算力網絡發展啟動算力網絡試驗網CFITI 1.0,發布 算 網 服 務 體 系1.0打造新平臺打造新平臺34算力與網絡跨學科交叉融合創新算力與網絡跨學科交叉融合創新網絡演進需求網絡演進需求算力發展需求算力發展需求
4、 從通信服務向新型信息通信服務新型信息通信服務轉變 性能性能代際提升對算力提出更高要求 單一速率范式制約網絡規模網絡規模發展 摩爾定律下單點算力單點算力面臨性能瓶頸 多樣性算力多樣性算力需要異構融通、互補協同 泛在算力泛在算力閑散分布,需要高效集約利用研判:算和網已經呈現雙向驅動趨勢,為了進一步呈現整體的能效、性能和利用率優勢研判:算和網已經呈現雙向驅動趨勢,為了進一步呈現整體的能效、性能和利用率優勢,需要算網一體化的系統思維和多學科交叉創新需要算網一體化的系統思維和多學科交叉創新算網一體=F(Computing,Network)必要條件:Network,Computing 互相影響充分條件:
5、F(Computing,Network)=F(Computing)+F(Network)限制條件:有限的Computing資源,和有限的Network資源優化目標:=G(=G(能效、性能、利用率)算為核心,網為根基,算力與網絡的融合體現在算為核心,網為根基,算力與網絡的融合體現在“以算促網以算促網”和和“以網強算以網強算”兩個方面,兩個方面,二者二者“雙向驅動雙向驅動”,算網交叉融合創新成為發展新范式,算網交叉融合創新成為發展新范式4算力網絡能效能效性能性能利用率利用率5算網一體是算力網絡的發展目標算網一體是算力網絡的發展目標走過算力網絡走過算力網絡“泛在協同泛在協同”的重要階段,邁入的重要階
6、段,邁入 “融合統一融合統一”的發展新階段的發展新階段5起步:起步:泛在協同泛在協同發展:發展:融合統一融合統一一站一站服務、協同運營服務、協同運營協同編排協同編排網隨算動網隨算動融合融合服務、統一運營服務、統一運營算網融合算網融合智能編排智能編排跨越:跨越:一體內生一體內生一體服務,模式創新一體服務,模式創新智慧內生智慧內生算網算網一體一體6算網一體主要特征算網一體主要特征設備一體設備一體以外掛或內嵌/內生的方式,形成“算力感知”、“網絡感知”或“轉發即計算轉發即計算”的計算形態的計算形態,構建異構融合的設備硬件支持算力、網絡、應用等多維資多維資源感知和調度的新協議源感知和調度的新協議,可通
7、過網絡協議擴展并攜帶計算信息,或者定義新型協議協議一體協議一體架構一體架構一體構建統一編程范式和異構算力抽象機制,形成一體編譯鏈接、跨架構動態運行的基礎軟件架構,實現應用跨架構無感遷移應用跨架構無感遷移網絡和計算服務統一入口,通過能力的相互補充和調用,面向用戶提供無感知的網絡無感知的網絡和計算服務和計算服務服務一體服務一體算網一體原創技術深度賦能算網基礎設施、編排管理、運營服務多層次一體化發展算網一體原創技術深度賦能算網基礎設施、編排管理、運營服務多層次一體化發展67算網一體發展需要原創技術創新算網一體發展需要原創技術創新算力網絡是算網交叉學科創新的重大契機。為構筑算力網絡發展源動力,開創算力
8、網絡是算網交叉學科創新的重大契機。為構筑算力網絡發展源動力,開創算網一體算網一體原創技術體原創技術體系,已形成一批系,已形成一批標志性標志性的原創技術的原創技術數據快遞數據快遞突破廣域傳輸性能瓶頸空芯光纖空芯光纖新型光纖介質與系統在網計算在網計算打破算網邊界全調度以太全調度以太突破無損以太性能瓶頸算力度量算力度量打破單維算力指標移動算力移動算力5G、6G新增計算面算力路由算力路由突破互聯網架構協議存算一體存算一體突破馮氏架構算力原生算力原生實現應用跨架構遷移400G/800G400G/800G超高速大容量全光網絡G-SRv6G-SRv6統一IP承載協議算力卸載算力卸載多算力形態統一底座算力并網
9、算力并網實現算力供給側改革新一代新一代SD-WANSD-WANUnder與Overlay協同算力解構算力解構應用模塊化解構部署算力智能內生算力智能內生計算要素創智能服務空天地一體空天地一體突破異構算網融合隱私計算隱私計算安全數據分析計算應用感知應用感知應用類型識別OTNOTN光電聯動光電聯動新型全光網架構全光接入全光接入新型接入網架構云原生云原生敏捷高效體系總線互聯總線互聯卡間高速通信50G PON+FTTR50G PON+FTTR新型接入網架構算網一體算網一體“5 5顆珍珠顆珍珠”:算力原生、全調度以太、算力路由、在網計算、數據快遞:算力原生、全調度以太、算力路由、在網計算、數據快遞78算網
10、一體需要解決的核心技術問題算網一體需要解決的核心技術問題81構筑新型智算中心的問題構筑新型智算中心的問題傳統無損以太存在性能天花板,網絡技術成為AI算力瓶頸,通過創新以太網轉發機制,以網強算構建無阻塞、高帶寬、低時延的新型智算中心網絡。23大規模數據廣域高效傳輸大規模數據廣域高效傳輸的問題的問題針對傳統協議吞吐隨著傳輸距離、丟包率增加而急劇下降問題,設計新型可靠傳輸協議,實現長肥網絡下超高吞吐數據傳輸。面向網絡和計算的聯合優化問題面向網絡和計算的聯合優化問題基于互聯網協議體系,在路由中引入算力因子,開創算力路由協議,實現距離向量和計算向量在路由技術的疊加,滿足新型業務網絡和計算的時延需求。算力
11、路由算力路由CATSCATS突破互聯網架構協議全調度以太全調度以太GSEGSE突破無損以太性能瓶頸數據快遞數據快遞GSNGSN突破廣域傳輸性能瓶頸91 1、算力路由、算力路由CATSCATS(1/1/3 3)AR/VR AR/VR 時延需要低于時延需要低于20ms20ms保障用戶體驗,包括:保障用戶體驗,包括:傳感器采樣延遲:1.5ms(客戶端)顯示刷新延遲:7.9ms(客戶端)GPU的幀渲染計算延遲5.5ms5.5ms(服務器)網絡延遲(預算)=20-1.5-7.9-5.5=5.1ms5.1ms(網絡)結論:結論:需要同時考慮網絡和計算資源狀態,進行路由協議層面的聯合優化需要同時考慮網絡和計
12、算資源狀態,進行路由協議層面的聯合優化典型場景典型場景1 1:Computing-Aware AR/VRComputing-Aware AR/VR典型場景典型場景2 2:Computing-Aware V2XComputing-Aware V2X 通過算力路由在本地優先優先處理低時延業務(如輔助駕駛業務),保證其用戶體驗和可用性 將時延不敏感時延不敏感業務(如車載娛樂業務)從本地調度到遠端算力路由將算力路由將算力因子算力因子引入路由域,實現引入路由域,實現網絡和計算的聯合優化網絡和計算的聯合優化,克服面向邊緣計算的,克服面向邊緣計算的“性能反轉性能反轉”問題,問題,滿足時延和計算敏感新型業務需
13、求滿足時延和計算敏感新型業務需求9 觀察觀察1 1:計算延遲和網絡時延在同量級:計算延遲和網絡時延在同量級 觀察觀察2 2:僅根據網絡或計算負載選擇服務節點,總:僅根據網絡或計算負載選擇服務節點,總 時延時延無法滿足無法滿足 觀察觀察3 3:根據兩者選擇邊緣站點:根據兩者選擇邊緣站點3 3,總延遲,總延遲19.4ms19.4ms101 1、算力路由、算力路由CATSCATS(2 2/3 3)在距離矢量上疊加算力向量,改變選路方法,影響路由決策。簡單疊加將導致路由不收斂算力信息維度較多,需要定義面向路由調度的高可用性計算信息,兼顧報文封裝成本以及可用性構建算力路由信息表(CA-RIB),考慮距離
14、因子、算力因子以及權重,生成算網cost=w1*網絡cost+w2*算力cost技術方向:技術方向:新型算網多因子算路算法新型算網多因子算路算法提出分域通告、分類通告,約束算力信息更新的范圍,減少算力信息的無效通告。通過仿真建模量化分析算力信息通告信令開銷的影響技術方向:簡單高效的算力信息封裝技術方向:簡單高效的算力信息封裝通告頻率越高,算力信息越實時,但開銷越大,如何找到通告信令開銷與信息實時性的平衡點技術方向:自適應技術方向:自適應的算力通告的算力通告問題問題3 3:路由求解,多維因子路由優化問題:路由求解,多維因子路由優化問題問題問題2 2:合理的算力信息通告問題:合理的算力信息通告問題
15、問題問題1 1:算力度量問題:算力度量問題統一量綱,使用與網絡和業務相同的度量維度信息,應用于路由調度,例如通過BGP Path Attribution擴展封裝計算時延信息ABCE網絡節點ABCE連接算力的網絡節點網絡拓撲算力網絡節點拓撲算力網絡狀態拓撲網絡節點ABCE連接算力的網絡節點算力節點算力節點能力通告能力通告算力節點算力節點狀態通告狀態通告網絡節點算力路由需要解決算力擴展、算力信息通告、多因子路由求解等多方面的問題,實現基于網絡因子算力路由需要解決算力擴展、算力信息通告、多因子路由求解等多方面的問題,實現基于網絡因子和計算因子的聯合路由和計算因子的聯合路由10111 1、算力路由、算
16、力路由CATSCATS(3 3/3 3)2019202220192022年年5 5次研討會次研討會20232023年年3 3月月 CATS CATS WGWG成立暨首次會議,成立暨首次會議,是路由域最受歡迎的工作組之一是路由域最受歡迎的工作組之一完成場景和需求立項完成場景和需求立項推動面向推動面向AIAI大模型大模型的算力路由場景寫入的算力路由場景寫入CATS WGCATS WG標準標準 基于CATSCATS的分布式推理 基于CATS+AICATS+AI的內容獲取AI-based Media Distribution and Traffic Steering完成實驗系統,驗證完成實驗系統,驗證
17、全局時延優化上約全局時延優化上約30%30%的性能提升的性能提升合力合力攻關算力路由技術,圍繞攻關算力路由技術,圍繞IETF CATSIETF CATS構建標準體系,推動產業構建標準體系,推動產業生態生態加速構筑領先優勢加速構筑領先優勢歷經歷經4 4年,中國移動在年,中國移動在IETFIETF發起成立算力路由工作組發起成立算力路由工作組(CATS,Computing-Aware Traffic Steering)(CATS,Computing-Aware Traffic Steering),中國移動擔任主席,是中國移動擔任主席,是IETFIETF路由域路由域近近2020年年由中國高校由中國高校
18、/公司牽頭成立的公司牽頭成立的兩個兩個工作組之一工作組之一11122 2、全調度以太、全調度以太GSEGSE(1/1/3 3)集群有效算力集群有效算力GPUGPU單卡算力單卡算力*總卡數總卡數*線性加速比線性加速比*有效運行時有效運行時網絡可用性決定網絡可用性決定GPUGPU集群穩定性集群穩定性2%2%的丟包就會使的丟包就會使RDMARDMA吞吐率下降為吞吐率下降為0 0網絡設備能力決定網絡設備能力決定GPUGPU集群組網規模集群組網規模芯片容量提升芯片容量提升2 2倍,組網規模提高倍,組網規模提高4 4倍倍隨著隨著GPUGPU單卡算力受限,獲得同等算力的難度持續增加,以網強算成為提升大模型訓
19、練效率的關鍵單卡算力受限,獲得同等算力的難度持續增加,以網強算成為提升大模型訓練效率的關鍵網絡性能決定網絡性能決定GPUGPU集群算力加速比集群算力加速比GPUGPU集群性能集群性能 單單GPUGPU性能性能*N NAIAI大模型以大模型以GPUGPU集群分布式訓練為基礎,帶來大量節點間通信消耗,集群分布式訓練為基礎,帶來大量節點間通信消耗,網絡成為網絡成為AIAI算力算力“瓶頸瓶頸”智算中心建設進入快車道,網絡技術發展已滯后于智算中心建設進入快車道,網絡技術發展已滯后于AIAI模型演進,模型演進,新型新型AIAI網絡方案成為業界創新焦點網絡方案成為業界創新焦點12132 2、全調度以太、全調
20、度以太GSEGSE(2 2/3 3)從從“局部局部”決策決策到到“全局全局”調度調度從從“流流”分發到分發到“報文報文”分發分發從從盲發盲發+被動控制被動控制到到感知感知+主動控制主動控制將業務流拆分到不同“報文容器”轉發,提供逐“報文容器”負載均衡機制,提升帶寬利用率從被動擁塞控制,到基于“授權請求和響應機制”的主動流控,最大限度避免網絡擁塞產生全局視野的轉發調度機制,實現集中式管理運維、分布式控制轉發,提高網絡可用性當前:逐流負載,鏈路利用率低、發生擁塞被動降速當前:逐流負載,鏈路利用率低、發生擁塞被動降速未來:逐報文容器轉發,鏈路負載均衡,全局調度,避免擁塞未來:逐報文容器轉發,鏈路負載
21、均衡,全局調度,避免擁塞創新以太網轉發機制,實現創新以太網轉發機制,實現三大核心機制轉變三大核心機制轉變源leafSpineSpineSpine目的leaf213213213213213213擁塞21321321丟包中國移動提出全調度以太網(中國移動提出全調度以太網(GSEGSE)技術架構,最大限度兼容以太網生態,創新基于報文容器()技術架構,最大限度兼容以太網生態,創新基于報文容器(PKTCPKTC)的轉發及)的轉發及調度機制,構建無阻塞、高帶寬、低時延的新型智算中心網絡,形成標準開放的技術體系,助力調度機制,構建無阻塞、高帶寬、低時延的新型智算中心網絡,形成標準開放的技術體系,助力AIAI
22、產業發展產業發展 13142 2、全調度以太、全調度以太GSEGSE(3 3/3 3)全調度以太網(全調度以太網(GSEGSE)特設組研究)特設組研究范疇范疇2023.2023.1111云網智聯大會發布云網智聯大會發布全調度以太網技術架構白皮書全調度以太網技術架構白皮書中國算力大會正式啟動中國算力大會正式啟動全調度以太網(全調度以太網(GSEGSE)推進計劃)推進計劃中國網絡大會發布中國網絡大會發布業界首款業界首款GSEGSE原型系統原型系統CCSACCSA成功立項成功立項全調度以太網總體技術要求全調度以太網總體技術要求2023.2023.6 62023.2023.8 82023.2023.9
23、 92023.52023.5ODCCODCC冬季全會冬季全會GSEGSE工作組成立工作組成立及第一次工作組會議及第一次工作組會議低延遲FEC、光交換、故障快速檢測、400G/800G以及更高速率接口物理層擴展等改進的PFC、GSE高級調度技術、鏈路級安全、鏈路級容錯等新型網絡拓撲、新型路由協議、新型組播協議等改進的RDMA、新型擁塞控制協議、網絡多路徑能力、亂序重排、選擇性重傳等運維和管理體系端到端網絡可視化、可調試能力、部署/運維/變更/故障恢復等多維自動化能力物理層數據鏈路層網絡層傳輸協議層中國移動,中國信息通信研究院,中國廣電、華為、盛科、中興、銳捷、新華三、浪潮信息、Intel、Bro
24、adcom、清華大學、上海交通大學、鵬城實驗室、紫金山實驗室、北京郵電大學、中科院計算機網絡信息中心、中信科、Spirent、是德科技、云合智網、楠菲微電子、燧原科技、昆侖芯、邁普,星云智聯、云脈芯聯、中科馭數、云豹智能、大禹智芯、中盈優創等四十余家產學研機構及廠商全調度以太網(全調度以太網(GSEGSE)合作伙伴)合作伙伴中國移動攜手中國信通院,聯合國內外三十余家主流互聯網,設備商、芯片商、高校院所聯合發起中國移動攜手中國信通院,聯合國內外三十余家主流互聯網,設備商、芯片商、高校院所聯合發起GSEGSE推進計劃,推進計劃,推動智算中心網絡推動智算中心網絡技術創新、標準完善和產業應用技術創新、
25、標準完善和產業應用,打造高速無損、開放兼容的新型智算中心網絡技術體系,打造高速無損、開放兼容的新型智算中心網絡技術體系 14153 3、數據快遞、數據快遞GSN(1/2)GSN(1/2)數據量大數據量大單次傳輸在單次傳輸在TBTB級別級別天文觀測:幾十TB/次基因測序:TB100TB/次影視渲染:10TB100TB/節目傳輸距離遠傳輸距離遠屬于長肥網絡(屬于長肥網絡(LFNLFN)帶寬時延積(BDP)大網絡傳輸帶寬:10Gbps傳輸時延:20ms50ms網絡復雜多樣網絡復雜多樣設備異構、拓撲復雜,難以無損設備異構、拓撲復雜,難以無損鏈路層誤碼率不可避免大象流負載不均,存在擁塞丟包多流競爭,存在
26、微突發丟包傳統傳統TCPTCP協議在數據快遞中吞吐受限,有效吞吐與鏈路時延、丟包率成反比協議在數據快遞中吞吐受限,有效吞吐與鏈路時延、丟包率成反比TCPTCP網絡吞吐網絡吞吐=1.221.22*MSSMSSRTT RTT*Sqrt(L)Sqrt(L)單流傳輸時,時延由單流傳輸時,時延由1ms1ms增加到增加到10ms10ms時,時,吞吐下降吞吐下降約約1010倍倍使用多流傳輸會使單流使用多流傳輸會使單流吞吐下降吞吐下降,且受主機,且受主機CPUCPU性能限制,同樣存性能限制,同樣存在吞吐瓶頸在吞吐瓶頸RFC 3649:HighSpeed TCP for Large Congestion Win
27、dows8條流并發傳輸,單流吞吐下降7%算力分布的不均衡以及智算、超算業務的蓬勃發展對廣域數據傳輸提出更高要求,中國移動提出算力分布的不均衡以及智算、超算業務的蓬勃發展對廣域數據傳輸提出更高要求,中國移動提出“數據快遞數據快遞”技術體系,充分利用技術體系,充分利用高帶寬高帶寬網網絡絡實現實現高吞吐高吞吐數據傳輸數據傳輸15163 3、數據快遞、數據快遞GSN(GSN(2 2/2)/2)基于基于UDPUDP協議設計新型可靠傳輸協議協議設計新型可靠傳輸協議貴州到北京貴州到北京“數據快遞數據快遞”測試測試貴州FAST北京國家天文臺傳輸距離遠傳輸距離遠2200km廣域長肥網絡測試結果:新型傳輸測試結果
28、:新型傳輸協議是傳統協議是傳統TCPTCP協議吞吐的協議吞吐的1 18 8倍倍(單流吞吐:7.94Gbps vs 424Mbps)新型傳輸協議設計,消除端側吞吐瓶頸新型擁塞控制算法,提升網絡有效利用率丟包快速恢復算法,降低數據傳輸尾時延丟包精確重傳機制,降低丟包對吞吐影響端到端多路徑傳輸,實現帶寬聚合與均衡5 5大大核核心心技技術術基于新型傳輸協議,構建基于新型傳輸協議,構建“數據快遞數據快遞”技術體系,實現超長距廣域網環境下的超高吞吐數據傳輸技術體系,實現超長距廣域網環境下的超高吞吐數據傳輸物理層物理層互聯網協議層(互聯網協議層(IPIP)應用層應用層新型可靠新型可靠傳輸協議傳輸協議廣域擁塞
29、控制機制廣域擁塞控制機制丟包精確重傳丟包精確重傳用戶數據報協議用戶數據報協議層層(UDPUDP)API API 編程接口編程接口丟包快速恢復丟包快速恢復多路徑傳輸多路徑傳輸聯合產、學、研共同推動聯合產、學、研共同推動“數據快遞數據快遞”產業成熟產業成熟第二屆中國算力大會發布技術白皮書CCSA TC3推動關鍵技術行標立項鏈路時延長鏈路時延長RTT45ms鏈路帶寬大鏈路帶寬大10Gbps網絡類型復雜網絡類型復雜云專網/傳輸網/DC1617多舉措推動算網一體技術和產業發展多舉措推動算網一體技術和產業發展17打造打造算力網絡試驗示范網(算力網絡試驗示范網(CFITICFITI)構建算力網絡構建算力網絡
30、產業鏈合作產業鏈合作機制機制“1+9+9”“1+9+9”節節點點布局布局“A-B”“A-B”雙平面雙平面協同互促協同互促“三大裝置互聯三大裝置互聯”科學裝置科學裝置打造打造多節點互聯、雙平面互促的算力網絡試驗示范網多節點互聯、雙平面互促的算力網絡試驗示范網(CFITICFITI),并與),并與“中國算力網中國算力網”、“信息高鐵信息高鐵”等互聯,等互聯,面向基礎學科和前沿技術創新形成面向基礎學科和前沿技術創新形成技術支撐平臺技術支撐平臺以以“補強建延補強建延”為指導思想,構建為指導思想,構建產業支撐平臺產業支撐平臺,成立多種,成立多種攻關戰隊開展協同攻關,提升產業鏈韌性和競爭力,推動算攻關戰隊開展協同攻關,提升產業鏈韌性和競爭力,推動算力網絡產業繁榮發展力網絡產業繁榮發展四維一體、鏈式牽引四維一體、鏈式牽引編隊作戰,協同創新編隊作戰,協同創新四大工作組算網應用算力基礎設施網絡基礎設施算網服務和協同省專協同聯合研發研采協同五大協同創新機制 協同創新基地以網強算,算網一體,以網強算,算網一體,以學科交叉融合范式創新,以學科交叉融合范式創新,領航智算產業未來新發展領航智算產業未來新發展