《中國信通院:算力時代全光網架構研究報告(2024年)(34頁).pdf》由會員分享,可在線閱讀,更多相關《中國信通院:算力時代全光網架構研究報告(2024年)(34頁).pdf(34頁珍藏版)》請在三個皮匠報告上搜索。
1、中國信息通信研究院技術與標準研究所 2024年9月 算力時代全光網架構算力時代全光網架構 研究報告研究報告 (2022024 4 年年)版權聲明版權聲明本報告版權屬于中國信息通信研究院,并受法律保護。本報告版權屬于中國信息通信研究院,并受法律保護。轉載、摘編或利用其它方式使用本報告文字或者觀點的,應轉載、摘編或利用其它方式使用本報告文字或者觀點的,應注明注明“來源:中國信息通信研究院來源:中國信息通信研究院”。違反上述聲明者,本院。違反上述聲明者,本院將追究其相關法律責任。將追究其相關法律責任。前前 言言 隨著行業數字化轉型的深入及人工智能(AI)大模型技術的發展,AI 在千行百業中的融合應用
2、日益豐富,企業及家庭用戶對算力資源的需求快速增長,數字經濟已進入以人工智能+算力為核心生產力要素的算力時代。全光網作為運送和支撐調度算力資源的關鍵底座,其重要性日益凸顯。算力時代下,各類算力應用場景向全光網提出新需求挑戰,如多級數據中心間的算間互聯帶來大容量、低時延及云邊協同,以及企業及家庭用戶入云用算帶來便捷接入、安全可靠及靈活敏捷等需求,全光網亟需加速演進,逐步升級網絡架構和傳輸能力,支撐各級算力資源的靈活互聯和用戶高品質應用入算。面向支撐算力創新應用、賦能行業數智化轉型發展的愿景,本報告詳細分析了算力時代下的高品質聯云入算、城市內算力互聯、樞紐間算力互聯以及網絡智能化調度四大需求,總結了
3、穩定大帶寬、安全高可靠、確定低時延,以及智能化服務等全光網發展四大特征,包括,提出算力時代的全光網目標架構和關鍵技術體系:一是通過全光DCA(數據中心接入),提供靈活高品質入算能力,以網促算;二是通過全光 DCI(數據中心互聯)實現數據中心高效互聯,以網強算;三是通過光電融合 DCN(數據中心網絡)助力提高算力資源利用效率,以網補算;四是通過靈活一體調度的智能管控平臺,使能算網高效敏捷調度。期望通過本報告研究成果,為我國全光網技術創新、融合應用及產業生態發展提供參考,助力我國數字經濟持續高質量發展。目目 錄錄 一、算力時代推動全光網高質量創新發展.1 二、算力時代全光網發展的四大需求特征.2(
4、一)高品質聯云入算,開啟萬兆光網接入時代.3(二)城市內算力互聯,打造 1ms 全光接入時延圈.7(三)樞紐間算力互聯,構筑高速可靠全光底座.8(四)網絡智能化調度,使能算網高效協同發展.10 三、算力時代全光網目標架構和關鍵技術.11(一)算力時代全光網目標架構.11(二)以網促算,全光 DCA 實現用戶高品質入算.12(三)以網強算,全光 DCI 實現數據中心高效互聯.17(四)以網補算,光電融合 DCN 助力突破算力瓶頸.22(五)靈活一體調度的智能管控平臺.25 四、總結與展望.28 圖圖 目目 錄錄圖 1 基于全光接入網絡的智慧汽車工廠.6 圖 2 全球相干光傳輸網絡帶寬增長.10
5、圖 3 全光網的目標架構.12 圖 4 萬兆智慧家庭的高品質入算方案.14 圖 5 中小企業的全光網絡入算方案.15 圖 6 大企業高品質專線入算方案.16 圖 7 樞紐間互聯骨干網立體擴容.18 圖 8 光電保護協同提升網絡可靠性.19 圖 9 光電聯動技術實現業務快速發放.20 圖 10 算力接入 1ms 城市的城域全光網架構.21 圖 11 DCN 采用 OXC 的光電混合組網方案.23 圖 12 全光網多維靈活感知.26 表表 目目 錄錄表 1 多業務并發場景網絡需求.4 表 2 XR 教室對網絡指標的訴求.5 表 3 智能制造企業的工業自動化系統帶寬需求.7 算力時代全光網架構研究報
6、告(2024 年)1 一、一、算力時代全光網高質量創新發展 人工智能發展對算網融合服務能力提出更高要求。國際貨幣基金組織認為,人工智能將促進全球經濟增長,影響全球近 40%的工作,企業和個人用戶對人工智能和算力服務的需求,將會像用水用電一樣成為必需,對算力服務的及時性、便捷性和可靠性,也會有更高要求。另一方面,大模型訓練對計算資源的需求急劇增加,然而數據中心受到地域空間、供電能力、供需不均衡等制約,多個數據中心實現分布式算力集群需高質量的通信網絡提供連接,協同調度發揮最大的效能。各國積極探索實踐算力時代的全光網絡技術創新??v觀全球,各主要國家和地區均將光網絡建設作為提升數字經濟建設的基礎之一,
7、如中國的算力基礎設施高質量發展行動計劃,歐盟的2030 數字羅盤,美國聯邦的寬帶公平接入與部署計劃(BEAD)、聯邦通訊委員會的連接美國基金(CAF),以及新加坡數字藍圖等,都通過產業政策、科研計劃、發展藍圖等多種形式,加強數字基礎設施底座的光纖通信網絡建設,以獲得更高品質的算力聯接和應用。各國的科研機構、企業都在探索實踐算力時代的全光網絡技術創新,美國最大科研網絡能源科學網絡(ESnet6)、中國未來網絡試驗設施(CENI)、歐盟國家研究和教育網絡(GANT),日本 NTT 牽頭成立以 6G 為目標的創新型光和無線網絡(IOWN)全球聯盟并推動建設全光子網絡(APN),都在開展面向算力和未來
8、 6G 時代的超高速率、超大容量、靈活調度和綠色節能的光網絡新技術創新研究。我國運營商積極開展算力時代全光網絡發展建設。中國移動提出算力時代全光網架構研究報告(2024 年)2“4+N+31+X”的算力網絡總體布局,發布九州算力光網目標網架構,實現全球首個 400G 全光骨干傳送網規模商用,持續深化三級低時延算力服務圈,暢通“東數西算”大動脈。中國電信圍繞國家一體化大數據中心優化網絡結構,近期啟動骨干 400G ROADM 設備集采,構建“四區六軸八樞紐多通道”的低時延骨干光網絡底座,支撐算力樞紐間全光高速互聯。中國聯通已形成“1+N+X”智算梯次布局,加快建設“新八縱八橫”國家骨干網,基于
9、400G 構建全光算力互聯網,提供超高安全、超低時延、超高可靠、超大帶寬、超長距離、靈活可調、綠色節能的高品質連接,賦能人工智能+時代高質量發展。本報告分析研判國內外全光網絡發展的需求趨勢,從用戶入算網絡(DCA)、數據中心互聯網絡(DCI)、數據中心網絡(DCN)到智能管控平臺,分析提出全光運力的目標網絡架構和關鍵技術體系,總結明確了算力時代的全光網絡發展方向,并對未來應用場景做出展望。二、算力時代全光網發展的四大特征 面向算間互聯帶來的大容量、低時延及云邊協同需求,用戶入算帶來的便捷接入、安全可靠及靈活敏捷需求,一體化算力調度帶來的算網協同及資源智管需求,現有全光網需持續向超大帶寬、超低時
10、延、安全可靠、泛在覆蓋、靈活敏捷、智能管控等方向發展,全面升級網絡架構和傳輸能力,通過全光網構建高效泛在全光運力,打造覆蓋全國的“1ms”、“5ms”、“20ms”三級時延圈,實現各級算力資源的高效靈活互聯和用戶高品質應用入算。算力時代全光網呈現出四大需求特征,一是穩定大帶寬,根據各算力時代全光網架構研究報告(2024 年)3 行業數字化、智能化應用需求,提供穩定充足的大帶寬以支撐數據流量的激增,包括未來低收斂或不收斂的大象流。二是安全高可靠,提供高可靠高安全的網絡連接,確保智算業務隨時在線流轉,保障各行業應用順暢和數據信息安全。三是確定低時延,降低傳輸鏈路時延和時延抖動,支撐分布式智算集群的
11、創新驗證,提高行業應用的業務體驗。四是智能化服務,提供自動化、智能化的光網絡資源調度和運維管理服務,支持算力業務敏捷開通和高效可視運維,滿足各行業數智化發展的業務需求。(一)(一)高品質聯云入算高品質聯云入算,開啟萬兆光網接入時代,開啟萬兆光網接入時代 各國政府和運營商都積極擁抱萬兆全光接入時代的到來。新加坡政府于 2023 年發布“數字聯接藍圖(DCB)”,提出五年內實現國內寬帶接入 10Gbps 無縫鏈接,包括固定光接入、Wi-Fi 和無線通信;2024 年發布“數字企業藍圖(DEB)”,計劃在未來五年內,通過人工智能解決方案、云端和集成化解決方案、提高網絡恢復能力、提升員工技能,讓 5
12、萬家中小企業受益。2024 年 4 月沙特通信部正式發布萬兆社會規劃,包括萬兆到個人、萬兆到家庭和萬兆到企業,指出光網絡作為基礎設施是實現沙特“2030 愿景”的關鍵。日本 NTT 在 2024年發布了 100G 大帶寬的光專線入云連接,讓客戶可以通過 NTT 提供的光專線,接入全日本 70 多個 NTT 數據中心,為云運營商和互聯網服務提供商(ISP)提供大容量骨干網和云服務平臺,實現遠程工廠機器操作、多點 CAD 協同、遠程醫療等云服務。截至 2024 年 7 月底,中國固定互聯網寬帶接入用戶總數達 6.56 億戶,其中 1000Mbps算力時代全光網架構研究報告(2024 年)4 及以上
13、接入速率的用戶為 1.9 億戶,較 2023 年末凈增 2684 萬戶,占總用戶數的 29%。在高速率用戶持續增長拉動下,家庭戶均接入帶寬達 491.5Mbps/戶,同比增長 16.6%。到 2024 年中,包括北京、上海等 19 個省份、直轄市的運營商發布萬兆家寬場景的試點應用。據不完全統計,全球已有超過 50 家運營商提供了萬兆光纖寬帶服務,萬兆時代已經來臨。萬兆全光接入網絡滿足家庭、園區、企業等各類終端和業務對帶寬、時延、安全的綜合需求。1智慧家庭超千兆網絡需求 終端類型增加及業務類型豐富,促使家庭網絡帶寬需求提升。隨著家庭業務類型的豐富、家庭終端的多樣化及并發數量的增加,以及業務體驗品
14、質的提升,家庭多業務并發對超千兆甚至萬兆家寬需求日益顯現。個人及智能家庭終端類型日益豐富,如 8K 電視、裸眼 3D 電視、XR 頭盔、家庭云盤等推動帶寬需求不斷增長,新興智能家居終端如智能門鎖、智能音箱、掃地機器人等,也提出新的網絡帶寬需求。此外,家庭交互視頻和云服務業務類型不斷豐富,如 XR 直播、AR/VR視頻、云辦公、云存儲和云游戲等,都對業務體驗提出新的需求。據寬帶發展聯盟研究,高質量裸眼 3D、8K 云游戲、在線存儲等家庭業務所需帶寬已達到 5 千兆,見表 1。表 1 多業務并發場景網絡需求 業務類型業務類型 分辨率分辨率 幀率幀率(FPS)平均碼率平均碼率(Mbps)視點數視點數
15、 時延需求時延需求(ms)帶寬需求帶寬需求(Mbps)裸眼 3D 光場屏點播(16k)1536014400 60 868 60 視點 15 1736 算力時代全光網架構研究報告(2024 年)5 業務類型業務類型 分辨率分辨率 幀率幀率(FPS)平均碼率平均碼率(Mbps)視點數視點數 時延需求時延需求(ms)帶寬需求帶寬需求(Mbps)Cloud VR 強交互業務(8K)76804320 60 270 2 視點 15 540 淺壓縮云游戲(8K)76804320 120 800 單視點 10 1600 在線云存儲/15 1000 智能看家 19201080/20 智能音箱/150 54 家庭
16、總帶寬需求 4950 來源:寬帶發展聯盟家寬多業務并發體驗分級白皮書(2023 年)2智慧園區萬兆網絡需求 教育信息化、智能化發展推動校園帶寬快速增長。隨著智能化教學設備普及率逐步提升,教學領域 XR 虛擬仿真教學設備采用 8K 以上高分辨率,單臺設備需要配置 160Mbps 帶寬,每間教室 30 臺帶寬需求近 5Gbps;考慮視頻直播、電子課件下載,無線投屏等多媒體系統的帶寬疊加,未來XR教學教室帶寬需求會接近萬兆,如表2所示。當前普教類中小學出口帶寬在 5001Gbps 左右,大專院校出口帶寬為 110Gbps 左右,主流以 10Gbps 為主,隨著 XR 教學普及單個教室帶寬需要 10G
17、bps,學校出口帶寬預計達到 20Gbps 到 100Gbps 以上。表 2 XR 教室對網絡指標的訴求 業務業務 并發終端并發終端 單點帶寬(單點帶寬(Mbps)總帶寬(總帶寬(Mbps)電子書包 WEB 30 2.5 75 視頻直播(4K)30 35 1050 課件下載 30 16 480 教學業務 無線投屏(4K)46 35 210 其它 錄播(4K)4 35 140 XR(8K)30 160 4800 每教室總帶寬訴求 6755 來源:中國信息通信研究院 算力時代全光網架構研究報告(2024 年)6 3智慧工廠萬兆網絡需求 AI 算力向制造行業邊緣延伸,推動萬兆工業園區網絡建設。智能汽
18、車、智能制造等領域的生產企業,將越來越多依賴邊緣 AI 算力來實現制造流程的數字化和智能化升級。圖 3 給出了汽車制造企業采用全光網絡的工廠連接方案示意圖,利用 3D 機器視覺現場檢驗及遠控中心的 AI 智能分析技術,對生產過程中的關鍵零部件進行實時分析,可大幅降低產品部件缺陷,提升裝配行為規范性及生產效率。汽車工廠的一條產線長度超過一公里,覆蓋上千個點位,采用 3D 機器視覺+AI 質檢分析,每個點位需要配置 1Gbps 帶寬,整個工廠需采用10Gbps 組網,并且設備和線路需配置 1+1 冗余保護,保證全時在線。來源:中國信息通信研究院圖 1 基于全光接入網絡的智慧汽車工廠 OLT分光器O
19、NU智慧汽車工廠控制中心高清3D檢測核心交換機雙發選收發動機曲軸檢測導熱墊檢測表面缺陷檢查GE到信息點位雙10GE光鏈路邊緣算力中心AI質檢分析OTN算力時代全光網架構研究報告(2024 年)7 工業制造領域需要高可靠低時延網絡。在精準數控和工業相機等領域要求 5 個 9 可靠性,工業生產總線涉及數十臺套數控機床和上百臺工業相機的系統組合,整個網絡的可靠性要求會達到 6 個 9 以上。AI 質檢分析及數控精準控制等需要滿足實時強交互要求,網絡時延小于 1ms。智能制造企業的工業自動化系統對帶寬、時延和可靠性的詳細要求如表 3。表 3 智能制造企業的工業自動化系統網絡需求 典型應用典型應用 帶寬
20、帶寬 時延時延 丟包率丟包率 抖動抖動 可靠性可靠性 3D 機器視覺+AI質檢(單路)1250Mbps 1ms 10-7 0.5ms 99.999%數控精準控制 10Mb/s 1ms 10-7 100us 99.999%工業全幅相機(單路)500Mb/s 10ms 10-6 5ms 99.999%數字孿生 100Mb/s 30ms 10-6 10ms 99.99%工業總線(單向)110Gbps 100us 0 30us 單套 99.995%多套疊加需要99.9999%數據來源:中國信息通信研究院(二)(二)城市內算力互聯,打造城市內算力互聯,打造 1ms 全光接入時延圈全光接入時延圈 金融行業
21、對網絡時延要求嚴苛,微秒級節省意義重大。高頻交易(HFT)利用自動交易系統在極短時間內捕捉市場波動并從中獲利的交易策略,對時延要求更加嚴苛。2022 年,為降低倫敦證券交易所和Interxion 之間的網絡時延,英國 euNetworks 公司累計鋪設 14 公里的空芯光纖(HFC),可每公里降低 3us 時延,金融行業實現微秒級時延的節省具有重大價值。多云互聯可用區(AZ)要求單向互聯時延小于 1ms。亞馬遜等云算力時代全光網架構研究報告(2024 年)8 服務商,在云網絡建設中采用了可用性區域(AZ)設計理念,AZ 是云服務地區范圍(Region)內的若干獨立數據中心的集群。AZ 之間要有
22、足夠距離,以降低因天氣、供電等因素帶來的可靠性風險,實現數據容災備份。同時 AZ 之間需要滿足往返時延(RTT)小于 2ms 要求,保障多 AZ 之間的數據傳輸達到實時訪問及同步。個人及企業的實時云服務體驗要求低時延傳輸。隨著個人云視頻、企業分支上云、汽車自動駕駛、AI 推理應用普及等業務發展,個人終端、家庭網絡、企業分支、政府機構,都需要通過確定性低時延城域網絡來接入城域邊緣算力中心,以獲得更高效、及時的算力服務。按照典型的 50km 半徑范圍,網絡單向時延應控制在 1ms 以內。城域 1ms 時延圈已成為運營商提升網絡質量目標。算力基礎設施高質量發展行動計劃明確要強化算力接入網絡能力,要求
23、城區重要算力基礎設施間時延不高于 1ms,提升邊緣節點靈活高效入算能力,滿足企業快速、就近、靈活、高效聯接算力需求。我國基礎電信運營企業積極開展算力接入 1ms 時延圈網絡建設和質量監測,根據中國信通院 算力網絡運載力指數評估報告(2024 年)的統計,截至 2024年二季度,三家基礎電信運營企業上報滿足城市 1ms 時延圈的網絡數量超百個,網絡覆蓋半徑和綜合接入點比例差異較大。(三)(三)樞紐間算力互聯,構筑高速可靠全光底座樞紐間算力互聯,構筑高速可靠全光底座 萬億級參數大模型訓練推動部署分布式智算集群方案。隨著 AI大模型參數量從千億邁向萬億,對超大規模算力需求急劇增長,單個數據中心集群部
24、署面臨供電挑戰。以 GPT6 為例,需要超 10 萬張 H100算力時代全光網架構研究報告(2024 年)9 卡的集群規模,整體功耗約 197 兆瓦,相當于一個典型火電站 1/5 發電量。Google Gemini Ultra 模型參數量約 1.8 萬億,已采用多數據中心協同訓練的分布式智算集群部署方案,解決供電問題并滿足超大規模算力需求。千卡/萬卡數據中心互聯帶寬需求達到百 Tbps 量級。華為 Atlas 900 AI 集群由數千顆昇騰訓練處理器構成,要求全節點 200Gbps 網絡互聯,英偉達最新的Blackwell GB200單向網絡速率達到400Gbps。按照單卡出口帶寬 200Gb
25、ps 或 400Gbps 來核算千卡、萬卡規模的數據中心間互聯帶寬需求,初期按照 10%規劃互聯帶寬將達到10200Tbps,未來最大互聯帶寬將達到 1002000Tbps。數據中心互聯推動 400G/800G 高速光傳輸系統部署。從全球相干光傳輸網絡帶寬預測看,數據中心互聯(DCI)帶寬從 2023 年開始占據光網絡總帶寬需求的 50%以上,且整體年增速達到 47%,同時電信運營商及互聯網企業的光傳輸帶寬也在穩步增長,如圖 2 所示。國內樞紐中心的出局總帶寬規劃都在 100Tbps 以上,部分節點如長三角樞紐的上海青浦節點,部署帶寬已經超過 300Tbps。2024 年 5 月,北京電信分公
26、司和中國電信研究院聯合在現網完成智算長距無損互聯技術驗證,使用了單波長 800Gbps 的超高速光波分復用傳輸系統,光層采用 C+L 擴展波段,整個系統傳輸容量近 100Tbps。算力時代全光網架構研究報告(2024 年)10 來源:Lightcounting 圖 2 全球相干光傳輸網絡帶寬增長 分布式大模型訓練對 DCI 網絡的可靠性要求非常高。在大模型訓練過程中,大約每 4 小時設置 1 個檢查點(checkpoint)。一旦發生光模塊或網絡鏈路故障,需要從上個 checkpoint 點重新訓練,損失 4個小時訓練時間將導致訓練成本增加,因此對 DCI 網絡的可靠性要求很高。此外傳輸網絡的
27、誤碼損傷會觸發 RDMA 協議的回退機制,每次丟包報文重傳,傳輸時延會增加一個 RTT 周期,導致訓練交互時延變大,降低計算效率。分布式 AI 大模型訓練要求高可靠無損傳輸,確保網絡可用性達到 6 個 9。(四)(四)網絡智能化調度,使能算網高效協同發展網絡智能化調度,使能算網高效協同發展算網智能化統一編排調度,賦能算力服務高效供給。依托算網融合的統一管理控制系統和服務運營平臺,精準實施算網資源的協同編排與智能調度,確保算力服務的資源高效供給和性能體驗卓越。向下深度整合算網的全域資源,向上全面支撐多樣化算網融合業務運營,算力時代全光網架構研究報告(2024 年)11 通過融合 AI 與大數據技
28、術,實現算網資源的一體化編排、智能調度、精細管理及高效運維,構建靈活、高效、優化的算力服務生態,加速AI 智算應用發展。融合 AI 網絡智能化技術,躍升全光網絡運營效能。借助 AI 網絡大模型和大數據智能化分析能力,深度挖掘光網絡潛力,在全光網絡的規劃、建設、維護、優化、運營的全生命周期中,實現自智網絡 L3級別的全面自動化,并向 L4 級別的智能化逐步升級,顯著提升網絡運營管理的效率與精準度,不僅實現故障預測預警和性能劣化的主動運維能力,還提升算網融合業務的快速配置開通、動態帶寬調整和精準性能監測能力,引領全光網絡邁入智能運維新時代。三、算力時代全光網目標架構和關鍵技術(一)(一)算力時代全
29、光網目標架構算力時代全光網目標架構 算力時代的全光網發展目標是實現網絡無所不達、算力無所不在、智能無所不及的發展方向,支撐算力成為與水電一樣,可“一點接入、即取即用”的社會級服務。面向算力時代的全光網目標架構如圖 3 所示,由四部分組成:一是算力接入網絡(DCA),入算帶寬將演進到萬兆及以上,并方便千行百業快速靈活入算;二是算間互聯網絡(DCI),帶寬可達到單纖百 Tbps 容量的數據中心間全光連接;三是數據中心內網絡(DCN),通過引入全光交叉調度技術優化光電融合組網性能和可靠性,提升數據中心的算力使用效率;四是算網統一編排系統和全光網管控系統、算力管控平臺,實現端到端算網融合業務的資源高效
30、調度和算力服務開通。算力時代全光網架構研究報告(2024 年)12 來源:中國信息通信研究院 圖 3 全光網的目標架構(二)(二)以網促算,全光以網促算,全光 DCA 實現用戶高品質入算實現用戶高品質入算 多種全光入算連接方案,滿足不同客戶的差異化入算訴求。光網絡可以提供 100Gbps 到園區和企業,10Gbps 到企業和家庭的多種用戶入算的網絡連接方案,通過 PON 網絡切片、OTN 硬管道和波長間的隔離支撐用戶入算數據安全,通過全光調度一跳入算保障高等級算力應用的時延體驗最低。面向家庭及企業園區等用戶,可采用PON+OTN 接入方案,為不同業務提供差異化的服務管道;面向中小企業用戶,可采
31、用 OTN P2MP 方案,在實現硬管道隔離服務的同時,提供業務快速開通并降低用戶入算成本;面向大企業用戶,提供 OTN P2P 方案,實現大帶寬、高品質用戶入算。全光網靈活的高品質入算連接方案,讓算力應用走入千家萬戶、賦能千行百業,推動算力應用創新和數字經濟產業生態蓬勃發展。1家庭園區萬兆全光入算 FTTOFTTR50G PONEDC個人家庭園區大型企業中小企業P2P/P2MPP2P樞紐算力邊緣算力樞紐算力樞紐算力DCA入算DCI 聯算DCN立體全光組網算網統一編排系統全光網管控系統算力管理平臺全光算力錨點全光算力網關省級算力OXC交換交換算力時代全光網架構研究報告(2024 年)13 50
32、G-PON/FTTR/Wi-Fi 實現萬兆光網無縫覆蓋。為實現用戶和業務終端的光和無線融合接入無縫便捷覆蓋,需應用新一代 50G-PON和 FTTR+Wi-Fi 融合組網技術。50G-PON 可實現住宅、商業和移動小基站回傳網絡的全光接入,FTTR+Wi-Fi 直接將光纖延伸至各個房間,實現全屋千兆以上覆蓋能力,同時具備靈活擴展、可視、可管、可維的電信級網絡優勢,是構建家庭和企業高質量信息基礎設施的關鍵。新一代 FTTR 末端無線接入網絡可進一步向 Wi-Fi 7 演進,支撐南北向流量以及東西向流量轉發,支持高達 30Gbps 的吞吐量,帶寬相比Wi-Fi 6 提升 2 倍。50G-PON 和
33、 FTTR+Wi-Fi 融合組網技術提供泛在萬兆接入,并與 OTN 網絡協同調度,實現個人、企業用戶敏捷入算和動態帶寬調整,獲得高品質的算力服務體驗。PON+OTN 為萬兆智慧家庭提供高品質全光入云用算體驗。云游戲、云桌面和云 NAS 等算力應用延伸到家庭,需要提供高安全、高隔離和低時延的業務體驗。萬兆智慧家庭用戶入云用算是在現有家庭網關為用戶提供普通上網服務的基礎上,為入算業務增加一條到邊緣云的二層以太網專線,通過 PON 網絡切片和 OTN 硬管道連接到部署在邊緣云池的全光算力網關,如圖 4 所示,提供高品質入云用算業務體驗。算力時代全光網架構研究報告(2024 年)14 來源:中國信息通
34、信研究院 圖 4 萬兆智慧家庭的高品質入算方案 雙 WAN 口實現家庭業務分流:ONT 新增 L2 橋接 WAN 口,高價值業務走橋接 WAN 口入云,上網流量走 PPPoE WAN 口。全光算力網關提供多向業務分流:全光算力網關是邊緣云池流量的總入口,可以連接家庭、云端和外網,提供多向業務分流能力。不同用戶間相互隔離,保障用戶和用戶之間的隱私,提升網絡安全性;同時提供互聯網的融合業務網關功能,為用戶提供云主機等獨享業務的二層連接,實現云游戲等業務在不同家庭用戶間的網絡地址轉換(NAT)轉發訪問,以及云主機訪問互聯網的高速轉發和服務能力。OTN 提供確定性網絡體驗:從 OLT 到全光算力網關之
35、間采用OTN 硬管道實現業務隔離,光網絡為用戶到邊緣算力資源構建端到端帶寬保障的二層網絡,為用戶提供確定性網絡體驗。2中小企業便捷一跳入算 PON+OTN 端到端硬切片支持中小企業一跳入云用算。影視動漫類、游戲設計類和直播數字人等企業對接入 GPU 算力服務有較高要求,不僅要求算力延伸到企業,還需要算網資源同開同停,支持管道IP城域網OTN網絡L2橋接ONTTORTOR交換機云主機云游戲家庭全光算力網關邊緣云池OLT端到端二層網絡PPPoE分流BRASCR入算業務上網業務云主機上網流量互聯網算力時代全光網架構研究報告(2024 年)15 靈活拆建和按需動態擴容。光網絡為中小企業入算場景提供一跳
36、到邊緣云的二層專線,通過 PON 網絡切片和 OTN 硬管道一直延伸到在邊緣云池的全光算力網關,入算網關連接企業和邊緣云,如圖 5 所示。來源:中國信息通信研究院圖 5 中小企業的全光網絡入算方案 端到端硬管道切片隔離:從用戶 ONU 到全光算力錨點采用全光切片,區分不同企業用戶,從全光 OLT 到全光算力網關用 OTN 硬管道隔離,或從用戶 CPE 到全光算力網關實現端到端硬管道隔離,為每個企業提供獨立 OTN 管道。管道動態拆建和帶寬無損調整:感知用戶上線,請求算網統一編排系統進行算力資源分配和管道拆建,算力平臺驅動設備建立/刪除OTN 管道和算力分配,達到算網同開同停。同時感知用戶資源使
37、用狀況請求進行帶寬調整,算網統一編排系統驅動 OTN 管道動態無損調整帶寬,提升網絡資源利用率。3大企業高品質專線入算 大企業端到端高品質入云用算。政務、金融、醫療等大企業作為OTN網絡全光算力網關邊緣云池GPU設計/動漫/數字人等云主機OLTOTN小微企業中型企業ONUCPEP2MP全光算力錨點業務感知帶寬調整算網統一編排系統全光網管控系統算力管理平臺算力時代全光網架構研究報告(2024 年)16 高端行業用戶,在開展辦公系統云化、生產系統云化和核心系統云化的進程中,對運營商提供的云網融合業務提出了更嚴格和差異化的服務能力和指標要求,涉及訂購、安全、可靠、感知、便捷等多個維度。端到端入云用算
38、包括云池預連接、光云管道預配置、端到端業務發放幾大部分,如圖 6 所示。來源:中國信息通信研究院圖 6 大企業高品質專線入算方案 云池預連接:采用跨節點雙歸保護技術,OTN 兩個節點和云池網關節點(DCGW)對接,業務流量可負載分擔和主備保護雙模式,實現 50ms 業務保護。云光管道預配置:當企業進行跨地市入云訪問時,為了提升業務發放效率,需要合理規劃網絡資源,在本地網絡核心或匯聚節點與中心云池之間的省干網絡建立雙路高速 OTN 管道,實現業務接入本地網絡即可快速打通入云通道。省級/樞紐算力VLAN#1VLAN#2OTNOTNDCGWDCGW跨節點保護OTNOTNOTN客戶CPE端到端云光專線
39、業務(EoS/EoO/EoOSU)云光管道預配置云池預連接全光算力錨點全光算力網關算網統一編排系統全光網管控系統算力管理平臺業務受理業務自動發放OTN算力時代全光網架構研究報告(2024 年)17 端到端業務發放:采用端到端云光專線方式,實現企業訂單到運營商運營系統,再到管控系統端到端的業務自動化發放,縮短企業訂單履行時間,提升效率。(三)(三)以網強算,全光以網強算,全光 DCI 實現數據中心高效互聯實現數據中心高效互聯全光網連接不同層級數據中心,提升算力資源使用效率。隨著超大模型訓練對智算網卡資源的大規模增加,導致單一數據中心算力集群的電力供應成為瓶頸。同時,用算的突發性和不確定性讓數據中
40、心算力負載不均衡,存在算力資源過??臻e的情況。通過大帶寬高可靠的光網絡,連接不同層級、不同規模和不同位置的數據中心,支撐構建分布式智算中心集群,協同調度所有在網算力,應對更高算力訴求。同時在網算力,無論智算、超算還是通算都進行協同池化,讓算力資源可以平衡調度,緩解單一數據中心算力發展的壓力。通過光網絡的全域低時延覆蓋,實現就近入算。1樞紐算力:實現大帶寬動態立體調度構建多維立體全光網絡,解決網絡帶寬流量瓶頸。廣域的智算中心間互聯不僅對接口速率和帶寬容量要求高,而且對流量調度能力要求更高,例如東數西算的樞紐節點,規劃流量都超過了 100Tbps,這對原本就存在流量不均衡的運營商骨干網絡增加了額外
41、壓力。采用多維波長選擇開關(WSS)構建的 OXC 設備,在網絡帶寬瓶頸節點擴容,實現多維立體網絡升級,既解決了網絡流量瓶頸,又避免了全網擴容,節省了網絡建設投資,如圖 7 所示。OXC 的多方向全光調度能力使得多個光傳輸平面組成一張統一的立體網絡,實現業務全光一算力時代全光網架構研究報告(2024 年)18 跳直達,保證了低時延和高可靠性的組網需求。骨干光網絡部署單波400Gps 高速光傳輸系統,支持單纖 100Tbps 大容量,采用靈活立體組網,進行波長調度和流量疏導,解決網絡帶寬瓶頸問題。來源:中國信息通信研究院圖 7 樞紐間互聯骨干網立體擴容 數據搬運及資源池化共享,降低入算成本。東數
42、西算戰略工程的深化實施需要算力網絡技術和應用協同創新發展,近期大數據搬運正是在國家算力樞紐間實現 TB 到數百 TB 級超大容量數據傳輸的協同創新應用,致力于解決海量數據傳輸網絡成本高、時間長等難題。傳統專線是按照租賃時長單位為月或年計費,存在專線租用費用高和帶寬不能按需動態調整等問題。大數據搬運業務需要支持分鐘級的快速帶寬提供能力,采用按數量流量計費或以小時為時長單位的新商業模式,通過近年來的試點應用驗證,已逐步獲得業界廣泛認同。根據用戶共享帶寬和分時使用的特征,在網絡核心、樞紐節點進行帶寬資源池化,滿足不同方向、不同時刻用戶的海量傳輸帶寬需求,同時通過流量預測模型,定期修正網絡的擴容門限,
43、及時擴容調整網絡資源,最大化的提升帶寬利用率,降低網絡投資成本。光電保護協同提升網絡可靠性,保障智算數據傳輸。面向廣域智算力時代全光網架構研究報告(2024 年)19 算互聯的超高速長距光傳輸系統對線路質量要求極高,400Gbps 光傳輸系統的 50ms 線路中斷會導致每個波長承載業務丟包約 20Gbit 數據,智算場景的單次丟包會導致后續所有數據重傳,因此需提供穩定可靠的網絡快速保護機制,支持無損傳輸和抗不少于 2 次斷纖的保護恢復能力。光電保護協同技術是在電層配置 1+1 保護技術,在光層配置波長交換光網絡(WSON)的動態恢復技術,如圖 8 所示。同時對光電性能進行統一規劃,形成光層一跳
44、直達的可達圈,可達圈內可保障傳輸性能參數可用,便于快速形成光層恢復路由。光層 WSON 重路由后,需要將新路由的鏈路代價、SRLG、時延等信息同步到電層,通過電層的自動交換光網絡(ASON)實現小于 50ms 的快速保護,同時通過 WSON 恢復光纖中斷,提供更多恢復資源,在成本不增加的情況下,提供抗多次斷纖恢復能力,滿足算網業務 99.999%的可靠性要求。來源:中國信息通信研究院圖 8 光電保護協同提升網絡可靠性2省級算力:扁平化光電聯動高效組網 扁平化組網打造全省一朵云。打破行政區限制,推動網絡扁平化,支路板線路板線路板線路板線路板線路板線路板支路板線路板線路板WSSWSS可達圈 1可達
45、圈 2故障1故障故障1WSON恢復路由恢復路由故障故障2WSON恢復路由恢復路由故障故障1電層保護倒換電層保護倒換故障故障2電層保護倒換電層保護倒換故障2算力時代全光網架構研究報告(2024 年)20 構建超高速的全光網絡底座,打造全省一朵云,實現省內算力資源統一調配,加強省內算網協同,同時高效連接國家算力樞紐中心。省干全光網絡應面向三級 DC 實現扁平化組網,實現省級中心 DC、州市核心 DC、州市邊緣算力 DC 之間任意路徑可達,打造全省一張高速全光網,核心節點之間需滿足超 10Tbps 級大帶寬、99.999%高可靠和3-5ms 低時延。光電聯動實現端到端業務快速發放。當前基于靜態業務為
46、主的網絡業務發放,需提前完成光層系統調測、光波長(OCh)業務提前部署,通過創建電交叉的方式,完成業務發放。面向智算中心間超大帶寬傳輸需求,需同時調度多個波長來滿足帶寬需求,并進行光電聯動調度、光層參數調測和多因子智能算路,快速開通業務以滿足超大帶寬連接需求,光電聯動如圖 9 所示。來源:中國信息通信研究院圖 9 光電聯動技術實現業務快速發放 光參算路支路線路線路線路線路線路線路支路OCh1nOCh1nOCh1n自動調測業務請求光電協同業務建立端到端業務調測全光網管控系統OSU/fgOTN/ODU算力時代全光網架構研究報告(2024 年)21 3城市算力:打造算力接入 1ms 時延圈 全光交換
47、網絡助力構建城市算力接入 1ms 時延圈。城域內金融專線等超低時延業務需求,分布式數據中心多 AZ 冗余保護、個人與企業實時云服務業務,都需要城域光傳送網絡的核心到核心節點之間、以及業務接入點到核心節點之間提供 1ms 超低時延連接。為滿足城市算力中心間不高于 1ms 互聯和用戶入算 1ms 一跳直達訴求,實現算力無損全光傳輸,需構建靈活調度的城域全光底座,節點間連接采用全光一跳直達,同時具備全光靈活調度能力,滿足算力時代的業務動態性、任務式需求。在接入層實現光層環網保護,核心層采用網狀網(MESH)組網實現多路徑冗余保護,確保業務高可用性要求,如圖 10 所示。來源:中國信息通信研究院圖 1
48、0 算力接入 1ms 城市的城域全光網架構 城域核心引入 OXC 實現多路由無損傳輸。應用 OXC 技術構建金融醫療制造企業1ms入算全光算力錨點DC 1ms 互聯城域核心城域匯聚城市算力城市算力城域核心M*N WSS2維ROADM:110:1120:算力時代全光網架構研究報告(2024 年)22 數據中心間全光大容量、無損網絡,核心路由不少于 3 個方向,實現多路由互通和無損傳輸,網絡可靠性達到 99.9999%,部署 400Gbps 或800Gbps 光傳輸系統,提供大帶寬、高可靠的城域算間互聯服務。城域匯聚引入低成本 ROADM 實現全光業務一跳直達。當前ROADM 主要部署在城域核心層
49、,需要推進 ROADM 部署到城域匯聚接入層,實現城域全光調度,波長級業務一跳直達,小顆粒fgOTN/OSU 端到端 1ms 入算。由于城域站點每下沉一層,站點數量增加 510 倍,因此需大幅降低 ROADM 的部署成本。匯聚節點采用新型的 MN WSS 池化共享技術,擴展 WSS 的線路端口,實現多個接入環上聯一個匯聚節點并共享一組 WSS,降低設備空間、功耗和成本。接入節點部署二維 ROADM 技術,可靈活配置每個站點的波長,實現多個環間波長共享,支持波道間隔靈活可配。(四)(四)以網補算,光電融合以網補算,光電融合 DCN 助力突助力突破算力瓶頸破算力瓶頸1光電融合組網,優化拓撲提升集合
50、通信性能引入全光交換降低擴容升級成本,提升算力資源利用率。智算中心網絡通常采用無收斂 CLOS 架構組網,即葉脊(Spine-Leaf)樹形架構,也稱胖樹架構。智算中心內以太網交換機的端口能力限制了接入服務器的數量和接口最高速率,可能導致新建的物理分區(POD)無法接入現有組網架構,需要擴容以太網交換機和調整組網拓撲。當單一 AI 集群規模達到十萬卡時,胖樹網絡架構的層數需要三層或以上,導致網絡負載均衡的哈希(Hash)沖突點多,造成集合通信性能大幅下降,嚴重影響訓練算力的利用率。采用光交換機替換頂層以太算力時代全光網架構研究報告(2024 年)23 網交換機,進行 POD 間互聯具備四個優點
51、:一是光交換機有端口速率無關優勢,支持未來向 1.6Tbps 及以上速率的升級演進;二是與以太網交換機相比,光交換機可大量減少互聯光模塊數量,網絡整體故障率下降,同時可監測光路故障并實現光波長保護調度,提升了系統可靠性;三是光交換機的功耗更低,比傳統以太網交換機方案節省 20%以上功耗。四是光交換機是物理端口級交換,不會出現 Hash 沖突,提升了算力利用率。采用光電混合組網的 DCN 方案如圖 11 所示,光交換機部署在核心層連接各 POD,當前基于兩維微機電(MEMS)的光交換機(OXC)通常支持 256256 端口,多個 OXC 與多個 POD 內的高速以太網交換機實現光電混合組網,可滿
52、足百萬卡集群的 DCN互聯需求。啟動 AI 訓練任務時,需要由管控系統分析訓練任務的模型并行或數據并行策略,根據并行策略分析 POD 之間的最優拓撲,完成 POD 間 OXC 連接的建立。來源:中國信息通信研究院圖 11 DCN 采用 OXC 的光電混合組網方案 ServerServerServerServerServerServerServerServerSpineSpineSpineSpineLeafLeafLeafLeafOXC光交換DCN 數據中心網絡OXC光交換PODPODDCN管控系統算力時代全光網架構研究報告(2024 年)24 2光電智能運維,提升可靠性優化 AI 訓練效率 O
53、XC 全光信號檢測技術提升 DCN 智能化運維水平。隨著 AI 算力需求激增,智算集群規模日趨擴大,導致數據中心內網絡設備激增,設備間光纖連接復雜化,給智算中心交付與運維帶來巨大挑戰?;?OXC 的光電融合 DCN 方案不僅提升了集合通信網絡性能和可靠性,還需要自動化、智能化的光電運維技術支撐,實現光電混合網絡的狀態實時監控和故障快速恢復。OXC 通過全光信號質量檢測技術實現對鏈路光信號的實時檢測,判斷光路連接質量,快速定位光路故障,預測光路性能劣化,縮短故障排查時間,提升數據中心穩定性和可靠性,保障數據無損傳輸。DCN 光電智能運維可有效降低 AI 訓練成本,提供更加穩定和可靠的基礎設施支
54、持,并進一步增強 DCN 網絡的智能化運維水平。光模塊性能監控及預測性維護提升 DCN 網絡可靠性。以太網交換機與光模塊的通信管理是通過通用管控接口規范(CMIS)協議實現,定義了光模塊與系統管理軟件之間的接口和數據格式,管控系統通過 CMIS 協議實現對光模塊的配置、監控和管理。數字診斷監控(DDM)作為 CMIS 協議的一項重要功能,提供了光模塊的工作狀態和性能的實時監控,包括輸入光功率、輸出光功率、溫度和電壓等參數,實現對光模塊的遠程配置、報警監測、故障預測、故障定位和性能優化能力。例如,當光模塊的環境參數超出規定標準范圍時,DDM 可以向系統發出報警,顯示模塊處于不良狀態,從而觸發維護
55、動作,避免潛在的網絡中斷。此外,DDM 還能通過監測激光器的偏算力時代全光網架構研究報告(2024 年)25 置電流來預測激光器的劣化,確保在故障發生之前采取措施,如切換到備用鏈路或更換可能故障的光模塊。這種預測性維護減少了意外中斷的風險,提高了網絡的穩定性和可靠性。(五)(五)靈活一體調度的智能管控平臺靈活一體調度的智能管控平臺面向算力網絡的全光智能管控系統,從企業點對點的專線網絡調度,升級到網+算的協同調度,一方面需要增強網與算的聯動,通過網絡資源和算力資源的綜合評估,實現算網資源協同編排的綜合最優,達成“一點接入、即取即用”的高效敏捷調度目標;另一方面需要增強光網絡的業務感知和保護協同能
56、力,進一步提升網絡的可靠性,實現算網業務的高可靠和算力集群的高安全。1多維信息智能感知,支持算網靈活編排感知用戶業務流和算力資源信息,滿足用戶差異化靈活入算需求。全光網管控系統可以從算網編排系統獲取算力資源信息和業務識別信息,未來具備智能感知用戶業務流量特征和算力資源信息的能力。光錨點可感知用戶業務流,根據從算網編排系統獲取的業務 SLA 標識與分流策略,全光網管控系統可配置光錨點感知用戶業務流特征策略,如基于報文特殊字段對業務進行區分和識別,將不同類型的業務流,如 VR 渲染、AI 訓練等,映射到不同品質光網資源,如圖 12 所示。算網編排系統支持感知算力資源,及時獲取算力資源信息,如總算力
57、規模、算力類型、算力使用量、空閑算力等。當算力資源不足時,算網編排系統觸發算力節點遷移,同步通知到全光網管控系統,由其提供新的運力資源。算力時代全光網架構研究報告(2024 年)26 來源:中國信息通信研究院圖 12 全光網多維靈活感知 2多策略匹配算網資源,實現運力敏捷調度 多策略網絡評估滿足算網業務的差異化訴求。全光網智能管控系統基于實時采集和分析的網絡資源狀態信息,通過帶寬+時延+可用率等多因子選路算法,評估滿足算力接入業務 SLA 訴求的網絡路由,支撐算網編排系統實現運力通道的敏捷調度。面向企業資源接入算力需求,快速評估符合算力應用要求(GPU、存儲資源等)的算力接入點及滿足網絡 SL
58、A 要求(時延、帶寬、可用率等)的網絡路由,實現企業快速入算;面向算力集群互聯需求,快速評估該算力中心在不同時延要求下可覆蓋的企業接入范圍,支撐算力集群布局和網絡覆蓋精準優化。全光網需要支持運力按數據流量、傳輸時長靈活配置和調度需求。面向“東數西算/存/渲”的算網融合業務,如科研、工業、影視、醫療、制藥等行業,對算力和網絡的資源使用并不是長期固定的,而是呈現算網編排系統全光網管控系統算力管理平臺VR渲染時延敏感無特殊要求帶寬敏感光網鏈路2通用算力AI訓練業務SLA配置時延、帶寬、可靠性、丟包率全光算力錨點業務流感知VLAN、VLAN PRI、IP地址、UDP端口算力資源算力規模、算力類型、算力
59、使用量算力時代全光網架構研究報告(2024 年)27 大帶寬、短時長和周期性的特征。因此全光智能管控系統需要建立運力日歷,合理調配網絡資源,提供業務按時預約、運力管道按流量計費和分時復用的能力,實現網絡資源利用的最大化,同時降低企業的數據搬運成本,支撐更多的企業“用得起”算網。通過基于波長鏈路最優規劃算法,綜合評估所有備選路由的質量與線路速率、碼型、譜寬等參數匹配度,規劃出業務源/宿節點間的最優波長鏈路。同時對光傳輸系統進行全網數字化建模,通過全網光纖路徑連通可達性探測和光電協同自動調測能力,實現波長鏈路的自動化開通。3網絡質差監控分析,提供算網差異化保障 多層次監控分析與故障隱患排查,使能算
60、網差異化 SLA 保障。圍繞算網業務的時延、帶寬、可用率等關鍵指標,對光網絡業務層、電層、光層、光纜等不同層次進行全方位監控分析,快速定位故障位置,實時識別風險隱患,使能算網業務差異化 SLA 保障。通過業務秒級性能監控,感知業務狀態實時變化,快速排障流量突發和業務閃斷類問題;通過電層、光層最優可達路徑分析,識別算網業務的時延越限風險,快速推薦可優化路由,滿足算網業務低時延運行要求;通過鏈路信號功率實時監測,實現光纖閃斷自動定位,結合廣域無損傳輸技術,提升業務端到端可用率;通過光傳輸特征識別,檢測光纖同纜隱患,并通過主備路由分離算法避開同路由業務中斷風險;通過數字孿生技術提供光纖參數快速調優,
61、快速恢復等能力,實現光系統快速調測穩定,確保算力連接的確定性和可靠性。算力時代全光網架構研究報告(2024 年)28 四、總結與展望隨著 AI 技術與千行百業的深度融合,業務云化部署以及視頻化、高清化趨勢加速,算力需求呈現爆發式增長,分布式智算協同、數據快遞等新應用需求不斷出現,驅動全光網高品質連接需求進一步升級。算力時代的全光網具備穩定大帶寬、高可靠、確定性超低時延、業務敏捷開通和高效可視運維等四個典型特征。全光網需要實現萬兆全光接入,支撐家庭、園區及企業高品質靈活入算,通過靈活大帶寬立體組網實現算間多層層級 DCI 互聯,在數據中心內部引入光電融合組網提升集合通信性能及網絡可靠性,靈活一體
62、化調度的智能管控平臺實現算力及網絡資源的深度協同。展望算力時代下的全光網目標架構及關鍵技術發展趨勢,建議產業各方繼續在新技術研發攻關、跨領域融合方案創新、業務及應用模式探索等方面協同推進,持續推動全光網向超大帶寬、廣域無損傳輸、確定性低時延、算網智能協同等方向演進,為千行百業的數智化轉型提供高效、穩定和可靠的網絡連接和數據傳輸服務,支撐算力基礎設施高質量發展!中國信息通信研究院技術與標準研究所中國信息通信研究院技術與標準研究所 地址:北京市海淀區花園北路地址:北京市海淀區花園北路 52 號號 郵編:郵編:100191 電話:電話:010-62300112 傳真:傳真:010-62300123 網址:網址: