《中國信通院:算力時代全光運力應用研究報告(2024年)(36頁).pdf》由會員分享,可在線閱讀,更多相關《中國信通院:算力時代全光運力應用研究報告(2024年)(36頁).pdf(36頁珍藏版)》請在三個皮匠報告上搜索。
1、中國信息通信研究院中國信息通信研究院技術與標準技術與標準研究所研究所 2024年9月 算力時代全光運力應用算力時代全光運力應用 研究報告研究報告 (2022024 4 年年)版權聲明版權聲明本報告版權屬于中國信息通信研究院,并受法律保護。本報告版權屬于中國信息通信研究院,并受法律保護。轉載、摘編或利用其它方式使用本報告文字或者觀點的,應轉載、摘編或利用其它方式使用本報告文字或者觀點的,應注明注明“來源:中國信息通信研究院來源:中國信息通信研究院”。違反上述聲明者,本院。違反上述聲明者,本院將追究其相關法律責任。將追究其相關法律責任。前前 言言 隨著我國產業數字化轉型的持續深入,企業及家庭用戶數
2、字化應用對算力資源的需求快速增長,全光運力作為連接用戶及算力資源的承載底座,重要性進一步凸顯。全光運力需要支撐算力資源互聯及調度,滿足各類新應用催生的高速互聯、靈活敏捷、確定低時延、算網高效協同等應用需求。如何發掘典型行業應用,探索創新融合應用方案,有效發揮全光運力大帶寬、高可靠、硬隔離、低時延等優勢,更好推動企業數智化轉型、家庭數智體驗升級,強化高品質網絡運力對經濟社會數字化轉型的支撐作用等成為業界關注熱點。本報告立足算網融合時代下產業數字化轉型升級背景,圍繞智慧交通、工業仿真、數字文旅、智慧家庭等典型行業入云場景,以及分布式大模型訓練場景等,深入剖析用戶服務體驗以及數據傳輸等對網絡的需求,
3、提出滿足企業及用戶品質聯算需求的超大帶寬、確定性、高可靠安全、業務感知、算網協同等全光運力關鍵技術,展示全光運力在智慧交通、數字云網吧、智家云電腦、智算拉遠等場景下的行業創新應用案例。希望業界聚力協同推進全光運力技術、產業及應用多維創新,支撐培育新質生產力,推動我國數字經濟持續高質量發展。目目 錄錄 一、概述.1 二、全光運力應用需求.3(一)智慧交通.3(二)工業仿真.6(三)數字文旅.8(四)智慧家庭娛樂.15(五)分布式模型訓練.18 三、全光運力關鍵技術.21(一)超大帶寬.21(二)確定性承載.22(三)高可靠安全.22(四)業務感知調度.23(五)算網協同控制.25 四、行業應用案
4、例.25(一)智慧交通案例.25(二)數字云網吧案例.26(三)智家云電腦案例.28(四)智算拉遠案例.29 五、總結與展望.30 圖圖 目目 錄錄 圖 1 交叉路口通信架構圖.5 圖 2 仿真上云設計過程.6 圖 3 網吧、電競酒店算力上云場景.9 圖 4 實景三維云建模場景.12 圖 5 影視云制作場景.14 圖 6 智慧家庭云游戲場景.16 圖 7 算力分布式部署場景示例.19 圖 8 全光運力解決方案架構圖.21 圖 9 超大帶寬連接.22 圖 10 業務感知流程示意.24 圖 11 智慧交通案例.26 圖 12 數字云網吧案例.27 圖 13 智家云電腦案例.28 圖 14 智算拉遠
5、案例.29 表表 目目 錄錄 表 1 攝像頭帶寬需求.3 表 2 不同帶寬下的理論傳輸時間.7 表 3 不同分辨率、刷新率對應的帶寬需求.10 算力時代全光運力應用研究報告(2024 年)1 一、概述 各類算力行業應用涌現對網絡帶來新需求和挑戰。一方面,消費互聯網新業態新模式競相發展,推動數據計算需求持續增長,數字醫療、數字辦公、數字娛樂、智能出行等用戶規模呈普遍增長態勢,智能手機、虛擬現實(VR)/增強現實(AR)頭顯、智能網聯汽車、智慧家庭網關、工業園區網關等智能終端向多元化分布式發展,驅動數據處理從集中式計算向分布式云計算發展,并逐步從云端向邊側和端側擴散,催生數據泛在處理及云邊端算力的
6、協同調度需求。隨著人工智能(AI)大模型技術的成熟,生成式 AI 應用呈爆發式增長,AI 模型訓練及推理過程對網絡性能指標要求愈加嚴苛,要求網絡滿足高速互聯、靈活敏捷、確定性低時延、算網高效協同等能力。另一方面,產業互聯網算力需求呈指數級增長,產業互聯網數據量龐大且增速迅猛,且由于產業互聯網應用與工業、農業及服務業等產業領域的設計、研發、制造、經營具體環節密切相關,對數據處理的實時度及精確度要求更高,需要更為強大泛在的算力資源及高質量的網絡傳輸配合完成數據的高效處理。全光運力建設取得積極成效。一是全光網建設快速推進,網絡傳輸性能大幅提升。我國已經建成全球規模最大的光纖通信網絡,網絡規模和網絡性
7、能均達到國際先進水平。光纜線路總長度持續增加,截至 2024 年 7 月底,我國光纜線路總長度已達到 6712 萬公里,新型超低損光纖部署規模逐步擴大;千兆及以上接入速率的固定互聯網寬帶接入用戶達 1.9 億戶,占總用戶數的 29%。二是傳輸網絡系統容量及算力時代全光運力應用研究報告(2024 年)2 算網調度能力不斷提升,數據中心互聯(DCI)能力持續增強?;A電信運營企業陸續開展骨干網速率升級和容量擴容,國干層面以及部分省市開始部署單波 400G 系統,系統容量進一步提升,靈活全光交叉、智能管控、網絡切片等新技術加快發展應用。三是高速光傳輸各項關鍵技術攻關取得一系列標志性成果。正交相移鍵控
8、(QPSK)調制格式、C+L 波段擴展等 400G 長距骨干傳輸關鍵技術標準體系基本完善,三大基礎電信運營企業均已開展 400G 超長距傳輸試點。細粒度光傳送網(fgOTN)、光業務單元(OSU)等我國自主創新技術方案向國際標準的轉化率顯著提升,國際影響力及話語權持續增強。全光運力行業創新應用持續探索。目前,行業應用場景與業態日益豐富,光網絡對千行百業數字化轉型的賦能潛力不斷激發,油氣、鐵路、電網等國民經濟關鍵領域,以及金融政務、汽車制造、工業生產等重點垂直行業已涌現出一批創新應用優秀案例。隨著全光運力基礎設施的持續建設,如何發掘典型行業應用,探索創新融合應用方案,有效發揮全光運力大帶寬、高可
9、靠、硬隔離、低時延等優勢,更好推動企業數智化轉型、家庭數智體驗升級,強化高品質網絡運力對經濟社會數字化轉型的牽引作用,成為現階段的關鍵任務。本報告將立足算網時代下產業數字化轉型升級背景,詳細分析典型垂直行業的應用場景及對網絡的需求,提出滿足行業應用的全光運力關鍵技術,展示全光運力行業創新應用案例,為我國全光運力技術創新、融合應用及市場發展提供參考。算力時代全光運力應用研究報告(2024 年)3 二、全光運力應用需求(一)(一)智慧交通智慧交通 1.智慧交通應用場景 智慧交通建設需求推動攝像頭智能化升級。交通運輸部發布的數字交通“十四五”發展規劃,提出深入推進數字交通體系,交通新基建在 2025
10、 年要取得重要進展。智慧交通可支撐交通行業的數字化、網絡化、智能化水平提升,支撐交通運輸行業高質量發展和交通強國建設。智慧交通建設推動攝像頭智能化升級,把普通攝像機升級為智能攝像機,并把分布式存儲在各個區域的視頻、抓拍圖片上傳到數據中心,以引入 AI 系統對路口數據進行分析,實現交通態勢的全局監管、信號的綜合調優。攝像頭智能化帶來帶寬升級需求。交通路口升級使用智能攝像機,現有的通信網絡的以滿足遠程查看視頻錄像為主,智能攝像機多路同時上傳需要進行帶寬升級,相關帶寬需求如表 1。單個攝像機的帶寬需求從 1080P 的傳統攝像機的視頻帶寬需求 9Mbps,提升到高清的500W 像素智能攝像機,單個攝
11、像機帶寬需要達到 103Mbps。表 1 攝像頭帶寬需求 攝像機類型攝像機類型 視頻帶寬視頻帶寬 抓拍圖片上傳帶寬抓拍圖片上傳帶寬 普通攝像機普通攝像機上行帶寬上行帶寬(Mbps)智能攝像機智能攝像機上行帶寬上行帶寬(Mbps)編碼碼率編碼碼率(Mbps)緩存補錄速緩存補錄速率(率(Mbps)抓拍圖片大抓拍圖片大?。ㄐ。∕B)每秒抓每秒抓拍數量拍數量 元數據速率元數據速率(Mbps)1080P 攝像機 4 1 1.5 2 24 9 68 500W 攝像機 10 2 2 2 32 22 103 4K 攝像機 14 3 4 2 64 31 191 攝像機帶寬計算公式:算力時代全光運力應用研究報告(
12、2024 年)4 普通攝像機的帶寬=(編碼的碼率A+緩存補錄路速率)預留帶寬系數(1.2)智能攝像機的帶寬=(編碼的碼率A+緩存補錄速率+抓拍圖片大小每秒圖片數8+FTP/SFTP 上傳圖片大小每秒圖片數8)預留帶寬系數(1.2)A 為超強糾錯附加碼率,取值 200%。來源:中國信息通信研究院 攝像頭視頻數據需要實時上傳 AI 處理中心,對網絡可靠性提出更高需求。一個大型城市交通攝像機有 45 萬臺,據統計城市光纜每百公里年均中斷 3 次以上。攝像頭數據在實時上傳到 AI 處理中心的時候,光纜中斷容易導致數據丟失,需要網絡提供保護能力,發生斷纖時保持數據傳輸不受影響。攝像頭點位多、分布廣、網絡
13、變動頻率高,帶來統一承載及運維需求。攝像頭分布在城市的各個交通路口,配套的網絡也需要跟隨攝像頭逐個安裝、調試,為避免不同安裝調試方式帶來的人工錯誤和額外工作,需要通過統一承載的方式,降低安裝復雜度。路口交通繁忙,大部分攝像頭是改造升級,要減少攝像頭的通信和供電線纜,降低施工對交通影響的時間。此外通過統一承載網絡遠程監控維護,當光纜中斷、設備故障發生時,網絡能夠快速定位到具體故障點或故障設備。2.智慧交通網絡要求 智能攝像機升級后,相關視頻和圖片數據要實時傳輸到中心機房,通過 AI 集中處理視頻、圖片數據,需要對網絡的帶寬、可靠性進行升級,以滿足智能攝像頭集成上傳和處理的需求,同時面對大量攝像頭
14、的承載需求,需要統一承載方式,簡化運維,以降低安裝、維護要求。升級后的交叉路口的通信網絡架構如圖 1 所示。算力時代全光運力應用研究報告(2024 年)5 來源:中國信息通信研究院 圖 1 交叉路口通信架構圖 網絡統一承載:針對交叉路口多種設備需要通信和控制需求,可以使用一臺設備統一承載,以減少設備數量。不同攝像頭的信號控制、電子警察、卡口、交通誘導、視頻監控、流量監測等不同業務流,可以通過分配不同時隙的方式實現信號流間的隔離。帶寬升級:按照交叉路口 16 個攝像頭,每個 500W 像素攝像頭103Mbps 預留帶寬計算,路口到區域機房的帶寬要從百 M 升級到1.7Gbps 以上。每個區域機房
15、納管 5060 個路口,區域機房到中心機房的帶寬需要提速到百 Gbps,同時面向未來帶寬升級需求,應具備平滑升級到 N*100Gbps 的預留帶寬擴展能力??煽啃裕航徊媛房跀z像機的業務接入終端到街邊柜的接入設備、接入設備到區域機房的匯聚設備,應提供 1+1 保護能力。區域機房到中心機房故障影響范圍大,城市內光纜存在主備雙斷風險,需提供三路由的保護,整體達到 99.99%以上的業務可用率。安裝維護便捷:終端網絡設備應支持自動上線和遠程配置,減少現場調試時間。設備層面引入統一管控系統,實現故障全局監控,實路口接入設備ONUONUONUONU匯聚設備多路口匯聚中心機房交通態勢監管信號綜合調優網管云平
16、臺區域機房街邊柜業務接入終端核心設備算力時代全光運力應用研究報告(2024 年)6 時監測光纜通斷狀態,實現快速故障分析定位。(二)(二)工業仿真工業仿真 1.工業仿真應用場景 工業仿真與云技術、人工智能融合,推動工業產業加速轉型升級。黨的十九大報告指出“加快建設制造強國,加快發展先進制造業,推動互聯網、大數據、人工智能和實體經濟深度融合”。工業仿真在工業設計、開發領域可以大幅提升設計精度和效率。工業仿真涉及結構、流體、動力學、散熱、電磁等多領域,每個領域都有多種仿真工具軟件,集成整合難度大、數據流轉多,并且仿真時間受硬件資源限制,仿真周期較長。隨著云化技術、人工智能技術的發展,工業領域的仿真
17、應用引入云化技術集成自動化仿真工具鏈,利用云的彈性擴展優勢,提供更強算力,增強用戶使用便捷性,例如 Ansys 的仿真平臺可以集成 100 種以上計算機輔助工程(CAE)和計算機輔助設計(CAD)工具,用戶可以隨時訪問使用。此外 AI 技術的引入以及更強大的算力支撐,通過預測全部性能節省仿真求解時間,大幅減少仿真時間,提升設計開發效率。云化技術和 AI 技術的進入,工業產業加速向智能制造升級。工業仿真上云設計過程如圖 2 所示。來源:中國信息通信研究院 圖 2 仿真上云設計過程 算力時代全光運力應用研究報告(2024 年)7 工業仿真云化場景下,企業本地與云端存在大量數據交互。工業仿真云化后,
18、企業需要把仿真數據放到云端進行計算處理,仿真數據量大,需要在短時間內完成數據傳輸,避免影響設計開發。以汽車行業的新車型研發為例,汽車碰撞仿真、結構件強度仿真、整車空氣動力仿真,需要大量的高性能計算(HPC)算力,部分車企租用第三方云端 HPC 算力,研發中心與云端的平均每天的數據傳輸量在 TB 級別。智能駕駛研發過程中,需要大量數據進行訓練,百臺路測車的數據量是百 TB/天。數據傳輸時間和帶寬間的關系如表 2 所示。表 2 不同帶寬下的理論傳輸時間 數據量數據量 傳輸時間傳輸時間 100M 1G 10G 100G 10TB 12 天 29 小時 3 小時 20 分鐘 100TB 121 天 1
19、2 天 29 小時 3 小時 1PB 1243 天 125 天 12 天 29 小時 來源:中國信息通信研究院 企業對專線資費敏感,需探索新型專線業務服務模式。為提高工作效率,一般需要當天晚上把數據傳輸到云端,第二天能正常開展工作。但大帶寬專線的租賃費用高,企業只在傳輸仿真數據的時候需要使用大帶寬,日常查詢仿真結果等只需要幾十 Mbps 到百 Mbps 左右的帶寬??紤]費用和使用習慣因素,需要企業專線按需進行帶寬調整,并能按使用時長收費,滿足大帶寬數據傳輸需求,同時降低使用費用。工業仿真云化數據安全性要求高。仿真系統云上部署后,大量的企業研發數據上云,帶來了仿真的便利性,但也面臨數據的安全性問
20、題,需要網絡能夠提供加密手段,防止傳輸過程中出現數據泄密。算力時代全光運力應用研究報告(2024 年)8 2.工業仿真網絡要求 工業仿真數據傳輸需要滿足用戶對網絡帶寬、成本、數據安全性等多方面的要求。彈性可調整大帶寬:企業接入側提供 10Gbps 級別的帶寬入口,日常使用提供 100Mbps 的帶寬,在需要傳輸仿真數據時,動態調整到 10Gbps100Gbps 帶寬,實現百 T 以內數據小時級傳輸。在匯聚層和干線層同一份帶寬資源供多個企業分時復用,提升帶寬利用效率,降低使用資費。獨立通道加密傳輸:網絡提供基于物理隔離的硬管道,保證傳輸數據與網絡中其他業務數據硬隔離,并在業務入口側增加基于國密的
21、硬件加密能力,既不影響線路傳輸效率,又可防止數據被竊取。(三)(三)數字文旅數字文旅 1.網吧電競行業(1)網吧電競酒店應用場景網吧電競酒店應用場景 網吧上云成為趨勢。文化和旅游部互聯網上網服務行業上云行動工作方案要求加快推動互聯網上網服務營業場所數字化轉型,創新發展“存儲上云”“算力上云”等上網服務行業云服務新模式,助力行業轉型升級。網吧行業調研數據顯示,網吧上云占比 2023 年為 6%,2024 年預期進一步提升至 15%。網吧上云后,本地主機系統的 CPU、GPU 遷移到云端集中部署,本地瘦終端僅保留鼠標、鍵盤、顯示器等外設,瘦終端通過網絡連接到云端算力,如圖 3 所示。網吧的瘦終端把
22、本地的鼠標、鍵盤操作采樣數據傳輸到云端,云端算力操作系統調算力時代全光運力應用研究報告(2024 年)9 度到應用軟件進行交互邏輯處理、同時交給 GPU 做圖形處理和渲染,渲染后形成每一幀視頻畫面寫入緩存,畫面經過編解碼將視頻通過網絡傳輸給瘦終端,瘦終端經過解碼后把圖像在顯示器上展現。來源:中國信息通信研究院 圖 3 網吧、電競酒店算力上云場景 網吧上云后要求用戶體驗不變,對網絡傳輸提出更高要求。網吧、電競酒店的玩家主要選擇 3A 和競技兩大類游戲,3A 類游主要追求畫面質量,競技類游戲依靠玩家的操作技能和反應能力進行對抗或比賽,對流暢度、操作靈敏度要求高。游戲畫面流暢、清晰,操作靈敏、不卡頓
23、是網吧體驗的關鍵要求,影響體驗的關鍵指標包括:1)顯示分辨率:網吧、電競酒店顯示分辨率以 2K 為主,即2560*1440,也有部分升級到 4K。為了滿足高分辨率要求,網絡需具備足夠穩定帶寬傳輸視頻信號。2)顯示刷新率:游戲需要高刷新率讓視覺體驗流暢,渲染的游戲畫面在顯示器上實際輸出的刷新率高低將直接影響到玩家的操作,過低的刷新率,還會導致畫面不連貫,令人感到暈眩不適。目前網吧、電競酒店主流刷新率以 144 幀/秒刷新率為主,部分升級到 240 幀/秒高刷新率。畫面傳輸的帶寬、時延及時延抖動將直接影響顯示效果。3)操作流暢度:鼠標點擊丟失、跳躍、卡頓、遲滯是影響操作體算力時代全光運力應用研究報
24、告(2024 年)10 驗的關鍵。流暢的電競操作體驗,依賴盡可能短的時間內完成用戶操作數據的傳輸、處理、畫面生成、畫面傳輸和顯示整個端到端過程,即要算力處理快,又要傳輸時間短。(2)網吧上云的網絡要求網吧上云的網絡要求 網吧上云體驗不降低,要求網吧側到云端的連接帶寬穩定、傳輸時延低、時延抖動小,傳輸丟包率低。穩定帶寬:帶寬越大可支持的分辨率越高。當前網吧主流應用的2560*1440 分辨率、144 幀刷新率的畫面,需要的帶寬為 120Mbps,如表 3 所示。單個網吧按同時上線 80 臺電腦計算,一個網吧需要約10Gbps 的帶寬才可保障流暢運行。表 3 不同分辨率、刷新率對應的帶寬需求 分辨
25、率分辨率 刷新率刷新率(幀(幀/秒)秒)傳輸峰值帶寬傳輸峰值帶寬(Mbps)1080P 1920*1080 60 50 2K 2560*1440 60 80 120 100 144 120 4K 3840*2160 60 150 144 250 來源:中國信息通信研究院 穩定低時延:按每秒 144 幀/秒刷新率計算,每幀顯示間隔時間要求穩定在 6.9ms,為不影響使用體驗,云端處理、本地處理和網絡傳輸時延需要在一幀內完成。云端當前主流顯卡處理時間平均為3.4ms 左右,本地瘦終端處理時間平均為 2ms 左右,因此在保證 144幀顯示的情況下,網絡傳輸的往返時延(RTT)需保證在 1.5ms 以
26、內。低丟包率:傳輸網絡丟包會造成視頻畫面數據異?;虿僮鲃幼鱽G算力時代全光運力應用研究報告(2024 年)11 失,造成視頻畫面影響有花屏、跳幀、卡頓等,操作影響有操作跳動、點擊丟失等。根據現網丟包驗證結果分析,丟包率需保證小于 1E-5。2.實景三維測繪行業(1)實景三維應用場景實景三維應用場景 實景三維測繪應用日益廣泛。自然資源部發布關于全面推進實景三維中國建設的通知,全國各地基礎測繪十四五規劃中,紛紛將實景三維建設列為重要建設任務之一。實景三維運用采集設備,如無人機、相機、掃描儀等,對現有場景進行多角度環視拍攝,以三維視覺重建技術為核心,利用數字攝影測量技術與人工智能技術將采集場景快速還原
27、為三維,真實還原世界。實景三維作為數字中國的基礎底座,已廣泛應用于自然資源、數字景區、數字文物、智慧城市、應急管理、公安、住建、環保、礦山等行業。全國已有 23 個省在基礎測繪“十四五”規劃中將實景三維作為重點建設任務,2023 年實景三維建設有 169 個地市,占比超過 50%。實景三維涉及大量數據采集及處理流程。實景三維操作流程包括實景數據采集、建模、修模、原子化四個關鍵步驟,如圖 4 所示。其中實景數據采集根據對不同地物分辨率的要求,進行實地地形調研、方案設計,軟硬件準備等,完成無人機傾斜攝影測量和像控點測量。實景采集數據需要上傳云服務器存儲并進行建模,完成影像數據的自動化建模及生成模型
28、加密,提供通用格式的三維模型成果。修模需要遠程操作云上數據,對自動化建模生成的三維模型中的碎片、殘缺、標牌破損、紋理拉伸模糊等共性問題進行修飾后處理。原子化過程需算力時代全光運力應用研究報告(2024 年)12 要遠程針對云上建模和修模得到的三維模型進行語義原子化和手工原子化處理,滿足模型與各行業應用中的屬性數據進行掛接與關聯。來源:中國信息通信研究院 圖 4 實景三維云建模場景 實景三維云上數據操作流程需要高性能的算力和網絡。一個航拍無人機一天采集約 300GB 數據,超大型項目更需要多個無人機同時工作,每天產生 TB 級數據需要建模和修模,因此即要大量高性能算力集群完成批量建模。設計人員使
29、用高分辨率、高刷新率云電腦完成在線修模工作,要求網絡保證顯示刷新率和操作流暢度。同時采集數據回傳需要靈活的大帶寬提出要求。實景三維采集數據需要提供物理隔離的傳輸通道。實景三維采集數據的全生命周期流程,都需要保障地理信息數據的安全性,一方面處理數據的算力資源和傳輸數據的網絡通道均需要物理隔離;另一方面人員與數據隔離避免直接接觸,人員建模、修模、單體化全部使用云電腦完成,工作人員只接觸顯示畫面不接觸數據源,且顯示畫面經過安全處理。邊緣算力機房瘦終端瘦終端瘦終端CPE實景三維企業12G帶寬,RTT1.5ms 用戶遠程操作云電腦 2k/165fps顯示渲染服務器存儲服務器 讀取數據用于修模/建模 算力
30、讀取模型數據企業存儲服務器托管無人機采集數據回傳算力時代全光運力應用研究報告(2024 年)13(2)實景三維的網絡需求實景三維的網絡需求 針對云上處理的實景三維數據,需要使用實時渲染的高性能云電腦和離線的渲染集群,因此對網絡提出更高要求。實景三維需要物理隔離和大帶寬、低時延網絡保障。安全性要求:用于實景三維數據的傳輸通道需要與其他通道物理隔離,需支持國密加密傳輸,考慮傳輸帶寬和數據處理量比較大,需支持硬件加密。時延要求:企業在本地連接云端電腦實時展示圖像效果并進行優化處理,考慮畫面的高分辨率、刷新率、流暢度,網絡時延要求和云網吧一樣,在2K顯示器及144幀/秒刷新率下,RTT時延需要1.5m
31、s。帶寬要求:按一臺無人機一天 300GB 數據,同有 10 臺拍攝,共3TB 數據,白天拍攝后,晚上完成參數和預處理,按傳輸數據 2-3 小時計算,需要 3Gbps 左右的帶寬。白天工作時間進行圖像優化時,只需要云端傳輸視頻信息到企業本地,和云網吧帶寬需求一樣,每臺云電腦需要 120Mbps,按 8-10 個人同時使用,需要 1Gbps 左右帶寬。3.影視綜藝制作行業(1)影視制作行業應用場景影視制作行業應用場景 影視制作行業上云成為趨勢。國家發展改革委聯合住房城鄉建設部、文化和旅游部、國家電影局、廣電總局、國家文物局等部門印發推動文化和旅游領域設備更新實施方案 部署實施電影產業高新促進行動
32、重點任務,鼓勵在電影視覺效果和后期制作中運用人工智能、虛擬拍攝、虛擬預演等新技術新裝備。推動電影后期制作設備體系的算力時代全光運力應用研究報告(2024 年)14 升級改造,實現高新技術化和標準化。推動建立和升級云制作平臺、云數據中心,夯實行業通用制作技術和算力底座。影視制作上云如圖 5 所示。影視制作包括剪輯、視效、聲音、調色關鍵環節。其重頭是視效和剪輯,并且操作需要實時看效果,因此后期制作企業需要高分辨率、高刷新率、高精度操作的云電腦產品,同時配套快速讀寫的文件存儲池、歸檔存儲池和并行渲染的高性能算力池。來源:中國信息通信研究院 圖 5 影視云制作場景 影視制作上云提出高精度還原、按需使用
33、、安全便捷等需求。制作流暢、高精度還原:滿足專業級影視剪輯需求,顯示色彩逼真,細膩,無損還原圖像色彩和亮度。滿足專業級影視設計渲染要求,高刷新率保證高速動態視頻場景下的流暢體驗。按需便捷使用:影視制作由多個公司、多人協作完成不同環節,隨時的多方訪問共享資源,高效協作,快速接入。云電腦需即開即用,按需擴容算力、存儲。數據安全:影視數據在公開上映之前存在高安全保密需求。算力邊緣算力機房瘦終端瘦終端瘦終端CPE影視制作企業12G帶寬,RTT1.5ms 用戶遠程操作云電腦 4k/165fps顯示渲染服務器存儲服務器企業存儲服務器托管 讀取數據用于修模/建模 算力讀取模型數據企業存儲服務器托管硬盤數據導
34、入存儲服務器攝像機攝像機多機位硬盤加密收錄拍攝現場算力時代全光運力應用研究報告(2024 年)15 處理數據和網絡傳輸數據均使用物理硬隔離,制作人員操作云電腦只接觸顯示畫面不接觸影視數據源,且顯示畫面經過安全處理。(2)影視、綜藝制作的網絡要求影視、綜藝制作的網絡要求 影視制作高性能云電腦要求高刷新率、高分辨率保證,因此對時延、帶寬都提出比其他行業的更高要求。影視制作上云需要低時延、大帶寬、物理隔離的網絡。靈活大帶寬要求:影視制作使用 4K 分辨率顯示器,刷新率主要為 144 幀/秒,部分高要求的要 240 幀/秒,單臺 4K/144 幀/秒云電腦帶寬需求為 250Mbps,同時運行 1020
35、 臺,日常接入帶寬要求為2.5Gbps-5Gbps,影視原始素材 100TB 左右,傳遞需要 10100Gbps 左右帶寬,網絡需要彈性帶寬可調能力。低時延要求:與云網吧網絡時延需求類似,影視制作云電腦由于144/240 幀/秒高刷新率和 4K 分辨率的高色彩、高精確度要求,需引入更強算力 GPU 和增強型本地瘦終端,網絡 RTT 時延要求1.5ms。安全加密:數據傳輸通道需要與其他通道硬隔離,需支持國密加密傳輸,考慮傳輸帶寬和數據處理量比較大,制作時處理實時性要求高,需支持硬件加密。(四)(四)智慧家庭娛樂智慧家庭娛樂 1.智慧家庭應用場景 云游戲及 VR 應用成為家庭應用新場景。智慧家庭應
36、用通過對現實世界的數字化,例如巨幕影院、游戲、XR/VR 等,為家庭用戶帶來沉浸式的生活體驗。游戲是典型的家庭應用場景,區別于傳統本地游算力時代全光運力應用研究報告(2024 年)16 戲,云游戲使用云端 GPU 算力資源,為強交互性的在線視頻流,如圖 6 所示,玩家可通過鼠標、鍵盤、手柄等輸入設備對游戲進行實時操作,云端服務器通過 GPU 進行渲染,并將渲染完畢后的游戲畫面和聲音壓縮后,通過網絡傳輸至電腦、移動終端、機頂盒等終端,由終端設備進行編解碼操作,在本地顯示畫面和播放聲音。云 VR 是將云計算的理念及技術引入到 VR 業務應用中,其基本原理與云游戲類似,VR 應用程序運行在云端服務器
37、上面。充分利用云端強大的 CPU與 GPU 進行 3D 圖形運算和渲染,并將渲染后數據以視頻流形式,通過高速穩定的承載網絡,傳送至一體式 VR 頭顯等用戶終端設備,讓用戶無需購置昂貴主機或高端 PC,即可享受各種高清晰、低延遲的 VR 業務。來源:中國信息通信研究院 圖 6 智慧家庭云游戲場景 超低時延是保障云游戲和 Cloud VR 應用體驗的基礎。以 3A 電競類游戲為例,最佳體驗是 144 幀/秒,每幀間隔 6.9ms,要求網絡RTT 時延1.5ms,同時業務對抖動的要求也比較高,抖動高會導致游戲掉幀畫面模糊和卡頓。Cloud VR 為了防止眩暈,對業務端到端的時延有明確要求,其關鍵指標
38、運動的光子延遲(MTP)指一個用戶的算力時代全光運力應用研究報告(2024 年)17 操作需要充分反映在顯示屏上的時間,Facebook 旗下的 Oculus 公司經過測試驗證,MTP 時延目前公認能接受的是20ms,扣除用戶端操作處理時間及云上處理時間,要求網絡 RTT 時延2ms。智慧家庭娛樂存在按需帶寬調整需求。云游戲與 Cloud VR 用戶按需使用云端算力,算網同開同停,需要具備感知用戶業務并按需提供鏈接和帶寬的能力。2.智慧家庭網絡需求 家庭云游戲和 Cloud VR 本質上是算力云化和服務化,要達到和本地化相同的體驗要求、以及按需的服務訴求。穩定帶寬保障:家庭云游戲和 Cloud
39、 VR 的在不同分辨率、刷新率下的帶寬需求和云網吧一樣,為保證家庭的基本體驗,起步分辨率和刷新率要求是 1080P、60 幀/秒,更佳體驗優選 2K、144 幀/秒,要求網絡帶寬達到 120Mbps 能力,將來 Cloud VR 達到 4K、60 幀/秒或4K、144 幀/秒,則帶寬要求達到 150Mbps 或 250Mbps 以上。確定性低時延:網絡時延要求主要由幀率、云端 GPU 和本地瘦終端處理時間決定,應用體驗要求同本地處理一樣不劣化,家庭側體驗優選體驗是 2K、144 幀/秒,網絡時延和云網吧一樣要滿足RTT1.5ms 的要求??紤]家庭側存在一部分低性能瘦終端及云側上一代 GPU 算
40、力的利舊,部分用戶體驗可適當降低到 1080P、60 幀/秒,每幀處理時間是 16.7ms,云端 GPU 處理時間 8.5ms,瘦終端處理時間 5ms,網絡 RTT 時延可放寬到3.2ms。業務感知及連接彈性拆建:當家庭用戶上下線時,需要網絡能夠算力時代全光運力應用研究報告(2024 年)18 感知終端的啟動和關閉,同時感知業務類型、使用狀態、以及性能指標,以便實時能夠保證用戶體驗。Cloud VR 等業務對時延敏感,需要保障業務時延抖動穩定無變化,現有共享帶寬模式不能保證業務體驗,需要提供剛性管道,在感知到用戶上下線時,需要網絡能夠具備業務連接秒級動態拆建能力,讓用戶的服務體驗為即開即用。(
41、五)(五)分布式模型訓練分布式模型訓練 1.AI 多 DC 分布式訓練應用場景 大模型訓練對計算資源需求急速增加,大規模智算訓練存在分布式部署需求。隨著 AI 技術的迅猛發展,文生圖、文生視頻類、多模態大模型成為 AI 領域的熱點,正在加速推動智算領域的發展。模型的參數量急劇增長,最新發布的 GPT4、谷歌 Gemini 1.5 已達到了萬億級別的參數,GPT5、Gemini2.0 預計達到 10 萬億規模,同時模型的序列長度也從 4K 快速增長到 100 萬以上(如 Gemini 1.5)。模型的參數量以及序列長度快速增長帶來模型計算資源需求急劇增長,從最初的數千張智算卡集群,迅速擴展至數十
42、萬張,甚至百萬張智算卡的超大規模集群,如微軟及 OpenAI 的星際之門項目,預計需要數百萬計算卡。超大規模集群動輒數十兆瓦的功耗需求,電網的承載能力也面臨巨大挑戰,微軟公司為 OpenAI 訓練 GPT6 時,需要的算力超過10萬張H100智算卡,由于電力供應限制,采用跨區域的分布式訓練。面對超大規模集群動輒數十、數百兆瓦的功耗需求,電網的承載能力面臨巨大挑戰,跨數據中心的智算分布式協同成為解決方案之一。多中心算力資源聚合成為業界大模型訓練的解決方向之一,網絡算力時代全光運力應用研究報告(2024 年)19 需要提供大帶寬、高可靠互聯的能力。智算分布式協同場景是將兩個數據中心通過網絡互聯,組
43、成廣域無損網絡,支撐不同數據中心間智算卡間按需組成超大模集群。智算分布式協同包括算力資源池聚合及空閑算力資源整合兩種場景,如圖 6 所示。算力資源池聚合場景下,分布式智算拉遠訓練將已建成的分散在不同地理位置的小型智能計算中心連接起來,整合成大智算集群,以擴大算力資源,形成大型算力資源池,為訓練更大規模的人工智能模型提供支持??臻e算力整合場景下,為避免單個智能計算中心的空閑算力呈現出碎片化狀態,通過智算中心間互聯構建算力共享資源池解決智算碎片問題,提升算力資源的利用率。多中心算力資源聚合的二種場景,網絡都需要保證多個算力中心之間的低時延及可靠互聯,并提供敏捷的超大帶寬能力供給能力,保證互聯的算效
44、。來源:中國信息通信研究院 圖 7 算力分布式部署場景示例 2.智算分布式訓練的網絡要求 100KMDC1DC2100KMDC1DC22000卡3000卡算力資源池聚合算力碎片資源聚合算力時代全光運力應用研究報告(2024 年)20 針對智算分布式訓練場景,為保障兩個數據中心間 AI 算力卡間的數據快速可靠傳輸,對網絡帶寬、傳輸質量都提出了很高的要求。超大帶寬:集群互聯帶寬需求達到百 T 量級,以雙集群每個集群5000 卡、單卡速率 200Gbps 為例,需要的最大互聯帶寬為 1000T,通過優化集合通信庫,將流量盡量封閉于 DC 內部,跨 DC 采用數據并行(DP)通訊,對稠密模型和萬億及十
45、萬億稀疏模型的仿真顯示,可以將千 T 的互聯帶寬壓縮到百 T 量級。高可靠傳輸:智算卡計算中互相傳遞數據過程中如發生傳輸錯誤,即使通過重傳機制,但等待重傳仍會影響計算效率,如果故障導致當次計算中斷,大模型會從上個 checkpoint(檢查點)重新啟動計算,當前典型的 checkpoint 間隔一般為 3-4 小時,計算中斷會影響幾個小時訓練,大幅增加計算成本。為了防止網絡中斷導致的訓練中斷,網絡需要具備高可靠傳輸能力,保證智算不中斷,以防智算卡間的協同計算受到影響。敏捷拆建:算力一般采用分時的方式租給不同客戶,不同客戶、不同時間段智算任務的算力需求不同,網絡需要根據算力中心間協同的算卡數量,
46、根據智算任務周期按需建拆并分配不同的帶寬資源。穩定低時延:訓練過程中為保證跨數據中心計算卡之間保持同步,提升通訊穩定性以及保證集群的計算效率,需要保障智算分布式網絡具備穩定低時延能力,DC 之間可采用直達架構,網絡需避免光纜繞遠、避免增加轉發設備以降低網絡時延。算力時代全光運力應用研究報告(2024 年)21 三、全光運力關鍵技術 為滿足大型企業高性能算力、中小企業集中共享算力、家庭用戶靈活算力的應用需求,網絡需要面向不同用戶提供帶寬按需、時延穩定、安全可靠、即用即開的運力,實現算力的按需靈活應用。面向算網時代企業及用戶算力連接需求的全光運力整體架構如圖 8 所示,具備超大帶寬、確定性低時延、
47、高可靠安全、業務動態感知、算網協同控制等能力特征。來源:中國信息通信研究院 圖 8 全光運力解決方案架構圖 全光運力關鍵技術能力特征包括:(一)(一)超大帶寬超大帶寬 面向大數模型訓練的算間協同的大帶寬連接。算力中心間連接的百 T 級別的帶寬需求,高速線路支持單波 400G/800G,可演進支持到家庭算力中心接入企業匯聚核心干線邊緣云算力中心 超大帶寬確定性硬管道安全接入算網協同管控系統全光網絡管控系統算力管控系統按需建立連接動態分配算力算網資源管理算網智能決策算網融合編排多因子算路性能管理故障管理網絡資源管理算力資源管理算力資源調配業務配置管理 業務感知調度 算網協同控制 高可靠安全 確定性
48、承載算力時代全光運力應用研究報告(2024 年)22 1.6T 或更高速率,光層擴展頻譜支持 C+L 波段,80 波 800G 達到單纖 64T 容量,未來可演進達到單纖百 T 容量。來源:中國信息通信研究院 圖 9 超大帶寬連接(二)(二)確定性確定性承載承載 企業、家庭用戶上云后,需要保障多種上云應用與本地化體驗相同,要求網絡提供穩定的帶寬和時延接入算力中心。管道硬隔離:通過 fgOTN、OSU 以及光通道數據單元(ODUk)等技術,為用戶分配專屬固定帶寬,實現物理隔離傳輸,確保云端數據(視頻、數據流)一跳直達用戶終端,打造專屬高速、互不干擾的數據傳輸通道。確定性低時延:考慮云網吧、云游戲
49、類強交互應用,需要穩定時延的管道?;谏鲜鲇补艿栏綦x技術以及智能管控系統的可視化運力時延地圖等技術,提供清晰全面的路徑時延信息,并給客戶提供最優的傳輸路徑,確保數據傳輸的確定性時延。(三)(三)高可靠高可靠安全安全 算力上云后,用戶需要頻繁與算力中心進行數據交互,經過的網絡需要保障數據的可靠傳輸,保障數據傳輸安全,避免被竊取或篡改。多路由保護恢復:網絡光纜故障頻繁發生,且存在光纜同時中斷算力時代全光運力應用研究報告(2024 年)23 的故障情況,在提供網絡保護的基礎上,引入多重路由恢復技術,在網絡發生多處光纜同時故障時,保障業務正常運行。無損傳輸和保護:線路光纜功率波動容易導致誤碼,通過線路
50、側提供前向糾錯(FEC)糾錯能力,把線路傳輸過程中的少量誤碼通過算法糾正到“0”誤碼。光纜故障情況下即使有保護倒換,業務存在瞬態中斷,對高要求的業務,需要提供無損保護技術,在光纜故障發生保護倒換時,實現業務 0 丟包。安全加密:對高安全要求的數據,在傳輸過程中對數據進行加密,引入量子密鑰、國密算法等技術;考慮較多應用需要大帶寬傳輸,加密處理要不影響業務時延,考慮在 L1 層提供物理層加密,實現數據安全可靠傳輸。(四)(四)業務感知業務感知調度調度 面向用戶提供業務及網絡資源的按需使用,滿足用戶低成本訴求。需要對用戶的業務及網絡資源使用狀態進行感知,在此基礎上,通過網絡動態拆建及帶寬彈性調整,為
51、用戶按需分配網絡資源以滿足其服務級別協議(SLA)需求,降低用戶使用成本,提升網絡資源利用率。業務感知:用戶申請使用時,業務接入節點能感知到客戶側業務信息,識別業務類型,判斷業務源宿、帶寬需求、業務可靠性等級,通過控制協議在節點間傳遞業務源宿和網絡節點的關聯關系,通過管控系統決策形成轉發面映射路徑,用于業務動態創建,把不同類型的業務流按需傳輸到對應的算力中心,并能感知停用狀態,通過協議通知概況系統拆除業務。算力時代全光運力應用研究報告(2024 年)24 來源:中國信息通信研究院 圖 10 業務感知流程示意 業務動態拆建:感知到業務請求后,已經有現成管道的,通過調整映射關系把業務映射到現有管道
52、中,直接打通業務,并把新的業務和映射關系通過控制協同傳遞到管控系統。當前無可用管道的,需要根據業務源宿、帶寬、保護等級等 SLA 需求,通過控制協議傳遞到管控系統,管控系統根據分配資源創建滿足要求的業務。用戶使用完成后,自動拆除業務或解除業務映射關系。業務動態創建有時效性要求,業務創建時間需要達到秒級。帶寬彈性調整:部分企業日常百 M 級帶寬即可滿足使用需求,在數據傳輸上云期間,需要較大帶寬。數據傳輸具有周期性,如夜晚上傳為主,需要提前申請大帶寬使用,通過帶寬日歷等方式,定時觸發帶寬調整,到達申請使用的時長后,自動調低帶寬,或數據傳輸完成后,用戶側設備自動發送帶寬調整請求,管控系統根據用戶請求
53、下調帶寬。帶寬調整期間,用戶可能還有其他業務在使用網絡,帶寬調整不能影響網絡正常使用。匯聚核心家庭娛樂辦公/生產業務接入點入算節點算力中心2算力中心1入算節點游戲AI訓練云渲染仿真設計業務感知全光網絡管控系統協議控制基于感知網絡控制算力時代全光運力應用研究報告(2024 年)25(五)(五)算網協同控制算網協同控制 算力和全光運力需要協同工作,實現算力和網絡資源的統一編排、協同調度,提供算網融合的統一服務。算網協同調度:算網管控系統需要實現資源統計、需求決策、業務編排能力。網絡管控系統把網絡的帶寬、時延等數據傳遞到算網管控系統,算力管控系統把算力分布、使用情況、出口帶寬等傳遞到算網管控系統。業
54、務需求到達時,算網管控系統根據業務需求,分析算力需求和網絡需求,根據用戶位置和算力中心位置、業務 SLA 等級,進行資源編排,把編排的網絡需求下發給網絡管控系統進行業務開通,同時傳遞算力需求到算力管理平臺。通過算網管控系統的編排處理,實現算網協同調度。業務使用完后,算網管控系統通知算力管理平臺、網絡管控系統釋放資源。算網融合計費模式:新型應用以算力+運力組合的方式提供應用,需要提供算網融合類產品的新計費方式,需要進行商業模式創新,算網管控系統需要按照用戶需求動態分配算力及網絡資源,并提供計費相關數據信息,把業務及算力資源使用情況和使用時長傳遞到計費系統,計費系統根據使用的算力(算力資源類型、算
55、力資源數量)、網絡(帶寬、時延、保護)等情況,結合使用時長進行計費。四、行業應用案例(一)(一)智慧交通案例智慧交通案例 全光運力升級實現智慧交通網絡快速擴容。廣東省某市交管局引入智能攝像頭后,圖片、視頻數據急劇增長,導致原有千兆網絡滿負算力時代全光運力應用研究報告(2024 年)26 荷運行,網絡資源緊張,亟需實現網絡業務擴容。新方案以光線路終端(OLT)全光接入交叉路口設備,單路口帶寬高達 10Gbps,利用光網絡硬隔離承載多業務,簡化光纖電纜部署,避免路面開槽施工,交付周期縮短 80%。匯聚核心層引入光傳送網(OTN),單波 800Gbps傳輸,單纖 64Tbps,應對未來業務帶來的擴容
56、需求。來源:中國信息通信研究院 圖 11 智慧交通案例 全光運力為用戶帶來全業務承載、專網品質、高效投資多重便利。用一張網承載各部門、各類業務,滿足安全、管理需求。OTN 專網專用,實現高品質、超大帶寬傳輸,滿足系統與業務快速增長要求,避免重復建設對業務的影響,保護投資,同時滿足未來擴容需求。(二)(二)數字云網吧案例數字云網吧案例 全光運力支撐實現算網一體化,為云網吧用戶提供電競級服務。區域1區域2中心局網管數據分析平臺OTN核心環OTN匯聚環OTN匯聚環OLTONUOLTONUOLTONUOLTONU算力時代全光運力應用研究報告(2024 年)27 云網吧模式下,網吧業主不再需要一次性購買
57、電腦終端,網吧所需游戲、視頻等運算過程和內容均在云端完成,網吧側只需配置顯示器、鼠標、鍵盤等輕量資產,可實現快速開店、輕量運維,節能環保,靈活運營,同時依托高性能算力和網絡技術,技術和設備實時更新便捷,有效保障用戶體驗,并實現了網吧經營行為和內容的集中管理。昆明某運營商采用 OTN 專網,結合邊緣算力資源池和算網管控,構建算網融合的端到端解決方案。該方案將網絡從環網升級到 Mesh 組網,用戶從接入機房直接通過 OTN 全光交換到邊緣算力池,形成 1ms 算力時延圈,向用戶提供本地無差異的 2K 高分辨率、240 幀高刷新率的電競級體驗。通過監測每個網吧流量變化,根據流量自動調整帶寬,實現按需
58、分配帶寬能力。采用算網資源統一編排策略,將邊緣算力資源和 OTN 網絡資源進行統一調配,終端上線自動申請業務帶寬,下線同時釋放算力和網絡資源,最大化降低邊際成本。通過分時復用OTN 大網資源,為用戶供給最優性價比的算網一體服務。來源:中國信息通信研究院 圖 12 數字云網吧案例 全光運力助力網吧降低一次性投資成本,提升運營商營收。該方案助力網吧降低一次性的投資成本,運營商從銷售專線到銷售算力網絡,提高營收。通過算力資源的集中池化與智能編排,整合社會分散運營商IDC機房交換機互聯網出口CPU/GPU算力區電競酒店10G網咖10G網絡RTT時延1msinternet算力時代全光運力應用研究報告(2
59、024 年)28 的算力資源,最大化算力資源共享,提升資源利用效率,降低大眾用戶獲取算力的成本,提升算力獲取的便利性,服務算力數字經濟建設。(三)(三)智家云電腦案例智家云電腦案例 全光運力連接家庭和云端算力為家庭用戶提供網吧級體驗。隨著網絡和算力的增強,家庭云電腦逐步走向 2K、60 幀/秒,以及 2K、144 幀/秒以上的體驗,由更清晰的畫質和更流暢的視頻體驗。廣東某運營商基于 OTN 組網,率先開通云游戲試點,實現家寬體驗最小達1ms,推動游戲業務由網吧走向家庭娛樂。方案構建家庭入算/上網雙平面解決方案,高價值業務走 OTN 管道保證品質,上網業務走家寬通道,兩條管道互不影響。接口速率方
60、面,60 幀和 144 幀場景均使用OSU 的 10GE 口。承載方案方面,ONT 采用雙廣域網(WAN)口分流,接入端采用無源光網絡(PON)軟切片,OLT 和城域 OTN 采用10GE 對接,新增云游戲、Cloud VR 業務入云管道采用 OTN 網絡承載,保障端到端穩定低時延。來源:中國信息通信研究院 圖 13 智家云電腦案例 為家庭用戶帶來高品質娛樂體驗,提升運營商營收。方案將云網運營商GPU機房云游戲業務路由器交換機互聯網出口GPU算力區存儲區云管理中心internet家庭云游戲家庭Cloud VROTN網絡OTN設備算力時代全光運力應用研究報告(2024 年)29 吧算力資源同家庭
61、云游戲、Cloud VR 場景進行算力資源池共享,過本地瘦終端+云端算力服務,降低用戶上云入算成本,增強用戶家庭娛樂體驗。同時提升業務每用戶平均收入(ARPU)值,拓展用戶數量,增加運營商收益。(四)(四)智算拉遠案例智算拉遠案例 全光運力實現三地智算中心 800G 互聯。因算力設施規劃規模有限,人口密集地區的單體智算中心的算力、空間、供電等資源有限。業界提出分布式智算集群方案,為解決將物理上分散的智算資源整合成一個智算集群。方案于 2024 年在北京三地之間通過 800G C+L 超高速波分互聯三個相距百公里的 AI DC,實現全光直達。為保證大模型訓練的穩定和算效,網絡需要彈性能力,實現網
62、絡匹配算力分時復用的能力,并具備任意二次斷纖容量不下降的能力。在線路光纖性能劣化后,自動預警鏈路故障,并自動優化,保證傳輸鏈路的穩定,保障智算拉遠訓練時高可用。來源:中國信息通信研究院 圖 14 智算拉遠案例 分布式訓練集群解決算力互聯及資源整合問題,幫助用戶部署大型智算集群。通過 800G C+L 實現智算集群的超大帶寬互聯,降低單智算C智算A智算B800G C+L算力時代全光運力應用研究報告(2024 年)30 比特成本,網絡提供波長級動態拆建能力,匹配算力需求,實現帶寬隨卡數分時復用,同時DC之間采用一跳直達架構,無中間轉發設備,實現穩定低時延,保持計算效率的穩定。實測結果顯示,在百公里
63、互聯范圍內,分布式智算集群的性能下降在 5%以內,符合理論分析,可通過超大帶寬的互聯解決電力及資源聚合的難題。五、總結與展望 隨著產業數字化轉型的推進、基于 AI 的各類數字化應用的蓬勃發展等,企業和家庭用戶的算力需求持續增長,不同垂直行業的應用場景向網絡提出大帶寬、高可靠、低時延、安全加密,以及基于業務感知的連接靈活拆建等差異化承載需求。為實現大型企業品質聯算、中小企業靈活用算、家庭用戶便捷入算,全光運力需要面向不同用戶,提供帶寬按需、時延穩定、安全可靠、即用即開的能力,支撐實現算力的按需靈活調度。算力時代下的全光運力將向超大帶寬、確定性承載、高可靠安全、業務感知控制、算網協同控制等技術特征發展演進。立足算力產業發展時機,聚焦算力時代下的全光運力應用發展,建議產業各方繼續在關鍵技術研發攻關、行業應用場景挖掘、業務及應用模式創新等方面協同推進,逐步構建面向各類垂直行業及家庭用戶差異化聯算需求的高品質全光運力,助力培育新質生產力,賦能數字經濟高質量發展!中國信息通信研究院中國信息通信研究院技術與標準研究所技術與標準研究所 地址:北京市海淀區花園北路地址:北京市海淀區花園北路 52 號號 郵編:郵編:100191 電話:電話:010-62300112 傳真:傳真:010-62300123 網址:網址: