《CXL互連技術應用探索.pdf》由會員分享,可在線閱讀,更多相關《CXL互連技術應用探索.pdf(19頁珍藏版)》請在三個皮匠報告上搜索。
1、CXL互連技術應用探索作者簡介:梁永貴,架構設計與技術規劃專家,創新技術研發總工程師目錄 CXL互連技術介紹 CXL互連技術應用探索 CXL互連技術展望3I/O近年來的兩大新星:Chiplet和CXLCXL互連為不同芯片間提供通信和數據傳輸 提供更高的通信帶寬和更低的延遲,提高系統性能 支持高速互連和共享內存,實現工作協同和數據共享 提供靈活的拓撲結構和可擴展性,實現資源解耦Chiplet技術解決單芯片面臨的挑戰 提高芯片設計和制造的靈活性和效率 提高芯片系統的可擴展性和可升級性 降低芯片開發成本UCIeRetimerCXL Switch DieUCIeRetimerUCIeRetimerOf
2、f-package Interconnect to CXL SwitchUCIeRetimer4CXL互連技術:2028年CXL技術將開拓新興千億市場2022-2028 CXL內存硬件外設市場收入預測5CXL互連技術:支持處理器擴展加速器和內存設備TYPE 1:加速器(帶cache)CPUDDRDDRCXL協議:CXL.io CXL.cache應用加速器網卡Cache高性能智能網卡NIC atomicTYPE 2:加速器(帶內存)CPUDDRDDRCXL協議:CXL.io CXL.cache CXL.memory應用加速器網卡CacheGPU高密計算HBMHBMTYPE 3:內存擴展設備CPU
3、DDRDDRCXL協議:CXL.io CXL.memory應用Memory Buffer內存帶寬擴展內存容量擴展SCM擴展MemoryMemoryMemoryMemory6CXL互連技術:解決內存與CPU耦合、容量和帶寬受CPU管腳限制的問題CXLControllerHostHost突破CPU管腳對內存限制,解決隨CPU核數增長,每核可用內存下降問題CPU 核數變化趨勢 vs 單核內存變化趨勢(來源:Software Defined Memory:A Meta perspective,OCP Global Summit,2021)7CXL互連技術:CXL內存時延可接受,與NUMA內存時延相當H
4、DDHDDSSDSSDRDMA RDMA NVMNVMCacheCacheMain Main MemoryMemoryRegRegCXLCXL-MemoryMemoryHDDHDDSSDSSDRDMA RDMA NVMNVMCacheCacheMain Main MemoryMemoryRegRegNUMANUMA-MemoryMemory訪問時延0.2ns1-40ns80-140ns170-250ns300-400ns2-4s10-40s10ms180-200ns8CXL互連技術:推進全新服務器架構,突破內存墻,I/O墻CPUCPUDIMMDIMMGPUPCIePCIeDIMMDIMMGPU
5、主板傳統服務器架構 內存/存儲/加速器與CPU緊耦合 通過網絡實現資源間互通互訪 配置固定,調整空間小基于CXL的服務器架構 內存/存儲/加速器與CPU解耦 有利于資源模塊化設計 資源配置可共享異構算力池CPUCXLDIMMCPUCXLCPUCXLCXL SwitchCXLCXLCXLCXLCXL SwitchCXLCXLCXLFabricCXLCXLCXLGPUMXCDDRMXCDDR主板主板GPU內存池DIMMCPU主板通用算力池9CXL互連技術:內存應用技術發展趨勢2H23 to 1H241H24 to 1H252H25 to 26+單節點內存容量擴展單節點內存帶寬擴展CXL 1.1多節
6、點內存池化(機柜內,DC內)CXL 2.0(標準協議僅支持到內存池化)CXL 2.0+(多節點內存共享)多節點內存網絡(DC內,跨DC)靈活、極強的擴展性CXL 3.0內存與CPU解耦內存與服務器解耦內存與網絡解耦(池化&共享)單節點內存擴展內存池化內存&數據共享10CXL互連技術:內存擴展解決方案CXL Memory Device讀時延(ns)帶寬(GB/s)GCCICCLocal CXL DDR524526017.524.1Remote CXL DDR546047517.416.8Local CXL DDR422523612.813.8Remote CXL DDR442243212.513
7、.2CXL內存擴展基礎性能參考CXL內存擴展卡原型可支持DDR4、DDR5可支持4 DIMM Slots單卡最大內存容量可達1TB支持NUMA Node模式支持FW升級擴展卡置于CPU直連內存之上,不改造服務器、不占面板空間、內存規格提升明顯11CXL互連技術:內存擴展解決方案32 X DIMM Slots to 48 x DIMM SlotsCXL Enabledhttps:/ TB8臺服務器總內存:8 TB單服務器內存:512GB8臺服務器總內存:4TB(8*512GB)JBOM內存:3 TB內存合計:7 TB(節省 12.5%)計算節點集群計算節點集群JBOM通過CXL互連技術進行內存池
8、化,提升機柜內內存利用率,降低內存成本CXL線纜單機高配置內存,適應業務擴展需求內存受物理機箱限制,無法共享內存空閑率40%以上,存在資源浪費單機無需高配內存,通過CXL內存池彈性分配來滿足業務擴展需求配置內存總量減少,內存利用率提升10%以上單機通過彈性分配可獲取更大的內存16CXL互連技術應用探索:機柜間共享CXL內存,提升HPC集群業務性能計算節點CXL線纜(光)加速節點胖節點CXL內存池胖節點更”胖”:擴展節點內存容量及帶寬,使胖節點算力更強。消除Checkpoint IO瓶頸:將計算過程Checkpoints保存在共享CXL內存池中,消除IO瓶頸,當發生錯誤時可快速恢復內存共享實現高
9、性能數據傳輸:節點間大數據傳輸時,直接將本節點內存切換掛給對端節點,毫秒級完成TB級數據傳遞17CXL互連技術展望:以內存為中心的DC創新架構傳統數據中心構架:“IO墻”,“內存墻”,“功耗墻”問題內存/存儲/加速器與CPU緊耦合配置固定,調整空間小,擴展、維護成本高資源利用難均衡,閑置、浪費情況嚴重下一代數據中心構架:資源模塊化設計,異構算力,存儲資源,內存資源全部池化資源配置靈活,可調整可共享,按需分配高利用率,擴展靈活易維護CXL FabricMemoryCPU PoolxPU Poolstoragestorage18道阻且長,行則將至!Question?Copyright2021 xF
10、usion Digital Technologies Co.,Ltd.All Rights Reserved.The information in this document may contain predictive statements including,without limitation,statements regarding the future financial and operating results,future product portfolio,new technology,etc.There are a number of factors that could
11、cause actual results and developments to differ materially from those expressed or implied in the predictive statements.Therefore,such information is provided for reference purpose only and constitutes neither an offer nor an acceptance.xFusionmay change the information at any time without notice.讓數字世界無限可能Fusion X,Digital InfinityThank you.