《賽迪:2021中國DPU行業發展白皮書(35頁).pdf》由會員分享,可在線閱讀,更多相關《賽迪:2021中國DPU行業發展白皮書(35頁).pdf(35頁珍藏版)》請在三個皮匠報告上搜索。
1、中國DPU行業發展白皮書顧問股份有限公司 2021前言伴隨著數據中心的高速發展,通信能力和計算能力成為數據中心基礎設施中的兩個重要的發展方向。隨著網絡傳輸帶寬的增加,數據中心的計算資源被愈加復雜的基礎設施操作所占據,使得業務處理遭遇瓶頸。DPU的提出背景就是應對數據中心的數據量和復雜性的指數級增長帶來的性能瓶頸。DPU對數據中心來說,是通過更明細的分工來實現效率的提升、實現總體系統的成本最優化。本白皮書內容共分4章內容,包括智能網卡的簡介及趨勢分析、DPU的簡介及分析、DPU產業分析及NVIDIA的DPU前景展望等。第一章為智能網卡的簡介及趨勢分析。該章節介紹了智能網卡的發展背景,并與通用網卡
2、的框架做對比,介紹了網卡及智能網卡的技術差別,對比了各種智能網卡不同實現的技術要點,分析了智能網卡發展的優劣勢,引出了DPU在數據中心的發展。第二章為DPU的簡介及分析,介紹了DPU的發展背景和DPU的定義,對DPU介紹并分析了其優勢和未來技術發展路徑。并從NVIDIA BlueField-3 DPU產品技術特點、產業定位分析、技術優勢分析、和技術對比等方面綜合介紹了NVIDIA BlueField-3 DPU產品技術情況。第三章為DPU的產業宏觀分析,分別列舉出目前市場上主流產品的產品技術特點,分析了DPU行業的市場競爭格局,概述了DPU應用市場的發展現狀,研究了DPU行業的發展趨勢,展望了
3、數據中心的未來前景。第四章為NVIDIA DPU的前景分析,從結構通用化、功能多樣化、應用廣泛化,場景豐富化四個方面對NVIDIA DPU的前景進行了相關分析與展望。一、智能網卡簡介和趨勢分析1(一)智能網卡發展背景及技術簡介 11.智能網卡發展背景 12.網卡及智能網卡技術簡介 1(二)智能網卡的優劣勢分析 5二、DPU簡介及分析 7(一)DPU發展背景與定義 71.DPU發展背景 72.DPU定義及綜述 7(二)DPU優勢及發展趨勢分析 81.DPU優勢分析 82.DPU技術發展趨勢分析 9(三)NVIDIA BlueField-3 DPU產品定位及優勢分析 101.BlueField-3
4、 DPU產品簡介 102.BlueField-3 DPU技術特點 123.BlueField-3 DPU產業地位分析 134.BlueField-3 DPU優勢分析 13(四)NVIDIA BlueField-3 DPU技術分析和技術對比 151.BlueField-3 DPU技術分析 152.智能網卡及DPU分析 19三、DPU產業分析 21(一)DPU產業宏觀分析 211.DPU產業分析 212.DPU競爭格局 21(二)DPU產業現狀與趨勢 251.DPU產業發展現狀 252.DPU產業發展趨勢 26四、DPU前景分析 28目錄圖1 網卡架構示意圖 1圖2 智能網卡架構示意圖 2圖3 智
5、能網卡不同技術實現示意圖 2圖4 智能網卡與DPU架構示意圖 6圖5 DPU產品示意圖 7圖6 DPU實現業務與基礎設施的操作分離 8圖7 OpenShift部署DPU前后性能對比 9圖8 DPU和網絡計算成為以數據為中心計算架構的核心 10圖9 NVIDIA DPU產品發展路線圖 11圖10 BlueField-3 DPU產品示意圖 11圖11 NVIDIA DOCA軟件開發包 12圖12 BlueField-3 DPU實現無阻塞通信后的性能表現實例 14圖13 NVIDIA DOCA軟件棧 15圖14 BlueField-3 DPU總體架構 16圖15 RDMA技術通過遠程直接內存訪問實現
6、低延遲 17圖16 GPU-Direct RDMA技術示意圖 17圖17 英特爾IPU概念圖 24圖18 OCTEON 10系列DPU架構 25圖19 全球DPU市場規模 26圖20 中國DPU市場規模 27表1 智能網卡不同技術實現參數對比 3表2 網卡與智能網卡性能參數對比 3表3 BlueField DPU系列的優勢 10表4 BlueField-3 DPU解決網絡高速傳輸數據安全瓶頸 13表5 BlueField-2和BlueField-3 DPU技術指標對比 14表6 智能網卡和DPU對比分析 20表7 DPU競爭格局 22圖目錄表目錄2021中國DPU行業發展白皮書1(一)智能網卡
7、發展背景及技術簡介 1、智能網卡發展背景網卡(Network Interface Card,簡稱NIC)是將電腦接入局域網的設備,網卡插在計算機主板的總線插槽中,負責將用戶要傳遞的數據轉換為網絡設備能夠識別的格式,通過網絡介質傳輸。智能網卡(Smart NIC),也稱智能網絡適配器,除了能完成標準網卡所具有的網絡傳輸功能之外,還提供內置的可編程、可配置的硬件加速引擎,提升應用的性能和大幅降低CPU在通信中的消耗,為應用提供更多的CPU資源。例如,在高度虛擬化的環境中,主機CPU需要運行OVS(Open Virtual Switch)相關任務,同時CPU還要處理存儲、數據包的在線加解密或離線加解
8、密、數據包深度檢查、防火墻、復雜路由等操作,這些操作不僅消耗大量的CPU資源,同時由于不同業務之間的CPU資源爭奪,導致業務的性能不能發揮到最佳。網卡作為連接各種業務的樞紐,在網卡上對于上述業務進行加速,成為了最理想的場所。智能網卡的出現,為解決這個問題提供了新的思路,我們可以通過智能網卡來將OVS操作從CPU卸載下來,并完成存儲加速、數據加密、深度包檢測和復雜路由等各種功能,將花費在處理這些工作負載上的大量的CPU周期返回給主機CPU,同時解決了不同業務之間的沖突問題,大幅提升了各項業務的性能,也確保了服務器CPU能為應用提供最大的處理能力或者提供更多的虛擬機(VM)服務,創造更大的價值。
9、2、網卡及智能網卡技術簡介(1)網卡架構技術特點網卡的架構如圖所示,一個典型的NIC由一個處理網絡流量的處理器、一對處理數據移動的DMA引擎和一個用于緩沖區和Doorbell的本地存儲器(通常是RAM)組成。一、智能網卡簡介和趨勢分析網卡架構示意圖圖1數據來源:ISLPED03, 顧問整理 2021,112(2)智能網卡架構技術特點智能網卡是具有獨立的計算單元,能完成特定的基礎設施功能操作的網卡,如智能網卡可完成特定的重組加速、安全加速等操作,相對于普通網卡可以帶來較大的性能提升。智能網卡上的可編程ASIC或FPGA單元有可以運行自定義軟件的計算層,計算層可以為網絡流量提供服務,并可以執行特定
10、網絡及數據中心基礎設施功能,還為外部網絡和服務器OS之間提供了額外的安全層(也就是將安全保障由ToR交換機轉移向了該設備)。智能網卡簡介和趨勢分析(3)各種智能網卡實現的技術要點對比目前的智能網卡有ASIC、FPGA和片上系統(SoC)三種實現。智能網卡不同技術實現示意圖智能網卡架構示意圖圖2圖3數據來源:公開資料, 顧問整理 2021,11數據來源:Vmware官網,顧問整理 2021,112021中國DPU行業發展白皮書3(4)網卡與智能網卡的性能對比(如表2所示)不同實現方式的智能網卡在成本、編程的簡易性和靈活性方面存在各種權衡。ASIC非常具有成本效益,可以提供最佳的性價比,但它的靈活
11、性受ASIC中定義的功能的限制?;贔PGA智能網卡則可以在可用邏輯門約束范圍內,花費足夠的時間和成本來相對有效地支持幾乎任何功能。但FPGA編程簡易性較差且價格昂貴。對于更復雜的、更廣泛的用例,基于SoC(如NVIDIA的BlueField DPU)提供了最佳的智能網卡實施選項:良好的性價比、易于編程且高度靈活。智能網卡不同技術實現參數對比表1網卡與智能網卡性能參數對比表2數據來源:顧問 2021,11ASICFPGASoC性價比高低中易編程度中低高靈活性低中高功耗低高中能力Capability加速工作負載Workloads Accelerated網卡NIC智能網卡Smart NIC入門級虛
12、擬化與數據移動Entry Level Virtualization and Data MovementTCP/IP 加速TCP/IP Acceleration企業工作負載Enterprise workloads虛擬化NIC (SR-IOV)NIC Virtualization (SR-IOV)企業工作負載Enterprise workloads網絡虛擬化Network Virtualization (VXLAN)多租戶工作負載Multi-tenant workloads 數據傳輸加速和可編程數據面Data Transport Acceleration & Programmable Da
13、ta PlaneRoCE 加速RoCE Acceleration虛擬機、存儲、大數據、人工智能/機器學習VM, Storage, Big Data, Al/ML 4數據平面開發套件DPDK虛擬化網絡功能Virtualized Network Functions Spark加速Spark Acceleration大數據Big Data NVMe-oF存儲NVMe-over-Fabrics Storage(NVMe-oF)存儲Storage OVS硬件加速OVS Hardware Acceleration高效、可擴展的虛擬化應用程序Efficient, Scalable Virtualized A
14、ppsQoS 和 ACL 加速QoS and ACL Acceleration網絡服務器/內容分發網絡Web Servers/ Content Distribution Networks流量監控/報告Flow monitoring/reporting可視性、網絡數據包代理、IBNVisibility, Network Packet Broker, IBN 流匹配/動作引擎Flow match/action engine軟件定義網絡Software Defined Networking完全可編程數據面Fully Programmable Data Plane網絡功能虛擬化Network Func
15、tion Virtualization ASAP2 虛擬交換/路由ASAP2 Virtual Switching/RoutingNAT、負載均衡、無狀態防火墻NAT, Load Balancing, stateless fire-wall 智能網絡和虛擬化Smart Networking & Virtualization虛擬交換政策引擎Virtual Switch Policy EngineOVS控制面OVS Control Plane(*)分析引擎Analytics engineDPI網絡監控與診斷DPI, Network Monitoring and Diag-nostics (*
16、)容器加速Container Acceleration多樣(AI/ML,大數據,分析)Various (AI/ML, Big Data, Analytics)(*)智能云虛擬化Smart Cloud Virtualization服務器分解與資源共享Server Disaggregation & Resource Sharing安全、壓縮、網絡功能虛擬化、存儲Security, Compression, Network Function Virtualization, Storage公鑰加密、RNGPublic Key Crypto, RNG認證、密鑰交換Authentication,
17、Key Exchange 故障域隔離/HAFault Domain Isolation/HA裸金屬云Bare Metal Cloud智能網卡簡介和趨勢分析2021中國DPU行業發展白皮書5數據來源:公開資料,顧問整理 2021,11(*)該功能FPGA型的智能網卡不具備,DPU具備(*)該功能ASIC型的智能網卡不具備,DPU具備IP/ACL狀態防火墻Stateful IP/ACL filtering過濾負載均衡IPD/IDS/UTM Load Balancing IPD/IDS/UTM存儲:哈希、ECC、壓縮Storage: Hashing, ECC, Com-pression除編碼、精簡配
18、置、重復數據刪除Erasure Coding, Thin Provisioning, Dedup加密/解密Encryption/Decryption靜態/動態數據Data at Rest or on-the-fly安全VNF卸載Security VNF Offloading防火墻、IDS、IPS、反惡意軟件、防DDosFirewall, IDS, IPS, Anti-malware, An-ti-DDos (二)智能網卡的優劣勢分析智能網卡為數據中心網絡提供了幾項重要優勢,包括:1) 對于運營大型數據中心的公共云服務提供商而言,智能網卡可以釋放CPU核來為最終用戶運行業務應用程序,從而可能實現
19、更高的服務器利用率。2) 各種基礎設施操作卸載。例如RDMA融合以太網(RoCE)、傳輸控制協議(TCP)、NVMe-oF(NVMe-over-Fabrics)、互聯網安全協議(IPSec)、安全傳輸層協議(TLS)、深度報文檢測(DPI)、OVS(Open Virtual Switch)等。3) 某些類別的智能網卡是可編程的,可以針對廣泛的應用程序進行定制,并且可以重新組裝以滿足新的要求。智能網卡并非沒有缺點,在智能網卡被更廣泛的采用之前,需要解決以下問題:1) 與標準網卡相比,智能網卡的價格顯著溢價??紤]到相同的端口速度,溢價可能會影響智能網卡的普及,尤其是在批量生產時需要降低價格。2)
20、智能網卡的功耗較普通網卡高,一般20W80W,隨著更多功能的集成,功耗也會越來越高。3) 鑒于智能網卡上支持的功能越來越多,其可編程性和復雜性也越來越高,它們可能會消耗大量工程資源來進行開發和調試,從而導致實施時間長且成本高?;谝陨峡紤],主要的云服務提供商和網卡供應商已經基于不同的解決方案開發了智能網卡:基于ARM的SoC、FPGA和定制ASIC。這些解決方案中的每一個都提供不同程度的卸載和可編程性, 本文中將會對于不同的實現進行對比。在智能網卡發展的過程中,NVIDIA將智能網卡升級為DPU(Data Processing Unit)。DPU延續了智能網卡的基本功能,并將通用工作任務做了加
21、速處理。如圖4所示,相比智能網卡在數據層面上實現加速,DPU的最大的區別是能在實現智能網卡的功能的基礎之上實現控制面的加速。6智能網卡與DPU架構示意圖圖4數據來源:NVIDIA官網,顧問整理 2021,11智能網卡簡介和趨勢分析2021中國DPU行業發展白皮書7DPU產品示意圖圖5數據來源:NVIDIA官網, 顧問整理 2021,11(一)DPU發展背景與定義 1、DPU發展背景隨著數據中心的高速發展,通信能力和計算能力成為數據中心基礎設施的相輔相成的兩個重要發展方向。若數據中心僅關注計算能力的提升,通信基礎設施的提升跟不上,那么數據中心的整體系統性能依然受限,無法發揮出真正的潛力。DPU的
22、提出背景就是應對這些數據量和復雜性的指數級增長。未來,需要將計算移至接近數據的位置,這是目前業界所公認的以數據為中心的體系結構下的創新。綜上,DPU對數據中心來說,是通過更明細的分工來實現效率的提升、實現總體系統的成本最優化。 2、DPU定義及綜述二、DPU簡介及分析DPU(Data Processing Unit)市場仍處于百家爭鳴的早期發展階段,各家廠商定義略有不同。目前市場上主流的DPU定義是NVIDIA提出的,即DPU是集數據中心基礎架構于芯片的通用處理器。它結合了:1) 行業標準的、高性能及軟件可編程的多核CPU,通?;谝褢脧V泛的ARM架構,與其它的SoC組件密切配合。2) 高性
23、能網絡接口,能以線速或網絡中的可用速度解析、處理數據,并高效地將數據傳輸到GPU和CPU。8DPU實現業務與基礎設施的操作分離圖6數據來源:NVIDIA官網,顧問整理 2021,113) 各種靈活和可編程的加速引擎,可以卸載AI、機器學習、安全、電信和存儲等應用,并提升性能。4) 具備開放性集成功能,未來支持更多功能集成。例如NVIDIA計劃未來在Bluefield-4產品中,將GPU集成至DPU中以完成數據中心的架構的終極整合。5) NVIDIA DPU的軟件開發包DOCA,提供了統一的面向各種應用的編程接口,讓用戶可以不用關注DPU的底層硬件接口而直接對硬件進行編程。DPU的出現實現了以數
24、據為中心的業務和基礎設施操作的分離,大幅降低了業務的長尾延時,對于實現安全的、裸性能的、云原生的下一代大規模計算至關重要。(二)DPU優勢及發展趨勢分析 1、DPU優勢分析(1)DPU實現了業務與基礎設施的操作分離DPU將基礎設施任務從CPU轉移至DPU,釋放CPU的資源,使更多的服務器CPU核可用于運行應用程序,完成業務計算,從而提高服務器和數據中心的效率。如通過在DPU上運行OVS,使業務域和基礎設施域分離,實現VM和VM間的高效安全通信,如圖6所示,傳統應用場景中會使用CPU來執行OVS操作,其效率較低,消耗CPU核較多,且VM之間的通訊延時較長。Red Hat在部署了DPU后,用DPU
25、來執行同樣的OVS操作,其效率大幅提升,幾乎不消耗CPU核,VM之間的通訊延時也得到了大幅縮減,大幅減少了長尾延時,從而提升了應用的性能。(2)DPU卸載網絡數據實現性能提升DPU針對云原生環境進行了優化,提供數據中心級的軟件定義和硬件加速的網絡、存儲、安全和管理等服務。如圖7所示,紅帽Red Hat的容器化云平臺即服務(PaaS)OpenShift上,借助DPU優化數據中心資源利用率,將網絡相關的數據處理(如VxLan和IPSec等)卸載到DPU加速執行,在25Gb/s網絡條件下,OpenShift部署DPU用來加速,可以只用1/3的CPU占用了來達到25Gb/s性能,而在100Gb/s網絡
26、條件下,未部署DPU的場景將達不到100Gb/s網絡線速,DPU可以帶來10倍的性能優勢。DPU簡介及分析2021中國DPU行業發展白皮書9OpenShift部署DPU前后性能對比圖7數據來源:Red Hat官網,顧問整理 2021,11(3)DPU可以提供零信任安全保護零信任(Zero Trust)是一種以安全性為中心的模型,其基于以下思想:企業不應對其內外的任何事物授予默認信任選項。零信任可以減少數據泄露、拒絕未授權的訪問,因此在數據安全方面價值巨大。DPU可以為企業提供零信任保護,通過將控制平面由主機下放到了DPU,實現主機業務和控制平面的完全隔離,數據將無法進行穿透,保證安全性。DPU
27、的出現相當于為每個服務器配備了一臺“計算機前的計算機”以提供獨立、安全的基礎設施服務,并與服務器應用域安全隔離。如果主機遭受入侵,安全控制代理與被入侵主機之間的DPU隔離層可防止攻擊擴散至整個數據中心。這樣DPU就解決了企業不愿直接在計算平臺上部署安全代理的情況。通過在完全隔離于應用程序域的DPU上部署安全代理,企業不僅能獲得對應用程序工作負載的可見性,還能在其基礎設施中執行一致的安全策略。(4)DPU助力實現“算存分離”DPU的BlueField SNAP技術方案通過在服務器系統的數據入口處引入計算資源,在DPU上獨立實現面對應用需求的存儲方案,幫助存儲廠商在數據中心中低成本地靈活部署、升級
28、高級存儲協議,而完全不需要對現有軟件棧進行任何更改。存儲廠商可以把自家團隊為各行業應用開發的開放系統的直連式存儲(DAS)、縱向擴展(Scale-UP)、橫向擴展(Scale-OUT)、超融合架構(Hyperconverged)等存儲解決方案,零開銷地推廣到各個應用領域的現有業務處理平臺和數據中心基礎架構中,而所有的安全加密、數據壓縮、負載均衡等復雜又必須的功能則完全由DPU透明地卸載。存儲行業的革新算法和實現,可以在DPU架構中,獨立于服務器操作系統進行部署。DPU技術幫助存儲廠商實現真正的“算存分離”,完全發揮自家產品的技術優勢,打通最高效服務應用需求的通路。 2.DPU技術發展趨勢分析目
29、前DPU以數據為中心作為計算架構,能針對數據中心的安全、網絡、存儲、AI、HPC等業務進行加速。從DPU概念的提出者NVIDIA的現有技術發展趨勢來看,未來的技術發展趨勢將會是高度集成化的片上數據中心的模式(Data Center Infrastructure on a chip),即一個GPU、CPU、DPU共存的時代。NVIDIA布局的數據中心從核心到邊緣(Edge)都采用了統一的一個計算架構CPU、GPU、DPU,如圖所示,形成了“3U”一體架構。3U一體的統一計算單元架構將會讓管理程序、調度程序都會變得非常容易。通過CPU、GPU、DPU之間的協調計算,可以在數據中心和邊緣端都可以達到
30、高性能與高安全性。10DPU和網絡計算成為以數據為中心計算架構的核心圖8數據來源:NVIDIA官網, 顧問整理 2021,11(三)NVIDIA BlueField-3 DPU產品定位及優勢分析 1、BlueField-3 DPU產品簡介現代超大規模云技術推動數據中心走向了新的架構,利用一種專門針對數據中心基礎架構軟件而設計的新型處理器,來卸載和加速由虛擬化、網絡、存儲、安全和其它云原生AI服務產生的巨大計算負荷,這種產品即BlueField DPU系列。NVIDIA 創始人兼首席執行官黃仁勛表示:“現代超大規模云正在推動數據中心的新架構。需要一種旨在處理數據中心基礎設施軟件的新型處理器來卸載
31、和加速虛擬化、網絡、存儲、安全和其它云原生AI服務的巨大計算負載。BlueField DPU的時代已經到來?!比绫?所示,BlueField DPU系列產品優勢有:從外圍設備到服務器都具備安全性、適用不斷擴展的工作負載的數據存儲、高性能且高效的網絡、軟件定義的基礎架構等。圖1BlueFieldDPU系列的優勢表3特點優勢詳情安全性從設備到數據皆安全無虞BlueField DPU支持零信任的全方位安全架構,其安全性覆蓋范圍從硬件設備到數據傳輸,再到惡意攻擊的安全加速引擎,確保從內到外的防護??蓴U展性適用不斷擴展的工作負載的數據計算與存儲借助于對NVMe over Fabrics SNAP(NVM
32、e-Of SNAP),GPUDirect Storage(存儲)、加密(Encryption)、彈性存儲(Elastic Storage)、數據完整性(Data Integrity)、壓縮(Decompression)和重復數據刪除(Deduplication)的支持,BlueField可提供高性能存儲訪問,而其遠程存儲延遲可媲美直連式存儲。DPU簡介及分析數據中心的變革已經來臨數據中心成為了新的計算單元GPU Accelerates AI & Machine LearningEvery workload will become accelerated AIDPU Accelerate
33、s Data Intensive TasksNetworking, Security, StorageData Processing UnitAI & MLAcceleratedComputing Software-Defined, Hardware-AcceleratedGPUDPUCPU2021中國DPU行業發展白皮書11數據來源:NVIDIA官網, 顧問整理 2021,11NVIDIADPU產品發展路線圖圖9數據來源:NVIDIA官網, 顧問整理 2021,11網絡性能高性能且高效的網絡BlueField是一款強大的數據中心服務加速器,可為傳統應用程序和現代GPU加速的應用程序提
34、供高達400Gb/s的以太網和InfiniBand的帶寬,同時釋放主機CPU核心以運行其它的應用程序??砷_發性軟件定義的基礎架構借助NVIDIA DOCA軟件開發套件(SDK),開發者可以不必考慮DPU底層的硬件加速接口,直接利用行業標準API輕松創建軟件定義的高性能云原生DPU加速服務。NVIDIA DPU 路線圖芯片級可編程數據中基礎架構BlueField-4 DPUArm CPU ComputingA100 GPU Accelerated ComputingInfiniBand/Ethernet/PCIe NetworkComputing/Storage/Security Framewo
35、rkData Acceleration2020 2022 1X10X100XBlueField-27B Transistors9 SPECint*0.7 TOPS200 Gbps BlueField-322B Transistors42 SPECint*1.5 TOPS400 GbpsBlueField-464B Transistors160 SPECint*1000 TOPS800 Gbps2024 DOCA ONE DEVELOPMENT ARCHITECTURE* SPECint2k17-rateBlueField-3DPU產品示意圖圖10數據來源:NVIDIA官網, 顧問整理 2021
36、,115關于 NVIDIA BLUEFIELD-3 DPU首款 400Gb/s 速度的DPU22B transistors400Gb/s Ethernet & InfiniBand Connectivity400Gb/s Crypto Acceleration16 ARM CPU Cores300 Equivalent x86 Cores18M IOP/s Elastic Block Storage12NVIDIADOCA軟件開發包圖11數據來源:NVIDIA官網, 顧問整理 2021,11NVIDIA的BlueField DPU產品發展路線圖如圖所示,包括了已有的二代產品BlueFi
37、eld-2,目前即將面世的首款達400Gb/s速度的BlueField-3 DPU,以及未來整合了NVIDIA GPU功能,可達800Gb/s的BlueField-4 DPU。BlueField-3 DPU是首款達400Gb/s為AI和加速計算而設計的DPU,助力各企業在任何規模的應用上都能實現業內領先的性能和數據中心的安全性。一個BlueField-3 DPU所提供的數據中心服務可相當于多達300個CPU核才能實現的服務,從而釋放寶貴的CPU資源來運行關鍵業務應用。這款DPU針對多租戶、云原生環境進行了優化,提供數據中心級的軟件定義和硬件加速的網絡、存儲、安全和管理等服務。 2、BlueFi
38、eld-3 DPU技術特點BlueField-3 DPU可以從業務應用中將數據中心的基礎設施服務卸載和隔離出來,實現了由傳統基礎設施到現代基于“零信任”環境的轉型,可對數據中心的每個用戶進行身份認證,保障了企業從云到核心數據中心,再到邊緣的安全性,同時在效率和性能上有了更大的提升。BlueField-3 DPU是首款支持第五代PCIe總線并提供數據中心時間同步加速的DPU。BlueField-3 DPU可為NVIDIA的基于AI技術的網絡安全平臺,Morpheus提供實時的網絡可視化、網絡威脅的檢測與響應、以及監控、遙測和代理服務。BlueField-3 DPU將傳統計算環境轉變為安全且加速的
39、虛擬私有云,使組織能夠在安全的多租戶環境中運行應用程序。BlueField-3 DPU采用NVIDIA的網絡計算技術,支持下一代超級計算平臺,提供最佳裸機性能和對多節點租戶隔離的原生支持。DPU簡介及分析15NVIDIA DOCA 軟件開發包Software Development Framework for BlueField DPUsOffload, Accelerate, and Isolate Infrastructure ProcessingSupport for Hyperscale, Enterprise, Supercomputing and Hyperconverged In
40、frastructureSoftware Compatibility for Generations of BlueField DPUsDOCA is for DPUs what CUDA is for GPUs助力BlueField合作生態系統CYBER SECURITY EDGESTORAGEPLATFORMINFRASTRUCTUREORCHESTRATIONMANAGEMENTTELEMETRYSECURITYNETWORKINGSTORAGEACCELERATION LIBRARIESDOCA2021中國DPU行業發展白皮書13BlueField-3 DPU利用NVIDIA DOCA
41、1.1 軟件開發包的優勢,為開發者提供一個完整、開放的軟件平臺,開發者在BlueField DPU上開發軟件定義和硬件加速的網絡、存儲、安全和管理等應用。DOCA包含利用BlueField DPU來創建、編譯和優化應用的運行時環境,用于配置、升級和監控整個數據中心數千個DPU的編排工具,以及各種庫、API和日益增加的各種應用,如深度數據包檢測和負載均衡等。每一代BlueField DPU都支持DOCA開發包,隨著每代DPU的演進,原先開發的應用程序可以完全向后兼容,且DPU路線圖上的后續的產品依然保證完全向前兼容。這意味著在目前BlueField DPU上運行的應用程序和數據中心基礎設施,在不
42、久的未來將能不加修改地加速運行在 BlueField-4 DPU等后續產品上。 3、BlueField-3 DPU產業地位分析BlueField-3 DPU的出現解決了目前產業無法完全確保數據安全的問題。在零信任的大環境下,產業原本是無法完全確保數據安全的。舉例來說,數據中心想支持IPSec協議(即通過加密與驗證等方式,為IP數據包提供安全服務),當它在100Gb/s的網絡傳輸數據下,對每一個數據包都進行IPSec加密時,CPU資源會急速耗盡,卻依然無法完成在網絡高速傳輸時對每一個數據包都進行IPsec加密的操作。如表4所示,BlueField-3 DPU具備了平臺安全、可加密加速、可執行安全
43、策略、深度包檢測與隔離安全控制平面的特點,將這個網絡層面上確保數據安全的不可能瓶頸打破。圖1數據來源:NVIDIA官網, 顧問整理 2021,11BlueField-3DPU解決網絡高速傳輸數據安全瓶頸表4特點詳情平臺安全通過使用硬件信任根(Root of Trust)實現安全和可追溯的操作系統啟動,保護計算平臺免受硬件級攻擊加密加速通過硬件加速、在線IPsec、TLS線速數據加密和MACSec線速數據加密來保護數據中心通信和Web應用程序交付分布式安全策略執行通過啟用NVIDIA的高級交換和數據包處理(ASAP2)技術在硬件中執行分布式安全策略深度包檢測通過使用內置數據格式(build-in
44、 pattern)匹配加速對傳入流量執行深度數據包檢查來檢測惡意活動隔離安全控制平面在受信任的DPU環境中部署安全應用程序,與主機系統隔離,以防止橫向移動并減少攻擊面 4、BlueField-3 DPU優勢分析1) BlueField-3 DPU擁有更強大的ARM核計算能力和更快的加解密速度,它與CPU、GPU和內存的互連速度也更快。14圖1數據來源:NVIDIA官網, 顧問整理 2021,11BlueField-2和BlueField-3DPU技術指標對比表5FeatureBlueField-2DPUBlueField-3DPUBandwidth200Gb/s400Gb/sDPDK Max
45、msg Rate215Mpps250MppsRDMA Max msg Rate215Mpps330MppsComputeSPECint2017: 9SPECint2017: 42VirtIO Acceleration40Mpps (*)80Mpps (*)IPsec Acceleration100Gb/s400Gb/sTLS Acceleration200Gb/s400Gb/sMACsec AccelerationX400Gb/s bi-dirBlueField SNAP5.4M IOPs 4K12M-18MIOPS 4K*Total packet rate for the sum of Tx
46、 and Rx2) 通過BlueField-3 DPU執行HPC通信框架,可以實現無阻塞通信,即讓計算與通信可并行同時發生。目前的超算網絡中大多數是有阻塞通信,有阻塞通信是通信與計算不可同時發生,即有通信時不計算,有計算時不通信。目前BlueField-3 DPU在無阻塞集合通信卸載操作上更為成熟,用戶可使用配套的MPI庫來加速科學計算應用的執行,特別是針對于大規模的的無阻塞all-to-all通信。如圖所示,應用BlueField DPU后,計算和無阻塞all-to-all集合通信的之間可100%重疊,如使用DPU加速P3DFFT應用程序(3D快速傅里葉變換)后,應用的總體執行時間減少了25
47、%以上,涵蓋了各種大小的網格大小。DPU簡介及分析BlueField-3DPU實現無阻塞通信后的性能表現實例圖12數據來源:NVIDIA官網, 顧問整理 2021,112021中國DPU行業發展白皮書153) 在兼容性上,通過使用DOCA庫,BlueField-3與上一代DPU上開發的應用保持完全的軟件兼容性,軟件運行方式沒有變化,并得到更高的性能和可擴展性。DOCA在底層硬件API上提供一個抽象層給上層的業務,開發者可以使用標準的API更快速、更輕松地進行開發,實現和上層業務的集成,并經優化后提供出色的性能,或者和底層接口合作達到更精細的控制。且DOCA具備基于容器化服務的DPU調配和部署,
48、包含用于簡化DPU設置、配置和服務編排的工具。NVIDIADOCA軟件棧圖13數據來源:NVIDIA官網, 顧問整理 2021,11DOCA 軟件棧ApplicationsDPUManagementDOCA-LibsDOCA Driver and RuntimeRDMAVerbs/DevXNetworkingDPDK/Kernel/P4StorageSPDK/KernelDPI5TUCXFlex IOPGAS, SHMEM SecurityDPDK/KernelProvisioningSecuritySFT/RegExNetworkingP4-RT/ebpf/BSD-Sockets/VMASH
49、ARPStorage, SNAPBlock storage servicesvNET-GW/FWRiverMaxVNF/UPFOrchestrationSDN AgentsVisibilityNetworkingSecurityStorageHPC/MLMediaTelcoSNAPIDPU BlueField and BlueField-X DOCAToolkitMPI(四)NVIDIA BlueField-3 DPU技術分析和技術對比 1、BlueField-3 DPU技術分析BlueField-3 DPU完全承接了BlueField-2 DPU的先進特性,并將其進行了性能加強與擴展,如下圖。16BlueField-3DPU總體架構圖14數據來源:NVIDIA官網, 顧問整理 2021,11BlueField架構本質上將網卡子系統與可編程數據路徑、用于加密、壓縮等的硬件加速器子系統以及用于控制的ARM處理器子系統融合在一起。在BlueField-3中,數據路徑加速分組(DPA)包括16個處理器核,可并行處理256個線程的任務。BlueField-3的重要技術特性按照網絡業務、安全業務、存儲業務等方面具體說明:網絡業務在網絡業務中,BlueField-3專門對RDMA、連接跟蹤(Connection Tracking)、ASAP2等這些網絡通信技術做