1、Tolly.數據中動駕駛絡 華為 CloudFabric 與 Cisco IBN(Data Center)對測試報告 Tolly Report#222112ZH 2022 年 2 2021 TOLLY ENTERPRISES,LLC2TOLLY REPORT#222112ZH1 數據中動駕駛絡指數31.1 實現絡動駕駛的五個階段31.2 數據中動駕駛絡指數評價標準42 案綜述72.1 華為 CloudFabric 數據中絡解決案72.2 思科 IBN 數據中絡解決案83 測試概要93.1 測試范圍93.2 測試結論103.3 測試概要114 Day0 規劃建設154.1 測試法154.2 測試
2、結論174.3 測試條215 Day1 業務部署355.1 測試法355.2 測試結論365.3 測試條396 Day2 監控排障566.1 測試法566.2 測試結論576.3 測試條637 DayN 變更優化917.1 測試法917.2 測試結論937.3 測試條948 測試設備、版本101錄3TOLLY REPORT#222112ZH1 數據中動駕駛絡指數 1.1 實現絡動駕駛的五個階段 實現全治絡這終極標是個期的過程,需要分步實現?;谕ㄐ沤j的復雜性,從戶體驗、解放的程度和絡環境復雜性等,業界形成如下數據中動駕駛絡分級標準:L0 級的特征是運維,所有任務都依賴執。L1 級的主要特征是以
3、命令配置設備為主,輔于某些配置腳本或具。L2 級部分治絡的特征是部分場景中,戶擺脫對設備命令的依賴,系統基于絡模型級提供意圖交互接及輔助具,進步降低了員對經驗和技能的要求;系統可基于些預定義的靜態策略進固定的監視與分析,由決策,實現部署和運維階段的動化。L3 級限定條件治絡的特征是以智能技術為核構建鍵式絡部署開通、業務發放、監控排障等關鍵能,這階段絡設備不僅實現部署動化,且能實現配置的事前仿真,事后校驗,機器參與決策,實現數據中絡達到有條件治。L4 級度治絡的特征是在 L3 級的基礎上,包含絡規劃、部署、運維等全命周期場景中,能夠實現全場景服務化及決策,絡能夠基于意圖進設計、部署、診斷、恢復,
4、參與決策只是輔助。L5 級完全治絡的特征是基于 L3 和 L4 的技術積累和設備現運的檢驗,逐步演進到意圖驅動的全治核絡,全釋放絡管理的和腦。從分級標準可以清楚的看出,動駕駛絡是個多維度,體化的戰略,這種階梯式上升的級別不僅僅是評價個絡的標準,也是循序漸進去推進動駕駛絡戰略的路線圖。等級定義L0:運營和維護L1:具輔助 運營和維護L2:部分 治絡L3:限定條件的治絡L4:度 治絡L5:完全 治絡執PP/SSSSS感知PPP/SSSS分析PPPP/SSS決策PPPP/SSS意圖/體驗PPPPP/SS適性N/A指定場景所有場景注:P-;S-系統。4TOLLY REPORT#222112ZH1.2
5、數據中動駕駛絡指數評價標準 如何具體衡量數據中動駕駛絡的等級,本報告從數據中命周期的 Day0、Day1、Day2、DayN 四個階段,六類,三九類,定義等級平。命周期權重L1L2L3L4Day0規劃設計意圖翻譯5%理解客戶需求,或使具輸出洞察分析指標、規劃需求使系統輔助輸出洞察分析指標、規劃需求系統動成洞察分析指標、規劃需求,調整系統動成洞察分析指標、規劃需求洞察分析使具獲取現歷史數據,分析/預測系統動獲取現歷史數據,分析/預測系統動獲取現歷史數據,系統動分析/預測系統動獲取現歷史數據,收集并分析然/社會信息(如區規劃、流變化等),進精準分析/預測絡規劃使具實現絡規劃,基于專家經驗會審使系統
6、實現絡規劃,基于專家經驗會審系統動規劃,勘測數字化同 L3規劃仿真仿真驗證離線具仿真驗證系統在線仿真驗證同 L3絡設計使具實現絡設計,基于專家經驗會審使系統實現絡設計,基于專家經驗會審系統半動設計(制定規則),勘測數字化系統全動設計,勘測數字化設計仿真仿真驗證離線具仿真驗證系統在線仿真驗證,決策系統仿真驗證,動決策,發現規劃設計異常動糾偏部署開通數據制作5%使具制作元參數和保障策略數據使系統制作元參數和保障策略數據,關聯設備物理標識(如機架位置等)系統動制作元參數和保障策略數據,系統動關聯設備物理標識(如機架位置等)同 L3數據下發使具實現元參數和保障策略數據下發系統動感知設備上線,實現元參數
7、動下發系統動感知設備上線,實現元參數和保障策略數據動下發同 L3程調測/優化使具下站調測/優化使具/系統遠程調測/優化系統動遠程調測/優化,動發現異常(如告警),糾偏系統動遠程調測/優化,動發現異常(如告警),并動糾偏業務驗證使具下站撥測和業務驗證,成報告使系統進遠程業務驗證,動成報告系統動遠程驗證業務,動成報告同 L35TOLLY REPORT#222112ZH命周期權重L1L2L3L4Day1業務發放意圖翻譯15%根據業務訴求輸出絡需求(絡意圖轉換)設計業務模板,系統根據選擇的模板輸出絡需求(絡意圖轉換)輸業務意圖(如站點列表、安全策略、SLA等),系統動轉換為絡需求(業務意圖轉換)戶極簡
8、意圖輸(如然語),系統動轉換為絡需求(業務意圖轉換)案設計使具查詢/分配資源,制定案使具查詢/分配資源,系統動成案系統動查詢/分配資源,系統動成案同 L3評估決策評估具/系統,決策離線具評估,決策系統在線評估,決策系統在線仿真驗證,動決策案實施使具/系統進配置下發系統動進絡配置下發系統動進絡配置和SLA 保障策略配置下發同 L3業務驗證使具進業務驗證使系統進業務驗證,動成報告系統動驗證業務,動成報告同 L3Day2監控排障意圖翻譯35%基于專家經驗配置監控規則(絡意圖轉換)設計監控規則模板,系統根據選擇的模板進監控(絡意圖轉換)輸業務意圖(如重要 VPC KPI 等)系統動轉換監控規則建議,調
9、整(業務意圖轉換)輸業務意圖(如監控區域、重??蛻?、KPI 等)系統動轉換監控規則進監控(業務意圖轉換)監控可視告警流可視、KPI 曲線可視故障可視、KPI 異??梢暆撛陔[患可視,故障和隱患對業務的影響可視系統對故障和隱患的處理流程和狀態可視故障識別具/系統采集數據,識別故障系統基于運維員制定的規則/策略(如告警相關性、KPI 閾值)識別故障系統動學習規則/策略(如相關性、閾值、AI 模型)并動識別故障同 L3隱患預測具/系統采集數據,根據巡檢策略(如 Checklist)逐項排查,識別潛在隱患系統基于運維員制定的規則/策略(如健康性檢查規則、KPI 閾值)對絡動巡檢,基于專家經驗識別潛在隱患
10、系統預測絡狀態趨勢,定性粗略識別潛在漸變類隱患(如某端可能發弱光故障)系統預測絡狀態趨勢,定量精準識別潛在隱患(如某端 90%的可能性(置信度)在周內出現弱光故障)問題定界使具或系統輔助定界(如連通性測試)系統基于運維員制定的規則/策略(如專家經驗樹)動定界系統動學習規則/策略(如知識庫、故障傳播圖)并動定界同 L3問題定位使具或系統輔助定位(如報分析,操作志分析)系統基于運維員制定的規則/策略(如專家經驗樹)動定位系統動學習規則/策略(如知識庫、故障傳播圖)并動定位,確認(系統給出個或多個疑似原因并排序)系統動學習規則/策略(如知識庫、故障傳播圖)并動定位(系統給出唯準確原因)案成制定備選案
11、系統給出修復建議,制定備選案系統動成備選案同 L3評估決策評估具/系統,決策最優案使具/系統進評估,決策最優案系統基于實時數據在線評估,給出評估結果,決策最優案系統基于實時數據在線仿真驗證,系統動決策最優案案實施使具/系統完成故障修復和隱患消除系統基于最優案動成可執指令,動修復故障消除隱患同 L2同 L2業務驗證使撥測具進業務驗證,成驗證報告使系統進業務驗證,系統動成報告系統動驗證業務,動成報告同 L36TOLLY REPORT#222112ZH命周期權重L1L2L3L4DayN絡變更意圖翻譯35%評估戶業務影響;輸出變更約束條件評估戶業務影響;系統動輸出變更約束條件,調整系統動評估戶業務影響
12、;系統動輸出變更約束條件,調整系統動評估戶業務影響;系統動輸出變更約束條件案設計制定變更案系統給出變更建議,制定變更案系統動成變更案同 L3評估決策評估具/系統,決策最優案使離線具進評估,分析決策最優案系統基于實時數據在線評估驗證,分析決策最優案系統基于實時數據在線仿真驗證,系統動決策最優案變更實施使具/系統完成絡變更實施系統基于最優案動成可執指令,動完成絡變更實施同 L2同 L2業務驗證使具對絡快照;使具進業務測試;值守系統動對絡快照;使系統進業務測試;值守系統動對絡快照;系統動進業務測試;系統動值守;發現異常糾偏系統動對絡快照;系統動進業務測試;系統動值守;發現異常系統動糾偏;動成變更報告
13、優化調參意圖翻譯5%基于專家經驗配置監控規則(絡意圖轉換)設計監控規則模板,系統根據選擇的模板進監控(絡意圖轉換)輸業務意圖(如客戶體驗指標、資源利率等)系統動轉換監控規則建議,調整(業務意圖轉換)輸業務意圖(如客戶體驗指標、節能標、資源利率等)系統動轉換監控規則進監控(業務意圖轉換)性能優化識別具/系統采集數據,根據專家經驗識別待優化問題系統按照運維員制定的規則/策略(如 KPI 閾值)識別待優化問題系統動學習規則/策略(如動態 KPI 閾值)并動識別待優化問題同 L3劣化預測具/系統采集數據,根據規則(如 Checklist)逐項排查,識別潛在險系統基于制定的監測策略(如 KPI 閾值)對
14、絡進實時檢查,識別潛在險(如基于專家經驗識別)系統預測絡狀態趨勢,定性粗略識別潛在險(如雙流量陡增)系統預測絡狀態趨勢,定量精準識別潛在險(如某地區在 XX,容量將增加 50%,在 YY 下降 30%)問題定界使具或系統輔助定界系統基于運維員制定的規則/策略(如專家經驗樹)動定界系統動學習規則/策略(如知識庫)并動定界同 L3問題定位使具或系統輔助定位系統基于運維員制定的規則/策略(如專家經驗樹)動定位系統動學習規則/策略(如知識庫)并動定位,確認(系統給出個或多個疑似原因并排序)系統動學習規則/策略(如知識庫)并動定位(系統給出唯準確原因)案成根據專家經驗制定備選案系統基于制定的優化規則給出
15、優化建議,制定備選案系統基于編排策略和在線推理等動成備選案系統動成備選案(動成策略、在線推理)評估決策仿真具/系統,決策最優案使具進仿真驗證,分析決策最優案系統基于實時數據在線仿真驗證,分析決策最優案系統基于實時數據在線仿真驗證,系統動決策最優案案實施使具/系統完成優化動作系統基于最優案動成可執指令,完成優化動作同 L2同 L2業務驗證使具進業務驗證(如客戶體驗、節能標等是否達成),成驗證報告使系統進業務驗證(如客戶體驗、節能標等是否達成),系統動成報告系統動驗證業務,動成報告同 L37TOLLY REPORT#222112ZH2 案綜述 2.1 華為 CloudFabric 數據中絡解決案
16、數據中動駕駛絡華為 CloudFabric 解決案總體架構如下圖所示,主要包括業務編排層,資源管理層,Fabric 設備層。業務編排層:包括云編排平臺,容器編排平臺,管理具等,主要是對數據中的計算存儲絡等資源進編排,如 OpenStack,Kubernetes 等,業務編排層北向對接各種業務 Portal,南向對接 SDN 控制器等資源管理層。資源管理層:華為 iMaster NCE-Fabric 數據中動駕駛絡管理控制系統北向對上層應提供開放資源接,南向統管理控制物理和虛擬絡,完成意圖翻譯,動化配置,意圖檢驗;華為 iMaster NCE-FabricInsight 分析器提供對絡設備的健康
17、度檢查,故障定界分析定位,并和控制器聯動完成故障的修復。Fabric 設備層:包括由華為 CloudEngine 數據中交換機組成的 Spine-Leaf 基礎組,提供服務器之間以及服務器與戶之間的互聯。由防墻,IPS,DDoS,負載均衡等設備組成的安全增值業務系統,提供數據中內外安全功能。備注:OpenStack,Kubernetes(K8s),和 Red Hat 是華為案可互通的第三平臺。8TOLLY REPORT#222112ZH2.2 思科 IBN 數據中絡解決案 思科 IBN 數據中絡解決案總體架構如下圖所示。思科 Nexus Dashboard Orchestrator 基于以前的
18、思科 Multi-Site Orchestrator 產品,可納管多個控制器集群,來編排多站點的絡策略等。思科 Nexus Dashboard Insights 集成以前的 Network Insights 產品以及 Network Assurance Engine 產品,提供絡分析以及保障。思科 APIC 作為 ACI 架構的控制器,配合部署在公有云的 vAPIC,以及控制 NX-OS 模式交換機的 Nexus Dashboard Fabric Controller(原 DCNM)等各站點的控制器實現絡動化。本次測試主要聚焦于思科 ACI 架構。思科 ACI 架構設備層采 Nexus 900
19、0 系列交換機。AutomationNetwork Infrastructureand TelemetryNexus Dashboard OrchestratorAPICNexus Dashboard Fabric ControllerNexus 9000Nexus Dashboard InsightsNexus Dashboard Data BrokervAPICOrchestration,Policy,Assurance and Insights9TOLLY REPORT#222112ZH3 測試概要 3.1 測試范圍 Tolly 本次就數據中動駕駛絡華為 CloudFabric 與 Ci
20、sco IBN for Data Center 在四個維度進了評估(思科案采 Cisco ACI 架構):Day0 規劃建設:規劃建設環節,包括基于業務意圖系統動理解,并轉化為絡需求,成案,同時完成部署驗證等物理絡就緒的能。Day1 業務部署:業務部署環節,包括意圖理解,事前仿真,配置動化,事后檢驗等業務部署時絡配置效率及準確性能。Day2 監控排障:監控排障環節,包括意圖監控,問題定界定位、案成、評估決策、案實施、業務驗證等智能運維能。DayN 變更優化:變更優化環節,對絡變更或優化的意圖進案設計、評估決策,案實施和驗證等,以提絡運效率的能。本測試報告對數據中動駕駛絡華為 CloudFabr
21、ic 和 Cisco IBN for Data Center 進對測試和分析,并從 Day0 規劃建設、Day1 業務部署、Day2 監控排障、DayN 變更優化四個進闡述。10TOLLY REPORT#222112ZH3.2 測試結論 根據數據中絡動駕駛指數評價體系,Tolly 從數據中命周期 Day0、Day1、Day2、DayN 4 個階段,規劃設計、部署開通、業務部署、監控排障、絡變更、優化調參 6 個類、39 個類,通過 150+指標測試,華為 CloudFabric 解決案在部署效率和準確性、易性、可維性、可靠性、絡性能優化等指標上以整體 3.51 分領先 Cisco IBN(Da
22、ta Center)解決案的 2.8 分,是 Tolly 評估過的業界唯實現跨越 L3.5 級動駕駛的數據中絡解決案。11TOLLY REPORT#222112ZH3.3 測試概要 命周期權重L4華為思科評估級別評估說明評估級別評估說明Day0規劃設計意圖翻譯5%系統動成洞察分析指標、規劃需求L3.61、免設計:基于具鍵導出階設計和低階設計(HLD&LLD)2、意圖翻譯:新建和擴容等場景,智能推薦絡案 3、分析器北向數據開放服務(如表項、KPI);可以與客戶業務系統對接,提供新絡的規劃依據 4、控制器北向作量流(runbook)服務化 5、CloudFabric Easy 極簡端到端規劃,設計
23、,部署輕量 SDN 解決案,控制器可全部虛擬機安裝,持設備合 L2.71、Cisco Design Zone 提供設計參考檔;設計案和具未知 2、控制器中基于場景的案推薦和評估 3、Mini ACI Fabric 的控制器 APIC 少需要臺物理機+2 個虛擬機,少 Spine-Leaf 兩層組洞察分析系統動獲取現歷史數據,收集并分析然/社會信息(如區規劃、流變化等),進精準分析/預測絡規劃系統動規劃,勘測數字化規劃仿真系統在線仿真驗證絡設計系統全動設計,勘測數字化設計仿真系統仿真驗證,動決策,發現規劃設計異常動糾偏部署開通數據制作5%系統動制作元參數和保障策略數據,系統動關聯設備物理標識(如
24、機架位置等)L3.31、絡架構:轉發持報分和重組;Border Leaf、Spine、Server Leaf、Service Leaf、Fabric Gateway 各種部署式可合并可分離,節省客戶投資 2、Underlay 絡動化:持基于意圖的 Underlay 規劃及仿真校驗;持靈活配置Spine RR/出互聯配置模板等;持批量配置 3、可性:BFD 最間隔 3.3ms,ESI 多歸持上四臺設備鏈路負載均衡 4、設備納管:控制器持對虛擬系統以及第三交換機的納管L2.91、絡架構固定:Leaf 和 Spine 法合組;不持 Border Leaf、Spine、Compute Leaf、Ser
25、vices Leaf 合組;不持 IP 報分 2、不持基于意圖的 Underlay 規劃;不持靈活配置 Spine RR/出互聯配置模板等;不持批量配置 3、Nexus 9000 系列交換機 BFD 最間隔 50ms,ESI 多歸最多持上臺設備鏈路負載均衡 4、Nexus 9000 系列交換機不持虛擬設備(VDC)數據下發系統動感知設備上線,實現元參數和保障策略數據動下發程調測優化系統動遠程調測/優化,動發現異常(如告 警),并動糾偏業務驗證系統動遠程驗證業務,動成報告12TOLLY REPORT#222112ZH命周期權重L4華為思科評估級別評估說明評估級別評估說明Day1業務發放意圖翻譯1
26、5%戶極簡意圖輸(如然語),系統動轉換為絡需求(業務意圖轉換)L3.71、配置式:持控制器和設備命令雙模配置,并且有加鎖機制不會引起配置沖突;持配置全、租戶、業務三級回滾;持設置配置基線件;控制器拖拽式部署 2、意圖仿真校驗:持 21 個典型數據中意圖發放,持基于業務意圖的理解和 IPv4&IPv6 仿真校驗,智能推薦邏輯絡案 3、對接虛擬化平臺:持和VMware vCenter,Microsoft System Center 等虛擬化平臺對接 4、對接云平臺:持基于標準模型對接 OpenStack 云平臺;持名單;遷移事件觸發配置下發 5、多云編排:持多數據中集中編排;持公有云和私有云組成的
27、混合云編排 L2.91、APIC 持圖形化界和 CLI 配置,但運在 ACI 模式的設備不持直接登錄設備進配置,在控制器故障時,法對絡做配置;持基于快照的全配置和租戶配置回滾,不持基于單次業務操作的業務配置回滾 2、不持基于業務意圖場景智能推薦絡案;持連通性校驗,不持跨 DC 過防墻/LB 的數據意圖驗證 3、持虛擬化平臺對接 4、控制 OpFlex 和 COOP,轉發 eVXLAN 均為私有協議(也開放給第三集成,但業界持度略低)5、持多數據中集中編排;持公有云和私有云組成的混合云編排 案設計系統動查詢/分配資源,系統動 成案評估決策系統在線仿真驗證,動決策案實施系統動進絡配置和 SLA 保
28、障策略配置下發業務驗證使系統進業務驗證,動成報告13TOLLY REPORT#222112ZH命周期權重L4華為思科評估級別評估說明評估級別評估說明Day2監控排障意圖翻譯35%輸業務意圖(如監控區域、重??蛻?、KQI 等)系統動轉換監控規則進監控(業務意圖轉換)L3.61、絡評估:系統化多維度絡健康評估體系,包括絡故障、絡隱患預測、SLA 評估、絡資源熱點、50+本體絡知識圖譜建模的體化資源狀態評估 2、故障識別:90+類基于故障知識庫的 DCN 典型故障 1-3-5 能、基于絡知識圖譜的未知故障聚合與溯源,故障傳播鏈可視與處理建議推薦 3、故障定位:業務連通性問題鍵式排障、DPV 連通性診
29、斷;基于設備芯邊緣智能技術的業務質差問題定界、基于 GRE 撥測技術的靜默類故障定界 4、監控可視:5 層 50+本體絡健康度監控、TCP 全流監控、流監控、IP360 監控、業務路徑路況監控、指定流質差監控與定界、120+Telemetry KPI 實時監控、整異常志監控、整搜索及關聯信息呈現 5、業務驗證:基于數據建模的 DPV 意圖絡驗證,包括業務連通性意圖、絡路由環路、路由洞等意圖 6、隱患預測:基于 AI 知識圖譜的絡險預測,包括絡可靠性、性能負載、資源容量、配置致性、絡穩定性 5 個維度的系統化險評估模型(如重保 CASE)7、案實施:20+種基于故障知識庫的 DCN 典型故障 1
30、-3-5 的聯動閉環能 8、分析器數據錄開放、與 APM 集成,實現應與絡路況的聯動,故障的動定位 L2.91、識別絡中的異常 2、提供故障關聯性根因分析 3、不持撥測技術 4、持 TCP/UDP 流可視,不持組播流量可視;持設備狀態、RIB、FIB 等設備 KPI 數據收集、分析 5、持連通性等意圖驗證 6、不持隱患預測 7、僅兩種故障持聯動閉環 8、持與 APM 集成監控可視系統對故障和隱患的處理流程和狀態可視故障識別系統動學習規 則/策略(如相關性、閾值、AI 模型)并動識別故障隱患預測系統預測絡狀態趨勢,定量精準識別潛在隱患(如某端 90%的可能性(置信度)在周內出現弱光故障)問題定界
31、系統動學習規 則/策略(如知識庫、故障傳播圖)并動定界問題定位系統動學習規則/策略(如知識庫、故障傳播圖)并動定位(系統給出唯準確原因)案成系統動成備選 案評估決策系統基于實時數據在線仿真驗證,系統動決策最優案案實施系統基于最優案 動成可執指令,動修復故障消除隱患業務驗證使系統進業務驗證,系統動 成報告14TOLLY REPORT#222112ZH命周期權重L4華為思科評估級別評估說明評估級別評估說明DayN絡變更意圖翻譯35%基于 SLA/時間窗 動評估,動輸出變更約束條件L3.41、持配置變更前仿真校驗 2、持對絡中設備進設備替換(持不同型號)/故障類操作前的業務影響性分析,統計并展示設備
32、替換/故障所影響的業務(包括接業務、出業務和安全業務)以及業務的詳情 3、持 ToR 交換機擴容以及服務器擴容的基于意圖的案動成,以及仿真、輔助決策、實施L2.71、持配置變更前仿真校驗 2、不持設備替換影響性分析 3、不持基于意圖的擴容案動成案設計在線動成案評估決策在線仿真驗證,輔助決策變更實施動/灰度完成變更業務驗證動對絡快照,動業務測試,動值守,發現異常系統動糾偏;動成變更報告優化調參意圖翻譯5%輸業務意圖系統動轉換監控規則進監控(業務意圖轉換)L3.21、預測性維護:接流量預測 2.智能損 DCN:根據流量模型適應調整 ECN 線參數,帶寬利率最優 3、持智能距損技術,同城雙活場景最持
33、 200G*100KM 4、Flex-Buffer:提升 TCP 流的完成時間,TCP 應性能提升 21%5、云協同-確定性 SLA:實現跨 DC 之間業務按照業務訴求如不同的 SRv6 隧道,保障業務跨云確定性 SLAL2.51、不持預測性維護 2、ECN 線靜態設置 3、距損技術未知 4、持智能緩存管理 5、基于 SR-MPLS 隧道 性能優化識別動學習規則/策略,并動識別待優化問題劣化預測系統預測絡狀態趨勢,定量精準識別潛在險問題定界動問題定界問題定位動問題分析,動定位(系統給出唯準確原因)案成系統動成備選案(動成策略、在線推理)評估決策在線仿真驗證,系統分析決策案實施動完成案優化業務驗
34、證動驗證業務并成優化報告15TOLLY REPORT#222112ZH4 Day0 規劃建設 4.1 測試法 Day0 規劃建設場景包括規劃設計和部署開通兩個階段。第規劃設計階段:根據客戶商業意圖、業務發展標、絡建設計劃,輸出絡規劃需求。根據監控排障、優化調測訴求,結合經驗數據、現如流量性能和拓撲資源利等情況,進洞察和分析,輸出如絡容量預測等洞察分析報告;根據意圖翻譯的絡規劃需求以及洞察分析結果,輸出階設計(HLD),根據絡規劃結果,對 HLD 案規劃正確性、合理性進評估和模擬驗證;根據 HLD 案,結合現勘測情況、設備采購選型、解決案組技術要求等因素,輸出低階設計(LLD),根據絡設計結果,
35、對 LLD 案設計正確性、合理性進評估和模擬驗證。規劃設計階段包括意圖翻譯、洞察分析、絡規劃、規劃仿真、絡設計、設計仿真等環節。16TOLLY REPORT#222112ZH第個階段是部署開通階段,是指將數據中 Underlay 絡打通的過程,根據規劃設計的輸出,制作絡設備初始化數據、接 IP 協議等 Underlay 絡詳細全量參數;將制作完成的元數據轉換為可下發到絡的詳細指令并下發到絡設備;數據下發到絡設備后進軟硬件調測,保障軟硬件配置正確,告警清零,對 Underlay 業務進撥測驗證,滿 Overlay 業務下發的條件。包括數據制作、數據下發、程調測優化、撥測驗證等環節。Tolly 認
36、為,評價數據中動駕駛絡 Day0 規劃建設階段 L3.5 等級平,應該重點關注以下個:針對關鍵規劃設計場景,系統動成洞察分析指標、規劃需求,調整;系統基于動獲取現歷史動分析/預測,動規劃,勘測數字化,在線仿真驗證,決策。針對關鍵部署開通場景,系統動制作元參數和保障策略數據,動感知設備上線,實現元參數和保障策略數據動下發;系統動遠程調測/優化,動發現告警等異常,糾偏,系統動遠程驗證業務。17TOLLY REPORT#222112ZH4.2 測試結論 Tolly 經過測試組發現,華為 CloudFabric 和 Cisco IBN(Data Center)均能完成物理絡的動化部署,但是華為 Clo
37、udFabric 在數據致性校驗、靈活性、可靠性、設備納管多樣性等更優。分類華為 CloudFabricCisco IBN(Data Center)-ACI 架構階設計體化設計具:持基于 SCT2.0 具,經過四步確認,導出階設計案、組拓撲、基于解決案的報價清單未思科官有類似功能全的階設計具總結:華為 CloudFabric 直接基于客戶的業務訴求,直接成階概要設計案和報價清單,售前免專家設計,未思科此類具。低階設計規劃具:根據導的配置報價清單 BOQ,iDesigner 能鍵導出階階段詳細設計指南,IP 地址,路由等絡規劃免參與未思科官有類似低階設計具,Cisco Design Zone只提
38、供設計參考檔總結:華為 CloudFabric 直接基于配置清單,結合 IP、帶寬、路由等資源動成低階詳細設計,配置腳本,并可直接于配置 iMaster NCE-Fabric,售前免專家設計,未思科有類似具。系統架構1、安裝式:iMaster NCE-Fabric 控制器和 iMaster NCE-FabricInsight 分析器持單機或集群式部署,持物理機虛擬機式部署 2、統平臺:動化配置和意圖保證在統的 iMaster NCE 平臺上實現;控制器 iMaster NCE-Fabric 和 分析器 iMaster NCE-FabricInsight 持單點登錄 3、負載分擔:控制器北向和南
39、向均為負載分擔式作。iMaster NCE-Fabric 針對云平臺的請求,可以負載分擔到所有集群成員節點處理 4、虛擬系統納管:iMaster NCE 持對交換機 VS 進納管 5、第三絡設備納管:iMaster NCE 持納管 Cisco Nexus 9000 系列以及 Nexus 7000 系列交換機并通過 NETCONF 接或命令接進配置 6、分析器北向持 Kafka、RESTful、SNMP、WebSocket 四種接的數據開放,同時,提供全量絡數據服務開放(50+本體資源,配置件、表項、故障事件、KPI、業務流路徑),拖拽式可編排,分鐘級成場景化 API1、控制器安裝式:APIC
40、要求少有個節點為物理機,并且當物理機故障時,絡法物理變更,存在脫管險 2、Nexus Dashboard 包含分析器 Nexus Dashboard Insights 并可以跳轉各站點的 APIC 控制器 3、控制器集群負載分擔 4、虛擬系統納管:Nexus 9000 系列交換機不持虛擬系統(VDC)總結:華為 iMaster NCE-Fabric 持雙模式安裝;Cisco APIC 安裝環境要求少有個節點為物理機,并且物理機故障時存在絡脫管險。Cisco 的 Nexus 9000 系列交換機不持虛擬系統,不利于節約客戶投資。同時華為分析器持北向數據開放服務(如表項、KPI),可以與客戶業務系
41、統對接,提供新絡的規劃依據。18TOLLY REPORT#222112ZH分類華為 CloudFabricCisco IBN(Data Center)-ACI 架構組架構絡架構靈活性:1、持 Border Leaf 和 Spine 兩個合組 2、持 Border Leaf、Spine、Server Leaf、Service Leaf、Fabric Gateway 五個合組 3、持多組 Border Leaf 4、持 Border Leaf 和 Fabric Gateway 合設置 5、iMaster NCE-Fabric 控制器和 iMaster NCE-FabricInsight 分析器和設
42、備之間的管理通道持 IPv4 和 IPv6 6、持 IP 報分和重組 絡架構可靠性:1、跨設備鏈路聚合 M-LAG 2.0 單鏈路故障 20 毫秒倒換 2、ESI 多歸持上四臺設備鏈路負載均衡 3、BFD 最檢測時間間隔 3.3 毫秒 4、損升級,設備版本升級,業務零中斷絡架構靈活性:1、Border Leaf 和 Spine 兩個法合組 2、不持 Border Leaf、Spine、Compute Leaf、Services Leaf 四個合組(Spine 集成了類似華為 Fabric Gateway 的功能)3、持多組 Border Leaf 4、不持 Border Leaf 和 Fabr
43、ic Gateway 合設置 5、管理通道也持 IPv4 和 IPv6 6、不持 IP 報分,在某些法改變中間 IP 設備傳輸 MTU 場景的某些應下法使 絡架構可靠性:1、跨設備鏈路聚合,Cisco vPC 持單鏈路故障 20 毫秒倒換 2、ESI 多歸最多持上臺設備鏈路負載均衡 3、BFD 最檢測時間間隔 50 毫秒 4、損升級,設備版本升級,業務零中斷總結:華為 CloudFabric 持轉發報分和重組,Cisco 不持;華為各種部署式可合并可分離,有利于節省客戶投資;另外華為在 ESI 多歸的路徑數量和 BFD 檢測時間上也更優。19TOLLY REPORT#222112ZH分類華為
44、CloudFabricCisco IBN(Data Center)-ACI 架構物理絡 動化上電部署:1、持極簡 ZTP 開局 2、靈活性:DHCP 服務器持內置和外置兩種模式 3、安全性:ZTP 帶外啟動,控制器和業務隔離 4、設備管理:持證書式納管設備 5、元配置:持靈活配置 Spine RR/出互聯配置模板等 Underlay 配置;持針對 Syslog 等運維的配置 批量配置:針對靜態路由,VPC,外部關,SFC 的 rule 等配置進批量導;基于 VPC 和設備對配置進批量導出;針對 LP 端名稱和描述、設備密碼、Spine 的 RR 等進批量修改 持基于意圖的 Fabric und
45、erlay 絡規劃仿真:1、持新建 DC Fabric 規劃:規劃拓撲形成,拓撲配置可修改,仿真評估,上線執 2、持新建 DC Fabric 導規劃:規劃拓撲形成,配置可導不可修改,上線執 意圖校驗:持 Underlay VTEP 之間連通性驗證,VTEP IP 地址校驗、Router ID 地址校驗、VTEP MAC 校驗、洞路由、環回路由等校驗 擴容意圖翻譯:持 ToR 擴容和服務器擴容意圖動化配置上電部署:1、持鍵式部署 2、DHCP 服務器僅持內置,不持外置 3、安全性:ZTP 帶內啟動,控制器和業務必須相連,存在安全隱患 4、持證書式納管設備 5、不持靈活配置 Spine RR/出互
46、聯配置模板等 控制器 GUI 不持批量配置,存在量相同配置修改時,需要逐個進配置 不持基于意圖的新建 DC Fabric 精細化的規劃和仿真 意圖校驗:本次未測試 擴容意圖翻譯:不持服務器和 ToR 擴容意圖動化配置總結:華為 CloudFabric 持基于意圖的 Underlay 規劃及仿真校驗,持新建 DC Fabric 導規劃或者規劃,持服務器或者 ToR 擴容等意圖理解及驗證,持批量配置;思科不持基于意圖的 Underlay 規劃以及擴容等意圖理解,且思科 Cisco 的 ZTP 帶內啟動,控制器和業務相連,存在安全險。20TOLLY REPORT#222112ZH分類華為 Cloud
47、FabricCisco IBN(Data Center)-ACI 架構可靠性/可性1、數據致性校驗:iMaster NCE-Fabric 持南向和北向數據致性校驗 2、轉發獨運:控制器單集群所有節點故障(下電),轉發器所有業務不受影響 3、控制器異地容災:持異地容災式部署,當主數據中的控制器集群故障時,異地容災控制器集群可以接替所有當前的配置1、數據致性校驗:APIC 不持北向數據致性校驗 2、轉發獨運:控制器單集群所有節點故障(下電),轉發器業務不受影響 3、APIC 控制器集群中,每份數據在三個節點中進存儲(節點超過三個時,不同的數據可能存儲在不同的三個節點)。需要謹慎規劃部署集群及 st
48、andby 節點,以防某地故障導致三個或以上控制器節點故障時,某些配置丟失法恢復總結:華為 CloudFabric 持主備 DC,控制器主備集群,持南北向數據致性校驗,iMaster NCE-Fabric 下線后不影響之前下發的所有業務。輕量化案持中 DC 輕量 SDN 解決案 CloudFabric Easy 控制器可全部虛擬機安裝,持設備合思科 Mini ACI Fabric 少 Spine-Leaf 兩層組 Mini ACI Fabric 的控制器 APIC 少需要臺物理機+2 個虛擬機,資源消耗較總結:華為 CloudFabric 持全盒+框盒的靈活組,持全虛擬機安裝,滿極簡端到端規劃
49、、設計,部署解決案;思科 Mini ACI Fabric,少 Spine-Leaf 兩層組;Mini ACI Fabric 的 APIC 部署少需要臺物理機+2個虛擬機,資源消耗較。21TOLLY REPORT#222112ZH4.3 測試條 4.3.1 階設計 華為:華為 SCT 階設計具提供詳細的流程,供售前員針對戶需求,通過勾選預設問題答案選項,成設備選型和報價清單。階設計包括四個主要:基礎需求、選取設備、案配置、和商務設定。具以選取配置為主,便售前員在不需要過多技術撐的情況下確定案和 BOQ 報價清單,供售前投標及后期項交付階段低階設計具的輸使。思科:未思科官有類似功能全的階設計具。選
50、取配置導出階設計結果為報價清單 BOQ 件22TOLLY REPORT#222112ZH4.3.2 低階設計 華為:華為 CloudFabric iDesigner 低階設計具持案設計、程設計、絡設計、控制器設計等步驟,持導出設計件以及供絡部署使的零配置開局 ZTP 件。思科:未思科官有類似低階設計具,Cisco Design Zone 只提供設計參考檔。低階設計持直接導或同步報價清單 BOQ 中的設備持導出低階設計 LLD 結果、Visio 件、零配置開局 ZTP 件23TOLLY REPORT#222112ZH4.3.3 系統架構 4.3.3.1 控制器和分析器安裝式 華為 iMaster
51、 NCE-Fabric 和 iMaster NCE-FabricInsight 均持單機式或集群式部署,并均持物理機或虛擬機式部署。思科 APIC 要求少有個節點為物理機,并且當物理機故障時,絡法物理變更,存在脫管險。Cisco Mini ACI Fabric 持 1 臺物理機+2 虛擬機的 APIC 集群。4.3.3.2 虛擬系統納管 華為:華為 CloudEngine 16816 持作為物理設備 PS(Physical System)被虛擬成多達 16 個相互隔離的虛擬系統(VS)。華為 iMaster NCE-Fabric 持管理 VS。思科:思科 IBN 案(ACI 架構)采的 Nex
52、us 9000 系列交換機不持多虛擬系統(Cisco VDC)。4.3.3.3 第三設備納管 華為:華為 iMaster NCE-Fabric 持納管思科 Nexus 9000 系列和 Nexus 7000 系列數據中交換機。華為 iMaster NCE-Fabric 可以通過 NETCONF YANG 模板配置思科 Nexus 7000 和 9000 系列。南向持采驅動的式納管第三設備,三設備驅動持動態加載,南向接持被業務設計器(runbook)使。納管 F5 設備,并可調 F5 設備創建 runbook24TOLLY REPORT#222112ZH 4.3.3.4 分析器架構開放性 華為:
53、華為 iMaster NCE-FabricInsight 北向持 Kafka、RESTful、SNMP、WebSocket 四種接的數據開放,同時,提供全量絡數據服務開放(50+本體資源,配置件、表項、故障事件、KPI、業務流路徑),拖拽式可編排,分鐘級成場景化 API。拖拽式編排創建 API調 F5 設備創建 Runbook 并仿真校驗25TOLLY REPORT#222112ZH4.3.4 組架構 4.3.4.1 絡架構靈活性-設備 數據中 Fabric 中的交換機包括多種。對于中型組或些特殊場景,戶會希望些設備同時擔負多種,以節省投資。華為:華為 CloudFabric 案將交換機劃分為
54、 Spine、于連接外部絡的 Border Leaf、于接計算節點的 Server Leaf、于接防墻和負載均衡設備等增值服務(VAS)的 Service Leaf、于多 DC 間互聯或 Fabric 互聯的 DCI Gateway(Fabric Gateway)。華為 CloudFabric 組架構靈活,持 Spine、Border Leaf、DCI Gateway(Fabric Gateway)、Server Leaf 和 Service Leaf 五個合組。華為 CloudFabric 同時也持 Border Leaf 和 Spine 兩個合組,或者 Border Leaf 和 DCI
55、Gateway(Fabric Gateway)合設置。思科:思科的 Spine 集成 DCI Gateway(Fabric Gateway)功能,并且不同的 Leaf 間持合可能。但思科 IBN 案 ACI 架構不持 Spine 和 Leaf 合組,因此不持 Spine 和 Border Leaf、Compute Leaf、Services Leaf 所有合組,也不持 Spine(含 DCI/Fabric Gateway)和 Border Leaf 兩個合組。對于型的 Fabric,思科較華為案需要更多的設備。26TOLLY REPORT#222112ZH4.3.4.2 通過 IPv6 管理設
56、備 隨著 IPv6 的普及,越來越多的機構開始從 IPv4 切換為 IPv6。華為 iMaster NCE-Fabric 和 iMaster NCE-FabricInsight 持通過 IPv4 或 IPv6 與設備通信。思科 APIC 也持通過 IPv4 或 IPv6 與設備通信。4.3.4.3 轉發 IP 報分和重組 華為 CloudEngine 數據中交換機持轉發 IP 報分和重組。在某些法改變中間 IP 設備傳輸 MTU 場景下,可以將超過 MTU 的報分,保障報在絡中的傳輸。思科 Nexus 9000系列交換機不持轉發 IP 報分。4.3.4.4 絡架構可性-BFD 華為 Cloud
57、Engine 數據中交換機持最 3.3 毫秒的 BFD 發包間隔,可??焖偬綔y到轉發路徑的故障,并聯動 OSPF 路由協議等實現故障快速切換。思科 Nexus 9000 系列交換機持最 50 毫秒的 BFD 發包間隔,故障探測時間較。27TOLLY REPORT#222112ZH4.3.4.5 絡架構可性-服務器/VAS 接 數據中絡要求具備可性,如服務器和 VAS 設備(防墻、負載均衡)接都要求鏈路冗余,常的包括 M-LAG 鏈路聚合(思科 vPC)、EVPN ESI Multihoming 多歸雙歸等冗余技術。華為:華為 CloudFabric 持通過 M-LAG 2.0 實現跨設備的鏈路
58、聚合。Tolly 程師驗證了,當條鏈路出現故障時,受影響流量的故障倒換時間 20 毫秒。華為 iMaster NCE-Fabric 持對兩臺交換機組成的 M-LAG 設備組進管理,以設備組為單元,類似單個設備進管理,設置設備等。華為 EVPN ESI 多歸最多持四臺上設備。Tolly 程師驗證了,四條鏈路間持負載均衡,且當三條鏈路故障時,剩余鏈路依然保障業務流量。思科:思科 vPC 當條鏈路出現故障時,受影響流量的故障倒換時間 20 毫秒。思科 EVPN ESI 多歸只持兩臺上設備實現雙歸。28TOLLY REPORT#222112ZH4.3.5 物理絡動化 4.3.5.1 上電部署 數據中絡
59、 SDN 案采控制器集中管理的式,設備上電后都需要被控制器納管。設備上電部署流程要同時兼具易性、靈活性和安全性。華為:華為 CloudFabric 解決案持極簡 ZTP 開局,持帶內或帶外管理模式,持內置或外置 DHCP 服務器。持拓撲設備上線校驗和 underlay 校驗,持證書認證和 SFTP 雙重安全保障。思科:思科 IBN 數據中絡解決案 ACI 架構也持極簡 ZTP 開局。思科 ZTP 帶內啟動,控制器和業務必須相連,存在安全隱患,且僅持 APIC 內置 DHCP 服務器。4.3.5.2 配置模板 華為 CloudFabric 和思科 IBN 案的部分業務,都通過各的控制器的圖形界進
60、配置和管理。對于部分功能,管理員仍需要通過控制器對設備進命令式的下發。華為 iMaster NCE-Fabric 持配置模板,對于很多需要通過命令式下發的配置,也能夠以填參數的式動成命令。思科 APIC 不持類似功能。華為 iMaster NCE-Fabric 配置模板29TOLLY REPORT#222112ZH4.3.5.3 批量配置 數據中絡開局存在量類似的配置需要次性下發,批量配置功能可以極地減少配置時間。華為:華為 iMaster NCE-Fabric 持外部絡、租戶、邏輯絡中各組件的批量配置,iMaster NCE-Fabric 提供各配置的 Excel 格式模板,便管理員在模板中
61、填寫配置然后上傳,即可批量創建、批量修改以及批量刪除。思科:思科 APIC 的圖形化配置界不持批量配置。下載模板、填配置、上傳進批量配置持批量配置的組件30TOLLY REPORT#222112ZH4.3.5.4 基于意圖的 Underlay 絡規劃仿真 基于意圖的 Underlay 絡規劃和仿真,可以極地簡化 Underlay 絡規劃和部署的流程,并減少錯誤。華為:華為 iMaster NCE-Fabric 持針對新數據中 Underlay 絡,基于意圖的規劃、仿真和部署。管理員輸意圖后,華為 iMaster NCE-Fabric 動成 Underlay 絡規劃、仿真評估、并實施部署。思科:
62、思科 APIC 不持 Underlay 絡基于意圖規劃。成規劃智能機器界新 DC 意圖輸意圖輸意圖規劃評估部署拓撲部署結果正在部署31TOLLY REPORT#222112ZH4.3.5.5 意圖校驗 數據中絡部署階段的意圖校驗功能,可以對部署的絡進校驗,避免絡故障。華為:華為 iMaster NCE-Fabric 在數據中絡開局階段持 Underlay 拓撲連線的驗證、Underlay 連線后端互聯驗證、互聯 IP 驗證;在 Underlay 絡創建后持 VTEP 連通性、洞路由、路由環回等校驗,確保 Underlay 絡連通性和故障。校驗結果:準備數據 收集數據 驗證絡連通性(連通鏈路:8
63、4,法連通鏈路:0)驗證絡洞(路由洞:0)驗證絡環路(路由環路:0)配置校驗(OSPF:0 路由器 ID:0 VTEP:0 互聯 IP:0)完成32TOLLY REPORT#222112ZH4.3.5.6 擴容意圖翻譯 對于已部署的絡,后期的擴容,也需要通過動化部署提效率,以及避免配置可能產的錯誤。華為:華為 iMaster NCE-Fabric 持 ToR 交換機擴容和服務器擴容意圖動化配置。以服務器擴容為例,管理員配置擴容意圖后,將安裝好操作系統并使能了 LLDP 的服務器連接到預設定的交換機,華為 iMaster NCE-Fabric 則會動發現擴容的服務器,并配置絡設備打通絡。思科:思
64、科 APIC 不持服務器擴容意圖翻譯。規劃擴容規劃成規劃評估規劃部署拓撲配置和仿真結果成配置仿真評估進程連通性仿真33TOLLY REPORT#222112ZH4.3.6 可靠性/可性 除了組的鏈路和設備冗余保障絡的可性,數據中絡解決案還持些其它特性保障業務的可性。4.3.6.1 數據致性校驗 華為:華為 iMaster NCE-Fabric 北向持與云平臺進配置數據致性校驗,南向持與交換機進配置數據致性校驗。北向,測試中,當 iMaster NCE-Fabric 與 OpenStack 云平臺的配置不致時,可以對配置進同步操作。如 iMaster NCE-Fabric 中動為云平臺中 ins
65、tance 成的接被意外刪除導致 instance 的絡不通,通過在云平臺執對賬命令,iMaster NCE-Fabric 成功將邏輯接添加回來,保持數據致性。南向,測試中,當運在雙模配置模式的交換機在緊急排障中刪除了配置,和 iMaster NCE-Fabric 中的配置不致時,通過在 iMaster NCE-Fabric 中執配置審計,會發現被刪除的配置,并可以鍵將配置添加回去。思科:思科 IBN 案 ACI 架構中的交換機設備只可以被 APIC 控制器進配置,所以南向數據校驗功能不必要。Tolly 程師未發現思科 APIC 與云平臺的北向數據致性校驗功能。4.3.6.2 轉發獨運 華為
66、CloudFabric 數據中絡解決案和思科 IBN 案 ACI 架構均持轉發獨運。當控制器集群所有節點故障,轉發器業務不受影響。34TOLLY REPORT#222112ZH4.3.7 輕量化案 對于中數據中,各商設計了對應的輕量化案。華為:CloudFabric Easy 是中數據中輕量 SDN 解決案,持所有設備或部分合設置,持控制器單節點或集群部署。思科:思科 Mini ACI Fabric 需要少 Spine-Leaf 兩層組??刂破?APIC 少需要臺物理機+2 個虛擬機的集群部署。35TOLLY REPORT#222112ZH5 Day1 業務部署 5.1 測試法 Day1 業務
67、部署場景是指在 Day0 規劃建設后,通過對客戶業務意圖的理解,轉換為對絡的設計需求,然后對案進評估,最后下發到設備實現并進業務連通性檢測的過程,具體包括意圖翻譯、案設計、評估決策、案實施、業務驗證等環節。Tolly 認為,評價數據中動駕駛絡 Day1 業務部署階段 L3.5 等級平,應該重點關注以下個:輸如部署套銀系統等業務意圖,系統動將業務意圖轉換為絡需求,動查詢/分配資源,動成案。系統在線仿真校驗,評估案,決策,系統動進絡配置和業務策略下發,系統動驗證業務連通性。36TOLLY REPORT#222112ZH5.2 測試結論 Tolly 經過測試組發現,華為 CloudFabric 和
68、Cisco IBN 均能完成配置的動化,但是華為 CloudFabric 在智能推薦絡、意圖翻譯、云數據致性校驗、三級回滾等特性優于思科。分類華為 CloudFabricCisco IBN(Data Center)-ACI 架構配置式1、雙模管理:全量業務持拖拽式和命令雙模配置管理,有利于繼承已有的絡運維習慣,當控制器故障時,仍然可以直接登錄設備進排障和配置,并且設備有加鎖機制,不會引起配置沖突 2、全配置回滾:控制器和設備的配置同時打快照,還原速度快,單設備 5 分鐘以內,全 20 分鐘,設備不重啟1 3、租戶配置回滾 4、業務配置回滾:基于單次業務操作配置撤銷 5、控制器設備配置恢復能:全
69、配置快照,對全 CE 交換機設備進配置回滾,持每臺設備 20 個件。且件內容相同將覆蓋之前件,持配置基線件,基線件不會被覆蓋,持回滾到某個配置件1、APIC 持圖形化界和 CLI 配置,但運在 ACI 模式的設備不持直接登錄設備進配置,在控制器故障時,法對絡做配置 2、持基于快照的全配置和租戶配置回滾 3、不持基于單次業務操作的業務配置回滾總結:華為 CloudFabric 持控制器和設備命令雙模配置,并且有加鎖機制不會引起配置沖突,持配置全、租戶、業務三級回滾,控制器拖拽式編排。意圖理解 仿真意圖翻譯 1、基于智能機器,動識別意圖,智能推薦邏輯絡案,免業務編排,包括應上線,下線,變更,應互訪
70、 2、21 個典型數據中絡意圖發放:覆蓋數據中絡規劃、建設、運維、調優全場景,實現數據中絡全場景意圖化編排動化。如:通過“新建 DC”意圖實現數據中絡規劃動化;通過應上線、下線意圖實現業務發放的動化;通過“重保業務監控”意圖實現重點業務的監控 3、戶定義異構絡意圖編排:持通過界拖拽的式進異構絡(含三設備)業務靈活編排,并可通過 API 的形式向上提供封裝后的絡編排能 意圖驗證 1、可達性驗證:持 Pod 內東向同 VPC 同,同 VPC 跨互訪;Pod 內跨 VPC 未過 FW 及 LB 互訪,經過華為 FW 未過 LB 互訪;單 Pod 南北向互訪等連通性校驗 2、隔離性驗證:驗證兩個(或
71、IP)間是否隔離 3、存在性驗證:絡中是否存在路由環路和路由洞 4、致性驗證:鏈路兩側接的致性校驗包括 MTU、速率、雙模式、協商模式、作模式、VLAN、IP 等參數 5、持跨 DC/Fabric 的過防墻/LB 的數據意圖驗證意圖翻譯:不持基于場景、智能推薦邏輯絡案 意圖驗證:不持跨 DC 過防墻/LB 的數據意圖驗證總結:華為 CloudFabric 持基于業務意圖的理解,智能推薦邏輯絡案;思科 IBN 不持基于業務意圖智能推薦絡。華為 CloudFabric 持 Fabric 內或跨 DC/Fabric 的數據連通性驗證;思科 IBN 持使 Nexus Dashboard Insight
72、s 進 Fabric 內的連通性驗證,不持跨 DC/Fabric 的連通性驗證。備注:1.實測單設備 1 分鐘還原,整 17 分鐘還原(兩臺設備)。華為認為整設備數不會對整還原耗時有較影響。37TOLLY REPORT#222112ZH分類華為 CloudFabricCisco IBN(Data Center)-ACI 架構仿真校驗配置變更前在線 IPv4&IPv6 仿真校驗:業務發放前,結合設備已有配置和新增配置,對資源、連通性、變更影響建模仿真,避免錯誤配置影響現有業務。1)靜態資源仿真校驗 范圍:VRF,VNI,L2 接,靜態路由;2)當前動態資源呈現:ARP、ND、FIBv4、FIBv
73、6、MAC;3)配置變更校驗范圍:邏輯絡,微分段規則,外部絡,VPC 互通 使形式化驗證算法,實現分鐘級仿真持配置變更前在線仿真校驗資源變更總結:華為 CloudFabric 和思科 IBN(Data Center)均持配置變更前的仿真校驗IPv6IPv6 VXLAN:持 IPv6/IPv4 VXLAN Overlay 業務的動化配置IPv6 VXLAN:持 IPv6/IPv4 VXLAN Overlay 業務的動化配置總結:華為 CloudFabric 和 Cisco IBN 均持 IPv6 VXLAN。微分段持 IPv4、IPv6 微分段持 IPv4、IPv6 微分段總結:華為 Cloud
74、Fabric 和 Cisco IBN 均持微分段。業務鏈1、NSH 業務鏈:持 IETF 標準的服務鏈(SFC)模型,持 NSH 模式,IPv4/IPv6 2、PBR 業務鏈:持 IETF 標準的服務鏈(SFC)模型,持 PBR 模式,IPv4/IPv6 3、業務鏈持編排 L4-L7 服務,例如引導流量過防墻1、NSH 業務鏈:不持 2、PBR 業務鏈:持 IETF 標準的服務鏈(SFC)模型,持 PBR 模式,IPv4/IPv6 3、業務鏈持編排 L4-L7 服務,例如引導流量過防墻總結:華為 CloudFabric 和 Cisco 均持 PBR 業務鏈,另外華為 CloudFabric 持
75、 NSH 業務鏈,Cisco IBN 不持絡虛擬化1、VMware vCenter:持控制器與 VMware vCenter 集成,推送虛擬絡配置到 vSwitch,實現物理與虛擬絡的統規劃;并通過感知 VM 上線、下線和遷移等事件,實現絡配置的按需下發和遷移跟隨,持 vSphere Fault Tolerance(FT)、跨 vCenter 遷移 2、Microsoft System Center:持控制器與 System Center 集成,推送虛擬絡配置到 vSwitch,實現物理與虛擬絡的統規劃。并通過感知 VM 上線、下線和遷移等事件,實現絡配置的按需下發和遷移跟隨VMware vC
76、enter:持 Microsoft System Center:持總結:華為 CloudFabric 和 Cisco IBN(Data Center)均持和 VMware vCenter,Microsoft System Center 等虛擬化平臺對接38TOLLY REPORT#222112ZH分類華為 CloudFabricCisco IBN(Data Center)-ACI 架構云協同1、標準模型及協議對接:iMaster NCE-Fabric 持基于標準模型對接 OpenStack 云平臺,實現絡資源的統管理和按需調,控制和轉發均為標準協議,持對接狀態查詢 2、裸屬納管:持與云平臺上的
77、裸屬機管理組件協同,動下發裸屬機業務部署所需的絡配置,持安全組轉 ACL 3、致性校驗:iMaster NCE-Fabric 與云平臺數據不致時,持全量和增量同步,避免配置沖突 4、其他功能:持名單;遷移事件觸發配置下發1、控制 OpFlex 和 COOP 以及轉發 Evxlan 均為私有協議,協議也開放給第三集成,業界持度略低 2、不持動將 OpenStack 中的安全組轉化為 Compute Leaf 交換機的對應 ACL 3、未發現思科 APIC 與云平臺的北向數據致性校驗功能總結:華為 CloudFabric 在和云平臺對接的可維護性、數據致性校驗、協議標準性等,優于思科 IBN。容器
78、絡1、K8s 對接:持對接 K8s 容器平臺 2、華為 CCE(Cloud Container Engine)容器平臺對接:iMaster NCE-Fabric 持與華為 CCE 敏捷版原 Calico 絡案對接,感知 Calico Node 上線,聯動控制器對物理絡下發 BGP 配置 3、容器絡模型可視:持容器邏輯絡拓撲和應絡拓撲可視1、K8s 對接:持對接 K8s 容器平臺 2、容器絡模型可視:持容器邏輯絡拓撲和應絡拓撲可視總結:華為 CloudFabric 和思科 IBN 均持 K8s 容器平臺對接,且持容器絡的可視化。多云編排跨 DC 編排:1、Multi-DC Controller
79、持納管跨 DC 的 TransitFabric,發放 TransitVPC 2、管理邊緣 DC:Multi-DC Controller 持發放中、邊緣 DC 間 L3 互通 3、私有云專線編排:Multi-DC Controller 持在Transit VPC 上發放多云 L3 互聯,專線接 4、跨 DC 絡業務的事前仿真校驗(IPv4&IPv6):業務發放前,對資源、連通性、變更影響建模仿真,避免錯誤配置影響現有業務 混合云編排:1、采開放框架持對接公有云,持公有云(包括 AWS)事前業務仿真校驗和連通性校驗 2、通過調公有云 API 形式對公有云側 VPC 進編排和拓撲還原,需在公有云側額
80、外部署虛擬絡設備跨 DC 編排:1、持跨 DC 編排 2、持管理邊緣 DC 3、持私有云專線編排 4、不持跨 DC 絡業務的事前仿真校驗(IPv4&IPv6)混合云編排:1、需要在公有云側部署 Cisco 虛擬設備,占公有云資源 2、不持公有云事前業務仿真校驗和連通性校驗 3、持 AWS、Azure、Google Cloud 對接總結:華為 CloudFabric 持的跨 DC 功能思科 IBN 更豐富,且對接公有云(AWS)需在公有云側部署額外絡設備。39TOLLY REPORT#222112ZH5.3 測試條 5.3.1 配置式 5.3.1.1 易性 華為:華為 iMaster NCE-F
81、abric 提供 GUI 界,可以完成絡配置的拖拽式圖形化配置、編輯和查看展示。下圖為華為 iMaster NCE-Fabric 的虛擬私絡(VPC)的邏輯絡,左側為可供拖拽添加的組件,中間顯示整個邏輯絡的拓撲,點擊每個組件可在右側進查看和配置。配置項也量采選取的式,便于配置和避免錯誤輸。邏輯絡的拓撲和配置在個界顯示,較為直觀。思科:思科 Nexus Dashboard 和 APIC 也基于圖形界完成業務發放。外部絡域邏輯 VAS(防墻、負載均衡服務等)互聯接(NFVI 場景路由器直連 PE 使)邏輯路由器:通常下掛多個邏輯交換機(),上連接防墻或外部絡邏輯交換機:通常對應個段邏輯端:戶端連接
82、的絡側虛擬邏輯端,對應到物理交換機的接戶端:虛擬機/Instance/Pod/裸屬主機的端設置鏈路:于連接邏輯路由器和邏輯交換機、或于連接邏輯端和戶端設置外部連接:于連接邏輯路由器和外部絡(流量不過墻)或者防墻類型的邏輯 VAS 和外部絡(流量過墻)外部絡域防墻邏輯 VAS邏輯路由器邏輯交換機邏輯端戶端40TOLLY REPORT#222112ZH5.3.1.2 配置式 華為:華為 CloudFabric 持雙?;騿文9芾?。單模管理模式下,交換機設備只能被 iMaster NCE-Fabric 管理。雙模管理模式下,交換機除了受 iMaster NCE-Fabric 管理,管理員仍然可以在緊急
83、情況,如控制器集群完全故障時,連接上設備并通過設備 CLI 做緊急配置。思科:思科 IBN 案 ACI 架構僅持通過控制器 APIC 進配置(圖形界或命令)。當控制器集群完全故障時,管理員法修改絡設備配置。5.3.1.3 配置回滾 華為:整快照與回滾:華為 iMaster NCE-Fabric 持對全量配置和數據進快照,持最多 5 個快照點進配置還原。還原速度快,單設備 5 分鐘以內,全 20 分鐘,設備不重啟(實測單設備 1 分鐘還原,整 17 分鐘還原)。整測試采的兩臺設備。華為認為整回退時間與規模的關聯度較?;貪L成功備份成功整回滾,iMaster NCE-Fabric 數據庫和交換機配置
84、均回滾41TOLLY REPORT#222112ZH租戶快照與回滾:華為 iMaster NCE-Fabric 持基于租戶級別定時或快照,可以選定任意快照點進配置還原,持將快照點配置和數據進本地或者遠端存儲,持遠程導快照點進配置恢復。華為 iMaster NCE-Fabric 持租戶的任意快照點與當前配置的差異對。業務配置回滾:華為 iMaster NCE-Fabric 持單次業務操作配置回滾。思科:思科 APIC 持全和租戶的配置快照回滾,不持基于單次業務配置的回滾。當前被對快照快照與當前配置相,需要刪除兩個邏輯組件單次業務操作配置回滾42TOLLY REPORT#222112ZH5.3.2
85、 意圖翻譯 意圖翻譯以戶意圖作為輸,動構建絡、成配置并驗證。華為:數據中動駕駛絡華為 CloudFabric 解決案持業務意圖翻譯,智能推薦邏輯絡案,免業務編排,包括應上線,應互訪,應監控。華為 CloudFabric 案可以按照需求提供種推薦組,構建絡并仿真、下發、和驗證。思科:思科 IBN(ACI 架構)數據中絡解決案前還不持以應為基礎的組推薦、仿真、下發、驗證整套意圖翻譯流程。兩種推薦組webApp意圖輸案推薦案成案實施絡案推薦成功43TOLLY REPORT#222112ZH5.3.2.1 典型數據中意圖發放 華為:華為 iMaster NCE-Fabric 持 21 個數據中典型絡意
86、圖,覆蓋數據中絡規劃、建設、運維、調優全場景,實現數據中絡全場景意圖化編排動化。如:通過“新建 DC”意圖實現數據中絡規劃動化;通過應上線、下線意圖實現業務發放的動化;通過“重保業務監控”意圖實現重點業務的監控。重保業務監控意圖某重保業務故障時的提示44TOLLY REPORT#222112ZH 絡變更意圖驗證,包括意圖識別,underlay 驗證,overlay 驗證三步該條為新增條鏈路的意圖underlay 仿真驗證連通性、路由洞、環路、配置overlay 仿真校驗,選擇服務的源的地址驗證連通性45TOLLY REPORT#222112ZH5.3.2.2 戶定義異構絡意圖編排 華為:華為
87、iMaster NCE-Fabric 持通過界拖拽的式進異構絡(含三設備)業務靈活編排,并可通過 API 的形式向上提供封裝后的絡編排能。創建 runbook46TOLLY REPORT#222112ZH5.3.2.3 意圖驗證 意圖驗證功能保障在業務發放或變更后,實時或定時校驗意圖,識別絡變更險。華為:華為 iMaster NCE-FabricInsight 持實時或定時意圖驗證功能,例如可達性驗證、隔離性驗證、存在性驗證、以及致性驗證。思科:思科 Nexus Dashboard Insights 持 Fabric 內的連通性驗證,但不持跨 DC/Fabric 的數據意圖驗證???DC/Fa
88、bric 的源和的間連通性驗證結果顯示跨 DC/Fabric 的路徑整連通性、致性、存在性驗證47TOLLY REPORT#222112ZH5.3.3 仿真校驗 仿真校驗功能可在業務發放前,對資源、連通性、變更影響建模仿真,避免錯誤配置影響現有業務。使形式化驗證算法,實現分鐘級仿真。華為:華為 iMaster NCE-Fabric 持對當前動態和靜態資源利率進呈現,可呈現資源包括 ARP、FIBv4、VNI/BD/EVPN、VRF、靜態路由、層接、ACL 等。華為 iMaster NCE-Fabric 還持在業務發放前,對資源、連通性和變更影響進建模仿真,避免錯誤配置影響現有業務。配置變更校驗
89、范圍包括:邏輯絡,微分段,外部絡,VPC 互通等配置。被校驗的資源包括:VRF、靜態路由、層接、VNI/BD/EVPN 等。思科:思科 Nexus Dashboard Insights 也持變更前仿真。各資源的利率配置仿真和業務配置的界致,保持致的體驗。在仿真對業務配置后,點擊仿真按鈕,即可得到仿真結果。管理員確認業務變更結果后,可以選擇提交配置,則配置會真實下發到交換機。仿真結果:資源變更、連通性和整影響48TOLLY REPORT#222112ZH5.3.4 IPv6 業務 華為 CloudFabric 和思科 IBN 解決案均持 IPv4 和 IPv6 VXLAN Overlay 業務的
90、動化配置,IPv6 的終端(endpoints)可成功互訪。5.3.5 業務安全服務 5.3.5.1 微分段 華為 CloudFabric 和思科 IBN 解決案均持基于 EPG(Endpoint Group)的 IPv4 和 IPv6 微分段,EPG 之間默認隔離,通過策略進 EPG 間的訪問控制。5.3.5.2 業務鏈 華為 CloudFabric 和思科 IBN 解決案均持基于 EPG(Endpoint Group)的 Policy-Based Redirect(PBR)業務鏈,引導 EPG 間的流量順次經過業務節點(如防墻等)。如下所示為常業務鏈,引導源 EPG 到的 EPG 的流量順
91、次經過三個防墻。華為 CloudFabric 另外還持 Network Service Header(NSH)業務鏈,實現功能和 PBR 業務鏈類似,應中各有優勢。思科 IBN 解決案不持 NSH 業務鏈。?EPGFW 1FW 2FW 3?EPG49TOLLY REPORT#222112ZH5.3.6 絡虛擬化 華為:華為 CloudFabric 數據中絡解決案持控制器 iMaster NCE-Fabric 與 VMware vCenter 和 Microsoft System Center 集成,推送虛擬絡配置到 vSwitch,實現物理與虛擬絡的統規劃。并通過感知 VM 上線、下線和遷移等
92、事件,實現絡配置的按需下發和遷移跟隨。詳細結果參 Tolly 報告#220113 https:/ IBN 數據中絡解決案持和 VMware vCenter 集成,也持與 Microsoft System Center 集成的功能。50TOLLY REPORT#222112ZH5.3.7 云協同 OpenStack 作為云計算平臺,將業界標準的硬件虛擬化成資源,并對這些資源進編排,戶可隨需獲取資源。華為 CloudFabric 和 Cisco IBN 數據中絡解決案均持與 OpenStack 云計算平臺對接。管理員只需要在 OpenStack 平臺控制臺進絡和實例的操作,華為和思科案的控制器即會
93、聯動對租戶絡設備進配置,打通 OpenStack 同租戶下實例間的三層通信。測試包括了實例創建、遷移和刪除等操作。5.3.7.1 標準模型及協議對接 華為:華為 CloudFabric 采標準模型對接 OpenStack 云平臺,控制 NETCONF 和 BGP-EVPN 以及轉發 VXLAN 均為業界泛采的標準協議,各商的絡設備普遍持。關于華為 CloudFabric 與 OpenStack 對接的詳細結果,參 Tolly 報告#220113 https:/ IBN 案 ACI 架構控制 OpFlex 和 COOP 以及轉發 eVXLAN 均為私有協議,協議也開放給第三集成,但業界持度略低。
94、51TOLLY REPORT#222112ZH5.3.7.2 裸屬納管 OpenStack Ironic 允許戶像管理虛擬機樣管理裸屬服務器。華為:OpenStack Neutron 提供安全組機制,來對虛擬機實例(instance)的通信進訪問控制。安全組通常通過直連虛擬機實例的 Open vSwitch 來實施。對于裸屬(bare metal)服務器實例,由于其直連 Server Leaf/Compute Leaf 交換機,法通過 Open vSwitch 來實施安全組機制。華為 CloudFabric 解決案通過與 OpenStack 對接,動將 OpenStack 中的安全組轉化為 S
95、erver Leaf 交換機的對應 ACL,實施安全組的策略,保持虛擬機和裸屬實例相同的使體驗。思科:思科 IBN 案 ACI 架構數據中絡解決案不持動將 OpenStack 中的安全組轉化為 Compute Leaf 交換機的對應 ACL。5.3.7.3 致性校驗 華為:華為 iMaster NCE-Fabric 與 OpenStack 云平臺的配置不致時(如 iMaster NCE-Fabric 中動為云平臺中 instance 成的接被意外刪除導致 instance 的絡不通),通過在 OpenStack 云平臺執對仗命令,iMaster NCE-Fabric 成功將邏輯接添加回來。思科
96、:Tolly 程師未發現思科 APIC 與云平臺的北向數據致性校驗功能。52TOLLY REPORT#222112ZH5.3.8 容器絡 華為:Kubernetes,簡稱 K8s,是個來動化 Linux 容器操作的開源平臺?!癙od”是 Kubernetes 中能夠創建和部署的單元,包含個或多個容器,每個 Pod 被分配個 IP 地址。Tolly 程師驗證了,華為CloudFabric 數據中絡解決案持控制器 iMaster NCE-Fabric 可與 Kubernetes 平臺對接。并通過感知 Pod 創建和刪除等事件,實現絡配置的按需下發。詳細結果參 Tolly 報告#220113 htt
97、ps:/ iMaster NCE-Fabric 持管理 400 萬容器規模,每分鐘持多達 10K 容器上下線。但是因為該規模數據需要超量的硬件資源才可測試,所以 Tolly 并沒有驗證。華為 iMaster NCE-Fabric 還持對接華為 CCE(Cloud Container Engine)敏捷版原 Calico 絡案,感知 Calico Node 上線,聯動控制器對物理絡下發 BGP 配置。思科:思科 IBN 數據中絡解決案也持和 Kubernetes 對接。53TOLLY REPORT#222112ZH5.3.9 多云編排 當戶擁有多個數據中,或者同時使私有云和公有云時,業界最新的案
98、是采中控制器,對多云進統編排和管理。5.3.9.1 多數據中編排 華為:華為 Multi-Datacenter Controller(MDC)多數據中控制器部署在專的集群服務器上,可以是物理服務器也可以是虛擬機,持創建于多云業務編排的 Transit Fabric,并通過 Transit Fabric 中實例化 Transit VPC 來實現多租戶 VPC 跨 DC 的 L3 互通。DC 持專線互聯。思科:思科 Nexus Dashboard Orchestrator 持跨 DC 編排,但不持像華為樣拖拽式編排。DC 2 中的租戶路由器DC 1 中的租戶路由器Transit 路由器防墻54TO
99、LLY REPORT#222112ZH5.3.9.2 混合云編排 華為:華為 Multi-Datacenter Controller(MDC)多數據中控制器持對公有云和私有云組成的混合云進編排。華為 MDC 控制器中可創建 AWS 中的 VPC,也可同步 AWS 中的 VPC 到本地。華為 iMaster NCE-Fabric 中創建 AWS VPCAWS 中同步出 VPC55TOLLY REPORT#222112ZH 思科:思科 Nexus Dashboard Orchestrator 也持配合部署在公有云中的 APIC 對公有云和私有云間業務進編排。思科案需要在公有云部署思科虛擬設備,占公
100、有云資源。對 AWS VPC 的編排華為 MDC 通過 IPsec 統模型編排與公有云對接,私有云與 AWS 之間持通過 IPsec 通信56TOLLY REPORT#222112ZH6 Day2 監控排障 6.1 測試法 Day2 監控排障場景是指在 Day1 業務發放成功后,通過對客戶業務意圖的監控,保障業務正常運,具體包括意圖翻譯、監控可視、隱患排查、異常識別、問題定界、問題定位、修復案、仿真決策、業務恢復、業務驗證等環節。Tolly 認為,評價數據中動駕駛絡 Day2 監控排障階段 L3.5 等級平,應該重點關注以下個:輸如監控租戶、業務流、KPI 等業務意圖,系統動轉換監控規則建議;
101、潛在故障和隱患對業務的影響可視,系統動學習如相關性、閾值、AI 模型等規則/策略并動識別故障;系統預測絡狀態趨勢,定性粗略識別潛在漸變類隱患(如某端可能發弱光故障)。系統動學習如知識庫、故障傳播圖等規則/策略,并動定界定位;對系統給出個或多個疑似原因并排序的結果進確認,系統動成備選案;基于實時數據在線評估,給出評估結果,決策最優案,系統動驗證業務,動成報告。57TOLLY REPORT#222112ZH6.2 測試結論 Tolly 經過測試組發現,華為 CloudFabric 和 Cisco IBN 解決案均具有監控排障的功能,但是華為CloudFabric 在配置信息快照對和系統的健康度評估
102、體系等優于 Cisco。本章節華為 CloudFabric 案的所有結果均通過了 Tolly 程師的驗證。由于本次測試沒有安裝思科 Nexus Dashboard Insights,思科相關結果采思科公開的資料,結果不提供截圖。分類華為 CloudFabricCisco IBN(Data Center)絡可視1、三層互視:持在拓撲圖展示應、物理和邏輯三層絡以及他們之間的映射關系;持在物理拓撲中查找設備信息,定位虛擬機位置;持全局查找虛擬機 2、設備管理 KPI 可視:(a)設備維度 CPU/內存、防墻 IPv4 會話數可視(b)單板維度 CPU/內存、防墻 IPv4 會話數、FIB/MAC/A
103、RP/ND 表項利率可視,其中 FIB/ARP/ND 表持查看各 VRF 的分布、MAC 表持各 BD 的分布(c)芯維度 TCAM 資源利率可視(d)接維度接收發包/收發字節、播/組播/單播收發包數、丟包/錯包數、收發帶寬可視(e)隊列維度持微突發可視,持關聯分析擁塞時的丟包五元組信息詳情(f)光鏈路維度持全光模塊的收發功率、電流、電壓、溫度可視 3、設備轉發 KPI 可視:(a)基于 Telemetry 秒級感知和采集設備轉發表項詳情,包括 ARP/ND/IPv4/IPv6 等表項明細(b)設備 Running Config 可視,持在 Running Config 發變更時進動同步 4、
104、設備轉發表項可視:持按設備查看 ARP 表項明細信息,ND 表項明細信息,IPv4 路由表項明細信息,IPv6 路由表項明細信息;持按周期存儲 ARP 表項,ND 表項,IPv4 路由表項,IPv6 路由表項的歷史快照 5、設備運配置可視:持按設備查看設備的配置信息,持按周期存儲設備的配置快照,持不同快照的差異對能 6、RoCE KPI 可視:收/發 PFC 反壓幀數、PFC 死鎖監控數、PFC 死鎖恢復數、ECN 報 7、絡快照對(ChangeDiff):基于拓撲、配置、路由/ARP 等表項、KPI 等數據進設備快照采集、管理、差異化對分析,從幫助客戶定界故障。a.變更前后信息采集:采集變更
105、前快照(絡拓撲、running config、ARP 表項、ND 表項、IPv4 路由表項、IPv6 路由表項、流量/CPU/內存等 KPI 數據);b.變更檢測:基于算法識別變更前后快照差異,識別變更詳情;c.變更匯總:對所有變更設備的變更進匯總,給出分析結論 8、絡搜索 Netsearch:持鍵檢索絡任意對象(50+絡本體資源/配置/表項/志/issue 等)、任意 IP 對的絡路徑;持搜索結果的智能排序推薦;持搜索結果的絡拓撲呈現;持搜索對象的 360 關聯信息呈現??梢杂行嵘j變更前數據收集的效率、業務報障時故障的快速檢索定位1、三層互視:不持應絡、邏輯絡、物理絡互視 2、設備 KP
106、I:持通過 Telemetry 協議對各性能指標采集并圖形化展示 3、資源容量:持 TCAM、邏輯資源、端、帶寬等容量統計 4、持協議狀態可視 5、持主機 IP 可視(但不持 IP 快照和差異化對)6、不持 RoCE 絡的 KPI 監控 7、不持設備表項明細的監控,持絡快照的采集和差異化對,但是絡快照的內容相華為 iMaster NCE-FabricInsight 較少,僅有策略差異、異常數量差異和少量資源使數量差異等信息 8、不持全的絡搜索總結:華為 CloudFabric 持應、物理、邏輯三層絡互視,持定位虛擬機位置及全局查找虛擬機,有利于從應的度定位絡問題,持 RoCE KPI 質量可視
107、;Cisco IBN 均不持。58TOLLY REPORT#222112ZH分類華為 CloudFabricCisco IBN(Data Center)流量可視1、TCP Flow 可視:TCP 控制報路徑可視化:(a)持全對 TCP SYN、FIN、RST 控制報的數據采集能和存儲能(b)持按不同的報查看絡轉發路徑,TCP 數據報路徑可視化(c)持指定范圍的 TCP 報轉發路徑可視化 2、UDP Flow 可視:持指定范圍的 UDP 報轉發路徑可視化 3、組播業務流轉發路徑可視化、丟包分析 4、絡流量可視:持按從設備、接、協議、會話、主機、應等多種維度對絡流量進統計和分析,識別流量分布和趨勢
108、1、TCP/UDP Flow 可視:持,包括路徑可視、丟包/時延可視 2、組播流量可視:不持 3、持絡流量可視總結:華為 CloudFabric 持 TCP/UDP/組播等流量可視化,類型豐富于 Cisco IBN。異常檢測1、環路檢測:對 VXLAN 絡中可能存在的環路現象,控制器可以檢測出絡中的環路故障點,并提供給管理員破除環路的段。持檢測的環路類型有單設備單端環路、單設備多端環路、跨設備環路多種 2、設備異常檢測:持通過機器學習算法,基于歷史數據,通過機器學習算法訓練出絡設備 KPI 的動態基線,如 CPU/內存利率、接收/發包數等指標;持基于動態基線并結合 KPI 指標的變化量實現絡設
109、備KPI 指標的異常為檢測 3、絡設備丟包檢測:持因隊列 buffer 擁塞導致的業務報丟棄的檢測,并展示因擁塞丟棄的五元組信息;持因設備轉發異常,ACL 等原因導致的丟包檢測能,檢測種類持查表失敗,報檢查,端檢測等 200+種類型;并展示具體丟棄的五元組信息,以及丟棄的明細原因;持 remark 染丟包定位 4、絡設備轉發時延檢測:持業務流轉發路徑上的逐跳時延檢測;持基于業務流的逐跳時延檢測絡鏈路的時延 5、單播業務流丟包檢測:持對指定業務流進丟包檢測;業務流類型覆蓋 TCP,UDP 6、組播丟包檢測:持對組播業務流的丟包檢測;持對組播組的丟包檢測 7、單播業務流時延檢測:持對指定業務流進的
110、絡轉發時延檢測;業務流類型覆蓋 TCP,UDP 8、組播業務流轉發時延檢測:持對組播業務流進的絡轉發時延檢測 9、TCP 業務連接類異常檢測:持 TCP 建鏈失敗的異常檢測,覆蓋 TCP SYN 重傳,SYN-ACK 重傳,RST 等原因;持對 TCP 建鏈異常流的 Overlay 轉發路徑展示,包括 BD,VRF,L3VNI 等信息,并持基于Overlay 轉發路徑進鍵式定位能,給出可能的原因1、持 KPI 的異常檢測(靜態閾值、AI)2、持異常檢測,如連通性分析、丟包、時延等 3、環路檢測:不持環路檢測及鍵破環 4、組播異常檢測:持組播協議異常檢測,基于流的路徑丟包時延等檢測總結:華為 C
111、loudFabric 持環路檢測和基于機器學習的動態基線異常檢測;思科 IBN 不持環路檢測和鍵破環,設備異常僅持基于靜態閾值檢測。59TOLLY REPORT#222112ZH分類華為 CloudFabricCisco IBN(Data Center)絡健康度1、評估體系:設備、絡、協議分析、Overlay、應流五層建模,構建健康度評估體系,并持導出健康度評估報告,撐常運維。2、持對絡隱患預測的險評估(五層四維):1)性能負載類:Eth-Trunk 鏈路負載不均、Leaf 設備上鏈路負載不均、接鏈路擁塞、CPU/內存持續增、超險閾值 2)可靠性:設備可靠性降級(硬件冗余備份)、絡可靠性降級(
112、互聯降級、Eth-Trunk 成員鏈路斷開)、協議可靠性降級(FullMesh 鄰居降級)3)致性:相同設備款型軟件版本致、相同設備/型號資源模型致、ServerLeaf 連接 Server 端配置致、物理鏈路配置致性、運時配置與啟動配置的致性、M-LAG 配置致性、接管理態運態致性 4)絡穩定性:接丟包/錯包持續增、設備硬件狀態變化、鏈路狀態變化、協議狀態變化 3、持對絡鏈路級 SLA 的評估:基于絡按需選擇設備編排路徑進 Underlay 撥測,實現指定鏈路的質量監控,絡內每條鏈路丟包及時延并進可視化呈現 4、絡微突發畫像:針對絡微突發進畫像分析,包括微突發分布、歷史特征分析、離群分析、與
113、丟包帶寬等關聯影響評估體系:系統的整健康度評估體系,聚焦于異?,F象數量/統計分布、存量統計 持監控各類異?,F象(事件)持存量資源利率評估 不持系統性的絡險評估,如性能負載、可靠性、致性等(絡隱患預測性分析)不持對絡鏈路級 SLA 的評估 不持絡指標畫像(僅持微突發記錄可視)總結:華為 CloudFabric 持設備、絡、協議分析、Overlay、應流五層建模系統的評價絡健康度的體系,思科 IBN 系統的健康度評估體系,僅聚焦于異?,F象數量。華為 CloudFabric 持對絡隱患預測的險評估、持對絡鏈路級 SLA 的評估、持對絡微突發進畫像分析;未 Cisco IBN 有此絡評估和分析功能。6
114、0TOLLY REPORT#222112ZH分類華為 CloudFabricCisco IBN(Data Center)全量故障 分析、已知故障 1-3-5 90+常故障 1-3-5,包括設備類、絡類、協議類、Overlay 類和業務類。20+種故障持閉環 1、設備類:(a)設備狀態類異常檢測:整機/單板/扇/電源硬件故障、層環路、堆疊故障(b)設備性能類超閾值異常檢測:交換機 CPU/內存、防墻 CPU 或 IPV4 會話超閾值(c)設備性能類異常增檢測:基于動態基線識別交換機 CPU/內存、防墻 CPU/內存的異常增(d)設備表項類超閾值異常檢測:交換機 FIB4/FIB6/ARP/ND/
115、MAC/ACL 表項超閾值(e)設備表項類異常增檢測:基于動態基線識別交換機 FIB4/FIB6/ARP/MAC 表項異常增(f)異常志數量異常增檢測:基于 AI 智能識別志突變異常,主動預警 2、絡類:(a)絡狀態類異常檢測:光鏈路亞健康、端狀態震蕩、端 error-down、互聯鏈路單通、端假死、IP 地址沖突(b)絡性能類異常檢測:端擁塞導致業務受損、流量預測越限(c)絡策略類異常檢測:ARP 攻擊、ND 攻擊(d)絡意圖類異常檢測:鏈路端指標不致、路由環路、路由洞 3、協議類:(a)協議狀態類異常檢測:OSPF/BGP/M-LAG 狀態檢測(b)協議容量類異常檢測:從 BGP 鄰居收到
116、的路由數量超限 4、Overlay 類:(a)協議狀態類異常檢測:OSPF/BGP/M-LAG 狀態檢測(b)協議容量類異常檢測:BGP 鄰居收到的路由數量超限 5、業務類:(a)業務連接類異常檢測:接側單 IP 異常、服務器接異常、TCP 服務端異常、TCP 服務端未打開(b)業務策略類異常檢測:TCP SYN Flood 攻擊(c)業務意圖類異常檢測:業務可達性/隔離性意圖驗證不通過、持對絡中設備進設備替換(持不同型號)/故障類操作前的業務影響性分析,統計并展示設備替換/故障所影響的業務(包括接業務、出業務和安全業務)以及業務的詳情。三、持分析器和控制器聯動,故障 1 分鐘定界,3 分鐘定
117、位,5 分鐘修復,持故障的閉環,包括配置變更影響分析,修復策略下發。四、未知故障聚合溯源 持基于全量 Syslog、異常 KPI、已知 Issues 結合知識圖譜,進故障聚合、推理與溯源,只上報根因故障,呈現根因事件引起的衍事件、故障傳播路徑。五、基于絡快照對 TCP 業務流進排障,基于 underlay 和 overlay 對轉發路徑建模,結合專家知識庫,鍵式定位連接類問題持異常分析,包括資源、事件、KPI、流等維度,持異常事件查看、管理等能(異常范圍與管理能與華為 iMaster NCE-FabricInsight 類似)不持設備替換影響性分析 閉環 case 少:Nexus Dashbo
118、ard Insights 持和 APIC 控制器聯動完成故障閉環,但僅有 2 個 case 不持多事件聚合溯源:持故障的相關性根因分析,不持多故障按照根因聚合呈現 總結:華為 iMaster NCE-FabricInsight 持對絡中的設備替換及故障操作前后的業務影響性分析,持 20+種故障的交互式故障閉環處理。思科 APIC 和 Nexus Dashboard Insights 僅持 2 種故障的故障閉環。華為 iMaster NCE-FabricInsight 持基于全量 Syslog、異常 KPI、已知 Issues 結合知識圖譜,進故障聚合、推理與溯源,只上報根因故障,呈現根因事件引
119、起的衍事件,持絡快照管理。思科 Nexus Dashboard Insights 持故障的相關性根因分析,不持多故障按照根因聚合呈現。61TOLLY REPORT#222112ZH分類華為 CloudFabricCisco IBN(Data Center)業務保障1、業務報障診斷(Troubleshoot)持業務流的絡轉發路徑、絡路況(路徑上逐跳故障、擁塞/丟包/錯包等質量數據、流量/帶寬利率/CPU/內存利率等 KPI 指標、接狀態等)疊加呈現;絡路徑路況服務開放,與 APM 系統對接實現應絡體化運維,應類問題鍵下鉆分析溯源,業務報障快速定界定位。(場景1)業務連通性問題診斷(a)鍵式連通性
120、診斷:持基于絡快照、流路徑建模、專家排障經驗對 TCP 業務流進排障?;?Overlay 轉發路徑建模,以及基于專家經驗梳理的連通性問題排障樹,鍵式定界業務連通性問題(b)業務連通性意圖驗證:持基于意圖驗證(DPV)對業務連通性進快速排障定界,直接給出通斷類問題原因,如路由缺失、環路、被安全策略阻斷等原因(c)絡快照對(ChangeDiff):基于拓撲、配置、路由/ARP 等表項、KPI 等數據進設備快照采集、管理、差異化對分析,從幫助客戶定界故障。1.變更前后信息采集:采集變更前快照(絡拓撲、running config、ARP 表項、ND 表項、IPv4 路由表項、IPv6 路由表項、流
121、量/CPU/內存等 KPI 數據);2.變更檢測:基于算法識別變更前后快照差異,識別變更詳情;3.變更匯總:對所有變更設備的變更進匯總,給出分析結論(場景2)業務質差類問題診斷(a)邊緣智能質差定界:持基于 CE 設備邊緣智能特性,對指定業務流進監控分析,包括流轉發路徑、丟包、時延、異常定界。持歷史數據回溯,快速幫助戶定界質差問題(b)絡撥測:持基于 IP 對、原宿交換機節點對轉發路徑進全鏈路覆蓋的絡質量撥測;持撥測路徑定義編排;持端到端丟包/時延檢測、異常位置的逐跳定界;持跨第三設備。幫助業務質差類問題的快速診斷定界 2、業務運維保障 持基于 5 層 50+建模的絡知識圖譜、絡轉發建模、業務
122、流、接主機等信息構建運維數據底座,保障業務運維(a)應絡體化運維:絡路徑路況服務開放,與 APM 系統(Netis 天旦)聯動實現應絡體化運維,包括應質量監控、告警(如交易響應率下降等);以及應故障的定界,應類問題鍵下鉆分析溯源,業務報障快速定界定位(b)意圖驗證:持基于絡數據對絡、業務意圖驗證,包括業務連通性(可達性/隔離性)、路由環路/洞檢測、鏈路配置致性等;持跨 DC 跨 Fabric 的意圖驗證;持過防墻過負載均衡(LB)的意圖驗證??梢杂行ПU辖j變更前后的 VIP 重保業務(c)絡搜索 Netsearch:持鍵檢索絡任意對象(50+絡本體資源/配置/表項/志/issue 等)、任意
123、IP 對的絡路徑;持搜索結果的智能排序推薦;持搜索結果的絡拓撲呈現;持搜索對象的 360 關聯信息呈現??梢杂行嵘j變更前數據收集的效率、業務報障時故障的快速檢索定位(d)IP 360:主機可視 IP360:持可視化在線主機 IP、主機接位置(IP、VLAN、接 ToR 設備和接、關、VPN)、歷史軌跡、IPv4 地址分布、利率等,持主機 IP 絡快照采集和差異化對(f)志可視管理 LogInsight:基于時間維度呈現設備 0-4 級異常志數量趨勢,異常志 TOP 分析,包括設備與特性維度的排名,多維度的異常志檢索查詢能持流可視,包括路徑、丟包、時延可視,與華為 iMaster NCE-F
124、abricInsight 的流分析能類似 持絡快照的采集和差異化對,但是絡快照的內容相華為 iMaster NCE-FabricInsight 較少,僅有策略差異、異常數量差異和少量資源使數量差異等信息 持業務連通性意圖驗證 持應絡體化運維,持 AppDynamics 對接 持主機可視,包括接位置、歷史軌跡,但是 IP 快照關聯與差異化對能 Troubleshoot 基于絡快照的對分析和連通性意圖驗證等,有基于流路徑、路況有限(微突發)的分析 絡撥測能 全的絡搜索能總結:華為 CloudFabric 持絡路徑路況分析可視,輔助業務報障時的故障診斷定界,同時針對業務通斷、質差問題分別提供了智能診
125、斷能,包括鍵式連通性排障、意圖驗證、邊緣智能、絡撥測;在業務運維保障,華為 CloudFabric 持與 APM 系統對接,實現應絡體化運維,同時持意圖驗證、絡搜索、IP360 等能,輔助變更前后的業務運維保障。Cisco Nexus Dashboard Insights 在業務報障場景,提供快照對分析,路徑路況疊加、絡撥測的智能診斷能;此外,不持全的絡搜索能,IP 地址不持快照對分析。62TOLLY REPORT#222112ZH分類華為 CloudFabricCisco IBN(Data Center)多 DC 絡分析持多 DC 流量分析:跨 DC/Fabric 業務流量互訪分析,跨 DC
126、/Fabric 絡互聯的專線/VPN/出Internet 分析,評估絡熱點流量異常和趨勢分析 持多 DC 質量檢測:按需撥測,檢測跨 DC 絡質量 持多 DC 故障定位:跨 DC 的 10+Issues 主動上報,給出問題根因 持多 DC 意圖驗證:跨 DC DPV 業務連通性驗證 提供統的運維,次戶名密碼即可登陸管理全數據不持跨 DC 流量分析、跨 DC 質量檢測、跨 DC 故障定位和跨 DC 意圖驗證 持統運維總結:華為 iMaster NCE-FabricInsight 持跨 DC 流量分析、跨 DC 質量檢測、跨 DC 故障定位和跨 DC 意圖驗證,持統運維。Cisco Nexus D
127、ashboard Insight 不持跨 DC 流量分析、質量檢測、故障定位和意圖驗證。63TOLLY REPORT#222112ZH6.3 測試條 6.3.1 絡可視 6.3.1.1 三層互視 數據中絡解決案包括應拓撲、邏輯拓撲和物理拓撲,三層絡拓撲相互關聯。華為:華為 iMaster NCE-Fabric 中可以將應、邏輯和物理組關聯展示,并顯示映射關系。數據中絡規模龐,相互映射的三層絡拓撲可以便管理員定位設備、配置或故障。思科:思科 APIC 中的應拓撲、邏輯拓撲和物理拓撲在不同的界,法顯示映射關系。應拓撲邏輯拓撲映射關系邏輯拓撲物理拓撲映射關系64TOLLY REPORT#222112
128、ZH6.3.1.2 設備 KPI 可視 設備監控涉及到各個層級的 KPI,以保障絡和業務的運。華為:華為 iMaster NCE-FabricInsight 持通過 Telemetry 協議對設備、單板、芯、接、和隊列等性能指標采集并圖形化展示。思科:思科 Nexus Dashboard Insights 也持通過 Telemetry 協議對設備、端等性能指標采集并圖形化展示。設備 單板 芯 接 隊列 光鏈路 RoCE當前視圖為設備級 KPI 的 CPU 利率展示65TOLLY REPORT#222112ZH6.3.1.3 RoCE KPI 可視 華為:華為 iMaster NCE-Fabri
129、cInsight 持對 RoCE 絡的 KPI,包括收/發 PFC 反壓幀數、PFC 死鎖監控數、PFC 死鎖恢復數、ECN 報等的監控和可視化呈現。思科:未思科 Nexus Dashboard Insights 對 RoCE 絡的 KPI 監控能。隊列 KPI 中持對各 PFC 報的監控數據呈現持的各 PFC 報信息不同時間段 RoCE 相關性能的對66TOLLY REPORT#222112ZH6.3.1.4 絡變更展示 華為:華為 iMaster NCE-FabricInsight 持定期備份絡已資源快照,展示 FIBv4 表項、ARP 表項、ND 表項,KPI,業務流量等的變更詳情,以及
130、展示具體的配置變化內容;持按需選擇兩個設備對,基于算法識別變更前后快照差異,識別變更詳情。思科:持絡快照的采集和差異化對,但是絡快照的內容相華為 iMaster NCE-FabricInsight 較少,僅有策略差異、異常數量差異和少量資源使數量差異等信息。設備配置變更對設備 IPv 路由表變更呈現67TOLLY REPORT#222112ZH6.3.2 流量可視 6.3.2.1 業務流可視 華為:華為 iMaster NCE-FabricInsight 持對 TCP 流、UDP 流以及組播流路徑及統計信息的監控。思科:Tolly 程師找到了思科 Nexus Dashboard Insight
131、s 持 TCP 和 UDP 流可視的信息,但未找到持組播流可視的信息。TCP 流UDP 流組播流68TOLLY REPORT#222112ZH6.3.2.2 絡流量可視 華為:華為 iMaster NCE-FabricInsight 持按從設備、接、協議、會話、主機、應等多種維度對絡流量進統計和分析,識別流量分布和趨勢,幫助運維員快速識別異常,合理分配資源??傆[Top 接流量Top 設備流量Top 會話Top 源主機Top 的主機每端各會話流量統計各主機流量統計各會話流量統計69TOLLY REPORT#222112ZH6.3.3 異常檢測 6.3.3.1 環路檢測 華為:環路為絡中常嚴重的故
132、障。華為 iMaster NCE-Fabric 持檢測 VXLAN 絡中可能存在的環路現象及故障點,并提供給管理員破除環路的段。持檢測的環路類型有單設備單端環路、單設備多端環路、跨設備環路多種。思科:未思科 IBN 案持對環路的檢測并鍵消除環路。疑似環路引起環路端鍵端隔離破環端被成功隔離70TOLLY REPORT#222112ZH6.3.3.2 設備異常檢測 華為:華為 iMaster NCE-FabricInsight 持基于靜態和動態基線進異常檢測,可以通過靜態基線避免設備負載超過極限,通過動態基線檢測異?,F象。思科:思科 Nexus Dashboard Insights 只持基于靜態基
133、線檢測設備異常。靜態基線為橙,設為 80%極限值,防過載,由于例尺原因未顯示?;也糠譃閯討B基線,根據歷史數據學習動成,記錄異?,F象71TOLLY REPORT#222112ZH6.3.4 絡健康度 6.3.4.1 評估體系 華為:華為 iMaster NCE-FabricInsight 基于設備、絡、協議、Overlay、應流五層建模,構建健康度評估體系并持實時導出或定期推送健康度評估報告,撐常運維。整健康度設備絡協議Overlay應72TOLLY REPORT#222112ZH 導出的健康度報告待處理問題73TOLLY REPORT#222112ZH6.3.4.2 絡險評估 華為:華為 iM
134、aster NCE-FabricInsight 持基于 AI 知識圖譜的絡險預測,包括絡可靠性、性能負載、資源容量、配置致性、絡穩定性 5 個維度的系統化險評估模型??煽啃噪U致性險性能險險列表74TOLLY REPORT#222112ZH6.3.4.3 絡 SLA 評估 華為:華為 iMaster NCE-FabricInsight 持基于絡按需選擇設備編排路徑進 Underlay 撥測,實現指定鏈路的質量監控,絡內每條鏈路丟包及時延并進可視化呈現。時延閾值設為 30s 時,多條毫秒級時延鏈路在撥測結果中判定為故障75TOLLY REPORT#222112ZH6.3.4.4 絡指標畫像 華為:
135、華為 iMaster NCE-FabricInsight 持對絡微突發進畫像分析,包括微突發分布、歷史特征分析、離群分析、與丟包帶寬等關聯影響呈現,便管理員深了解絡中的該現象。76TOLLY REPORT#222112ZH6.3.5 全量故障分析 6.3.5.1 常故障 1-3-5 閉環 華為:常故障 1-3-5 閉環包括設備類、絡類、協議類、Overlay 類和業務類。1)設備類事件:華為 iMaster NCE-FabricInsight 持評估交換機整機故障、交換機交換板故障、交換機 FIBv4 表項超閾值、路由環路、交換機芯軟失效導致的流異常故障、交換機路由表硬表丟失導致的業務異常故障
136、。交換機整機故障交換機交換板故障交換機 FIBv4 表項超閾值路由環路交換機芯軟失效導致的流異常故障交換機路由表硬表丟失導致的業務異常故障本圖以路由環路為例,顯示完整的故障呈現和分析界77TOLLY REPORT#222112ZH2)絡類事件:鏈路閃斷、端擁塞導致業務受損、疑似光鏈路故障。3)協議類事件:跳異常導致 CE 交換機 MLAG 成雙主狀態、OSPF router ID 沖突的發現、定位、恢復、BGP 鄰居法建。4)Overlay 類事件:VXLAN 隧道中斷,配置異常導致業務中斷。5)業務類事件:絡接側 IP 地址沖突、TCP SYN Flood攻擊。思科:思科 Nexus Das
137、hboard Insights 聚焦于異?,F象數量,持各類異?,F象(事件)的監控。鏈路閃斷疑似光鏈路故障端擁塞導致業務受損跳異常導致 CE MLAG 成雙主狀態OSPF router ID 沖突的發現、定位、恢復BGP 鄰居法建VXLAN 隧道中斷,配置異常導致業務中斷絡接側 IP 地址沖突TCP SYN Flood攻擊78TOLLY REPORT#222112ZH6.3.5.2 設備替換/故障影響性分析 華為:華為 iMaster NCE-Fabric 持對絡中設備進設備替換(持不同型號)/故障類操作前的業務影響性分析,統計并展示設備替換/故障所影響的業務(包括接業務、出業務和安全業務)以及
138、業務的詳情。思科:未發現思科 IBN 案對絡中設備進替換的業務影響性分析的能。設備替換影響性分析接業務出業務安全業務79TOLLY REPORT#222112ZH6.3.5.3 故障聯動閉環 華為:華為 iMaster NCE-FabricInsight 分析器和 iMaster NCE-Fabric 控制器持聯動,故障 1 分鐘定界,3 分鐘定位,5 分鐘修復。20+種故障持聯動閉環,包括配置變更影響分析,修復策略下發。iMaster NCE-Fabric 閉環操作的事件管理界鍵跳轉 iMaster NCE-FabricInsight 分析器查看事件詳情iMaster NCE-Fabric
139、推薦排障案80TOLLY REPORT#222112ZH 思科:思科 Nexus Dashboard Insights 持和 APIC 聯動完成故障閉環,但僅持 2 種故障。iMaster NCE-Fabric 中確認實施排障案故障已被排除81TOLLY REPORT#222112ZH6.3.5.4 未知故障定位 華為:華為 iMaster NCE-FabricInsight 持基于全量 Syslog、異常 KPI、已知 Issues 結合知識圖譜,進故障聚合、推理與溯源,只上報根因故障,呈現根因事件引起的衍事件。根因分析及故障傳導路徑82TOLLY REPORT#222112ZH6.3.5.
140、5 TCP 業務流基于絡快照分析進排障 華為:華為 iMaster NCE-FabricInsight 持基于絡快照對 TCP 業務流進排障?;?Overlay 轉發路徑建模,以及轉發模式,鍵式定位連接類問題的故障定位能。TCP 業務流絡故障定位可能的故障故障路徑正常路徑83TOLLY REPORT#222112ZH6.3.6 業務保障 6.3.6.1 絡路況直播 華為:華為 iMaster NCE-FabricInsight 持絡路況直播服務開放,與天旦 BPC 系統對接,應類問題鍵下鉆,故障快速定界定位。天旦 BPC 系統,監控應性能。點擊應間鏈路可跳轉華為 iMaster NCE-Fa
141、bricInsight 中的對應應路徑跳轉后顯示的應絡路徑84TOLLY REPORT#222112ZH6.3.6.2 NetSearch 統搜索 華為:華為 iMaster NCE-FabricInsight 持基于知識圖譜提供統的絡數據搜索引擎,鍵動推薦關聯結果。統搜索 各關聯信息搜索個 IP85TOLLY REPORT#222112ZH6.3.6.3 業務保障 APP 華為:華為 iMaster NCE-FabricInsight 中還提供些內置運維 APP(版):例如 IP 360 和 LogInsight。IP 360:整 IP 地址分析,提供虛擬機 IP 地址在整的接地點等歷史記錄
142、,以及快照對。LogInsight:Syslog 志分析具。思科:持主機可視,包括接位置、歷史軌跡,但是 IP 快照關聯與差異化對能。IP 矩陣顯示每個 IP 的狀態每個 IP 的歷史軌跡兩個絡快照的對顯示新上線、下線、遷移以及變化的 IP86TOLLY REPORT#222112ZH6.3.7 多 DC 絡分析 6.3.7.1 多 DC 流量分析 華為:華為 iMaster NCE-FabricInsight 持跨 DC/Fabric 業務流量互訪分析,跨 DC/Fabric 絡互聯的專線/VPN/出 Internet 分析,評估絡熱點流量異常和趨勢分析???DC/Fabric 流量可視化跨
143、 DC/Fabric 流量列表87TOLLY REPORT#222112ZH6.3.7.2 多 DC 質量檢測 華為:華為 iMaster NCE-FabricInsight 持按需撥測,檢測跨 DC 絡質量???DC/Fabric 按需撥測88TOLLY REPORT#222112ZH6.3.7.3 多 DC 故障定位 華為:華為 iMaster NCE-FabricInsight 持跨域 10+Issues 主動上報,給出問題根因???DC/Fabric 待處理 Issue 根因分析89TOLLY REPORT#222112ZH6.3.7.4 多 DC 意圖驗證 華為:華為 iMaster
144、 NCE-FabricInsight 持跨 DC 業務連通性驗證???DC/Fabric 的源和的間連通性驗證結果顯示跨 DC/Fabric 的路徑90TOLLY REPORT#222112ZH6.3.7.5 統運維 華為:華為 iMaster NCE-FabricInsight 持提供統的運維,次戶名密碼即可登陸管理全數據。從個 iMaster NCE-FabricInsight 可以跳轉多個 iMaster NCE-FabricInsight 的91TOLLY REPORT#222112ZH7 DayN 變更優化 7.1 測試法 DayN 變更優化包括絡變更和優化調參。絡變更是指對根據變更
145、訴求,評估變更影響的范圍和約束條件,完成備選案設計,對變更案評估后實施并進驗證等,具體包括意圖評估、案設計、評估決策、變更實施、業務驗證等環節,流程如下圖所示。92TOLLY REPORT#222112ZH優化調參是指根據識別的性能異?;蛄踊A測信息,并結合絡運監測情況,進問題定界定位,成最優案,評估決策后實施絡并進驗證,以提絡運的效率。它主要包括意圖翻譯、劣化預測、優化識別、問題定界、問題定位、案成、評估決策、案實施、業務驗證等環節,流程如下圖所示。Tolly 認為,評價數據中動駕駛絡 DayN 變更優化階段 L3.5 等級平,應該重點關注以下個:絡變更:針對關鍵變更場景系統動評估業務影響,
146、動輸出變更約束條件;系統基于歷史或實時數據在線評估驗證,分析決策最優案;系統動對絡快照,動進業務測試,系統動值守,發現異常糾偏。絡優化:輸業務意圖系統動轉換監控規則建議;系統動學習規則/策略,預測絡狀態趨勢;系統動學習規則/策略并動定界定位,基于編排策略和在線推理等動成備選案;基于實時數據在線仿真驗證,分析決策最優案,系統動驗證業務。93TOLLY REPORT#222112ZH7.2 測試結論 Tolly 經過測試組發現,華為 CloudFabric 和 Cisco IBN(Data Center)均具備絡變更優化的能,但是華為 CloudFabric 接容量預測,RoCE 流量智能調優以保
147、證零丟包等更優。分類華為 CloudFabricCisco IBN(Data Center)預測性維護1、接擴容:接流量預測,預測周期為未來 12 周,并聯動控制器進擴容 2、設備升級和補丁1、不持接流量預測 2、持設備升級和補丁總結:華為 CloudFabric 持接流量預測,并聯動控制器進擴容。智能損 DCN1、RoCE 參數調優:(a)根據流量模型適應調整 ECN 線參數。保障 RoCE 業務在各種流量模型下端帶寬利率能達到 90%以上,并且零丟包(b)持 IQCN,持針對 CNP 響應不及時補發 CNP,實現擁塞避免(c)持 VXLAN 場景,ECN 內外層拷,感知underlay 擁
148、塞 2、死鎖檢測和預防:spine 和 leaf 持 PFC 死鎖檢測和預防功能,檢測周期可配置,針對 U 型流量進破環,避免產 PFC 死鎖 3、RoCE&TCP 混跑:持 RoCE 與 TCP 流量的按例調度,調度例誤差控制在整端帶寬的 5%內 4、NVMe over Fabric(集中式存儲場景):(a)持即插即:計算和存儲上線根據絡規劃,動建鏈接 1s1(b)持故障快速切換:跨設備多路徑快速切換 1s(c)持故障隔離:接服務器故障導致 PFC 暴時進路徑切換 5、SDN 納管 AI Fabric:iMaster NCE-Fabric 持配置 AI Fabric 參數 6、智能距損:同城
149、雙活場景最持 200G*100KM1、RoCE 參數調優:僅持靜態調整 ECN 線參數 2、PFC 暴/死鎖檢測和預防:僅持PFC暴死鎖檢測,不持死鎖預防 3、RoCE&TCP混跑:持 4、距損特性未知總結:華為 CloudFabric 智能損絡持對 ECN 的參數進適應調整,持死鎖檢測和預防,持 RoCE 和TCP 流量混跑,持 NVMe over Fabric 即插即、故障快速切換、故障隔離等功能,iMaster NCE-Fabric 持配置 ECN 參數;思科 IBN 僅持靜態調整 ECN 參數,不持死鎖預防。Flex-Buffer持 Flex-Buffer 算法,給流動態分配更多的 B
150、uffer 于吸收 burst,提升 TCP 流的完成時間持智能緩存管理總結:華為 CloudFabric 持 Flex-Buffer 算法,動態給流動態分配更多的 Buffer 于吸收 burst,提升 TCP 流的完成時間。云協同-確定性 SLA實現跨 DC 之間業務按照業務訴求不同的 SRv6 隧道,提供隧道感知能,保障跨云業務確定性 SLA基于 SR-MPLS 隧道總結:華為 CloudFabric 持跨 DC 之間業務按照業務訴求不同的 SRv6 隧道,保障業務跨云確定性 SLA。備注:1.主機發起建鏈任務,1s 內收到交換機返回的建鏈信息。94TOLLY REPORT#222112
151、ZH7.3 測試條 7.3.1 預測性維護 華為:華為 iMaster NCE-FabricInsight 分析器持預測接未來流量。95TOLLY REPORT#222112ZH7.3.2 智能損 DCN 7.3.2.1 RoCE 參數調優 華為:華為 CloudEngine 數據中交換機持根據流量模型適應調整 ECN 線參數。保障 RoCE 業務在各種流量模型下端帶寬利率能達到 90%以上,并且零丟包。測試采如下拓撲,RDMA_Write BW Test 測試從 S1-S4 以及 S6-S9 往 S5 打流。測試使能了所有交換機上的 AI-ECN 功能。結果顯示,AI-ECN 保障了測試流的
152、端 S5 的帶寬利率近 100%,8 條流每條的吞吐量約為 3Gbps。1024 字節測試時延為 7.5 微秒,32768 字節測試時延為 73 微秒。思科:思科 Nexus 9000 系列交換機只持靜態調整 ECN 線,不持適應調整。Leaf3 交換機連接的端 S5 的端,出向利率 100%96TOLLY REPORT#222112ZH7.3.2.2 PFC 暴/死鎖檢測 PFC 暴可能引起絡癱瘓,需要及時獲得告警并嘗試恢復。PFC 暴可能由卡或交換機故障引起,也可能由 PFC 死鎖(PFC DeadLock)引起。PFC 死鎖是指當多個交換機之間因為環路等原因同時出現擁塞,各端緩存消耗超過
153、閾值,相互等待對釋放資源,從導致所有交換機上的數據流都永久阻塞的種絡狀態。華為:華為 CloudEngine 數據中交換機持 PFC 暴/死鎖檢測,可以檢測出 PFC 暴(包括死鎖原因引起的)并告警。華為 CloudEngine 數據中交換機同時也持檢測出死鎖后,進死鎖恢復和控制。思科:思科 Nexus 9000 系列交換機也持通過 PFC Watchdog 功能檢測 PFC 暴。PFC 死鎖,流量阻塞PFC 死鎖檢測功能,檢測出死鎖,告警97TOLLY REPORT#222112ZH7.3.2.3 死鎖預防 華為:華為 CloudEngine 交換機對些場景的死鎖持死鎖預防功能。Tolly
154、程師們組構建出如下 PFC 死鎖場景,多條相同優先級的流量在絡中引起了 PFC 死鎖。華為 CloudEngine 數據中交換機的死鎖預防功能可以通過改變部分流量優先級預防死鎖,所有流量全程正常轉發不丟包。思科:思科 Nexus 9000 系列交換機不持死鎖預防功能。PFC 死鎖預防功能,預防死鎖,流量正常,全程丟包98TOLLY REPORT#222112ZH7.3.2.4 RoCE&TCP 混跑 華為:華為 CloudEngine 數據中交換機組持 RoCE 與 TCP 流量的按例調度,調度例誤差控制在整端帶寬的 5%內。測試采和 7.3.2.1 章節樣的拓撲,從 S1-S4 以及 S6-
155、S9 往 S5 同時打 TCP 流和 RoCE 流。RoCE 和 TCP 流都盡搶占帶寬,Tolly 程師測試了將 RoCE 流隊列和 TCP 流隊列設為 9:1、7:3、5:5、3:7、和 1:9 時,真實流量的情況。測試例 9:1 時,真實帶寬占 RoCE:86.9%,TCP:13.1%測試例 7:3 時,真實帶寬占 RoCE:67.4%,TCP:32.6%測試例 5:5 時,真實帶寬占 RoCE:48.5%,TCP:51.5%測試例 3:7 時,真實帶寬占 RoCE:29.2%,TCP:70.8%測試例 1:9 時,真實帶寬占 RoCE:9.1%,TCP:90.9%。思科:思科 Nexu
156、s 9000 系列數據中交換機也持 RoCE 與 TCP 混跑。例9:1 時,8 條 RoCE 流的吞吐量例 9:1 時,8 條 TCP 流的吞吐量99TOLLY REPORT#222112ZH7.3.2.5 NVMe over Fabric 華為:華為 OceanStor Dorado 全閃存存儲系統和華為 CloudEngine 數據中存儲交換機持華為 NoF+案,持計算設備即插即連接存儲、故障快速切換以及故障隔離。即插即:當存儲絡已配置好時,計算主機上線后,秒內收到存儲建鏈通知,并能很快建鏈成功,訪問存儲。故障快速切換:計算節點映射到多個存儲 LUN 時,當個 LUN 故障,其它 LUN
157、 承接業務。VDBench 的讀寫 IO 測試在存儲故障中不受影響。VDBench 每秒輸出測試結果,因此故障切換時間于 1 秒。故障隔離:當計算節點發送量 PFC 報時,華為 CloudEngine 數據中交換機會將計算節點連接的端置為 error down。流量被分擔到別的鏈路。7.3.2.6 SDN 納管 RoCE 絡 華為:華為 iMaster NCE-Fabric 持通過配置模板下發 AI Fabric 相關命令到交換機。7.3.2.7 智能距損 華為:同城雙活場景最持 200G RoCE 端 100KM 損能。7.3.3 Flex-Buffer 華為:流為時延敏感型業務且易 bur
158、st 丟包,丟包后的 TCP 重傳(尤其是 RTO 重傳)是影響其性能的主要因素。華為 Flex-Buffer 算法,重新定義了流標準,能更精準的區分隊列,動態給流動態分配更多的 Buffer 于吸收 burst,提升 TCP 流的完成時間,測試中 TCP 應性能提升 21%。100TOLLY REPORT#222112ZH7.3.4 云協同-確定性 SLA 華為:華為 iMaster NCE-Fabric MDC 持實現跨 DC 之間業務,按照業務訴求進不同的 SRv6 隧道,保障業務跨云的確定性 SLA。思科:思科案跨站點 SLA 案基于 SR-MPLS 隧道。域需要基于 MPLS。配置
159、QoS 策略,綁定服務等級到 DSCP 值配置域東流量策略,特定 DSCP 值的流量進特定的 SRv6 隧道101TOLLY REPORT#222112ZH8 測試設備、版本 本次測試作為解決案測試,包含多款華為和思科設備以及組件,也包括配合測試的云計算平臺、虛擬機管理平臺、以及容器編排平臺。受測設備及組件如下表所示。部分思科 IBN 案組件未測試,相關結果源公開披露的信息。產品版本華為 CloudEngine 16800 數據中交換機V200R021C00、V200R021C10華為 CloudEngine 12800 數據中交換機V200R021C00、V200R021C10華為 Clou
160、dEngine 6800 系列數據中交換機V200R021C00、V200R021C10華為 CloudEngine 8800 系列數據中交換機V200R021C00、V200R021C10華為 CloudEngine 9800 系列數據中交換機V200R021C00、V200R021C10華為 iMaster NCE-FabricV100R021C00、V100R021C10華為 iMaster NCE-FabricInsightV100R021C00、V100R021C10華為 USG6655E 防墻V600R007C00SPC200 Cisco N9K-C9364C 數據中交換機15.2
161、(2f)Cisco N9K-C9336C-FX2 數據中交換機15.2(2f)Cisco N9K-C93180YC-FX 數據中交換機15.2(2f)Cisco Application Policy Infrastructure Controller(APIC)V5.2(2f)OpenStackRocky 14.0.2Kubernetesv1.6+開源 calico v2.0VMware vCenter6.7.0.11000VMware ESXi6.7.0Microsoft Windows Server 2016 Data CenterMicrosoft Hyper-V4.0.1662.0Mi
162、crosoft System Center 2016 Virtual Machine Manager4.0.1662.0102TOLLY REPORT#222112ZH使條款 該檔免費提供,可以在您調查某產品、技術或服務是否滿的特殊需求時作為參考。購買任何產品時,您必須根據的需求對產品是否適進獨的評判。本檔不應取代資深IT或業務專業的建議。該項評估的重點在于闡明產品的具體特性和(或)性能,評估過程在可控的試驗室條件下進。某些測試可能是為了反映產品在理想條件下的性能量身定制的,性能在實際環境中可能會有所不同。戶應根據的實際場景進測試,以驗證產品在他們絡內可提供的性能。我們已經做了合理的努,確保檔
163、中數據的準確性,但是不排除出現誤差和(或)疏漏的可能性。檔中介紹的測試和審核,可能還取決于各類測試具的準確性,具的準確性是我們法控制的。且,檔還參考了贊助提供的我們法驗證的某些描述。此外,被測試的軟件或硬件向產環境,為商業戶提供時,性能應該相當或更。同樣,本按“原樣”提供,Tolly Enterprises,LLC(Tolly)不對中所包含的任何信息的準確性、完整性、有性或適性做任何擔保、表示或保證,論是明示的還是暗含的,也不承擔任何直接或間接的法律責任。閱讀本時,您同意承擔使中所含信息可能帶來的險,并接受因直接或間接使中信息或材料所導致的損失、損害、成本或其他后果的所有險和責任。Tolly
164、及其相關下屬公司不承擔因您使或依賴本檔所包含任何信息引起的任何損失、傷害或損害的責任。Tolly 不評判本檔中所描述的任何產品或公司是否適合投資。在進投資或實施與本所述任何信息、產品或公司有關的項時,您應聽取法律、會計或其他的專業建議。如果有外翻譯版本,檔的英版本具有權威性。為了保證準確性,請使直接從 上下載的檔。未經 Tolly 的明確書許可,不得復制本檔,不管是全部還是部分。本使的所有商標均為各所有者的財產。您同意不在不屬于我們的任何活動、產品或服務中部分或全部使我們的商標,也不以迷惑、誤導或欺騙,或者可能會貶損我們或我們的信息、項或開發成果的式使我們的商標。關于 Tolly Tolly 集團公司超過 30 年來直致于提供世界流的 IT 服務。Tolly 是全球著名的服務提供商,為 IT 產品、組件和服務商提供領先的第三驗證服務。您 可 以 發 送 電 郵 件 到,或致電+1 561.391.5610 與公司聯系。敬請訪問 Tolly 站:http:/222112 ivcofs54 yx-20220304-VerE關于華為 CloudFabric 數據中絡解決案:https:/ 關于華為企業業務:https:/