《IDC:數據中心網絡自動駕駛指數報告(30頁).pdf》由會員分享,可在線閱讀,更多相關《IDC:數據中心網絡自動駕駛指數報告(30頁).pdf(29頁珍藏版)》請在三個皮匠報告上搜索。
1、 數據中心網絡自動駕駛指數報告 IDC白皮書 目錄 執行摘要執行摘要 .4 情況概述情況概述 .4 為什么組織需要一個數據中心網絡自動駕駛 .4 當今數據中心網絡挑戰 .2 敏捷的障礙.3 數據中心網絡自動駕駛數據中心網絡自動駕駛指數報告指數報告 .4 數據中心網絡自動駕駛數據中心網絡自動駕駛指數報告指數報告 .5 前進之路:實現前進之路:實現數據中心網絡自動駕駛數據中心網絡自動駕駛的道路的道路.6 數據中心網絡自動化現狀 .8 數據中心網絡自動駕駛數據中心網絡自動駕駛調研結果調研結果 .8 數據中心組網挑戰 .8 數據中心網絡挑戰數據中心網絡挑戰 .9 對無損、低時延的融合IP數據與存儲網絡
2、表示濃厚興趣 .9 數據中心網絡自動化:現狀和計劃 . 14 數據中心網絡自動化等級 . 17 數據中心網絡自動化:企業在網絡自動化進程中最迫切的需求和尋找方向 . 19 數據中心網絡自動化的主要障礙 . 21 完全自治的數據中心網絡是一個共同的目標嗎? . 22 如何開始、利用和提升自動駕駛級別如何開始、利用和提升自動駕駛級別 . 23 評估技術需求 . 23 評估技能集. 23 考慮組織結構和運作模式 . 23 借助可信的供應商和第三方的協助 . 23 華為數據中心網絡自動駕駛解決方案 . 24 數據倉庫 . 25 平臺開放性 . 25 廣泛的網絡智能 . 25 關于關于IDC. 27 表
3、 表1:數據中心網絡自動駕駛指數報告 . 5 表2:數據中心網絡自動駕駛指數報告的前三個自動化級別到整個網絡生命周期的需求的映射 . 7 圖形 圖1:數據中心網絡挑戰 . 9 圖2:對無損、低時延、高性能的融合IP數據和存儲網絡的興趣(按行業分列) .10 圖3:對無損、低延遲和高性能的融合IP數據和存儲網絡的興趣(按數據中心數量劃分).11 圖4:在12-24個月內部署無損、低時延、高性能的融合IP數據和存儲網絡的可能性(按行業劃 分) .12 圖5:在12-24個月內部署無損、低延遲、高性能的融合IP數據和存儲網絡的可能性(按數據中 心數量劃分) . 13 圖6:部署無損、低時延、高性能的
4、融合IP數據和存儲網絡面臨的障礙 .14 圖7:DC網絡自動化部署和智能運維現狀.15 圖8:數據中心網絡自動化規劃(按數據中心數量) .16 圖9:數據中心網絡自動化規劃(按行業).17 圖10:數據中心網絡自動化等級(按行業) .18 圖11:網絡生命周期中最重要的網絡自動化領域 (按行業劃分) . 19 圖12:數據中心網絡自動化驅動程序 .20 圖13:數據中心網絡自動化障礙 .21 圖14:三分之二的受訪者將數據中心網絡自動駕駛作為1-2年的目標 .22 圖15:華為數據中心網絡自動駕駛L3自治系統 Huawei CloudFabric . 24 October 2020, IDC
5、#US46931620 白皮書 數據中心網絡自動駕駛指數報告 執行摘要執行摘要 在本文檔中,IDC推出了數據中心網絡自動駕駛指數,用以幫助企業評估數據中心的網絡自動化水平, 并幫助企業在網絡的生命周期中制定一個計劃,逐步部署和運維完全自治的數據中心網絡。 IDC還評估了在推動企業數據中心網絡現代化和全面自動化過程中的挑戰。文中針對全球各行業企業的 調研展示其推動數據中心網絡自動化的驅動因素,當前利用數據中心網絡自動化方面所處的位置,以及 他們對數據中心網絡自動駕駛愿景的認同程度等。最后,IDC提供了一些指導建議企業如何推進并 逐步實現全面自動化,無論當前數據中心網絡自動化水平如何。 情況情況綜
6、綜述述 為什么組織需要一個為什么組織需要一個數據中心網絡自動駕駛數據中心網絡自動駕駛 數據中心網絡從一開始就存在,它向用戶提供應用程序和數據所需的連接和帶寬。然而網絡為了滿足應 用環境不斷變化的需求,一直處于被迫適應和演進的角色。 今天,數據中心網絡正處于一個關鍵的轉折點。為了能夠更好地滿足新應用的需求和業務目標,網絡必 須在架構和運營上進行調整。數據中心網絡正面臨前所未有的壓力,不僅需要實現可擴展性和高性能, 還要通過在網絡的生命周期內實現廣泛的自動化來獲得更高的敏捷性和靈活性,主要包括網絡的開通和 部署,故障的排除和補救,以及諸如補丁、升級、持續的變更管理和優化等日常網絡管理。 在云時代,
7、傳統的網絡設計、發放、部署和運營方式已經無法滿足要求。應用程序是當今組織的生命 線,網絡提供了支持和交付這些應用程序的數字神經系統。問題在于,隨著應用架構和開發方法變得更 加敏捷,傳統的數據中心網絡已經無法滿足需求。 2020 IDC #US46931620 2 幸運的是,IT變革和AIOps的興起能夠幫助企業重新評估網絡架構和運營模式,以一種更現代化的方法 來滿足應用程序的需求,實現業務敏捷性,同時更加靈活和更具成本效益(包括資本支出和運營支 出)。 企業正在逐漸認識到數據中心網絡自動化的價值,包括作為它能夠增強業務韌性和連續性。但企業所需 要的不僅是自動化腳本、配置自動化工具等碎片化的方法
8、和手段,它們更需要一種綜合的智能網絡自動 化方法,該方法可提供靈活的架構作為基礎以及優化的運營便捷性,從而讓網絡運維能夠將網絡作為一 個統一、認知、和自動化實體,而不是一個需要繁瑣的手動管理的不同設備的集合。盡管SDN是向前邁 出的重要一步,但其更多的是基于策略的管理和開通流程的自動化。正是基于此,自動駕駛的數據中心 網絡開始興起,它提供智能意圖轉換、智能自動化規劃和設計、完全自動化的部署和驗證、智能自動化 的故障排除和補救,以及自動化的變更管理和優化,從而有效實現網絡自動化閉環。 當今數據中心網絡當今數據中心網絡的的挑戰挑戰 隨著數字化轉型、云運營模式、云原生應用架構的出現,企業數據中心網絡
9、面臨諸多挑戰。 一個重要問題是,數據中心網絡需要與計算和存儲等其他數據中心基礎架構的自動化保持一致。網絡運 營商和管理者在努力避免讓網絡成為運營敏捷性和實現商業速度的阻礙因素,他們為此感受到了焦慮和 壓力。 與此同時,許多組織也試圖對其數據中心網絡架構實施重大變革,并且往往與匯聚和整合其IP數據和存 儲網絡以降低運營費用(OPEX)和資本支出(CAPEX)相關。許多企業目前擁有獨立的光纖通道存儲區 域網絡(SAN)和以太網數據中心網絡。很多客戶,特別是那些運行HPC或高計算密集型AI應用的客 戶,也可能擁有InfiniBand網絡。 因為有急迫的需求和充足的資源,大型互聯網公司已設法在單一以太
10、網或者IP數據中心網絡中運行所有 應用程序和工作負載,以滿足無損和高性能的需求。但對于大多數企業來說,情況并非如此。與大型互 聯網公司不同,一般企業往往缺乏資源和內部專業知識,無法通過單一以太網或者IP數據中心網絡聚合 所有工作負載和應用程序,無法滿足無損、高性能和極低延遲的需求。因此,他們在多個數據中心采購 和維護多個網絡,這就推高了運營費用和資本支出。 一個融合、智能的數據中心網絡顯然會讓這些企業受益,該網絡可以滿足無損存儲工作負載以及HPC和 AI對低延遲的嚴格要求。因為是合并采購和有持續管理的單一網絡,這種網絡將節省大量資本支出和運 營費用。當然,這樣的網絡在性能上絕不能遜色,它必須不
11、僅能夠支持所有必需的工作負載和用例,能 夠提供在云時代日益增長的彈性伸縮能力。 2020 IDC #US46931620 3 除了需要匯聚和整合數據中心網絡之外,還需要實現網絡和NetOps的敏捷性,需要支持DevOps實踐、 CI/CD工作流以及其他類似云的運營模式和流程。 傳統的數據中心網絡已經與所支持的應用和服務分離,網絡規劃和部署速度太慢,無法滿足應用和開發 者的需求。隨著虛擬化、云計算、容器的快速發展,企業IT業務正在發生前所未有的變化,不僅給計算 和存儲基礎設施帶來了變化,對數據中心網絡的需求也發生了深刻的變化。 雖然開發人員和DevOps團隊已經轉向CI/CD流程等敏捷方法來加速
12、開發流程,但因為現有的基礎設施發 展緩慢,其工作效果受到限制。資源請求需要快速響應和快速周轉,但網絡基礎設施部署存在滯后。繁 瑣的部署過程消耗了過多的時間,開發人員步履蹣跚,限制了處于數字業務前沿的應用程序。最終結果 是制約了業務敏捷性,網絡因而成為不受歡迎的罪魁禍首。 云的興起加劇了問題的嚴重性,云不僅是工作負載的目的地,也代表了運行模式和一系列相關技術。云 模式及流程已經成為數字化轉型的關鍵手段,開發者和DevOps團隊通過云來實現敏捷性、靈活性和速 度。 然而,在數據中心中,網絡一直是實現敏捷性的阻礙因素,長期以來以硬件為中心的、面向CLI的離散網 元部署、配置和手動管理方法削弱了敏捷性
13、。在許多方面,網絡本身仍然是一個由人工流程所定義的孤 島,配置起來既復雜又耗時,并且容易出現配置錯誤。這導致網絡和依賴這些流程的應用程序癱瘓。 IDC估計,由網絡中斷引起的企業宕機通常平均成本為每小時25萬美元。這個數字適用于所有行業、不 同規模和地域的組織。但是,根據組織的不同,宕機時間的實際成本可能會有很大差異。例如,大型金 融機構,因交易量很大宕機時間損失可能以每小時數百萬美元計。一個處于“平均”水平的組織在經歷相 對短的8小時宕機后,其損失大約在200萬美元。同樣,這些中斷經常源自于手動網絡錯誤配置或配置 漂移未被檢查。 與此同時,應用程序也也在經歷變革。大多數企業運行的應用程序種類比
14、以往任何時候都多,包括傳統 的單體應用程序和以容器和微服務為特征的較新的現代工作負載。數據中心必須支持多種工作負載和應 用基礎架構,包括裸金屬、虛擬機和容器。 敏捷的障礙敏捷的障礙 上述所有這些挑戰都造成了網絡的復雜性,成為實現敏捷運維的主要障礙?,F在,網絡生命周期的每個 階段都充滿了復雜性,從規劃設計、部署配置,到故障排除和補救,最后到變更管理和網絡優化。僅僅 在故障排除和補救方面,網絡運維者通常必須依賴過時的工具和操作流程,這往往使他們很難在重大服 務中斷之前發現和修復問題。由于缺乏協調和整合,零碎的工具和手動操作往往本身就造成了問題。此 外,那些零散且難以滿足目的的工具集合,也致使網絡管
15、理和可視性難以令人滿意。 數據中心網絡的另一個制約因素是企業運維團隊之間的技能差距和專業知識不足。我們很難去責怪網絡 運維者,他們已經在多條戰線上應對快速變化,不堪重負,他們不得不學習新的網絡拓撲和架構、自動 化、和可編程能力(API)。他們的工作也像云模式一樣 在完成所有責任內工作的同時,還要隨時 救火。因此,網絡供應商必須幫助他們的客戶,即運營者,為他們提供架構、基礎設施和平臺,幫他們 2020 IDC #US46931620 4 應對這些多重挑戰。 最后,隨著這些年來網絡的增長和擴展,越來越需要基礎架構能夠管理異構網絡的一致性。這些基礎架 構源于不同供應商并承擔不同職能。網絡運維團隊正在
16、尋找方法弱化挑戰,通過工具讓復雜的事情變得 簡單。 網絡自動化是解決這些挑戰的答案。但是,正如前面所說,這種自動化必須是易用的、易于規模實施、 易于管理和維護的。企業還需要一個框架體系來清楚地了解自己在數據中心網絡自動化歷程中所處的位 置,以及如何以數據中心網絡自動駕駛為代表逐步達到頂峰。 數據中心網絡自動駕駛數據中心網絡自動駕駛指數指數報告報告 為了幫助組織評估網絡的自動化程度,IDC聯合華為撰寫了此份數據中心網絡自動駕駛指數報告。該報 告將數據中心網絡自動化的復雜程度歸類到網絡生命周期的每個階段。要實現網絡完全的自動駕駛,必 然是一個長期的過程,不可能一蹴而就。但這是完全可以實現的,切合實
17、際的規劃可以確保組織能夠制 定適合其需要和資源的路線。 該指數報告定義自動化等級,從無自動化開始,逐級上升到綜合自動化: Level 0 在整個網絡生命周期中,所有操作和維護全部通過人工執行,沒有自動化。 Level 1 整個網絡生命周期中,以人工操作和維護為主,通過CLI對網絡設備進行一些工具 輔助分析和決策。 Level 2 部分場景部分自動化,雖然標準工具為策略定義和分析提供信息,但決策和執行仍由 人工完成。 Level 3 限定條件自動化,系統提供建議,由人工執行。 2020 IDC #US46931620 5 Level 4 網絡具有廣泛的自動化和高度自治性,在閉環的基礎上動態實施聲
18、明性(基于意圖的) 策略,盡管運維者經常收到基于事件的告警并決定是否接受和允許自動建議。 Level 5 網絡在整個生命周期中完全自動化,并且能夠自動駕駛,能夠應用策略、故障排除和 補救事件。運維者相信,網絡能夠正常運行,并適應幾乎所有已知場景。 表1列出了所有級別。 表表1 數據中心網絡自動駕駛數據中心網絡自動駕駛指數指數報告報告 資料來源:IDC與華為,2020年 2020 IDC #US46931620 6 前進之路:實現前進之路:實現數據中心網絡自動駕駛數據中心網絡自動駕駛的道路的道路 理想情況下,數據中心網絡自動駕駛應在整個網絡生命周期內提供全面的智能化和自動化。如果未能完成 這一良
19、性循環(或關閉自動化循環),只算取得部分成功。這意味著數據中心網絡自動駕駛應解決以下問 題: Day 0(規劃建設):(規劃建設): Day 0規劃建設包括兩個階段,規劃設計,其次是部署開通。 規劃設計階段主要涉及基于業務需求洞察的產品選擇和網絡規劃參數,即LLD和HLD,包括意圖 分析、洞察分析、網絡規劃、規劃仿真、網絡設計、設計仿真等。 Day 1(業務部署):(業務部署): Day 1業務部署場景是指完成Day 0流程后,將客戶服務意圖下發到設備的過程。Day 1流程 包括意圖翻譯、網絡設計、仿真決策、網絡配置、SLA配置、業務驗證等。 Day 2(運維(運維監控監控):): Day 2
20、運維監控場景是指在Day 1業務部署后,對業務意圖進行監控,確保網絡和業務按預期 運行。監控流程包括意圖翻譯、監控與可視化、潛在風險排查、異常識別、問題定界、故障 定位與隔離、故障修復、仿真決策、業務恢復(恢復)和業務驗證等。 Day N(網絡變更和優化):(網絡變更和優化): Day N變更優化包括網絡變更和參數優化。 網絡變更是指基于意圖的網絡變更的評估、實施和驗證,包括意圖評估、變更方案、仿真決 策、變更實施、驗證測試、異?;赝?、參數優化等。 表2描述了數據中心網絡自動駕駛索引中的前三個自動化級別如何映射到整個網絡生命周期(從Day 0到 Day N)的需求。 2020 IDC #US4
21、6931620 7 表表2 基于基于網絡生命周期需求的匹配網絡生命周期需求的匹配,數據中心網絡數據中心網絡自動駕駛指數前三個自動駕駛指數前三個等級等級衡量標準衡量標準 生命周期生命周期 Level 1 Level 2 Level 3 Day 0 意圖翻譯 洞察分析 網絡規劃 規劃仿真 網絡設計 設計仿真 人工評估輸出洞察分析指標和規劃參數 人工獲取歷史數據,人工分析 線下規劃評審 無 基于離線工具的人工設計 無 人工評估輸出洞察分析指標和規劃參數 自動獲取歷史數據或自動預測 離線規劃 離線仿真驗證 基于線下工具的半自動化設計(人工定義策略和規則) 離線仿真驗證 系統生成洞察分析指標和規劃參數,
22、人工校驗 自動獲取歷史數據,自動預測 在線規劃,數字化應用 在線仿真驗證 在線半自動設計,數字化應用 在線仿真驗證,輔助決策 安裝調測 數據準備 網絡配置 SLA配置 軟件調測 撥測驗證 手動+離線硬件調測工具 人工準備數據 人工批量配置 人工批量配置 人工執行 手動撥測 人工+離線硬件調測工具 網絡參數數據自動生成 聯網設備自動檢測和網絡參數設置 SLA保障策略配置自動下發 自動調測,手動調用 手動撥測 人工+離線硬件調測工具 網絡參數和SLA保障策略數據自動準備 聯網設備自動檢測,提供網絡參數設置 SLA保障策略配置自動發放 自動調試、基于異?;虍惓5念A警、手動更正 自動驗證和驗收報告 D
23、ay 1 意圖翻譯 網絡設計 仿真判決 網絡配置 SLA配置 業務驗證 運營人員通過工單人工錄入服務參數(網絡意圖) 工具輔助、工具化的資源查詢和分配 無 工具輔助 工具輔助 人工驗證 運營人員通過portal選擇業務參數(網絡/業務意圖) 工具輔助、工具化的資源查詢和分配 無 網絡參數配置自動下發 SLA參數自動下發 人工驗證 運營人員通過Portal選擇服務,自動生成參數(網絡/服務意圖) 自動查詢、分配資源,制定解決方案 仿真驗證和輔助決策 網絡參數配置自動下發 SLA參數自動下發 自動驗證業務,生成業務發放報告 Day 2 意圖翻譯 可視化監控 隱患排查 異常識別 問題定界 問題定位
24、解決方案 仿真判決 業務恢復 業務驗證 根據運營商經驗和知識配置監控規則 固定系統監控視圖 人工檢查 告警、性能、日志可視化,工具輔助識別 手動和離線工具輔助定界 手動和離線工具輔助故障定位 根據專家經驗提供修復建議 無 人工修復 人工+工具撥測 根據預置模板自動轉換監控規則 固定視圖+局部自定義視圖 基于操作員知識、離線工具、What if故障模擬、自動巡檢等,預測潛在問題 告警壓縮關聯,動態基線異常識別 可視化定界工具 可視化定位工具 提供修復建議 無 人工修復 人工+工具撥測 監控規則自動轉換 場景化自定義視圖 worst-case仿真 異常自動識別 故障自動定界 部分故障自動根因分析,
25、人工確認 自動生成具體的修復解決方案 仿真驗證和輔助決策 部分業務自動恢復 自動驗證業務,生成維修報告 Day N 意圖評估 變更方案 仿真判決 變更實施 驗證測試 異?;貪L 基于SLA/時間窗人工評估,人工輸出變更約束 人工變更 專家評審 工具輔助 網絡快照手動比對 手動回退 基于SLA/時間窗等人工評估,自動輸出變更約束 人工變更 專家評審、線下驗證 離線生成 網絡快照自動比對 手動回退 基于SLA/時間窗自動評估,變更約束自動輸出 在線、自動生成更改 在線仿真驗證,輔助決策 自動實施更改 業務自動測試,異常自動發現 手動觸發自動回退 意圖翻譯 劣化預測 異常識別 環境監控 問題定界 問題
26、定位 優化方案 仿真判決 調整參數 業務驗證 根據運營商知識人工翻譯策略 離線工具輔助預測 固定規則監控異常 人工檢查 工具輔助定界 工具輔助故障定位 人工制定方案 人工決策 工具輔助參數調整 人工+工具撥測 策略根據預置模板自動翻譯 運營商知識+在線工具 動態基線監控異常 人工檢查 可視化分析定界工具 可視化分析定位工具 人工制定方案 人工決策 工具輔助參數調整 人工+工具撥測 自動調用策略進行意圖轉換 運營商體驗+在線工具 自動準確識別異常 環境自動監控 故障自動定界 自動故障定位分析,人工確認 AI與自動化方案 仿真輔助決策 參數自動調整 業務自動驗證,生成優化報告 資料來源:IDC與華
27、為,2020年 2020 IDC #US46931620 8 數據中心網絡自動化現狀數據中心網絡自動化現狀 當前網絡生命周期階段,大多數組織尚未采用或實施完全自動的數據中心網絡。許多組織剛剛開始網絡自動化之 旅。有些組織還在使用人工流程和CLI進行網絡配置和管理,有些組織則使用Ansible、Puppet、Chef、Salt、 Terraform等自動化配置管理工具。還有一些組織采用了SDN,利用控制器、應用策略或網絡虛擬化(overlay)。 對于Day 2和Day N場景,一些企業已經使用了各種網絡分析工具,但是很難關聯和集成可操作的數據,以便及時解 決問題和持續進行優化。 數據中心網絡自
28、動駕駛數據中心網絡自動駕駛調研結果調研結果 接下來的部分將介紹一項全球調查的結果,該調查生動地說明了各個行業的企業在數據中心網絡自動化的現狀。 IDC代表華為對全球多個主要行業進行了數據中心網絡自動駕駛狀況調查。調查的目的是了解當前企業數據中心網 絡面臨的挑戰、企業數據中心網絡的自動駕駛進展,以及企業受訪者是否計劃實施數據中心網絡自動駕駛。 數據中心組網挑戰數據中心組網挑戰 在調查的初始階段,IDC要求受訪企業找出他們數據中心網絡面臨的最大挑戰。所有受訪企業列舉的挑戰中排名第 一的是“與計算和存儲自動化保持同步”,所占比例為41%。這表明網絡運營者對網絡能否與數據中心基礎設施的其 他方面保持同
29、步感到焦慮。其次為“靈活性”,包括對混合工作負載和環境的支持,所占比例接近40%。并列第三 的是“管理多廠商網絡基礎設施”和“敏捷”(包括對云架構和應用的支持),后者的反應與受訪企業關于數據中 心存在云原生容器的說法非常吻合。排名第五的“使能AI的網絡智能”,比例幾乎相同(近33%),這表明受訪者將 這一挑戰視為他們能夠快速提高運營效率和有效性的應對措施。其他上榜的相關挑戰是簡單性(易于管理)、可伸 縮性以及技能差距/專業知識(見圖1)。 2020 IDC #US46931620 9 圖圖1 數據中心網絡挑戰數據中心網絡挑戰 問:在您的數據中心網絡方面,您的組織面臨的最大挑戰是什么? n =
30、205 來源:IDC數據中心網絡自動駕駛調查,2020年8月 對無損、低時延的融合對無損、低時延的融合IP數據與存儲網絡數據與存儲網絡表示表示濃厚興趣濃厚興趣 IDC還問詢了被訪者對一個無損、低延遲、高性能的融合IP數據和存儲網絡的興趣。結果如圖2和圖3所 示,金融/銀行和媒體/娛樂/游戲以及擁有三個或三個以上數據中心的受訪者對此融合網絡的興趣最高。 2020 IDC #US46931620 10 圖圖2 無損、低時延、高性能的無損、低時延、高性能的融合融合IP數據數據和和存儲網絡(按行業)存儲網絡(按行業) 問:貴組織對擁有一個無損、低延遲、高性能的融合IP數據和存儲網絡的興趣有多大? n = 205 來源:IDC數據中心網絡自動駕駛調查,2020年8月 2020 IDC #US46931620 11 圖圖3 無損、低時延、高性能的無損、低時延、高性能的融合融合IP數據數據和和存儲網絡(按數據中心數量)存儲網絡(按數據中心數量) 問:貴組織對擁有一個無損、低延遲、高性能