1、 中國聯通 CUBE-Net2.0 開放硬件網絡設備白皮書 中國中國聯通聯通 2012019 9 年年 6 6 月月 中國聯通 CUBE-RAN 白皮書 版權所有 中國聯通網絡技術研究院,2019 目 錄 目錄 1 引言引言 . 2 2 發展趨勢發展趨勢 . 3 2.1 業務發展業務發展 . 3 2.2 網絡架構變革網絡架構變革 . 3 2.3 開源和白盒化趨勢開源和白盒化趨勢 . 5 3 相關開源組織相關開源組織 . 6 4 軟硬件解耦軟硬件解耦 . 8 4.1 白盒交換機架構白盒交換機架構 . 8 4.2 芯片方面芯片方面 . 9 4.3 白盒交換機整機硬件方面白盒交換機整機硬件方面 .
2、11 4.4 白盒交換機軟件白盒交換機軟件 . 12 5 白盒交換機組網方案白盒交換機組網方案. 18 5.1 白盒交換機通信云內部組網方案白盒交換機通信云內部組網方案 . 18 5.2 白盒交換機通信云間組白盒交換機通信云間組網方案網方案 . 20 6 中國聯通白盒交換機的創新應用中國聯通白盒交換機的創新應用 . 21 6.1 基于白盒交換機的基于白盒交換機的 vBNG 轉發面轉發面 . 21 6.2 基于白盒交換機的基于白盒交換機的 UPF . 23 6.3 基于白盒交換機的基于白盒交換機的 DC 出口路由設備出口路由設備 . 23 7 中國聯通白盒網絡設備規劃中國聯通白盒網絡設備規劃 .
3、 24 7.1 中國聯通白盒交換機定義和目標中國聯通白盒交換機定義和目標 . 24 7.2 中國聯通白盒交換機推進計劃中國聯通白盒交換機推進計劃 . 25 7.3 白盒交換機軟硬件采購模式白盒交換機軟硬件采購模式 . 26 10 總結與展望總結與展望 . 27 白皮書聯合編寫單位白皮書聯合編寫單位 . 28 中國聯通 CUBE-RAN 白皮書 版權所有 中國聯通網絡技術研究院,2019 1 引言 近十年,移動互聯網的飛速發展深刻地改變了人類生活方式。物聯網、大數據和云計算等新興技術正帶動各行各業實現信息化和數字化轉型。 深陷人口紅利消失,逐步管道化困境的運營商靈敏地嗅到了這場變革中新興業務的潛
4、在價值,開始加速挖掘行業客戶需求,積極尋求商業合作共贏,努力開辟新的市場空間。 未來網絡服務呈現出新的特點,實時、按需提供、永遠在線、自助服務已經成為數字時代所有行業新的用戶體驗標準。要實現最佳體驗,就需要運營商采取基于互聯網架構的運營系統, 并具備互聯網化的運營能力。 快速增收, 增加效率,敏捷服務成為運營商當前面臨的重大課題。要實現這些目標,必須對運營商網絡進行徹底轉型。 隨著云技術的不斷成熟,把 IT 技術應用到 CT 領域已經成為可能,而SDN/NFV 技術結合云計算、大數據正好滿足了這一網絡轉型對技術的要求。標準化組織也在積極推動 SDN/NFV 的快速成熟,產業界正通過共同努力加速
5、這一技術的商用化部署。 另一方面隨著 5G 迎來規模商用,數據流量爆發式增長,連接數量激增,業務場景多樣化,構建以 DC 為核心的全云化網絡是網絡轉型的基礎,經過提前規劃,對網元按照業務要求進行分層部署、構建統一的云平臺實現網絡的彈性與自動化運維能力,極力打造敏捷、彈性、智能的云化網絡,以滿足未來網絡業務的發展訴求。從網絡設備層面來看,傳統網絡設備軟硬一體,利用率低,缺乏敏捷性,新業務新網絡上線周期長,難以適應未來網絡發展需求,要求運營商網絡盡快實現網絡轉型,以增強網絡靈活性、敏捷性、開放性,實現低成本運營。 目前全球很多領先運營商都開始思考并啟動了自己的面向未來網絡的轉型戰略,中國聯通在 2
6、015 年發布新一代網絡架構白皮書 CUBE-Net2.0,指明了未來網絡的發展方向,并通過不斷論證與實踐,進一步提出中國聯通網絡轉型通信云架構白皮書,希望能夠為通信云建設指明方向。 中國聯通于2015年發布了新一代網絡技術體系和架構白皮書CUBE-Net2.0,指明了中國聯通網絡發展方向。本白皮書提出中國聯通 CUBE-Net2.0 開放硬件網絡設備的概念,本白皮書此版本主要關注通信云內部的交換機設備,文檔后續都將把通信云內部開放硬件網絡設備簡稱為白盒交換機。 旨在通過云化架構演進、多接入融合、資源智能管理和邊緣能力開放,打造彈性、敏捷、開放、高效、智能的移動無線接入網。 中國聯通 CUBE
7、-RAN 白皮書 版權所有 中國聯通網絡技術研究院,2019 2 發展趨勢 2.1 業務發展 業務的多樣性和不確定性愈加突顯, 快速實現業務商業創新及有效提升用戶體驗,將成為通信網絡演進最重要的驅動力。未來的應用和業務場景將更加多樣化(從人與人連接到萬物互聯) ,業務速率體驗需求從 Kbps 到 Gbps,時延體驗需求從秒到毫秒,這對運營商網絡能力和運營提出更高要求,運營商需要提供高效資源利用、網絡按需部署以及業務敏捷發放的能力匹配業務需求。 區別于個人客戶,行業客戶需求千差萬別且靈活多變,需為其提供定制化服務,實現業務快速響應和交付。為滿足客戶體驗,運營商迫切需要改變封閉僵化的運營思維,擺脫
8、重資產枷鎖,向更加高效敏捷的方向發展,以開放的姿態擁抱多變的外部需求,探索出一條可持續發展的互聯網化轉型之路。將 SDN/NFV、大數據、人工智能等 IT 領域技術應用到 CT 領域,能夠助力運營商重構基礎網絡資源,開放移動網絡能力,引入互聯網運營模式,實現云管端協同發展,構建良性循環的合作生態。 為適配業務在時延、帶寬、連接等方面的更高需求,通信網絡云化將成為趨勢。借助 NFV/ SDN/云計算等領先技術,構建面向未來的通信云,支撐通信業務和能力開放,實現網絡資源的虛擬化,打造高效、彈性、按需的業務服務網絡?;谕ㄐ旁铺峁╈`活、開放、多元化的應用平臺,實現業務和應用的持續快速創新,同時幫助運
9、營商用架構的確定性來管理未來技術的不確定性。 2.2 網絡架構變革 中國聯通在網絡轉型中始終主張聚焦、 創新、 合作的理念, 聚焦移動、 固定、IoT、視頻等基礎管道能力,基于中國聯通已有的網絡建設部署與運營經驗,為支撐網絡的云化演進、匹配網絡轉型部署、統一構建基于 SDN/NFV/云計算為核心技術的通信云基礎設施。實現個人、家庭、政企、物聯網等領域的業務創新,對外開放網絡能力,構建合作生態。 通信云是基于中國聯通已有網絡建設部署與運營經驗, 為支撐網絡的云化演進、匹配網絡轉型部署、統一構建基于 SDN/NFV/云計算為核心技術的網絡基礎設施。 為支撐網絡 NFV 不同階段集中或分布式部署要求
10、,傳統網絡機房將逐步向中國聯通 CUBE-RAN 白皮書 版權所有 中國聯通網絡技術研究院,2019 數據中心架構演進,從而構建通信云云化網絡總體架構。云化網絡總體架構沿用傳統通信網絡接入、城域、骨干網絡架構,與現有通信局所保持著一定對應和繼承關系,在不同層級邊緣、本地、區域進行分布式 DC 部署,實現面向寬帶網/移動網/物聯網等業務的統一接入、統一承載和統一服務。 整體網絡架構 通信云云化網絡架構總體上可劃分為四個層級單元部署, 包含 3 層 DC 以及一層接入局房: 區域 DC:以省域/集團/大區控制、管理、調度和編排功能為核心,如集團OSS/NFVO,省云管平臺、NFVO、VNFM 等,
11、主要承載省域內及集團區域層面控制網元以及集中媒體面網元包括 IMS、 GW-C、 CDN (內容) 、 MME 和 NB-IOT核心網等網元。 本地 DC:主要承載城域網控制面網元和集中化的媒體面網元,包括 CDN(內容) 、SBC、BNG、UPF、GW-U 等網元。 邊緣 DC:以終結媒體流功能并進行轉發為主,部署更靠近用戶端業務和網絡功能,包括 CloudRAN-CU、MEC、UPF 等網元。 接入局所: 以提升資源集約度和滿足用戶極致體驗為主, 實現面向公眾/政企/移動等用戶的統一接入和統一承載??紤]到接入局所主要部署接入型/流量轉發型設備,暫不考慮接入局所基礎設施 DC 化改造。未來按
12、需部署 Cloud RAN-CU/DU、MEC 等網元,基于現有機房條件直接入駐。 中國聯通 CUBE-RAN 白皮書 版權所有 中國聯通網絡技術研究院,2019 2.3 開源和白盒化趨勢 隨著運營商網絡轉型步伐加速,運營商開始深刻認識到黑盒設備的局限性,不僅僅將眼光局限在無線接入設備通用化、云化,甚至開始將軟、硬件的徹底開源和白盒化作為長期的目標。 通信云內部數據中心交換機設備采購成本在網絡建設成本中占比較高。降低數據中心交換機設備開發門檻,通過引入更多廠家形成規模效應,進行靈活的軟件功能和硬件配置匹配,從而降低設備成本,是運營商推動開源和白盒化的源動力。另外,開源和白盒化還可以加強運營商對
13、網絡數據的控制,從而更好地開放網絡能力、實現網絡運維與大數據分析、機器學習等技術相結合。 推動開源和白盒化最重要的是構建相應的生態系統, 運營商在該生態系統中需要發揮主導作用,深入研究數據中心交換機設備各硬件與軟件的組成部分,根據設備的運行環境、業務需求等分解軟硬件關鍵功能及指標,進行各部分模塊化設計,定義模塊間接口標準,理清方案細節設計,制定設計規范,最終推動設計方案共享。在這個過程中,運營商也應該重視積極參與開源軟件和社區工作。 開源和白盒化是運營商的長期目標, 但實現開源和白盒化最根本的原則是不能損失通信云網絡性能。 對于運營商來說目前數據中心交換機設備的開源和白盒化整體仍處于研究的初級
14、階段,還存在許多需要逐步嘗試和探討的內容。評估設備各部分開源和白盒化的迫切性及難易程度, 有規劃地合力推動其發展至關重要。 從 2010 年公開市場開始出現白盒交換機設備,各路玩家就盡顯身手為白盒網絡軟件嘗試各種突破口,數據中心是最先落地的場景。在商業模式不明朗的前期,一些初創公司基于 Linux 平臺移植開源協議軟件或者集成商用代碼,為多款萬兆白盒交換機提供了不同的軟件版本, 初步實現了軟件與硬件的解耦與靈活組合; 有了初創公司的市場宣傳與引導, 2015 年相繼出現 OpenSwitch 和 SONiC 等純開源軟件, 尤其是微軟將其數據中心運行的 SONiC 系統在 2016 年開源并提
15、交在 OCP 組織,至此數據中心級白盒交換機有了軟件和硬件的全部開放的實現。在巨大的市場驅動下, 品牌廠商也紛紛加入了白盒網絡軟件的戰局并享受開源的成果。部分企業或者將只有的路由協議解耦嫁接于開源平臺之上,或者全盤接收開源軟件將其移植到自研交換機芯片之上,如前所述,也有部分廠家直接引入白盒硬件,將其與自家操作系統對接,走品牌化白盒的路線。除了上述通過協議軟件的歸一化簡化設備復雜度的流派,以 OpenFlow 起家的 SDN 方案通過將白盒設備的控制能力體現在邏輯集中的控制器當中達到相同的目的,從早期的OpenFlow 到現在的 P4 可編程網絡設備, 白盒設備作為數據平面只需要快速敏捷中國聯通
16、 CUBE-RAN 白皮書 版權所有 中國聯通網絡技術研究院,2019 的轉發報文,谷歌聯合 ONF 打造的開源項目 Stratum 就沿著這個方向繼續細化控制與轉發的解耦,將管理配置監控等多個層面標準化,為白盒設備探索另一條落地之路。無論是商用白盒軟件還是開源操作系統,無論是中大規模數據中心還是相對封閉的企業環境,無論是 SDN/Openflow 還是傳統 BGP,白盒交換機已經可以根據用戶需求提供不同功能特性的方案,在 IT 環境中白盒網絡軟件已成氣候。 3 相關開源組織 OCP OCP 全稱是 Open Computer Project,是 2011 年 Facebook 發起的一個硬件
17、開源組織。它的關注點主要在這些方面:存儲設備、服務器主板、服務器機柜、虛擬 I/O、硬件驅動管理、數據中心基礎架構設計,期望能夠把涉及其中的硬件盡量標準化。 后續成立網絡組對交換機的硬件進行標準化, 也包括 sonic、 sai、 onie、onl 等幾個相關開源軟件項目,OCP 網絡硬件追求的是類似服務器的使用體驗,包括控制平面與數據平面的高度模塊化、軟件與硬件解耦合,以實現定制的靈活性(DIY) ,避免被供應商鎖定。 OCP 網絡組試圖定義一套標準化的硬件設計,標準化包括:交換機硬件 電路板中都要用哪些類型的器件, CPU 跟各種器件之間用什么樣的接口, 芯片接口類型和數量,各個器件地址空
18、間,鏡像文件在 flash 中存放的位置等等,基于這樣的硬件規范, 各個廠商或者代工廠可以生產符合 OCP 標準的硬件交換機。 OCP的交換機開源包含三個層次:第一個層次是硬件開源且標準化;第二個層次是硬件驅動, bootloader, linux OS的開源;第三個層次包括各種開發和管理工具的開源。 OCP 提供了一種全新的架構, 個人和組織可以與其他人分享知識產權, 促進了 IT 硬件行業走向開放。 OCP 成員可以向 OCP 提交硬件設計圖紙、 規格或者產品等。 如果是產品的話, 廠商可以選擇是否保留該產品的知識產權。如果廠商選擇保留該產品的知識產權,那么這個產品就是“OCP Inspi
19、red” ; 如果廠商將該產品的知識產權也轉移給 OCP,那么這個產品就是“OCP Accepted” 。 CORD CORD 是 ONF 旗下一個開源集成項目組織,中國聯通作為 CORD 的創始成員也加入了 CORD 董事會,并且在 2016 年 12 月成立了中國聯通 CORD 產業聯盟,推進 CORD 技術在中國聯通以及中國的應用。CORD 項目的目標是將開放中國聯通 CUBE-RAN 白皮書 版權所有 中國聯通網絡技術研究院,2019 的硬件和軟件相結合,使電信運營商的電信機房(CO , Central Office)擁有數據中心那樣的經濟性和敏捷性。 CORD 為電信運營商提供了一種
20、新的方式電信機房中的物理網絡改用數據中心非常流行的 Spine-Leaf 架構, 實現高效的無阻塞交換,同時將開放硬件和開放軟件相結合,大量使用 NFV、SDN 和云計算相關技術, 提高服務交付速度和運維效率。CORD 的本質其實就是將運營商中心化的網絡架構轉變為分布式的邊緣網絡, 在重構電信機房為數據中心的過程中借助云計算、NFV 和 SDN 等技術來解決長久以來在技術、運維等方面的一些痛點。 CORD就是用IT/互聯網運營商的技術思路/運維方法來解決電信運營商的技術、商業、管理、運維等問題。用開源軟件和白盒交換機來構建技術模塊,用通用的數據中心基礎設施規模來降低成本。 CORD 認為不改變
21、設備硬件形態的網絡虛擬化都不是真正的虛擬化,不是真正的云化,也不是架構性的變革。通過這樣的變革,希望達到互聯網公司的敏捷,同時創造高效的業務。CORD 項目中硬件只保留了簡化的用戶側接口板。 其他都被數據中心的硬件消化。 板間交換/網絡側出口都被交換機替代。所有的業務和控制都在服務器上處理。不同的業務場景最終是通過 SDN 控制器對不同的應用層軟件模塊調度組合完成的。整個數據中心變成了一個通信設備,而且有良好的軟硬件擴展性。 ODCC 開放數據中心委員會(open data center committee,ODCC) ,前身為天蝎聯盟, 由數據中心相關的企業事業單位自愿結成的行業性的全國性的
22、非營利性的社會組織。委員會旨在打造中國的數據中心開放平臺,推動互聯網產業發展和基礎設施標準化、產業化進程?,F有四個工作組,分別為服務器工作組、數據中心工作組、測試認證工作組和網絡工作組,各工作組下設項目組。網絡工作組下面開中國聯通 CUBE-RAN 白皮書 版權所有 中國聯通網絡技術研究院,2019 展相關白盒交換機硬件標準項目和白盒軟件鳳凰項目。 TIP TIP 電信基礎設施聯盟(Telecom Infra Project consortium,TIP)是 2016 年由Facebook 主導成立的一個開放組織,旨在重新思考如何設計和部署電信網絡基礎設施。TIP 將軟件與硬件組件分離,以提高
23、效率并創建創新解決方案,該項目主要集中在三個關鍵領域: 接入、 回傳和核心網/管理, 運用開放的開放計算項目(OCP)模型來刺激創新。 P4.org P4 Language Consortium 成立于 2015 年 5 月,P4 Language Consortium 建立一個致力于使用和改進 P4 語言的蓬勃發展的開源社區,利用 P4 來描述轉發平面如何處理數據包,促進 P4 語言的標準化和改進,幫助行業參與者開發符合規范的新技術,通過促進采用 P4 語言,使消費者和行業受益。P4.org 已經成立四個 Working Group, 分別是 Language Design Working
24、Group、 API Working Group、Architecture Working Group 和 Applications Working Group。目前 P4 已經成為開放網絡基金會(ONF)旗下的一個項目,ONF 將把 P4 工作置于運營商主導的開源 SDN 項目之下, 與所有 ONF 項目一樣, ONF 旨在戰略性地將 P4 活動與 Linux基金會結合起來, 以推動開源的發展。 P4 項目將繼續以前的運作方式, 同時受益于與 ONF 的戰略聯盟以及 ONF 的運營基礎設施和專業知識。 4 軟硬件解耦 4.1 白盒交換機架構 由于運營商網絡設備功能需求的數量和復雜性, 創建網
25、絡操作系統的門檻歷來很高。這種復雜性包括軟件和硬件方面。為增加網絡的靈活性,降低運營商網絡建設成本,實現下一代網絡云化、智能化發展目標,開放、解耦正在重構運營商未來的網絡。SDN/NFV 促進網絡設備更加開放、簡化。 另外隨著開源軟件系統、商業轉發芯片及其相應 SDK 的發展能夠滿足最高端的網絡設備的能力和吞吐量需求。諸如 P4、NPL 語言和可編程芯片等技術很快就會提供功能更強大的設備。 這些技術的結合創造了一個強大的網絡應用程序和構建模塊生態系統通過硬件和軟件組件供應商的協作生態系統更快地引入技術, 設計和功能, 通過即插即用的硬件和軟件組件靈活進行網絡設計和服務部署,可以經濟高效地進行擴
26、展和縮減, 通過使用具有規模經濟規模的標準硬件和軟件中國聯通 CUBE-RAN 白皮書 版權所有 中國聯通網絡技術研究院,2019 技術組件來降低單位成本。 以下是白盒交換機系統中功能組件的抽象表示。 白盒交換機系統由整機硬件和軟件組件組成。軟件組件包括基本操作系統、協議模塊、管理模塊以及驅動模塊等,相關開源軟件主要有 sonic、stratum、onie、onl、P4、SAI 等。硬件組件通常包括通用 CPU, 以運行用例所需的基本操作系統, 控制和管理平面以及任何軟件數據平面,硬件組件還包括專用轉發芯片,通用 CPU 和專用轉發設備可以共同設計在相同的硬件中,另外還包括風扇模塊、電源模塊、
27、BMC 等。 白盒交換機演進思路 后面將從芯片、 交換機整機硬件、 交換機軟件系統三個方面進行詳細說明。 4.2 芯片方面 白盒交換級芯片方面主要包括交換芯片和 CPU 芯片,下面從這兩方面介紹發展趨勢。 交換芯片方面交換芯片方面 近年來,數據中心的大規模建設和擴容,導致交換芯片的帶寬增長需求日益迫切,基本上呈現出兩年帶寬提升一倍的增長態勢。目前業界的 12.8T 單芯片方案已經非常成熟,但出于建設成本以及節能的考慮,25.6T 單芯片方案仍會是未來的重要趨勢。隨著 400GQSFP-DD 光模塊的日益完善,400G 接口也將成為高速數據互聯的主流方案,以此滿足大規模數據中心的布網需求。同時,
28、一些主流商業交換芯片公司紛紛在 2019 年宣布了基于 7nm 工藝的交換芯片解決方案,來縮小芯片尺寸并降低設備功耗。功能上,由于更多的網絡功能被智能網卡卸載,交換芯片不再需要承載各種復雜的封裝和解封裝功能, 而是更加專注于轉發表項中國聯通 CUBE-RAN 白皮書 版權所有 中國聯通網絡技術研究院,2019 和緩存的擴大以及對數據擁塞的管理。 在運營商業務方面,隨著 5G 的建設步伐加速,商業交換芯片也不斷更新換代來滿足 5G 的業務需要。 為了滿足了 5G 業務的切片和時延要求, Flex-E 和 TSN等技術逐漸的被商業交換芯片所支持, 并且隨著技術的演進和 BIDI 模塊的普及,IEE
29、E1588 對時精度也得到了極大的提升。5G 承載方面,交換芯片對 EVPN,Segment Routing 等新興技術的支持為承載網的演進提供了新的活力,并帶來了更為靈活的端到端連接保障;SD-WAN 和 NFV 技術的逐步成熟則為運營商提供了更為快捷的業務部署保證。 大部分的交換芯片廠家都提供了支持開放架構的軟件,比如基于 SAI 接口的 SDK 適配層,極大的減少了白盒設備研發的工作量,為運營商/云服務商提供了更加廣闊的生態環境。 另外現有的 SDN 解決方案為用戶開放的是控制平面的可編程能力,但轉發平面無法實現可編程,轉發設備的數據包解析,轉發流程是由設備轉發芯片固化的,所以設備在協議
30、的支持方面并不具備擴展能力,而且廠商開發新的轉發芯片以支持新的協議或者擴展協議特性的代價也非常高, 需要將以前的硬件重新設計,勢必導致更新成本高,時間周期長等一系列問題,而且轉發層面資源固化利用效率低,所以在一定程度上,這種將設備功能和協議支持與硬件綁定的模式限制了網絡的快速發展。新一代的 SDN 解決方案必須讓數據轉發平面的邏輯也具有可編程能力,讓軟件能夠真正定義網絡和網絡設備。打破了硬件設備對數據轉發平面的限制,讓數據包的解析和轉發流程也能通過編程控制,使得網絡及設備自上而下地、 真正地向用戶開放。 靈活的流水線/數據塊編程能力使得一款芯片可以滿足多種應用場合的需要,成為了今后交換芯片的另
31、一個發展趨勢。 CPU CPU 芯片主要起到白盒交換機控制管理平面的作用,半導體制程還無法保證嵌入式應用的低功耗時,MIPS/PowerPC 等 RISC 架構的 CPU 都尚有一席之地,因此在選擇設備操作系統時以精簡為主,隨著 x86 技術以及半導體工藝的進一步發展,白盒交換機內部 CPU 的 x86 化在現代數據中心尤為重要,這樣就能像運維服務器一樣運維網絡, 因此數據中心白盒交換機交換機在CPU方面的X86化成為了主流趨勢。 中國聯通 CUBE-RAN 白皮書 版權所有 中國聯通網絡技術研究院,2019 4.3 白盒交換機整機硬件方面 白盒交換機硬件組件通常包括通用CPU, 以運行用例所
32、需的基本操作系統,控制和管理平面以及任何軟件數據平面, 硬件組件還可以包括專用硬件轉發設備,例如商業 ASIC 芯片,NPU,FPGA 或類似設備。通用 CPU 和專用轉發設備可以共同設計在相同的硬件中,或者可以通過總線或網絡分開。 下圖是一個 48*25G+8*100G 白盒交換機的組件模型: 交換機硬件組件模型 ASIC: 交換機上 ASIC 芯片是交換機上重要的硬件組件, 它是一種快速處理數據包的專用集成電路芯片,能夠以最高達 12.8Tbps 的速率交換數據包,交換機 ASIC 內部有多個組件:存儲器,通常是 CAM、TCAM 或 SRAM,用于存儲需要由 ASIC 快速訪問的信息 ;
33、 一個解析流水線,由一個解析器和一個 deparser組成,它從數據包中定位、提取、保存感興趣的數據,并在數據包發送出去之前重建數據包;匹配-動作(Match-Action )單元,它們指定 ASIC 應如何根據數據包內的數據、配置的數據包處理邏輯和 ASIC 存儲器內的數據來處理數據包。 PHY:PHY(物理層子系統)負責將鏈路層設備(例如 ASIC)連接到物理介質(例如光纖) ,并將鏈路上的模擬信號轉換為數字化的以太網幀。在某些交換機設計中,PHY 可以在 ASIC 內構建。在高速傳輸數據時,電信號干擾非常嚴中國聯通 CUBE-RAN 白皮書 版權所有 中國聯通網絡技術研究院,2019 重
34、, 會導致交換機內部數據包損壞。 因此, 需要復雜的降噪技術, 如 PHY tuning, PHY tuning 控制各種參數,例如預加重、可變功率設置或用到的前向糾錯算法(FEC)的類型。 端口子系統:端口子系統負責讀取端口配置,檢測已安裝端口的類型,初始化端口以及為端口提供與 PHY 交互的接口。數據中心交換機包含多個 SFP 和QSFP 端口。 端口用于將交換機硬件與線纜連接, 端口的類型和數量由交換機規范和 ASIC 決定。 CPU 板:在交換機中存在一個 CPU 子卡, CPU 子卡非常類似于商業服務器,包含 CPU、RAM 和存儲介質。除了這些標準部件外,CPU 板還通過專門的PC
35、I-E 總線與交換機 ASIC 互連,可實現對 ASIC 的快速調用。X86 CPU 的存在使得能夠為交換機安裝商用 Linux 進而提供常見的操作系統功能。與服務器級CPU 相比,交換機內的 CPU 通常性能要低一些。目前白盒交換機系統架構支持模塊式 CPU 處理器,以滿足升級不同運算核數及內存需求。 BMC 基板管理控制: BMC 基板管理控制, 支持發生異常時, 能夠自我恢復。串接系統主 CPU 處理器, 實現基板遠程運維管理控制串接千兆管理網絡控制器,提供 RJ45 網路電口進行遠程運維管理控制,基礎器件控制。 電源系統:直流或交流電源輸入電源模塊,電源模塊 1+1 冗余,可支持熱插拔
36、。 風扇模塊:可選前風向/后風向風扇模塊,N+1 冗余,支持熱插拔。 TPM (Trusted Platform Module)信任平臺模塊: 一個選配 TPM 信任平臺模塊,提供 TCG 二種安全標準等級,提升數據中心解耦軟件保密性設計。 除以上模塊以外還包括串口、管理網口、USB 口、LED 等組件。 4.4 白盒交換機軟件 隨著白盒交換機在 OTT 大批量應用,涌現出了一些開源的白盒軟件系統,這些軟件各有特色,側重點也有不同,下面分別介紹一下相關開源軟件。 SONIC 2016 年度 OCP 峰會上,微軟推出了內部開發基于 Debian GNU/Linux 的系統-SONiC,全稱是 S
37、oftware for Open Networking in the Cloud(針對云計算開放網絡的操作系統) 。該系統包含代碼工具包和內核補丁能夠根據你的意愿來調整中國聯通 CUBE-RAN 白皮書 版權所有 中國聯通網絡技術研究院,2019 網絡交換機。該系統降低了對來自網絡設備提供商的硬件依賴,能夠在來自不同設備廠商的各種硬件設備上運行,且能夠使用通用的 Switch Abstraction Interface (SAI)對網絡設備專用芯片進行配置。這本質上就是允許完全控制和管理網絡設備來實現底層電子設備所需求的各項功能,正是由于 SAI 的存在,SONiC 的的網絡功能才能夠支持多個
38、廠家的 ASIC。 SONiC 的所有軟件功能模塊都是開源的,推動了 OCP 社區以及其他廠商在開放網絡方面的創新。SONiC 是構建交換機所需功能的軟件集合,它運行在 ONL 之上。 SONiC 是一個將傳統交換機操作系統軟件分解成多個容器化組件的創新方案, 這使得增加新的組件和功能變得非常方便。 SONiC 大量使用了現有的開源項目和開源技術, 如 Docker, Redis, Quagga 和 LLDPD 以及自動化配置工具 Ansible、Puppet 和 Chef 等。 Stratum ONF 在谷歌的支持下推出了 Stratum 項目, 中國聯通做為創始成員參與了該項目,該開源項目
39、將用于實現真正的軟件定義的數據平面參考平臺,其目標是提供一個白盒交換機開放軟件系統。 谷歌是Stratum首個版本的代碼貢獻者, Stratum將使用可編程芯片以及包含 P4 和 P4Runtime 的工具箱,可以徹底重新定義芯片轉發行為,并管理數據層的所有配置和運行。 中國聯通 CUBE-RAN 白皮書 版權所有 中國聯通網絡技術研究院,2019 為了真正實現軟件定義網絡的愿景, 需要一套新的接口來實現數據平面各個方面的生命周期控制和自動化網絡管理,并且在不需要定義新標準。在軟件速度上可以增強和改進接口,軟件工具鏈支持網絡操作系統(NOS)和數據平面之間的動態交互,以便開發人員鎖定升級部署。
40、Stratum 的創始成員計劃通過盡可能廣泛的網絡芯片以及來自多廠商的白盒交換機來提供 Stratum 解決方案。 鳳凰鳳凰 鳳凰項目是 ODCC 網絡工作組發起的開源網絡 OS 發行版項目,鳳凰項目于 2017 年 8 月正式發起,目前項目成員包括阿里巴巴、騰訊、百度、移動、聯通、京東、電信、中國信息通信研究院,該項目依托 SONiC 開源社區,選擇社區穩定的 SONiC 版本軟件,將 Base OS、SAI、平臺驅動等共同打包制作成可直接加載運行在白盒交換機的網絡 OS 映像文件,即鳳凰發行版。另外,鳳凰項目也會在軟硬件兼容性測試認證、運維管理體系等方面進行探索。鳳凰發行版支持跨芯片平臺、
41、跨硬件平臺,具有良好的開放性。鳳凰項目的目標是推動“白盒+開源 OS”的網絡生態,促進中國開放網絡和 SDN 網絡的進一步發展。 鳳凰發行版是一個開源網絡OS映像文件, 形態類似商業品牌交換機的OS,可直接運行在白盒交換機上,當前主要面向數據中心場景。鳳凰發行版映像由Base OS(目前為 Debian linux 發行版) 、SAI (芯片抽象接口) 、平臺驅動、SONiC編譯整合而成。鳳凰發行版的各項功能都以獨立 APP 形式分別運行在不同Docker 內, 通過 Docker 的管理可以非常靈活的實現相關功能模塊的重啟或替換。其次,鳳凰發行版僅支持非常有限的命令行進行配置,推薦采用結構化
42、的 JSON文件進行配置管理。 ONL 中國聯通 CUBE-RAN 白皮書 版權所有 中國聯通網絡技術研究院,2019 ONL(Open Network Linux)是專為開放網絡硬件平臺設計開源 Linux,ONL中包括了許多硬件(溫度傳感器、風扇、電源、CPLD 控制器等)的驅動程序。ONL 已經支持十幾家白盒設備供應商的開放網絡平臺。ONL 是 Big Swtich 在2014 年貢獻給 OCP 的。ONL 支持多種數據平面抽象接口:OF-DPA, OpenNSL 及 SAI。同時兼容大部分路由轉發代理項目:FRRouting, Quagga, BIRD, FBOSS, stratum
43、以及 SONiC。 ONIE ONIE (Open Network Install Environment ,開放網絡安裝環境)是白盒交換機事實上的標配軟件, 用于安裝各種 NOS。 ONIE 是 Culumus 在 2013 年貢獻給 OCP的 ONIE 是也是 OCP 網絡項目早期的重點工作,ONIE 即 Open Network Install Environment (開放網絡安裝環境) , 是一個定義用于裸金屬網絡交換機的開放“安裝環境”的開源項目, ONIE 軟件是一個智能的 bootloader(相當于 PC 中的 BIOS,但是比 BIOS 功能更多一些), 用來安裝和啟動符合
44、要求的交換機軟件系統。 只要軟件廠商或者交換機廠商開發的交換機系統軟件能夠適配 OCP 硬件,那就可以通過 ONIE 啟動。這樣一來,交換機軟件和硬件就徹底分離了,OCP 組織負責硬件規范設計,代工廠負責提供生產硬件,另外的廠商提供交換機軟件系統。這些交換機,就可以稱之為符合 OCP 要求的白盒交換機。 SAI SAI(Switch Abstraction Interface,交換機抽象接口),它定義了一套標準化的API 規范。SAI 向上給 SONiC 提供了一套統一的 API 接口,向下則對接不同的ASIC。正是由于 SAI 的存在,SONiC 才能在不進行額外修改的情況下就能夠支持不同廠
45、家的 ASIC 平臺。SAI 是微軟在 2015 年貢獻給 OCP 的。SAI 沒有公開源代碼, ASIC 廠家只提供二進制格式的 SAI 文件。 雖然 SAI 沒有開源, 但是 SAI向上給 SONiC 提供了一套統一的 API 接口,向下則對接不同的 ASIC。 DANOS AT&T 在 2018 年初將 dNOS 作為種子代碼貢獻給 Linux 基金會, Linux 基金會的據此成立 DANOS 項目 。 DANOS (Dis-Aggregated Network Operating System分解網絡操作系統)將提供一個開放的 NOS 框架,利用現有的開源資源和硬件平臺,如白盒交換機
46、、白盒路由器和 uCPE 等。項目將提供一個軟件架構,以加速在服務提供商的基礎設施中白盒設備的采用和使用。這意味著軟件開發商、網絡運營商、云服務提供商、硬件制造商和網絡應用開發商可以快速創建新的白盒基礎設施,以滿足不斷變化的用戶需求,并且能夠以具有成本效益的方式加以實中國聯通 CUBE-RAN 白皮書 版權所有 中國聯通網絡技術研究院,2019 現。DANOS 項目的目標是成為白盒設備的開放操作系統。該項目將支持現有的網絡協議, 也將提供擴展功能來支持新的工具, 如開源的數據平面編程語言 P4。DANOS 設立了如下目標:將路由器的操作系統從路由器底層硬件中分離,在基本操作系統、 控制和管理平
47、面以及數據平面內提供標準接口和應用程序編程接口(API) ,標準接口/API 實現數據平面與控制平面的分離。 Quagga& FRRouting Quagga 是一款功能比較強大的開源路由軟件,支持 ip,ripng,ospfv2,ospfv3,bgp 等協議。FRRouting(FRR)是 Quagga 路由套件的一個分支。FRRouting 是用于 Linux 和 UNIX 平臺的 IP 路由協議套件,其包括用于 BGP,IS-IS,LDP,OSPF,PIM 和 RIP 的協議守護進程。它隨著時間的推移不斷增長,目前它支持EVPN 部分特性。 FBOSS Facebook 在 2015 年
48、開源軟件 FBOSS 和 Wedge 交換機, Facebook 和 OCP 網絡項目通過分離或“分解”網絡硬件和軟件,明確推動了單一模式的變革。盡管名字中有“OS” ,FBOSS 并不是一個完整的操作系統。相反,它是一組可以在標準 Linux 操作系統上運行的應用程序。希望讓交換機像服務器一樣。每個交換機都像另一臺需要 FBOSS 套件/應用程序的服務器。它的設計考慮到了 Facebook的數據中心網絡。雖然 Facebook 有一個非常復雜的結構拓撲結構,但網絡使用相當小的簡單功能集來構建。對所有流量使用 L3 單播路由,使用 ECMP 平衡鏈路間流量,使用 BGP 配置整個網絡中的路由。
49、不支持數據中心內的多播流量,也不使用L2覆蓋, 生成樹甚至中繼等功能。 這個有限的功能集有助于保持FBOSS的實現相對簡單,并允許我們使用一個非常小的開發團隊來構建它。 OpenSwitch HP 在 2015 年發布了其基于 Linux 的開源網絡操作系統 OpenSwitch, HPE目前已經交出控制權,由 Dell 及 Snaproute 接手,OpenSwitch NOS 聚焦于數據中心交換機,支持 OCP 兼容交換機,通過 ONIE 安裝/卸載,系統提供完備的 L2 與 L3 層網絡協議,適用于與 OCP 兼容的交換機,即可以用 ONIE 引導器安裝或者卸載網絡操作系統。 操作系統的
50、開發環境是 Linux, 可用 docker 執行。 軟件主要包括如下一些模塊:基礎操作系統,協議及管控平面,以及驅動及數據平面等。 基本操作系統有如下主要職責: 系統的基本功能, 包括引導、 設備驅動程序、中國聯通 CUBE-RAN 白皮書 版權所有 中國聯通網絡技術研究院,2019 進程管理、shell 訪問等,基本網絡狀態信息的授權。目前基礎操作系統是主流從Linux 派生?;静僮飨到y應該與主要 Linux 發行版之一密切配合,以利用其現有的成果和生態系統。 基礎操作系統應支持多種 CPU 架構以實現系統可移植性?;静僮飨到y必須包含對開放網絡安裝環境(ONIE)的支持,以促進最常見的