《新思科技:借助IP滿足中國不斷演變的云呼叫中心技術需求(15頁).pdf》由會員分享,可在線閱讀,更多相關《新思科技:借助IP滿足中國不斷演變的云呼叫中心技術需求(15頁).pdf(15頁珍藏版)》請在三個皮匠報告上搜索。
1、白皮書借助 IP 滿足中國不斷演變的云呼叫中心技術需求Scott Durrant,新思科技云業務營銷經理序言自從云計算技術在將近 20 年前推出以來,應用和計算資源不斷從企業數據中心向云環境持續遷移。IT 基礎架構向云端的遷移仍在繼續,而據 Gartner 預測,到 2025 年,將有 80%的企業關停傳統數據中心,同時,其物理基礎架構將完全依賴云提供商而運行(圖 1)。隨著這一轉變的推進,云服務提供商將面臨在超大規模云環境中不斷提高性能、擴展性和安全性的挑戰。為達到所需的服務水平,這些超大規模云服務提供商采用一些工具,包括:增強計算、網絡和存儲基礎架構 用于實現可視化計算和人工智能的新技術
2、將某些云服務前移到網絡邊緣圖 1:向云基礎架構過渡本文將探討中國片上系統(SoC)開發人員在滿足現代云基礎架構需求方面所面臨的一些挑戰,以及可用于開發高效 SoC 解決方案的工具與技術。將關停傳統數據中心的企業受訪對象的比例資料來源:Gartner(2019年2月)保留所有權利當前2025推動云計算發展的主要趨勢推動當前云計算市場發展的主要趨勢有三個,而每個趨勢都給 SoC 設計人員提出了挑戰:云數據快速增長 無處不在地使用人工智能提取數據的含義 云服務向網絡邊緣擴展我們將在下文依次討論每一項挑戰。云數據的快速增長云數據正以指數級不斷增長。受互連設備數量快速增長,流視頻、社交媒體上共享的內容日
3、益增多、在線增強現實和虛擬現實(AR/VR)體驗以及 5G 無線網絡的推動,IDC 預計,從 2020 年至 2025 年,云數據的數量將增長 3 倍。(圖 2)圖 2:2010-2025 年的全球互聯網數據增長數據的增長給 SoC 開發人員帶來了幾個新的挑戰,他們需要在兩個方面快速而且有效地搬運大量數據:服務器之間以及服務器內部(即服務器內部設備之間)。這些挑戰包括:提高每瓦特的性能,在現有功率/熱量范圍內增強計算能力 為設備間的數據訪問提供高速、一致的芯片接口 在數據中心內部和之間提供低延時的高速聯網 提供創新的存儲方案,以增加容量并使數據更靠近處理器 保護數據機密性、完整性和可用性廣泛使
4、用人工智能提取數據含義云計算的第二個主要趨勢是云環境中收集、存儲和處理的數據迅速增多。由于數據量大,用于分析和提取數據含義的傳統機制已不再能夠滿足需求。相反,企業紛紛利用人工智能(AI)工具分析數據,包括Web搜索、語言翻譯、電子郵件過濾、產品推薦和語音助手等應用。為了促進將人工智能應用于眾多服務中,云服務提供商紛紛在云端部署人工智能加速器。據估計,到 2023 年,大多數云服務器都將包含人工智能加速器。1 全球數據的年增長規模180160140120100806040200Zetabytes201020112012201320142015201620172018201920202021202
5、2202320242025175 ZB資料來源:Seagate 贊助的2025 年的數據時代調研,數據來自 IDC全球數據報告。2018 年 11 月要從云端收集并存儲的大量數據中有效獲取價值,需要對 SoC 和云基礎架構進行多項增強,包括:采用高能力、高性能的人工智能加速器進行基于機器的數據分析 利用高帶寬內存/數據接口為人工智能加速器提供數據 通過高速、低延時的加速器互連實現人工智能加速器的擴展和數據傳輸向網絡邊緣擴展云數據增長的驅動因素之一是連接到云端的物聯網設備激增。這些設備中有許多對延時敏感的應用,包括汽車控制系統、圖像和語音識別與應答系統、流視頻以及增強和虛擬現實應用。為了滿足這些
6、應用的最低時延要求,設計人員在邊緣的分布式網絡中將相關數據和數據處理能力部署到更靠近使用點的位置。隨著云的擴展以滿足邊緣計算需求,SoC 開發人員必須滿足邊緣計算的新要求,包括:支持日益增多的機器間通信 亞毫秒級應用延時 在遠程數據中心的功率限制和可變環境條件下運行 AR/VR 和其它可視化計算應用的加速器針對每個云數據中心市場的專項增強前文所述的挑戰可通過增強云計算的六個主要功能領域而解決(圖 3):計算服務器 網絡基礎架構設備 存儲系統 可視化計算解決方案 電信邊緣基礎架構設備 人工智能/機器學習(AI/ML)加速器服務器網絡存儲 增強高密度和邊緣環境的功率效率 采用更快的接口進行數據傳輸
7、 受富媒體和高速設備推動,從100GbE向400+GbE過渡 AR/VR、圖形和視頻內容要求高性能 圖片處理 采用下一代PCIe、NVMe、SCM加快 數據訪問 采用本地CPU盡量減少數據移動可視化計算邊緣基礎架構人工智能 云服務向邊緣擴展 5G部署推動了更高的數據流量、更 低的延時 在云服務器中部署人工智能加速器,從大量數據集內獲取洞察圖 3:云計算的六個主要功能領域服務器云數據的增長推動著位于中心的超大規模數據中心和位于網絡邊緣的遠程設施中計算密度不斷增加。計算密度的提高需要更節能的 CPU,這樣才能在現有數據中心設施的功耗和熱量預算范圍內提高計算能力。由于對更節能的 CPU 的需求,市場
8、最近對于針對每瓦特性能而優化的基于 ARM 的服務器 CPU 再次表現出了極大的興趣。數據量的增長對更快的服務器接口提出了需求,因為在服務器內部和服務器之間需要搬運大量數據。服務器內的數據移動可能是主要的瓶頸,也是延時的根源。通過最大限度地減少數據移動,并在數據需要移動時提供高帶寬、低延遲接口,這對于最大程度提高性能、減少延時和功耗至關重要。要提高性能,所有內部服務器接口都在進行升級:DDR5 接口的速度提高到 6400 Mbps 當 PCIe 接口從 16GT/s 的 PCIe 4.0 過渡到 32GT/s 的 PCIe 5.0,再到 64GT/s 的 PCIe 6.0 時,其對帶寬的需求翻
9、了四倍。由于 PCIe 4.0 未廣泛普及,某些設備的帶寬會增加更多,因此,某些設備將直接從 PCIe 3.0(8GT/s)轉到 PCIe 5.0 或 PCIe 6 NVMe SSD 正從 PCIe 3.0 轉向 PCIe 5.0,使帶寬增加 4 倍 Compute Express Link(CXL)提供了在 PCIe 電接口上運行的緩存一致性接口,并允許多個處理器/加速器有效共享數據和內存,從而減少系統中需要移動的數據量 通過采用 PAM4 編碼并支持多種協議的 56Gbps 和 112Gbps 新型高速 SerDes 技術,可在包括晶片、芯片、加速器與背板的設備之間提供更快的接口除了上面列
10、出的接口之外,多種類型的內存還可以滿足不同用例的容量、功耗和性能要求。如果內存容量是主要考慮因素,DDR5則是必選的內存類型。如果內存帶寬是最重要的考慮因素,HBM2E則可提供對內存中數據的高速訪問,如圖4所示。DRAM 容量與帶寬1,0005001001,00010,00010容量(GB,對數分度)帶寬(GBps)1,5002,000HBM2EDDR58642564,800雙 128GB RDIMM8Gb 晶片,8DP16Gb 晶片,8HLPDDR5123286,400HBM2E41,024163,600DDR5LPDDR5DRAM#I/F I/F寬度(DQ比特)每I/F最大容量(GB)速度
11、(Mbps)注釋圖 4:多種內存類型的容量與最大帶寬對比舉例來說,圖 5 顯示了一個服務器的典型框圖,該服務器分別配備采用 CXL 和 PCIe 的一致性和非一致性 I/O 接口,以及一個大容量 DDR5 內存接口。為了在處理服務器之間傳輸的數據時提高性能和效率,許多服務器現在都整合了“智能 NIC”,它包含 NIC 上的嵌入式處理器,用于減輕主機 CPU 上的網絡協議、安全功能,SDN 和其他功能的處理負擔。智能 NIC 有助于以更高的性能對網絡數據包進行處理,同時為應用的處理保留主機 CPU 帶寬。具有代表性的智能 NIC 的實施框圖如圖 6 所示。Synopsys DesignWare
12、IPSynopsys DesignWare IPDDR5/4 或 HBM2e PHY 安全協議加速器 信任根加密AMBA 互連DSPCCIX 或 CXL控制器CCIX或CXL/PCIe PHY USB 3.2 PHY多協議SerDes 1G/10G 多協議SerDes 25G/56G/112GUSB 3.2控制器1G/10G以太網控制器25G/50G/100G 以太網控制器數據包處理加速器NVMe PCIe 控制器PCIe 4.0/5.0 PHYDDR5/4 或HBM2e 控制器L1 和 L2 緩存USBx 以太網通道圖 5:典型云服務器框圖圖 6:智能 NIC 框圖Peripheral I/
13、FPCIe 5.0 or 6.0 ControllerInline AES CryptographyPCIe 5.0 or 6.0 PHYStorage I/FPCIe 5.0 or 6.0PHYPCIe 5.0 or 6.0 ControllerNVMeCache Coherent ExpansionCCIX or CXLControllersPCIe 5.0 or 6.0 PHYInline AES CryptographyNetwork I/F56G/112GEthernet PHYs100G/400GEthernet ControllerProcessing SubsystemProc
14、essorsCacheMemory I/FDDR5/4 or DDR5/4 or HBM2/2E PHYInterconnectEmbedded MemoriesLogic LibrariesSecuritySecurity Protocol AcceleratorsCryptographyRoot of TrustDie-to-Die I/F56G or 112G USR/XSR PHYHBI Die-to-Die PHYControllerHBM2/2E ControllerInterconnectAcceleratorsDSPPacket Processing AcceleratorCa
15、che Coherent ExpansionCCIX or CXL ControllerPCIe 5.0 or 6.0PHYInline AES CryptographyNetwork I/F56G or 112GEthernet PHYs100GEthernet ControllerProcessing SubsystemARC ProcessorsCacheEmbedded MemoriesLogic LibrariesDie-to-Die I/F56G or 112GUSR/XSR PHYHBI Die-to-DiePHYControllerMemory I/FDDR5/4 or HBM
16、2/2E PHYDDR5/4 or HBM2/2E ControllerSecuritySecurity Protocol AcceleratorsCryptographyRoot of Trust在經歷了2019年的些許下降之后,到2023年,服務器市場收入預計將以每年6%的速度增長,如圖8所示。但應該注意的是,圖 8 中的數據是在新冠肺炎疫情爆發之前預測的結果。IDC 在 2020 年 3 月曾預測,疫情對經濟的影響之一是 2020 年全球最終用戶的服務器支出同比減少 3.4%,隨后將恢復增長,在 2019 年至 2024 年的整體復合年增長率為 4.9%。2 圖 8:2016 2024
17、年全球計算機服務器市場(估計)圖 7:按廠商收入排名的 2019 年第 4 季度數據中心服務器市場份額除了更快的接口和更高效的存儲器外,保護數據對于云計算同樣至關重要。隨著數據在云端傳輸和存儲的價值不斷提高,數據的不當訪問和濫用等方面的威脅也在增加。為了適當地保護授權用戶可訪問的數據的機密性、完整性和可用性,標準化機構紛紛將安全要求納入數據接口協議中。要在這些高速接口中實施必需的安全算法,需要用于數據加密和解密的高質量加解密 IP、用于實施高速安全協議的安全協議加速器 IP,以及用于提供信任根和安全密鑰管理的可信執行環境。為了避免在各個數據路徑中產生瓶頸,用于實現這些功能的 IP 必須能夠保持
18、原數據路徑線速率運行。數據中心計算服務器市場規模在過去幾年間,全球數據中心市場呈現溫和增長的態勢,IT 支出從 2017 年的 1810 億美元將增長到 2021 年預期的 2120億美元(復合年增長率為 4.0%)。如圖 8 所示,約三分之一的支出用于服務器系統。截至 2019 年第四季度,按收入計算的前 5 位供應商包括 HPE/New H3C Group 和 Dell Technologies,分別擁有約 16%的市場份額,IBM、浪潮和聯想進入前五名。值得指出的是,華為的服務器提供商地位不斷增強,由于中國的“一帶一路”基礎設施項目的推動,有望很快躋身前五名(圖 7)。2019 年第 4
19、 季度計算服務器市場份額(按廠商收入排名)HPE/New H3C Group15.9%16.3%15.7%9.1%6.8%6.6%5.1%25.5%Dell TechnologiesIBMInspur/Inspur Power SystemsLenovoHuaweiODM Direct數據來源:IDC,2020 年 3 月全球計算機服務器市場銷售額(十億美元)出貨量(百萬)2019-2024財年的復合年增長率銷售額=4.3%出貨量=6.6%資料來源:IC Insights中國地區的服務器出貨量增長勢頭強勁,2017 年出貨量達到 262 萬臺服務器,預計到 2022 年,年均增長率達到12.5
20、%(圖 9)。網絡基礎架構如前文所述,數據增長對網絡速度提出了更高的要求。許多數據中心正在將從服務器到架頂(ToR)交換機的網絡接口速度從 25GbE 提高到 100GbE。在從 ToR 交換機到分支交換機和主干交換機的鏈路上以及數據中心設施之間安裝了400GbE 基礎架構。領先的以太網交換機廠商已經在開發基于 112G SerDes 的 800Gbps 交換機,而且隨著數據量的持續增長,未來幾年可能會推出 1.6Tbps 以太網(圖 10)。2017-2022年中國服務器設備出貨量(百萬臺)資料來源iResearch:Statista 2020更多信息:中國:iResearch;2017-2
21、018出貨量(百萬臺)至 TERABIT 的速度高度并行速度(例如QSFP-DD)四倍速(例如QSFP)二倍速(例如SFP-DD)串行速度(例如SFP)鏈路速度(b/s)標準完成以太網速度 正在開發的速度 可能的未來速度資料來源:以太網聯盟,2019 年 圖 10:以太網路線圖圖 9:2017-2022 中國服務器設備出貨量支持 400Gbps 以太網端口的基礎架構交換機可采用 56G x 8 或 112G x 4 SerDes 電接口,如圖 11 所示。數據中心網絡基礎架構市場規模2019 年,數據中心網絡基礎架構(主要以全球以太網交換機和路由器市場為代表)與 2018 年相比略有增長,實現
22、總收入 443 億美元(以太網交換機為 288 億美元,路由器為 155 億美元)。華為和 Arista Networks 是前五名企業中在 2019全年相對于 2018 年實現市場份額增長的僅有兩家供應商。3 圖 12 顯示了全球前五名以太網交換機廠商各自的市場份額。目前,中國是僅次于美國的全球第二大云基礎架構市場,三家大型云服務提供商占據主導地位:阿里巴巴的云基礎架構服務支出超過 46%,騰訊占 18%,百度 AI Cloud 占 8.8%。在 2019 年第四季度,中國云基礎架構市場呈現 66.9%的強勁增長勢頭,達到 33 億美元,占全球市場的 10.8%。4 Synopsys Des
23、ignWare IPx8CPUTCAM/SRAM調度程序2 x 10G以太網控制器25G/50G/100G以太網控制器400G以太網控制器MP SerDes56G/112GMP SerDes10GMP SerDes28G/56G/112G解析程序應用加速器嵌入式存儲器邏輯庫DDR5/4或HBM2e PHY安全協議加速器PCIe 4.0/5.0 PHY內聯 AES 加密PCIe 控制器AMBA 互連帶 tRoot 的硬件安全模塊TRNG內聯 AES 加密內聯 AES 加密緩存AMBA 互連數據包處理管理端口32-128 以太網端口圖 11:以太網交換機 SoC 框圖50.9%9.6%7.0%5.
24、4%3.2%23.9%2019 年按以太網交換機廠商收入排名的網絡市場份額CiscoHuaweiAristaHP EnterpriseJuniper其他資料來源:IDC,2020 年 3 月圖 12:2019 年按以太網交換機廠商收入排名的網絡市場份額Host I/FPCIe 5.0 or 6.0 ControllerInline AES CryptographyPCIe 5.0 or6.0 PHYLookUpTCAM/SRAMApplication AcceleratorPacket ProcessingSchedulerParsersNetwork I/F56G or 112GEthern
25、et PHYs100G Ethernet Controller200G/400G Ethernet ControllerManagement I/F10GEthernet PHYs10GEthernet ControllerProcessing SubsystemARC ProcessorsCacheEmbedded MemoriesLogic LibrariesDie-to-Die I/F56G or 112G USR/XSR PHYHBI Die-to-Die PHYControllerMemory I/FDDR5/4 or HBM2/2EPHYDDR5/4 or HBM2E Contro
26、llerSecuritySecurity Protocol AcceleratorsCryptographyRoot of Trust據Global Industry Analysts公司的數據表明,在2020年至2027年,中國企業網絡設備市場將達到8.4%的復合年增長率,到 2027 年,市場規模將達到 205 億美元。憑借在該細分市場的強勁增長,到本預測周期結束時,中國的企業網絡設備市場在全球的份額將達到 21.1%。5 存儲存儲行業的最新進步要求管理不斷增長的數據量,并使用加速器來處理數據。這些進步包括使用計算存儲、存儲類內存、與持久性存儲器連接的緩存一致性接口,以及適用于更高數據傳輸
27、速度的下一代 NVMe 接口。計算存儲系統是智能存儲系統,在存儲服務器內完成應用處理任務,旨在最大程度減少從存儲服務器到計算服務器的網絡數據傳輸。計算存儲系統可以查詢本地數據庫,并且僅將結果集發送到應用/數據庫服務器,而不是將大量原始數據發送到應用/數據庫服務器進行處理。通過僅發送結果集,計算存儲系統可以減少網絡負載,使應用處理器能夠執行其他任務。存儲類內存(SCM)為增強服務器性能提供了一種相對低成本、高性能、持久內存解決方案。SCM 可以根據應用的需求以多種方式部署。例如,使用 SCM 作為附加內存層可以在數據庫服務器上實現在內存中進行數據處理,與 NAND 閃存驅動器相比,數據讀寫性能提
28、高 10 倍或更多(圖 14)。圖 14:內存和存儲層及相對延時圖 13:2020-2027 年中國與全球企業網絡設備市場規模對比DRAM NAND納秒級微秒級內存磁帶分鐘級磁盤毫秒級存儲縮短訪問延時存儲類內存企業網絡設備市場規模(10 億美元)中國資料來源:Global Industry Analysts 公司全球在存儲應用中使用緩存一致性接口可以使多個設備在共享內存時保持緩存一致性,從而提高性能,并減少數據移動。Compute Express Link (CXL)就是這樣一種接口?;?PCIe 5.0 的 CXL 1.1 以 32GT/s 的速度為緩存、內存和 I/O 設備提供數據傳輸。
29、NVMe 存儲設備紛紛采用 PCIe 5.0 接口,將 SSD 吞吐量提高到每個 PCIe 通道 4GB/s。與 PCIe 3.0 相比,這一速度提高了 4 倍,目前,x86 服務器中一般都實施了 PCIe 3.0。企業級存儲系統市場規模2019 年,企業級外部存儲系統 OEM 排名前五位的公司是分別是戴爾、HPE/New H3C Group、IBM、NetApp 和華為(圖15)。在 2019 年第 4 季度價值 79 億美元的全球市場上,戴爾在存儲系統市場上的份額遙遙領先,達到 27.6%,而其他四家廠商則占據 7.8%至 10.1%的份額。62020 年,由于新冠肺炎疫情,外部企業級存儲
30、系統的支出將下降 5.5%,而據 IDC 預測,2019-2024 年,該市場的整體復合年增長率為 1.3%。7 在中國市場,企業級外部存儲銷售額在 2019 年達到 40.1 億美元,同比增長 16.8%。據 IDC 預測,到 2024 年,該細分市場的規模將增長到 63 億美元8,復合年增長率為 9.46%。圖 16 顯示了 2019 年中國排名前五的企業級外部存儲廠商及其各自的市場份額。27.6%10.1%9.1%8.9%7.8%36.5%Dell TechnologiesHPE/New H3C GroupIBMNetAppHuawei其他2019 年第 4 季度按廠商收入排名的存儲系統
31、市場份額資料來源:IDC,2020 年 3 月圖 15:2019 年第 4 季度按廠商收入排名的存儲系統市場份額圖 16:2019 年中國企業級存儲市場前五大廠商市場份額資料來源:IDC 中國,2020 年可視化計算隨著云應用不斷演進,出現了更多可視化內容,對可視化計算的支持已經成為云基礎架構的一項額外功能,包括用于商業應用(包括在線協作)和娛樂(例如電影)的流視頻、AR/VR 和圖像分析(例如 ADAS、安全和其他需要實時圖像識別的應用)??梢暬嬎愕募ぴ鰧е赂咝阅?GPU 集成到云服務器中,并通過高速加速器接口連接到主機 CPU 基礎架構,如圖 17 所示。邊緣基礎架構云與邊緣的融合將使云
32、服務更靠近最終用戶,從而提供更豐富、更高性能和更低的延時體驗。同時,隨著云服務提供商和電信提供商急于推銷本地化、高響應性的服務,這將為他們創造新的商機,因為這些服務過去只能從云核心提供。在過去幾年中,連接到互聯網的設備數量一直在迅速增加,并且在未來幾年中將以更快的速度增長。據 Statistica 估計,2018 年有 220 億個聯網設備,到 2025 年,這一數字將增長到 380 億以上(圖 18)。圖 18:2018 年、2025 和 2030 年全球物聯網設備數量資料來源:Statistica,2020 年 2 月圖 17:基于服務器的圖形加速器框圖設備數量(10億)Processin
33、g SubsystemGraphics ProcessorCacheInterconnectEmbedded MemoriesLogic LibrariesSecuritySecurity Protocol AcceleratorsCryptographyRoot of TrustCache Coherent Expansion&Host I/FPCIe 5.0 or 6.0 orCXL ControllerPCIe 5.0 or 6.0 PHYInline AES CryptographyDisplay SubsystemDisplayPort PHYDisplayPort Controll
34、erDisplay EngineHDMI PHYHDMI ControllerVideo SubsystemMultimedia EngineDie-to-Die I/F56G or 112GUSR/XSR PHYHBI Die-to-Die PHYControllerMemory I/FHBM2/2E PHYHBM2/2E ControllerGDDR6PHYGDDR6 Controller在這些聯網的設備中,很多都是傳感器,用于收集數據并將其上傳到云端,以分析并確定立即或將要采取的行動。信息安全、交通和物料流管理以及自動駕駛汽車是眾多控制系統中的幾個例子,而且這些控制系統已經或即將會通過互
35、聯網交換信息。特別需要指出的是,對于控制系統,數據必須可靠地傳送,而且從收集數據到基于這些數據發出命令幾乎不能有延時。換句話說,這些類型的應用需要延時極低的基礎架構。要實現對控制系統和其他對延時敏感的應用的快速響應,最佳方法也許是使數據收集、存儲和處理基礎架構更靠近使用點,即網絡邊緣(圖 19)。因此,我們看到越來越多的云服務提供商與電信公司合作,在多訪問邊緣計算(MEC)平臺中提供云服務。Microsoft Azure9 和 Google Cloud10 已與 AT&T 合作,在 AT&T 的多訪問邊緣計算站點部署了云基礎架構。另外,AWS 與 Sprint 11(現為 T-Mobile)和
36、 Verizon12 合作,通過各自的基礎架構部署 AWS 云服務。然而,在邊緣基礎架構中部署云服務要求運行云服務的設備能夠容忍邊緣環境,因為邊緣環境不一定擁有與典型云數據中心相同的物理空間、環境控制或電力供應。因此,允許的延時越短,服務就越需要部署到邊緣,而且允許的功耗也可能越低。人工智能最后,用于數據分析的人工智能已成為云數據中心的重要功能。人工智能加速器在設備中和云端無處不在。人工智能加速器支持執行卷積、遞歸、尖峰和其他深度神經網絡,以支持大量應用。針對云環境的人工智能加速器一般針對 TOPS進行了優化,以提供最高的性能。這些加速器的設計支持擴展,以縮短訓練時間并適應最復雜的人工智能算法
37、(支持超過 80 億個參數)。由于人工智能加速器傾向于處理大量數據,因此,內存接口通常是瓶頸所在,這使得高帶寬內存對于這些設備特別有益(圖 20)。地區數據中心邊緣云邊緣計算現場服務器本地服務器聚合器網關/接入10us-1ms 延時1ms-5ms 延時5ms-10ms+延時 網絡 SoC存儲存儲存儲存儲存儲存儲AI加速器128-512 TOPSAI加速器64-128 TOPS本地服務器SoC65W基帶/WiFi/網絡 SoCAI 加速器16-64 TOPS網關服務器SoC30W服務器 SoC100W網絡 SoC圖 19:邊緣計算分層圖 20:有代表性的云托管式人工智能加速器框圖AI Accel
38、eratorNeural Network ProcessorsCacheMemory I/FHBM2/2EPHYInterconnectEmbedded MemoriesLogic LibrariesCache Coherent ExpansionCCIX or CXL ControllerPCIe 5.0 or 6.0PHYInline AES CryptographySecuritySecurity Protocol AcceleratorsCryptographyRoot of TrustNetwork I/F100G or 400G Ethernet Controller56G or
39、112G Ethernet PHYsDie-to-Die I/F56G or 112G USR/XSR PHYHBI Die-to-Die PHYControllerHBM2/2EController針對邊緣計算(尤其是聚合器和網關應用)的人工智能加速器通常針對每瓦性能(TOPS/W)進行了優化,以解決邊緣基礎架構和服務的功耗與延時問題。這些設備具有較高的計算能力和相對簡單的軟件模型,能夠提供快速響應能力。它們往往為實現低成本和低功耗而進行了優化,而這通常會要求使用低功耗 DDR(LPDDR)內存。為了支持人工智能解決方案的擴展,加速器必須包含一個高速接口,例如 56Gbps 或 112Gbp
40、s SerDes 或 HBI。芯片間的高速接口提供了加速器縮放和擴展能力,可滿足苛刻的人工智能應用的需求。開放計算項目(OCP)組織正在推動芯片間互連的標準化(開放計算項目-ODSA 子項目,2020 年)13,旨在簡化并改善加速器擴展接口的互操作性。這一工作的目的是為異構“小芯片”提供一個通用接口,從而使用通用功能構塊來開發SoC。如果被業界采用,這項工作可縮短這些 SoC 的開發時間,降低開發和制造成本,從而簡化加速器 SoC 的開發流程。適用于云基礎架構的 IP 解決方案新思科技提供了高質量且經過硅驗證的全面 IP 產品組合,使設計人員能夠開發支持當前和未來云計算應用的 SoC。新思科技
41、的 DesignWare 接口 IP、處理器 IP、安全 IP 和基礎 IP 針對高性能、低延時和低功耗進行了優化,同時支持從16nm 到 5nm FinFET 的先進處理技術。新思科技針對云 SoC 的全面 IP 產品組合包括:DDR5/4 內存控制器和 PHY:提供一流的性能,數據速率高達 DDR5-6400,引入了 DDR5 相位感知調度引擎,與競爭對手相比,面積減少了 15%,功耗降低 10%HBM2/2E 內存 PHY:具有業界領先的面積和功耗,并且功耗比競爭對手的 IP 低 80%112G 多協議 SerDes:以 5.5pJ/比特的速率支持多種數據速率(1.25 至 112 Gb
42、ps)112G USR/XSR SerDes 和 HBI 接口:針對芯片間接口進行了面積優化 400G 和 800G 以太網解決方案為超大規模數據中心、網絡和 AI SoCs 提供真正的長距離性能 新的 PCIe 6.0 IP 和當前的 PCIe 5.0 IP 解決方案:經過硅驗證,并已被 90%的領先半導體公司使用 CXL 解決方案:基于新思科技經過硅驗證的 PCIe 5.0 IP 而構建,可降低集成風險,其中包括用于驗證 I/O、內存訪問和一致性協議功能的 VC 驗證 IP ARC HS處理器:提供從1到12個CPU內核的業界領先的擴展性,并支持多達16個用戶硬件加速器,以適應極端工作負載
43、 高能效 CCIX PHY 和最低 延時的控制器 USB 3.0、USB 3.1、USB 3.2 和 USB4 解決方案:具有行業領先的低功耗和小面積實施能力,在數百萬 SoC 中提供了經驗證的互操作性,并且降低設計風險 高質量、經過硅驗證的基礎IP:包括內存編譯器和非易失性存儲器(NVM)、邏輯庫、通用I/O(GPIO)和測試解決方案,使片上系統(SoC)設計人員能夠 降低集成風險,并加快產品上市速度 TCAM 和多端口內存:支持用于網絡和其他應用的高速、低功耗網絡解決方案 ASIP Designer:通過基于 C/C+-編譯器的高效軟件開發套件而開發定制加速器,該套件可自動適應每種體系架構
44、的變更,并自動生成針對功耗和面積而優化的可合成的 RTL 安全 IP:包括安全協議加速器、加密加速器、PCIe/CXL IDE 和信任根 IP,可為云計算和其他市場中的多種產品提供最高效的芯片設計和最高的安全性新思科技 DesignWare IP 產品組合是市場上最廣泛的產品組合,涵蓋大多數云 SoC 芯片中的絕大多數 IP。采用 DesignWare IP 保證流片成功新思科技 DesignWare IP 已被部署到數千種設計中,可幫助設計人員縮短全球云計算應用投入生產運行的時間。選擇 DesignWare IP 作為云環境 SoC 的關鍵構件的領先公司包括 Habana Labs(英特爾旗
45、下公司),該公司采用新思科技 DesignWare 控制器和 PHY IP for PCI Express 4.0 實現其 Goya 推理處理器 SoC 的首次流片成功。Habana Labs 的首席業務官Eitan Medina表示:“經過全面的評估,我們選擇了新思科技領先的16 GT/s DesignWare IP for PCI Express 4.0,這是因為該產品在業界口碑良好,并且擁有最苛刻的數據密集型 SoC 所需要的先進功能?!盨tarblaze Technology 也使用 DesignWare IP 實現了 STAR1000 SSD 控制器的首次流片成功并投入批量生產。使用
46、DesignWare ARC 處理器、基礎 IP、安全 IP 和接口 IP,Starblaze 能夠將功耗和 I/O 延時減少 50%,使 SoC 面積減少7%,并通過最佳的功耗、性能和面積組合實現了最高的安全性。Starblaze Technologies首席執行官Sky Shen表示:“新思科技廣泛的 DesignWare IP 產品組合使我們能夠獲得所需的全部 IP,從而保證我們的 SSD 控制器實現首次流片成功?!盇MD 通過新思科技的 DesignWare IP 產品組合交付了 Ryzen 和 EPYC 處理器。AMD 公司 I/O 和電路技術高級總監Rolands Ezers 表示
47、:“通過選擇具有定制功能的 DesignWare IP,我們能夠按時完成計劃,而且使我們的路線圖得以實現?!盌esignWare IP 使 AMD 憑借 EPYC 服務器和 Ryzen PRO 桌面處理器擊敗競爭對手。它還提供了標準和定制的 IP解決方案,而且這些解決方案提供了我們所需的功能、性能、功耗和面積。此外,新思科技經驗豐富的設計團隊還可以幫助 AMD 工程師滿足緊張的開發和測試期限要求,支持其按原計劃交付產品。展望下一代協議,Achronix 和 Astera Labs 等公司已經宣布,它們已將 DesignWare PCIe 5.0 用于高性能云的設計??偨Y云計算的演進為 SoC
48、開發人員帶來了許多新的機遇和挑戰。這種技術引發的一些關鍵變化包括互聯網中傳輸以及云端存儲或使用的數據量快速增長,云服務向網絡邊緣的擴展,以及為處理海量數據并從中獲取洞察而廣泛部署的人工智能。隨著機器間的通信、流視頻、增強現實和虛擬現實以及其他應用生成越來越多的數據,云基礎架構必須不斷增強,以最大程度減少需要移動的數據,并最大程度加快從一個位置向另一位置傳輸數據的速度,無論是長距離傳輸,還是服務器內部的一個芯片傳輸到另一個芯片。隨著互聯網用戶和聯網設備數量不斷增多,互聯網上數據的快速增長要求采用新的機制而減少數據移動,并加快數據從一個位置向另一位置的傳輸。借助高質量、經過硅驗證的 IP 構件,設
49、計人員能夠開發用于高端云計算解決方案的 SoC,包括服務器、網絡、存儲、可視化計算、邊緣計算和人工智能加速器應用。1“深度學習處理器指南”,The Linley Group,2019 年 1 月。2 IDC 全球季度服務器跟蹤,2020 年 3 月 26 日。3 IDC 全球季度以太網交換機和路由器跟蹤顯示 2019 年第四季度市場疲軟,2020 年 3 月 11 日4 Techcrunch,這個云基礎架構市場 2019 年第 4 季度創收 33 億美元,2020 年 3 月,2020 年 3 月 18 日,2020 年 4 月 16 日引用。5 Global Industry Analyst
50、s 公司?!捌髽I級網絡設備全球市場發展與分析”,2020 年 6 月 29 日引用。6 IDC,“據 IDC 調查,2019 年第 4 季度,全球企業級外部 OEM 存儲系統市場收入下滑 0.1%”。2020 年 3 月。7 IDC 全球季度企業級存儲系統跟蹤,2020 年 3 月 26 日。8 “華為在中國企業級存儲市場排名第一”2020 年 4 月。9“AT&T與Microsoft宣布結成戰略聯盟”,https:/ 年 4 月 14 日引用。10“AT&T 與 Google Cloud 攜手推動企業采用網絡邊緣 5G 計算解決方案”。https:/ 年 3 月 5 日,2020 年 4 月
51、 14 日引用。11“Amazon Web Services 將其云服務與 Sprint 的 Curiosity IoT 平臺集成,向網絡邊緣提供可行的智能”,https:/ 年 2 月 25 日,2020 年 4 月 14 日引用。12“AWS 與 Verizon 攜 手 提 供 5G 邊 緣 云 計 算”,https:/ 年 12 月 3 日,2020 年 4 月 14 日引用。13 開放計算項目,ODSA 子項目,2020 年 6 月 19 日引用。2021 Synopsys,Inc.版權所有。保留所有權利。Synopsys 是 Synopsys,Inc.在美國和其他國家的商標。Synopsys 商標列表可從 獲得。本文提及的所有其他名稱均為其各自所有者的商標或注冊商標。07/16/20.CS529828393 SG|云基礎架構白皮書。發布日期:2021 年 6 月