1、基于英特爾 架構的中國數據庫解決方案集錦AI 賦能數據庫 數據庫助力 AI前言我們已經進入到以數據為中心的時代,數據處理與分析能力已經成為企業的重要競爭力。通過把握數字化創新帶來的商業機遇,融入蓬勃的數字化生態,并部署高性能、高可用、高擴展且高安全性的數據庫方案,企業將能夠持續挖掘數據價值,推動業務轉型,從而釋放創新價值、塑造獨特的市場競爭力。數據爆炸式增長以及大模型訓練等新型負載在數據中心的擴展,意味著數據庫將面臨來自性能、成本等方面的重重挑戰。與此同時,AI 與數據庫技術的融合、向量數據庫、超融合、多模態數據處理等創新技術的出現意味著,數據庫領域正在發生更多的變革,帶來更高的復雜性,以及對
2、于多元算力的嚴苛要求。企業需要利用創新的軟硬件技術組合,推進基礎設施的重構或優化,以構建新一代的數據庫解決方案。通過針對性能和能效的微架構創新,以及在各個級別和維度上的異構計算投入,英特爾推出了涵蓋英特爾 至強 可擴展處理器在內的領先硬件,旨在幫助用戶更智能地使用強勁計算資源,使用卓越架構來完成每項任務。除了硬件之外,英特爾還強化了在軟件及數據庫生態方面的投入。在中國,英特爾致力于攜手廣泛的合作伙伴,加快數據庫系統的創新,推動數據庫軟硬件的協同優化,賦能數據庫產業的健康發展。本白皮書不僅介紹了面向數據庫的英特爾創新的軟硬件產品組合,還展示了英特爾與騰訊云、南大通用、超聚變、PingCAP、星環
3、科技、東方國信等合作伙伴的創新數據庫產品與解決方案。通過這些生態成果,英特爾與合作伙伴正在致力于為數據庫行業帶來新的飛躍、助力締造未來。展望未來,英特爾將通過軟硬件技術的協同創新,挖掘新一代數據庫的無限可能,持續釋放技術創新的神奇力量,并將這種力量賦能客戶、合作伙伴、開發者等數字化生態中的各個角色,攜手開啟一個開放共贏的創新時代。目錄010203中國數據庫產業的發展現狀、趨勢及挑戰.011.1 數字化轉型驅動數據庫快速增長.021.2 中國數據庫行業的發展趨勢.041.3 數據庫面臨的重要技術挑戰與應對策略.06英特爾加速生態系統構建,賦能中國數據庫產業發展.08基于英特爾 架構的數據庫方案集
4、錦.113.1 GBase 8a MPP Cluster 采用英特爾 至強 6 能效核處理器 構建高效節能的分布式邏輯數據倉庫.123.2 英特爾 至強 6 能效核處理器助力 H3C UIS 超融合方案 實現節能增效.143.3 英特爾 至強 6 能效核處理器助力 星環科技分布式分析型數據庫 ArgoDB 釋放大數據價值.163.4 基于英特爾 至強 6 能效核處理器的分布式數據庫 OceanBase 加速數據洞察 助力降本增效.183.5 英特爾 TDX 助力構建阿里云瑤池全密態數據庫.203.6 GBase 8a MPP Cluster 采用第五代英特爾 至強 可擴展處理器 有效提升數據壓
5、縮性能.223.7 H3C UIS 超融合方案采用第五代英特爾 至強 可擴展處理器 大幅提升數據庫性能.243.8 軟硬件并行優化,第五代英特爾 至強 可擴展處理器助 騰訊云向量數據庫成為大模型時代數據中樞.2604目錄033.9 第五代英特爾 至強 可擴展處理器助力星環科技 分布式向量數據庫 Transwarp Hippo 實現大幅性能提升.283.10 第四代英特爾 至強 可擴展處理器與英特爾 技術助力 超聚變 FusionDB 數據庫性能優化.303.11 采用 AVX-512 指令和英特爾 QAT 加速器優化的東方國信大數據 解決方案.323.12 第四代英特爾 至強 可擴展處理器助力
6、 GBase 8a MPP Cluster 提高性能與壓縮率.343.13 第四代英特爾 至強 可擴展處理器助力 TiDB 開源分布式數據庫 大幅提升性能,優化存儲空間.363.14 第四代英特爾 至強 可擴展處理器助力星環科技 分布式分析型數據庫 Transwarp ArgoDB 釋放大數據價值.383.15 第四代英特爾 至強 可擴展處理器助力星環科技 分布式向量數據庫 Transwarp Hippo 釋放大模型價值.403.16 基于第四代英特爾 至強 可擴展處理器的 亞信科技 AntDB 數據庫.42英特爾數據庫相關產品與技術介紹.444.1 英特爾 至強 處理器平臺.454.2 英特
7、爾 至強 處理器平臺集成的指令集與加速器.474.3 基于英特爾 架構的軟件工具.52中國數據庫產業的發展現狀、趨勢及挑戰01021.1 數字化轉型驅動數據庫快速增長數據正在成為組織至關重要的資產,通過數據庫技術高效處理龐大的數據,獲得精準的業務洞察,充分挖掘數據價值,成為企業數字化戰略的重要組成部分。特別是隨著以大模型為代表的人工智能(AI)、深度學習(DL)等技術快速落地,需要處理與分析的數據出現爆發式增長,企業對于數據庫的性能有著更高的要求。在此背景下,構建高性能、高可靠、高并發的數據庫的意義不斷凸顯。據大數據技術標準推進委員會數據顯示,2022 年全球數據庫市場規模為 833 億美元,
8、中國數據庫市場規模(包含數據庫服務、安全等周邊生態)為 59.7 億美元(約合 403.6 億元人民幣),占全球 7.2%。6 年時間內,中國數據庫軟件市場始終保持平穩增長,且增速呈現遞增趨勢。預計到 2027 年,中國數據庫市場總規模將達到 1286.8 億元,市場年復合增長率(CAGR)為 26.1%1。圖 1.中國數據庫市場規模與增長率在中國數據庫模型分類方面,墨天輪數據社區發布的2023 年中國數據庫行業年度分析報告顯示,關系型數據庫以絕對優勢占據主導地位,占比高達 57.0%,這反映了關系型數據庫在數據管理和分析中的普遍適用性和重要性。時序數據庫占比 14.8%,位居第二,顯示出市場
9、對于處理時間序列數據的強烈需求,特別是在物聯網、金融監控和實時分析等領域。圖數據庫占比 10.9%,位列第三,凸顯了圖數據庫在處理復雜關系和網絡分析方面的重要性2。403.6540.4678.8843.71044.51286.833.9%25.6%24.3%23.8%23.2%0.0%5.0%10.0%15.0%20.0%25.0%30.0%35.0%020040060080010001200140020222023e2024e2025e2026e2027e中國數據庫市場規模(億元)增長率1 數據援引自:大數據技術標準推進委員會數據庫發展研究報告(2023 年)。2 數據援引自:墨天輪數據社區
10、2023 年中國數據庫行業年度分析報告。033 數據援引自IDC FutureScape:2024 年中國數據和分析市場十大預測,https:/ 2.中國數據庫模型分類從驅動因素來看,中國數據庫行業主要受以下因素的驅動:需要快速處理與分析的數據出現爆炸式增長,為數據庫發展帶來了強大的內生動力在數字經濟浪潮下,全球范圍內產生的數據正在出現爆炸式增長,據 IDC 發布的最新報告顯示,全球數據量規模預計將從 2022 年的 103.66ZB 增長至 2027 年的 284.3ZB,年復合增長率達到 22.4%3。數據分析與價值挖掘已經成為驅動產業經濟變革、加速商業增長,并實現可持續發展的關鍵力量。數
11、據庫作為承載數據存儲、計算的關鍵技術之一,對于數據價值的釋放有著極為重要的意義。國家對于數據產業的發展給予了大力倡導,為數據庫發展提供了良好的政策環境2023 年 12 月 31 日,國家數據局等 17 部門聯合印發“數據要素”三年行動計劃(2024-2026 年),要求推動數據要素與勞動力、資本等要素協同,以數據流引領技術流、資金流、人才流、物資流,突破傳統資源要素約束,提高全要素生產率;促進數據多場景應用、多主體復用,培育基于數據要素的新產品和新服務,實現知識擴散、價值倍增,開辟經濟增長新空間;加快多元數據融合,以數據規模擴張和數據類型豐富,促進生產工具創新升級,催生新產業、新模式,培育經
12、濟發展新動能。2022 年 12 月,國務院發布關于構建數據基礎制度更好發揮數據要素作用的意見,要求加快構建數據基礎制度,充分發揮中國海量數據規模和豐富應用場景優勢,激活數據要素潛能,做強做優做大數字經濟,增強經濟發展新動能,構筑國家競爭新優勢。軟硬件技術不斷創新,為數據庫帶來了新的發展路徑在計算方面,每一次 CPU 的迭代都會帶來更高的 IPC(每時鐘指令)性能、更多的核心,并集成更先進的數據處理加速器,為數據庫提供了強大的平臺基礎。硬件加速器的使用則支持卸載數據加密、壓縮等負載,為系統帶來更高的性能表現。在內存與存儲方面,內存硬件的性能和容量的快速演進帶動了內存分析型數據的發展。在網絡方面
13、,遠程直接數據存取(RDMA)的廣泛應用,以及 Compute Express Link(CXL)協議等技術的涌現,提升了網絡傳輸性能以及 CPU 卸載能力,為設計高性能數據庫帶來更多的可能。在軟件優化方面,通過結合實際應用場景對于數據庫中的性能熱點進行分析,并進行函數庫替換、編譯器優化等軟件優化策略,再加上新一代編程語言的使用,越來越多的數據庫性能瓶頸被克服。行業標準的制定,促進了數據庫行業的發展在數據庫企業、行業協會的推動下,數據庫領域的行業標準正在不斷細化、科學化。例如,中國通信標準化協會大數據技術標準推進委員會(CCSA TC601)圍繞數據庫領域標準化工作,設立數據庫與存儲工作組(W
14、G4)。自 2015 年起,WG4 共推出數十項數據庫相關標準,逐步構建起以數據庫產品、服務和應用為目標的標準體系。這些數據庫領域的標準發揮了基礎性、引領性作用,規范了數據庫的發展,為數據庫行業提供了更加清晰和統一的方向,有效促進了行業的發展。041.2 中國數據庫行業的發展趨勢中國數據庫行業在市場規??焖僭鲩L的同時,也出現了大量的新發展趨勢。這些新趨勢在加速數據分析與洞察的同時,也引領數據庫行業進入新的發展賽道。中國企業數字化轉型帶來旺盛的數據庫需求伴隨著中國企業數字化轉型戰略的推進,需要快速處理、分析的數據正在快速增長,驅動了數據庫需求的不斷上升,疊加數據庫領域國產化趨勢的發展,中國數據庫
15、產品的數量也在持續增長。墨天輪數據社區報告顯示,截止 2023 年 12 月,墨天輪排行榜數據庫數量已經上升到 288 個,較上年同期增加 39 個4。以大模型為代表的創新技術的蓬勃發展,則帶動了向量數據庫、時序數據庫、文件數據庫、全文搜索、圖數據庫、知識圖譜等數據庫技術的演進與商業落地。大模型等 AI 技術驅動著創新數據庫技術的快速發展AI 與數據庫技術的協同創新為數字化創新注入了充沛的活力,這體現在以下兩方面:其一,數據庫技術能夠更好地賦能 AI,加速 AI 模型訓練、推理等流程。例如,向量數據庫能夠以向量空間為基礎,將數據轉化為向量形式進行存儲和查詢,可以支持相似性搜索、檢索增強生成(R
16、AG)以及基于向量的分析,幫助降低模型訓練的成本,并提高 AI 輸出結果的及時性和準確度。時序數據庫與 AI 的融合,為金融波動預測、氣象預測、交通流量預測等智能預測模型提供了堅實的支撐。其二,AI 技術也能夠更好地賦能數據庫開發、數據庫性能優化、數據庫結構設計等領域,加速數據庫產品與方案的完善。例如,在數據倉庫應用中,可以通過 AI 模型來管理海量的數據表,即通過自然語言方式描述數據表管理需求,同時通過大模型對數據表進行維護。通過大語言模型(LLM),用戶可以簡化創建復雜數據庫的查詢過程,使得用戶更容易使用自然語言來與數據庫進行交互檢索。通過基于大模型的智能數據庫運維系統,企業能夠實現數據庫
17、的智能運維與優化,降低人員工作負載,提升運維響應的及時性。在數據庫開發與分析方面,企業可以通過大模型將自然語言轉換為對應的 SQL 語句,從而對數據庫進行開發與操作。4 數據援引自:墨天輪數據社區2023 年中國數據庫行業年度分析報告。1171401892402492732882020 年 12 月2021 年 6 月2021 年 12 月2022 年 6 月2022 年 12 月2023 年 6 月2023 年 12 月墨天輪排行榜數據庫產品數量圖 3.墨天輪排行榜數據庫產品數量052 2 1 1 0 0 2 2 2 2 1 1 2 2 2 2 5 5 5 5 5 5 3 3 3 3 8 8
18、 0123456789產品數量圖 4.中國不同時期推出的開源數據庫數量5 數據援引自:大數據技術標準推進委員會數據庫發展研究報告(2023 年)。6 數據援引自:墨天輪數據社區2023 年中國數據庫行業年度分析報告。7 數據援引自:Markets and Markets:Cloud Database and DBaas Market Global Forecast to 2028(USD BN)。8 數據援引自:大數據技術標準推進委員會數據庫發展研究報告(2023 年)。即時數據分析帶來內存數據庫的旺盛需求隨著互聯網交易、電子商務、數據檢索、個性化推薦等性能/時延敏感型應用的不斷普及,以及業務
19、量的不斷增長,需要實時處理的數據規??焖贁U大,傳統的數據庫機制在 I/O 吞吐性能、時延等方面已經無法應對上層應用的迫切需求,內存數據庫隨之應運而生。Redis 等內存數據庫能夠將數據緩存到 DRAM 內存等高速存儲介質,實現熱點數據的高速緩存,提高應用的響應速度,緩解后端數據庫的壓力。對于性能/時延敏感型應用,內存數據庫已經被普遍認為是理想之選?;陂_源技術的安全可控成為數據庫行業的關鍵詞用戶對于數據庫安全性、可控性的需求凸顯了開源數據庫的重要性,開源社區的蓬勃發展則為數據庫注入了充沛的活力,催生了大量的數據庫。2023 年數據庫發展研究報告的數據顯示,開源數據庫在 2011-2020 年進
20、入發展高峰期,這十年間,一共出現了 159 個產品,全球 59.3%的開源數據庫均誕生于在這一時期。2022 年,中國出現了 8 個新的開源數據庫,達到歷史峰值5。據墨天輪對中國數據庫起源的不完全統計,超 70 多款中國數據庫產品為基于開源數據庫開發,起源數據庫最多的前三名分別是 openGauss(占比 22.1%)、PostgreSQL(占比 20.8%)和 MySQL(占比 13.0%)6。對于數據安全的關注使得數據加密成為數據庫的重要工作負載數字經濟時代,數據要素被列為和土地、資本、技術和勞動力并列的第五大生產要素,保障數據流通過程中的數據要素安全成為組織的重要需求。為了降低數據泄露風
21、險,越來越多的組織對數據庫的數據進行加密,以獲得更高的安全防護能力。此外,全密態數據庫開始嶄露頭角,該數據庫能夠限制數據庫內數據庫用戶對數據操作的訪問控制,避免非授權訪問,可以幫助確保數據對包括 DBA 在內的任何數據庫用戶是可用不可見的狀態。數據庫云化趨勢持續發展,并將扮演主流地位云計算使得數據庫獲得了前所未有的敏捷性與靈活性,能夠更加高效地支撐云上業務,特別是以容器、微服務、DevOps 等技術為基礎的云原生技術產品體系的應用,使得數據庫實現了資源深度池化與卓越彈性。Markets and Markets 預測,全球云數據庫和數據庫即服務(DBaaS)市場規模將從 2022 年的 168
22、億美元增長到 2023 年的 213 億美元,2025 年的市場規模將達到 575 億美元,預測期間的復合年增長率(CAGR)為 227。2022 年中國公有云數據庫市場規模為 219.15 億元,同比增長 51.6%,公有云數據庫市場占比達到 54.3%,首次過半8。06另外一個值得關注的趨勢是云原生數據庫的快速增長。數據顯示,在中國數據庫部署方式中,云原生數據庫占比 17.4%,分布式數據庫占比 46.1%,領先于占比 36.5%的集中式數據庫9,這表明市場對于數據庫的可擴展性和靈活性有著明確的偏好。軟硬件協同一體化成為數據庫系統實施的重要選擇數據庫性能的優化一向被認為是一項重要的挑戰,特
23、別是在業務環境日趨復雜的背景下,數據庫應用可能會出現難以預期的瓶頸,由此帶來的性能優化流程將帶來大量的時間成本。軟硬件協同一體化的數據庫設計與交付模式,將可以為用戶提供可開箱即用的數據庫方案,不僅能夠提升數據庫運行效率,還有助于降低用戶在數據庫硬件選型、軟件調優等方面的成本,支撐業務的敏捷增長。9 數據援引自:墨天輪數據社區2023 年中國數據庫行業年度分析報告。1.3 數據庫面臨的重要技術挑戰與應對策略在快速發展的同時,中國數據庫行業也面臨著來自市場、技術、政策等層面的重要挑戰。本白皮書聚焦于數據庫系統面臨的技術挑戰,這些挑戰包括:在算力層面,數據庫性能難以滿足高并發與新興負載的要求在數據急
24、速涌現的背景下,需要數據庫進行即時處理的數據出現爆炸式增長,高并發、低延時的任務也持續擴展,這對于數據庫的性能帶來了嚴苛挑戰。另一方面,向量數據庫、圖數據庫、時空數據庫等新型數據庫技術不斷推陳出新,處理數據加密、數據壓縮等負載的需求不斷增長,都帶來了更加復雜且多元化的算力需求,對于 CPU 等關鍵硬件帶來了極高的挑戰。用戶可采取的應對策略包括:減小內存占用空間,加快內存數據庫速度,提升實時數據分析處理量。加速 CPU、內存和外部設備之間的數據傳輸,使數據完整性校驗和去重等任務的處理速度得到提升。將數據壓縮與加密負載卸載到專用的硬件加速器,加速批量數據壓縮與加密。利用指令集與 AI 加速器處理矩
25、陣乘法等計算,加速相似度計算等應用負載。07在成本層面,在數據庫領域的高額投資需要得到更加合理的回報近年來,企業用戶普遍強化了在數據庫系統、基礎設施、運維等方面的投資,但激烈的競爭形勢也意味著,企業需要盡可能地控制數據庫方面的投資成本,以將更多資源集中于業務本身。要控制數據庫的總體擁有成本(TCO),用戶可采取的應對策略包括:采用新一代的硬件,提升數據庫單節點的性能密度。面向實際場景,對于數據庫實例進行智能優化,盡可能地釋放硬件潛力。通過削峰填谷的彈性伸縮,降低資源投入總量,在性能與成本方面得到更優的均衡。在安全性層面,日趨嚴苛的數據安全法規帶來了數據庫審計與風險控制要求在運營層面,數據庫基礎
26、設施的功耗不斷提升,帶來了成本與節能減排壓力日趨嚴苛的數據安全法律法規要求數據庫執行嚴格的安全保護策略,滿足數據庫審計與風險控制等方面的規范。要更好地實現數據庫的合規化,用戶可采取的應對策略包括:通過區塊鏈、可信計算等技術彌補數據庫缺乏防篡改能力、無法驗證篡改行為等缺陷,為數據完整性提供可靠的保護。對于數據進行加密,提升對于數據竊密等攻擊的抵抗能力。為了追求更高的性能表現,數據庫服務器的能耗正在持續增長,這不僅帶來了較高的能源成本,對服務器的供電、冷卻設計產生了更高的要求,也難以契合綠色數據中心的發展要求。要實現節能減排,用戶可采取的應對策略包括:通過采用更先進制程、進行智能化的 CPU 調度
27、管理等方式,降低 CPU 等關鍵 IT 設備的功耗。對于數據中心的供電、冷卻技術進行優化,采用液冷、空閑電源優化等技術,優化能源效率。英特爾加速生態系統構建賦能中國數據庫產業發展0209英特爾正在積極拓展生態體系,增加整個生態系統協作方面的努力和投入,與包括數據庫廠商、行業應用開發商、系統集成商、硬件設備制造商等在內的合作伙伴,以及企業用戶一起,加快數據庫系統的創新,推動數據庫軟硬件的協同優化,賦能數據庫產業的健康發展。英特爾不止關注通過 CPU 和服務器平臺等基礎設施產品的創新組合,加速數據庫工作負載運行,幫助客戶構建高性能、彈性伸縮、高可用、高安全的數據庫;更通過長遠布局,將產品線拓展到更
28、多領域,推出全生態解決方案,幫助用戶應對數據爆炸式增長時代的全新挑戰。針對數據庫的需求,英特爾持續推動英特爾 至強 可擴展處理器的迭代。新一代的英特爾 至強 可擴展處理器不僅具備更多核心、更高的主頻,而且配備更大三級緩存、更快內存。這些特性使得英特爾 至強 可擴展處理器成為構建高性能數據庫的服務器平臺的重要選擇。英特爾 至強 可擴展處理器同時內置了豐富的加速器,包括英特爾 存內分析加速器(英特爾 IAA)、英特爾 高級矩陣擴展(英特爾 AMX)、英特爾 高級矢量擴展 512(英特爾 AVX-512)等,在配合英特爾 OneAPI DPC+/C+編譯器等軟件工具之后,有助于提升數據庫性能,幫助用
29、戶從數據中更快獲取洞察,顯著提高生產力。在數據庫安全性方面,英特爾 至強 可擴展處理器提供的英特爾 軟件防護擴展(Software Guard Extensions,SGX)、英特爾 可信域擴展(TDX)技術等技術也有助于化解數據庫安全風險。英特爾 AVX-512 指令集提升數據庫的并行計算能力,加速向量數據庫等數據庫負載的運行。英特爾 AMX可高效地處理 AI 任務所需的大量矩陣乘法運算,加速數據庫的向量檢索、海量特征匹配等操作。英特爾 IAA有助于提升數據庫的數據壓縮率,同時降低數據壓縮帶來的性能開銷,卸載 CPU 的負載壓力。英特爾 QAT能夠以硬件方式為高效的壓縮算法進行數據壓縮,從而
30、提升數據庫備份效率,降低 CPU 負載。英特爾 OneAPI DPC+/C+編譯器提供跨 CPU 和加速器的生產力和性能,有助于構建高性能數據庫。英特爾 Open Analytic Toolkit支持開發人員在英特爾 平臺上快速創建高性能的數據處理與分析方案。英特爾 FMAL 加速庫能對相似度計算進行加速并提供了相似度計算和 top-K 查詢的 API 接口。除了英特爾 至強 可擴展處理器之外,英特爾還提供了英特爾 OneAPI DPC+/C+編譯器、英特爾 Open Analytic Toolkit 等軟件工具,能夠進一步提升數據庫性能。10圖 5.基于英特爾 架構的加速器與軟件工具基于英特
31、爾 架構的數據庫解決方案具備以下優勢:化解數據庫應用的 CPU 性能瓶頸,提升數據庫整體性能表現,加快應用響應速度,實現更好的服務質量(QoS)。提供更高的性能密度,降低數據庫集群中的服務器規模要求,從而降低服務器部署所帶來的空間、供電、散熱等成本,提升投資回報率。通過內置的加速器以及英特爾軟件工具套件,卸載數據壓縮等操作、降低 CPU 資源消耗,進一步優化數據庫的性能表現。英特爾與騰訊云、南大通用、超聚變、PingCAP、星環科技、東方國信等合作伙伴攜手,構建了基于第五代/第四代英特爾 至強 可擴展處理器的數據庫解決方案,并證明其性能足以滿足企業數字化轉型所需。英特爾 高級矩陣擴展(英特爾
32、AMX)英特爾 存內分析加速器 (英特爾 IAA)英特爾 數據流加速器(英特爾 DSA)英特爾 動態負載均衡器(英特爾 DLB)英特爾 數據保護與壓縮加速技術(英特爾 QAT)英特爾 安全引擎 英特爾 SGX/英特爾 TDX 英特爾 oneAPI DPC+/C+編譯器 英特爾 Open Analytic Toolkit 英特爾 FMAL 加速庫 英特爾 VTune Amplifier 英特爾 VROC 英特爾 AVX-512 指令集 11基于英特爾 架構的數據庫方案集錦03123.1 GBase 8a MPP Cluster 采用英特爾 至強 6 能效核處理器構建高效節能的分布式邏輯數據倉庫“
33、英特爾 至強 6 能效核處理器實現了可觀的能效提升,結合處理器的創新特性,以及我們在數據庫方面的深厚積累,成功將 GBase 8a MPP Cluster 的性能與能效提升至新的高度。這一軟硬件的協同方案將能夠幫助用戶快速構建高效節能的分布式邏輯數據倉庫,提升用戶在數據庫方面的投資收益,為企業的數字化轉型提供充沛動能?!标P連坡8a 產品經營部總經理天津南大通用 數據技術股份有限公司GBase 8a MPP Cluster 是在 GBase 8a 列存儲數據庫基礎上開發的一款無共享(Shared Nothing)架構的分布式并行數據庫集群,具備高性能、高可用、高擴展等特性,可以為各種規模的數據管
34、理系統提供高性價比的通用計算平臺,并廣泛用于支撐各類數據倉庫系統、商業智能(BI)系統和決策支持系統。解決方案GBase 還發布了基于 GBase 8a MPP Cluster 專業打造的云上數據倉庫管理系統 GCDW,在 GBase 8a MPP Cluster 的功能基礎上實現計算與存儲分離。南大通用云數據倉庫 GCDW 支持公有云、私有云、虛擬機、物理機等部署環境,使用對象存儲作為數據存儲系統,同時提供 SaaS 能力,為客戶提供企業級彈性數據倉庫系統,開箱即用。同時 GBase Cloud Data Warehouse 的算力彈性伸縮特性使其非常適用于業務規模(并發量、處理的數據量等)
35、在不同時段變化較大的場景,能夠在不同的時段根據業務需求自動匹配合適的資源,在節省用戶成本的同時很好的保證用戶業務的性能需求。圖 6.GBase 8a MPP Cluster 產品架構圖13南大通用測試了英特爾 至強 6 能效核處理器與第五代英特爾 至強 可擴展處理器在 GBase 8a MPP Cluster 中的性能與能效差異。測試數據如下圖所示,英特爾 至強 6 能效核處理器的單處理器性能提升到 1.37 倍,每瓦性能提升到 1.61 倍10。隨后,南大通用還測試了英特爾 至強 6 能效核處理器與第三代英特爾 至強 可擴展處理器在 GBase 8a MPP Cluster 中的性能與能效差
36、異。測試數據如下圖所示,英特爾 至強 6 能效核處理器的單處理器性能提升到 2.76 倍,每瓦性能提升到 2.51 倍11。10 數據援引自南大通用截止 2024 年 5 月的內部測試結果。測試配置 基準配置:雙路英特爾 至強 8592+處理器 1.90 GHz,512 GB 總內存(16x32 GB DDR5 5600 MT/s),CentOS Stream 8;新配置:雙路英特爾 至強 6780E 處理器 2.20 GHz,512 GB 總內存(16x32 GB DDR5 6400 MT/s),CentOS Stream 8。英特爾并不控制或審計第三方數據。請您審查該內容,咨詢其他來源,并
37、確認提及數據是否準確。11 數據援引自南大通用截止 2024 年 5 月的內部測試結果。測試配置 基準配置:雙路英特爾 至強 8380 處理器 2.30 GHz,512 GB 總內存(16x32 GB DDR4 3200 MT/s),CentOS Stream 8;新配置:雙路英特爾 至強 6780E 處理器 2.20 GHz,512 GB 總內存(16x32 GB DDR5 6400 MT/s),CentOS Stream 8。英特爾并不控制或審計第三方數據。請您審查該內容,咨詢其他來源,并確認提及數據是否準確。實現了更高的性能,可以幫助用戶更好地應對大規模數據處理所帶來的性能壓力。英特爾
38、至強 6 能效核處理器在能效上的提升結合GBase 8a MPP Cluster 彈性伸縮的優勢,有助于用戶降低能源等方面運營成本。有助于提升數據庫基礎設施的部署密度。方案價值掃碼獲取完整白皮書關于南大通用天津南大通用數據技術股份有限公司(簡稱:南大通用,GBASE)成立于 2004 年,注冊資金 1.6 億元,公司自成立以來始終堅持自主創新,產品的核心技術及底層代碼自主可控,構建了覆蓋數據管理全生命周期,包括分析型、事務型、分布式事務型、云原生數據倉庫等全技術棧的數據產品體系及服務解決方案。圖 7.英特爾 至強 6 能效核處理器/第五代英特爾 至強 可擴展處理器性能與能效比較圖 8.英特爾
39、至強 6 能效核處理器/第三代英特爾 至強 可擴展處理器性能與能效比較1.00 1.00 1.00 1.37 1.21 1.61 0.000.300.600.901.201.501.80單處理器性能單核性能每瓦性能以 8592+處理器的性能結果為基準 性能與能效比較(越高越好)英特爾 至強 鉑金 8592+處理器 英特爾 至強 6780E 處理器 1.001.001.002.76 1.53 2.51 0.000.501.001.502.002.503.00單處理器性能單核性能每瓦性能以 8380 處理器的性能結果為基準 性能與能效比較(越高越好)英特爾 至強 鉑金 8380 處理器 英特爾 至
40、強 6780E 處理器 143.2 英特爾 至強 6 能效核處理器助力 H3C UIS 超融合方案實現節能增效“超融合是軟件定義時代,企業構建基礎設施的卓越選擇。得益于英特爾 至強 6 能效核處理器在性能、能效等方面的優勢,我們能夠為用戶提供高密度、節能、高性能的數據庫方案。在強大的硬件基礎上,我們將繼續推動超融合的變革,滿足客戶信息化發展任意階段、任意規模、任意場景、任意形態的需求?!毙鞚櫚睭3C 云與計算存儲產品線總裁H3C UIS 超融合是新華三集團自主研發的面向下一代企業和行業數據中心的軟件定義基礎設施解決方案。在通用服務器上無縫集成計算虛擬化、存儲虛擬化、網絡虛擬化、安全虛擬化、數據
41、庫服務、運維監控管理、容災備份、云業務流程交付等軟件技術。H3C UIS 全無損超融合將傳統超融合內核升級為全新的超融合云原生內核,更好的滿足云原生業務需求,靈活構建以應用為核心的云化數據中心。圖 9.H3C UIS 超融合方案架構解決方案H3C UIS 超融合云管理平臺 災備引擎UIS 6000 超強算力 UIS 9000 UIS 5000 高密計算 UIS 4500 海量空間 UIS 3000 彈性靈活 UIS 5300 異構計算 UIS 2000 TURBO 加速引擎 數據庫引擎容器引擎安全引擎邊緣引擎UIS 超融合云原生內核 網絡虛擬化 安全虛擬化 計算虛擬化 存儲虛擬化 一箱即云 U
42、IS Manager 1512 數據援引自 H3C 截止至 2024 年 5 月的內部測試結果。測試配置 基準配置:雙路英特爾 至強 6330 處理器 2.00 GHz,512 GB 總內存(16x32 GB DDR5 5600 MT/s),H3Linux 2.0.2-SP01;新配置:雙路英特爾 至強 6780E 處理器 2.20 GHz,512 GB 總內存(16x32 GB DDR5 6400 MT/s),H3Linux 2.0.2-SP01。英特爾并不控制或審計第三方數據。請您審查該內容,咨詢其他來源,并確認提及數據是否準確。為計算、存儲、網絡應用提供更強大的 CPU 算力支持,化解大
43、規模、高并發的應用在性能上的瓶頸,并加快應用響應,保證更好的服務質量(QoS)。降低超融合一體機的整體能耗,在降低能耗成本的同時,助力數據中心節能減排。有助于優化超融合一體機的設計,降低供電、散熱等方面的要求,提升一體機的部署密度??蛻魞r值圖 10.英特爾 至強 6 能效核處理器/第三代英特爾 至強 可擴展處理器性能對比掃碼獲取完整白皮書關于新華三新華三集團作為數字化解決方案領導者,致力于成為客戶業務創新、數字化轉型值得信賴的合作伙伴。作為紫光集團旗下的核心企業,新華三通過深度布局“云-網-算-存-端”全產業鏈,不斷提升數字化和智能化賦能水平。新華三擁有計算、存儲、網絡、5G、安全、終端等全方
44、位的數字化基礎設施整體能力,提供云計算、大數據、人工智能、工業互聯網、信息安全、智能聯接、邊緣計算等在內的一站式數字化解決方案,以及端到端的技術服務。H3C 驗證了基于英特爾 至強 6 能效核處理器的 H3C UIS 超融合一體機在數據庫負載中的性能表現。測試數據如下圖所示,英特爾 至強 6 能效核處理器的每節點 hammerDB 數據庫吞吐量是第三代英特爾 至強 可擴展處理器的 2.08 倍,單個虛擬機性能提升 1.26 倍12。112.081.2600.511.522.5每節點 hammerDB 數據庫吞吐量 單虛擬機性能以 6330 處理器的性能結果為基準性能比較(越高越好)英特爾 至強
45、 金牌 6330 處理器 英特爾 至強 6740E 處理器 163.3 英特爾 至強 6 能效核處理器助力 星環科技分布式分析型數據庫 ArgoDB 釋放大數據價值“Transwarp ArgoDB 借助在分布式向量化計算引擎、高性能存儲引擎、實時計算、多模型融合分析等技術方面的深度創新,結合英特爾 至強 6 能效核處理器提供的卓越性能以及能效,不僅能夠為聯機分析處理(OLAP)、人工智能(AI)、實時數倉、數據集市和湖倉集一體等場景提供強大的性能,還有助于實現更高的部署密度與更低的成本,助力用戶輕松釋放大數據價值?!敝飕B辰星環科技聯合創始人兼副總裁為了幫助用戶高效構建面向大數據的數據庫系統,
46、星環科技自主研發了 Transwarp ArgoDB 分布式分析型數據庫,可以替代 Hadoop+MPP 混合架構。Transwarp ArgoDB 支持標準 SQL 語法,提供多模型數據分析、實時數據處理、存算解耦、混合負載、數據聯邦、異構服務器混合部署等先進技術能力。Transwarp ArgoDB 基于多模型統一架構,支持關系型、寬表、時序、地理空間、搜索、圖、向量等市面主流的 11 種數據模型。通過一個 ArgoDB 數據庫,就可以滿足湖倉集一體化、實時數據倉庫、數據集市、多模型融合分析、聯機分析處理(OLAP)、異構數據聯邦分析計算等場景的建設需求。解決方案圖 11.星環科技 Tra
47、nswarp ArgoDB 分布式分析型數據庫架構星環科技與英特爾合作,推出了基于英特爾 至強 6 能效核處理器的 Transwarp ArgoDB 分布式分析型數據庫解決方案。該方案具備高安全性,實現了實時處理能力與向量數據庫能力的增強,為 OLAP、AI 等負載提供了強大的數據庫能力支持,還借助英特爾 至強 6 處理器配置的能效核,顯著提升了數據庫基礎設施的能效表現,降低了能耗成本并提升了基礎設施的部署密度。17在性能測試中,星環科技對比了基于英特爾 至強 6 能效核處理器的 Transwarp ArgoDB 的性能表現。測試數據如下圖所示,對比第三代英特爾 至強 可擴展處理器,英特爾 至
48、強 6 能效核處理器能夠將 Transwarp ArgoDB 性能提升到 2.31 倍,同時能效提升到 2.01 倍13。這也意味著,數據中心機房無需大幅更新當前的基礎設施,即可實現更高的密度和性能。13 數據援引自星環科技截至 2024 年 5 月的內部測試結果。測試配置 基準配置:雙路英特爾 至強 鉑金 8380 處理器 2.30 GHz,512 GB 總內存(16x32 GB DDR4 3200 MT/s),Red Hat Enterprise Linux 9.3(Plow);新配置:英特爾 至強 6780E 處理器 2.20 GHz,512 GB 總內存(16x32 GB DDR5 6
49、400 MT/s),Red Hat Enterprise Linux 9.3(Plow)。英特爾并不控制或審計第三方數據。請您審查該內容,咨詢其他來源,并確認提及數據是否準確。加速實時計算等高負載應用的運行,能夠更好地滿足實時數據分析平臺、OLAP 數據庫、全文檢索數據庫、向量數據庫等負載的計算要求。降低能耗支出的同時提升數據庫服務器的部署密度。星環科技 Transwarp ArgoDB 安全技術結合英特爾 至強 6 能效核處理器,能夠有效保護數據,降低數據泄露風險。支持用戶以更低的服務器規模實現目標性能,這有助于降低相應的服務器擴展、能耗、數據中心空間等成本,提升大數據系統的投資回報率。方案
50、價值圖 12.星環科技 Transwarp ArgoDB 性能與能效提升掃碼獲取完整白皮書關于星環科技星環科技致力于打造企業級大數據基礎軟件,圍繞數據的集成、存儲、治理、建模、分析、挖掘和流通等數據全生命周期提供基礎軟件與服務,構建明日數據世界。經過多年自主研發,星環科技建立了多個產品系列:一站式大數據基礎平臺 TDH、分布式分析型數據庫 ArgoDB 及交易型數據庫 KunDB、基于容器的智能數據云平臺 TDC、大數據開發工具 TDS、智能分析工具 Sophon 和超融合大數據一體機 TxData Appliance 等,并擁有多項專利技術。112.312.0100.511.522.5性能能
51、效以 8380 處理器的性能結果為基準 性能與能效比較(越高越好)英特爾 至強 鉑金 8380 處理器 英特爾 至強 6780E 處理器 183.4 基于英特爾 至強 6 能效核處理器的分布式數據庫 OceanBase 加速數據洞察 助力降本增效“隨著數字化、在線化、智能化的演進,企業面臨著指數級遞增的海量存儲需求和挑戰,同時,企業需要降本增效,進行更好更智能的數據決策?;谟⑻貭?至強 6 能效核處理器的分布式數據庫 OceanBase 在性能與能效上具備突出優勢,不僅能夠響應快速變化、持續增長的業務訴求,而且還有助于企業控制數據庫領域的成本,實現更高的投資收益?!狈庵傺蚈ceanBase
52、開源生態 資深研發總監OceanBase 是完全自主研發的國產原生分布式數據庫,采用 Shared-Nothing 架構,各個節點之間完全對等,每個節點都有自己的 SQL 引擎、存儲引擎、事務引擎,運行在普通 PC 服務器組成的集群之上,具備高可擴展性、高可用性、高性能、低成本、與主流數據庫高兼容等核心特性。解決方案圖 13.OceanBase 數據庫架構圖利用英特爾 至強 6 處理器配置的能效核,OceanBase 進一步提升了性能,可全面滿足金融、政務、運營商、零售、互聯網等行業用戶對數據庫性能的要求,同時還可降低數據庫負載的能耗,降低 TCO 并提升服務器的部署密度。19OceanBas
53、e 每秒事務數(TPS)和每瓦性能測試數據如下圖所示,相較于第三代英特爾 至強 可擴展處理器,英特爾 至強 6 能效核處理器的 TPS 提升到 2.47 倍,每瓦性能提升到 2.14 倍14。14 數據援引自 OceanBase 截止至 2024 年 5 月的內部測試結果。測試配置 基準配置:英特爾 至強 鉑金 8380 處理器 2.30 GHz,512 GB 總內存(16x32 GB DDR4 3200 MT/s);新配置:英特爾 至強 6780E 處理器 2.20 GHz,512 GB 總內存(16x32 GB DDR5 6400 MT/s)。英特爾并不控制或審計第三方數據。請您審查該內容
54、,咨詢其他來源,并確認提及數據是否準確。利用英特爾 至強 6 能效核處理器的多核能力,提升數據庫系統性能,滿足要求苛刻的現代化數據庫負載的支撐需求,助力商業價值的提升。利用英特爾 至強 6 能效核處理器的制造工藝及微架構升級提供業界卓越的能效比,在降低能耗成本的同時,推動綠色可持續數據中心建設。得益于性能與能效的提升,用戶能夠提升業務部署密度,節省數據中心機架空間。方案價值圖 14.基于英特爾 至強 6 能效核處理器的 OceanBase 的 TPS 與每瓦性能比較掃碼獲取完整白皮書關于 OceanBaseOceanBase 始創于 2010 年,是完全自主研發的企業級原生分布式數據庫。202
55、0 年 OceanBase 成立北京奧星貝斯科技有限公司并開始獨立商業化運作,目前是分布式數據庫的領軍企業之一。致力于為企業提供一站式的數據管理解決方案和服務,為企業核心系統提供穩定可靠的數據底座。112.472.1400.511.522.53每秒事務數每瓦性能以 8380 處理器的性能結果為基準每秒事務數與每瓦性能比較(越高越好)英特爾 至強 鉑金 8380 處理器 英特爾 至強 6780E 處理器 203.5 英特爾 TDX 助力構建阿里云瑤池全密態數據庫“云數據庫已成為云計算時代管理數據的重要形態。阿里云瑤池數據庫團隊一直致力于為用戶提供更快、更穩、更安全、更好用的云數據庫服務。其中,保
56、障數據安全始終是我們的第一要務。新興的全密態數據庫在確保全方位數據機密性的前提下,支持完整的 SQL 密文計算查詢能力,已成為保障數據安全的利器。第五代英特爾 至強 可擴展處理器提供的英特爾 TDX 技術,讓我們有機會構建更安全、更可信的全密態數據庫服務,為用戶的云上數據資產保駕護航?!蓖絷砂⒗镌骑w天實驗室數據庫系統與安全負責人阿里云瑤池數據庫團隊阿里云瑤池數據庫基于全密態技術,保護用戶敏感數據不泄露的同時,仍然支持所有的計算查詢、事務等操作。相較于傳統數據庫針對數據所處階段分階段保護措施,例如 TLS(Transport Layer Security)、TDE(Transparent Dat
57、a Encryption)、RLS(Row Level Security),阿里云瑤池全密態數據庫具備更強的數據安全防護能力。用戶接入阿里云瑤池全密態數據庫后,查詢的敏感數據始終以加密形式返回,即便數據庫賬號被盜數據仍不泄露。此外,瑤池全密態數據庫采用英特爾 TDX 技術對數據庫運行時內存加密保護,結合遠程證明技術,提供端到端安全的密鑰分發機制,無懼平臺基礎設施層的威脅。此外,阿里云瑤池全密態數據庫支持完備的 SQL 查詢能力,兼容普通數據庫,TPC-C 性能貼近明文性能;提供了對應用透明無感知的客戶端接入方式,應用無需代碼改造,同時支持數據傳輸服務(DTS)、數據管理服務(DMS)等生態工具
58、,便于應用輕松遷移。圖 15.阿里云瑤池數據庫全密態 MySQL 引擎解決方案基于遠程證明建立安全信道傳遞密鑰磁盤文件(TDE 落盤加密)查詢/操作語句(明文)用戶密鑰執行結果(明文)查詢/操作語句(密文)執行結果(密文)Driver(查詢加密/執行結果解密)(查詢解密/執行結果加密)MySQL 引擎 查詢/操作語句(明文)執行結果(明文)用戶密鑰敏感數據規則SecureGWMySQL 客戶端云基礎設施軟件棧(HostOS,VMM 等)由英特爾 TDX 保護21阿里云瑤池全密態數據庫能夠為數據提供更強的保護,并更好地滿足以下場景的安全需求:平臺運維安全:在一般的應用場景中,數據的擁有者即為應用
59、服務方。他們希望防止數據庫服務及其運維人員接觸到任何應用數據,同時保證數據庫的正常運作。數據安全合規:在面向終端用戶的應用場景中,部分數據(如健康數據、財務數據等)的擁有者為客戶本人。他們希望應用服務只提供數據管理和分析的能力,不能接觸私人明文數據,而應用服務也希望對敏感數據處理滿足合規要求。多源數據融合:在進行多源數據聯合分析時,他們希望保證在參與多方數據融合計算的同時,己方數據不會被其他參與方獲取。關于阿里云阿里云創立于 2009 年,是全球領先的云計算及人工智能科技公司,致力于以在線公共服務的方式,提供安全、可靠的計算和數據處理能力,讓計算和人工智能成為普惠科技。方案價值掃碼獲取完整白皮
60、書223.6 GBase 8a MPP Cluster 采用第五代英特爾 至強 可擴展處理器 有效提升數據壓縮性能“第五代英特爾 至強 可擴展處理器實現了可觀的代際性能提升,結合處理器內置的英特爾 IAA 加速器,以及我們在海量數據壓縮技術方面的長期研發成果,我們成功將 GBase 8a MPP Cluster 的數據壓縮率與數據壓縮性能提升至新高度。在數據庫的數據規模不斷增長的今天,這一成果能夠幫助用戶更好地節約存儲成本,提升數據庫性能,為企業的數字化轉型提供充沛動能?!标P連坡南大通用數據智能產品 經營部總經理GBase 8a MPP Cluster 是在 GBase 8a 列存儲數據庫基礎
61、上開發的一款無共享(Shared Nothing)架構的分布式并行數據庫集群,具備高性能、高可用、高擴展等特性,可以為各種規模的數據管理系統提供高性價比的通用計算平臺,并廣泛用于支撐各類數據倉庫系統、商業智能(BI)系統和決策支持系統。GBase 8a MPP Cluster 采用 MPP+Shared Nothing 的分布式聯邦架構,節點間通過 TCP/IP 網絡進行通信,每個節點采用本地磁盤來存儲數據,實現非對稱部署。分布式管理集群、分布式調度集群、分布式計算集群支持獨立部署和混合部署。系統中的每一個節點都是相對獨立的、自給的,整個系統中不存在單點瓶頸,具備出色的擴展性。解決方案圖 16
62、.GBase 8a MPP Cluster 產品架構2315 數據援引自南大通用截至 2023 年 11 月的內部測試數據。測試配置 基準配置:雙路英特爾 至強 鉑金 8480+處理器 2.0 GHz,56 核,啟用超線程技術,啟用睿頻加速技術,1024 GB 總內存(16x64 GB DDR5 4800 MT/s),6 塊 1.8 TB 固態盤,CentOS Stream 8;新配置:雙路英特爾 至強 鉑金 8592+處理器 1.9 GHz,64 核,啟用超線程技術,啟用睿頻加速技術,1024 GB 總內存(16x64 GB DDR5 5600 MT/s),6 塊 1.8 TB 固態盤,Ce
63、ntOS Stream 8。英特爾并不控制或審計第三方數據。請您審查該內容,咨詢其他來源,并確認提及數據是否準確。在海量數據壓縮存儲的基礎上,實現了更高的壓縮率,有助于節約存儲空間。進一步提升壓縮性能,降低壓縮耗時,同時釋放更多的 CPU 資源。提升數據庫的性能/成本比,幫助用戶節省在數據庫存儲等方面的投資。方案價值南大通用測試了在第五代英特爾 至強 可擴展處理器 中,啟用英特爾 IAA 加速器前后的壓縮率與性能表現。測試數據如圖所示,對比 ZSTD 壓縮算法,英特爾 IAA 的性能提升了 10%;對比 Rapidz 算法,英特爾 IAA 壓縮率提升了 33%。對比第四代英特爾 至強 可擴展處
64、理器,第五代英特爾 至強 可擴展處理器對不同壓縮算法的性能提升最多可達 20%15。圖 17.英特爾 IAA 啟用前后的性能與壓縮率差異(左)和 第四代/第五代英特爾 至強 可擴展處理器在不同壓縮算法的代際性能差異(右)1.11.030.861.3300.20.40.60.811.21.4IAA 對比 ZSTD IAA 對比 Rapidz 性能提升與壓縮率比較(越高越好)性能提升壓縮率1111.21.161.1500.30.60.91.21.5ZSTDRapidzIAA以 8480+處理器的性能結果為基準 性能提升(越高越好)英特爾 至強 鉑金 8480+處理器英特爾 至強 鉑金 8592+處
65、理器掃碼獲取完整白皮書關于南大通用天津南大通用數據技術股份有限公司(簡稱:南大通用,GBASE)成立于 2004 年,注冊資金 1.6 億元,公司自成立以來始終堅持自主創新,產品的核心技術及底層代碼自主可控,構建了覆蓋數據管理全生命周期,包括分析型、事務型、分布式事務型、云原生數據倉庫等全技術棧的數據產品體系及服務解決方案。243.7 H3C UIS 超融合方案采用第五代英特爾 至強 可擴展處理器 大幅提升數據庫性能“超融合是軟件定義時代,企業構建基礎設施的卓越選擇。受益于第五代英特爾 至強 可擴展處理器的性能優勢,我們增強了 H3C UIS 超融合方案在數據庫等關鍵業務中的表現,實現了顯著的
66、代際性能提升。在強大的硬件基礎上,我們將繼續推動超融合的變革,滿足客戶信息化發展任意階段、任意規模、任意場景、任意形態的需求?!毙鞚櫚睭3C 云與計算存儲產品線總裁H3C UIS 超融合是新華三集團自主研發的面向下一代企業和行業數據中心的軟件定義基礎設施解決方案。在通用服務器上無縫集成計算虛擬化、存儲虛擬化、網絡虛擬化、安全虛擬化、數據庫服務、運維監控管理、容災備份、云業務流程交付等軟件技術。H3C UIS 全無損超融合將傳統超融合內核升級為全新的超融合云原生內核,更好的滿足云原生業務需求,靈活構建以應用為核心的云化數據中心??勺赃m應部署于私有云、混合云、邊緣云的全域云場景,為客戶提供極致融合
67、、極優交付、極簡上云、極寬場景、極速性能的全無損云計算基礎架構,滿足數據中心未來十年信息化發展任意階段、任意規模、任意場景的技術架構變革需求。解決方案圖 18.H3C UIS 超融合方案架構H3C UIS 超融合云管理平臺 多角色引擎 邊緣云 混合云 私有云/行業云 UIS 6000 超強算力 UIS 9000 UIS 5000 高密計算 UIS 4500 海量空間 UIS 3000 彈性靈活 UIS 5300 異構計算 UIS 2000 赤霄智能加速引擎 數據庫引擎 容器云引擎 云安全引擎 邊緣云引擎 UIS 超融合云原生內核 網絡虛擬化 安全虛擬化 計算虛擬化 存儲虛擬化 一箱即云 在數據
68、庫應用中,H3C UIS 超融合方案采用第五代英特爾至強 可擴展處理器內置的英特爾 QAT 加速器,在不額外增加 CPU 負載的前提下,提高數據壓縮效率。25在虛擬機上運行的 Oracle 數據庫實例中,H3C 采用 hammerdb TPROC-C 基準測試驗證了第五代英特爾 至強 可擴展處理器相較第三代英特爾 至強 可擴展處理器的代際性能提升。測試數據如圖所示,相較于第三代英特爾 至強 可擴展處理器,第五代英特爾 至強 可擴展處理器在數據庫應用中將性能提升到 1.30 倍16。16 數據援引自 H3C 截止 2023 年 11 月的內部測試結果。測試配置 基準配置:雙路英特爾 至強 金牌
69、6326 處理器 2.90 GHz,啟用超線程技術,啟用睿頻加速技術,512 GB 總內存(16x32 GB DDR4 3200 MT/s),CentOS Linux release 7.6.1810(Core);新配置:雙路英特爾 至強 金牌 6526Y 處理器 2.80 GHz,啟用超線程技術,啟用睿頻加速技術,512 GB 總內存(16x32 GB DDR4 4800 MT/s),CentOS Linux release 7.6.1810(Core)。英特爾并不控制或審計第三方數據。請您審查該內容,咨詢其他來源,并確認提及數據是否準確。為計算、存儲、網絡應用提供更強大的 CPU 算力支持
70、,化解大規模、高并發的應用在性能上的瓶頸,并加快應用響應,保證更好的服務質量(QoS)。PCIe 5.0 與 DDR5 內存支持可帶來更高的平臺整體性能,降低超融合集群中的服務器規模要求,從而降低服務器部署所帶來的空間、供電、散熱等成本,提升投資回報率。通過英特爾 QAT 等加速器,有助于卸載數據壓縮等負載,降低 CPU 資源消耗,并節約存儲空間。方案價值圖 19.hammerdb TPROC-C 基準測試 CPU 代際性能比較00.20.40.60.811.21.4英特爾 至強 金牌 6326 處理器英特爾 至強 金牌 6526Y 處理器以 6326 處理器的性能為基準 性能比較(TPM,越
71、高越好)+1.30X 掃碼獲取完整白皮書關于新華三新華三集團作為數字化解決方案領導者,致力于成為客戶業務創新、數字化轉型值得信賴的合作伙伴。作為紫光集團旗下的核心企業,新華三通過深度布局“云-網-算-存-端”全產業鏈,不斷提升數字化和智能化賦能水平。新華三擁有計算、存儲、網絡、5G、安全、終端等全方位的數字化基礎設施整體能力,提供云計算、大數據、人工智能、工業互聯網、信息安全、智能聯接、邊緣計算等在內的一站式數字化解決方案,以及端到端的技術服務。263.8 軟硬件并行優化,第五代英特爾 至強 可擴展處理器助騰訊云向量數據庫成為大模型時代數據中樞“大語言模型以及 AGI、AIGC 應用等新一代
72、AI 技術與能力正在各行各業嶄露頭角,向量數據庫無疑是為其提供強大知識庫后援的數據中樞。騰訊云向量數據庫希望成為這個數據中樞,并聯合騰訊云的其它能力,為用戶打造下一代 AI 能力的堅實基座。來自英特爾的第五代至強 可擴展處理器、英特爾 AVX-512 指令集以及英特爾 AMX 加速引擎等產品與技術,為騰訊云向量數據庫性能的提升提供了更加強勁的助力?!绷_云騰訊云數據庫副總經理一直站在 AI 技術潮頭的騰訊,依托其旗下騰訊云推出了全新的向量數據庫產品。作為一款全托管的自研企業級分布式數據庫服務,其能為多維向量數據提供高效的存儲、檢索和分析能力。騰訊云向量數據庫正成為用戶構建 AI 能力時的強力“后
73、援團”。如下圖所示,數據庫能與 LLM 模型配合使用。用戶的私域數據在經過文本分割、向量化后存儲在騰訊云向量數據庫中,構建起專屬的外部知識庫,并在后續的檢索任務中,為 LLM 模型提供提示信息,輔助 AGI、AIGC 等應用生成更加精準的結果。此外,這一產品還可廣泛應用于推薦系統、計算機視覺以及智能客服等 AI 領域。解決方案圖 20.騰訊云向量數據庫為 LLM 模型提供知識庫知識庫生成知識庫檢索大語言模型 LLMtext0:whentext1:with.text2:convert.text0:whenvector:0.23498,0.23084text1:whenvector:0.23498
74、,0.23084SplitNeural NetworksNeural NetworksAPI2.Embedding Question1.Question:How to embedding a long content?6.Question+Knowledge4.Vector Query5.Top Similar Knowledge8.Answer:7.Answer3.Return VectorEmbeddinginsert騰訊云向量數據庫為助力騰訊云向量數據庫進一步提升效能,英特爾提供了全新第五代英特爾 至強 可擴展處理器、英特爾 AVX-512 指令集和英特爾 AMX 加速引擎,讓向量檢索的
75、計算性能得到了顯著提升,雙方隨后開展的驗證測試也有力地證明了這一點。27測試結果如圖所示,經數據歸一化對比后,在同樣使用騰訊云 S6 服務器(基于第三代至強 可擴展處理器)的情況下,使用英特爾 AVX-512 優化后,使用 IVF-PQFastScan 算法執行向量檢索時的 QPS 性能提升了約 100%,而將算力設備升級為第五代至強 可擴展處理器后,性能相比基準組提升了約 230%17。在同樣使用第五代至強 可擴展處理器的算力平臺上,使用英特爾 AMX 加速數據格式為 INT8 的測試場景相比使用英特爾 AVX-512 加速數據格式為 FP32 的測試場景,性能提升達約 5.8 倍18。17
76、,18 數據來源于騰訊未公開的內部測試,如欲了解更多詳情,請訪問:https:/ AI 能力的堅實基座。釋放向量數據庫在模型訓練中的潛力,有效降低模型訓練的成本,并提高 AGI、AIGC 等應用輸出結果的及時性和準確度。方案價值圖 21.向量檢索時的 QPS 性能對比(左)和英特爾 AMX 優化加速暴力檢索的吞吐性能對比(右)0.0基準組測試組 1測試組 20.51.01.52.02.53.03.50基準組測試組1234567掃碼獲取完整白皮書關于騰訊云騰訊云是騰訊集團傾力打造的云計算品牌,面向全世界各個國家和地區的政府機構、企業組織和個人開發者,提供全球領先的云計算、大數據、人工智能等技術產
77、品與服務,以卓越的科技能力打造豐富的行業解決方案,構建開放共贏的云端生態,推動產業互聯網建設,助力各行各業實現數字化升級。283.9 第五代英特爾 至強 可擴展處理器 助力星環科技分布式向量數據庫 Transwarp Hippo 實現大幅性能提升“與上一代產品相比,第五代英特爾 至強 可擴展處理器實現了令人驚喜的性能提升,能夠有助于進一步釋放星環科技分布式向量數據庫 Transwarp Hippo 的性能潛力,為用戶帶來強大的向量數據處理能力,這在大模型訓練等場景中有著重要的意義,可幫助用戶更高效、更精確地打造大模型產品?!敝飕B辰星環科技聯合創始人兼副總裁星環科技分布式向量數據庫 Transw
78、arp Hippo 作為一款企業級云原生分布式向量數據庫,基于分布式特性,可以對文檔、圖片、音視頻等多源、海量數據轉化后的多維向量進行統一存儲和管理。它能夠通過水平擴展架構,充分發揮并行檢索能力,實現毫秒級高性能數據檢索,結合相似度檢索等技術,幫助用戶快速挖掘數據價值。與開源的向量數據庫不同,星環科技分布式向量數據庫 Transwarp Hippo 具備高可用、高性能、易拓展等特點,支持多種向量搜索索引,支持數據分區分片、數據持久化、增量數據攝取、向量標量字段過濾混合查詢等功能,很好地滿足了企業針對海量向量數據的高實時性檢索等場景。解決方案圖 22.星環科技分布式向量數據庫 Transwarp
79、 Hippo 產品架構Manager安裝 升級運維 配置SophonModelCube模型倉庫AquilaInsight監控 日志監管 告警Vector Engine向量檢索引擎TDDMS:Transwarp Distributed Data Management System星環分布式數據管理系統Embedding Hub向量轉化模塊Python/Restful/Java數據接口星環云原生操作系統Transwarp Cloud Operating System29為進一步提升數據庫性能,星環科技將 Transwarp Hippo 處理器升級為第五代英特爾 至強 可擴展處理器,并測試了性能表現
80、。星環科技選用了 Transwarp KNN search 評測程序,該評測程序模擬用戶的 top K 鄰近范圍查詢。測試數據如圖所示,對比第三代英特爾 至強 可擴展處理器,基于第五代英特爾 至強 可擴展處理器的 Transwarp Hippo 性能是其 2.07 倍19。支撐數據的高效處理:能夠實現海量、高維度向量數據處理,并具備低時延、高精確度等優勢,可以滿足大模型訓練等場景對于數據處理能力的苛刻要求。降低向量數據庫的總體擁有成本(TCO):提升 Transwarp Hippo 服務器節點的性能密度,幫助用戶節省在服務器采購、部署等方面的投資。具備性能進一步提升潛力:新一代處理器還具備英特
81、爾 IAA 等硬件加速特性,有助于進一步提升數據庫等場景的性能。方案價值圖 23.基于不同代際英特爾 至強 可擴展處理器的 Transwarp Hippo 性能對比00.511.522.5英特爾 至強 鉑金 8380 處理器英特爾 至強 鉑金 8592+處理器以 8380 處理器的性能為基準 性能比較(越高越好)+2.07X 19 數據援引自截至 2023 年 11 月由星環科技開展的測試。測試配置 基準配置:雙路英特爾 至強 鉑金 8380 處理器,40 核,1024 GB 總內存(16x64 GB DDR5 5600 MT/s),800 GB 固態盤,CentOS Stream 8,Ker
82、nel 5.19.0;新配置:雙路英特爾 至強 鉑金 8592+處理器,40 核,1024 GB 總內存(16x64 GB DDR4 3200 MT/s),800 GB 固態盤,CentOS Stream 8,Kernel 5.19.0。英特爾并不控制或審計第三方數據。請您審查該內容,咨詢其他來源,并確認提及數據是否準確。掃碼獲取完整白皮書關于星環科技星環科技致力于打造企業級大數據基礎軟件,圍繞數據的集成、存儲、治理、建模、分析、挖掘和流通等數據全生命周期提供基礎軟件與服務,構建明日數據世界。經過多年自主研發,星環科技建立了多個產品系列:一站式大數據基礎平臺 TDH、分布式分析型數據庫 Arg
83、oDB 及交易型數據庫 KunDB、基于容器的智能數據云平臺 TDC、大數據開發工具 TDS、智能分析工具 Sophon 和超融合大數據一體機 TxData Appliance 等,并擁有多項專利技術。303.10 第四代英特爾 至強 可擴展處理器與英特爾 技術助力超聚變 FusionDB 數據庫性能優化“數字化轉型進程的加快驅動著數據的爆發式增長,用戶對于數據庫的性能有著越來越高的要求。通過在第四代英特爾 至強 可擴展處理器上采用 英特爾 Open Analytic Toolkit、英特爾 QAT 等技術進行優化,我們增強了 FusionDB 在數據庫索引、物理備份等場景下的性能表現,這有利
84、于用戶在高效應對性能敏感型業務的同時,保護在數據庫方面的投資?!表n雨發超聚變算力服務產品部部長FusionDB 數據庫基于開源 openGauss 內核深度開發,是一種具有自主可控、出色性能、高兼容、高安全、高可用、易于運維等多種特性的企業級關系型數據庫。它具備業內領先的性能表現、生態支持、SQL 兼容性能力,以及數據遷移和運維能力,能夠幫助企業縮短業務系統研發周期、大幅降低業務系統的遷移、改造、運維成本。解決方案圖 24.超聚變 FusionDB 數據庫能力與愿景 數據丟失 集群故障 異構不兼容 高并發延遲 標準不合規 運維復雜 業務痛點 核心訴求 業務場景 自主可控 信創合規 異構兼容 業
85、務零改造 自動切換 業務連續 容災方案 安全可靠 高性能內核 降低延遲 配套工具 高效運維 關鍵業務 ERP|CRM 分析類 統計|報表 核心業務 會計|財務 一般業務 HR|網站 辦公管理 OA|郵件 為了進一步增強 FusionDB 數據庫性能優勢,超聚變與英特爾從硬件升級、軟件優化等多方面進行了合作。在硬件層面,超聚變選擇了搭載第四代英特爾 至強 可擴展處理器的數據庫服務器作為基礎驗證平臺。在該平臺的支持下,超聚變針對 FusionDB 數據庫在索引訪問、端到端備份中的緩存機制等方面的瓶頸,與英特爾協同開展了軟件優化工作,這包括采用英特爾 Open Analytic Toolkit 優化
86、布隆索引訪問性能;采用英特爾 QAT 提升物理備份性能,節約空間。31超聚變針對 FusionDB 數據庫索引執行時間測試的數據如下圖左所示,從數據可以看出,在啟用英特爾 AVX-512 之后,索引性能最高提升 1.67 倍;備份速率的測試如下圖右所示,優化后全量備份的速度提升了 10 倍以上,增量備份的速度提升了 20 倍以上20。20 數據援引自超聚變和英特爾于 2023 年 4 月聯合進行測試的結果。測試配置:主節點 雙路英特爾 至強 鉑金 8480 處理器,56 核,7.3 TB NVMe;備節點 雙路英特爾 至強 鉑金 8480 處理器,56 核,1.8 TB NVMe。英特爾并不控
87、制或審計第三方數據。請您審查該內容,咨詢其他來源,并確認提及數據是否準確。實際性能受使用情況、配置和其他因素的差異影響。更多信息請見 www.I 提升索引訪問性能,高效支撐性能敏感型業務,更有效地應對大規模業務在吞吐、時延方面的挑戰,提升業務服務能力??s短備份恢復時間,降低業務遷移成本,減少業務備份中斷時間,同時降低對系統性能的影響。實現了更高的壓縮率,有助于節省存儲空間,降低支出。方案價值圖 25.布隆索引訪問性能比較(圖左)和備份速率比較(圖右)00.20.40.60.811.21.41.61.8啟用英特爾 AVX-512 前 以優化前的性能為基準 布隆索引訪問性能比較(越高越好)啟用英特
88、爾 AVX-512 后 050010001500200025003000全量備份 增量備份 備份速率比較(MB/s,越高越好)優化前 優化后 帶 QAT 硬件 掃碼獲取完整白皮書關于超聚變超聚變數字技術有限公司致力成為全球領先的算力基礎設施與服務提供者。我們堅持“以客戶為中心,以奮斗者為本,長期堅持艱苦奮斗,合作共贏”的核心價值觀,持續為客戶和伙伴創造價值,加速行業數字化轉型。超聚變在全球設立 11 個研究中心和 7 個地區部、5 大供應中心,目前服務于全球 130 個國家和地區客戶,包括全球 211 家財富 500 強企業,覆蓋運營商、金融、互聯網、政企等行業。323.11 采用 AVX-5
89、12 指令和英特爾 QAT 加速器優化的東方國信大數據 解決方案“Gluten 可以很好的將 Spark 和 C+開發的向量化引擎 Velox 粘合 在一起,使得 Spark Operators 和 Functions 可以很方便的結合新硬件指令集的優化方案,達到提升計算性能的目的。我們還采用第四代英特爾 至強 可擴展處理器集成的 QAT 加速器,顯著提升了 Spark 的執行效率,同時降低了 CPU 使用率、磁盤讀寫、網絡吞吐量,減少后臺程序對硬件資源的占用,提升了大數據平臺集群穩定性,助力用戶構建卓越的大數據系統?!蓖趸|方國信大數據事業部 副總經理在開源 Hadoop 的基礎上,東方國信
90、對 Hadoop 組件進行增強和封裝,推出了適用于超大規模數據存儲和在線分析的東方國信大數據平臺企業版(BEH)通用產品解決方案,可以幫助企業快速搭建大數據平臺,提升開發效率,降低后期維護成本。為了解決 Spark 執行效率的問題,東方國信大數據 BEH 平臺集成了 Gluten+Velox Backend 向量化執行引擎。其中,Gluten 屬于 Spark 硬件加速項目,通過 CPU 的單指令多數據(SIMD)指令集及加速庫(Velox 或 ClickHouse)來使得 Spark 具備更好的向量化執行能力。Gluten 能夠通過 Spark Plugin 的機制,攔截 Spark 查詢計
91、劃并下發給原生引擎來執行,整體的執行框架仍沿用 Spark 既有框架實現。解決方案圖 26.Gluten 技術架構Velox(CPU 指令優化)ClickHouse(CPU 指令優化)Arrow(列式 Shuffle)FPGA/GPU(定制硬件加速)Spark DataFrame Plan Conversion 計劃轉化 Memory Manager 內存管理 Columnar Shuffle 列式 shffle Shim Layer 列式 shffle Fallback 回退 Metric 統計信息 Gluten Plugin for Spark Native Library Catalys
92、t Query Plan Optimization JVM Engine JNI Bindings Tungsten Physical Plan Execution Operators Expression JIT Whole-stage code generation 為了進一步提升 Spark 執行效率,東方國信在 BEH 平臺中采用了第四代英特爾 至強 可擴展處理器,并利用處理器集成的 SIMD 指令集以及英特爾 QAT 來提升 Gluten+Velox Backend 向量化執行引擎的性能。33TPC-DS 性能對比測試數據如圖所示,在 SF=2T 的數據量下,Spark+Gluten
93、+Velox 對比 Vanilla Spark,TPC-DS 99 條 SQL 執行效率有 2.73 倍的提升;Spark+Gluten+Velox+QAT 對比 Vanilla Spark,TPC-DS 99 條 SQL 執行效率有高達 2.91 倍的提升21。顯著提升 Spark 執行效率,應對大數據分析快速增長帶來的挑戰,從而支撐用戶挖掘海量數據的價值。方案能夠有效釋放 CPU、存儲等硬件潛力,提高性能密度與資源利用率,降低在大數據系統擴展方面的投資。方案能夠有效兼容當前 Spark 生態,無需用戶將業務遷移到新的平臺上,從而避免業務遷移所帶來的負擔。方案價值圖 27.執行效率對比00.
94、511.522.533.5vanilla sparkspark+gluten+veloxspark+gluten+velox+qat以 Vanilla Spark 的性能為基準SF2T TPC-DS 99 條 SQL 執行效率對比(越高越好)+2.73X+2.91X21 東方國信截至 2023 年 8 月的內部測試結果。測試配置:雙路英特爾 至強 鉑金 8480+處理器,1 TB DDR5 總內存,6 塊 3.5 TB 固態盤,25 Gbps 網卡,CentOS Linux release 8.5.2111,Kyuubi 1.6.1,Spark 3.3.2,Hadoop 3.3.4,Glute
95、n 1.1.0,Velox 1.1.0。英特爾并不控制或審計第三方數據。請您審查該內容,咨詢其他來源,并確認提及數據是否準確。掃碼獲取完整白皮書關于東方國信北京東方國信科技股份有限公司成立于 1997 年,是一家專注大數據、云計算等領域核心技術的高科技軟件企業,經過 20 余年的發展,東方國信已形成橫向跨行業、縱向全產業鏈的戰略布局。打造了基于大數據、云計算、移動互聯,全鏈條、全自主知識產權的技術研發體系,實現了大數據端到端全產業鏈的自主研發,并以豐富的大數據軟件產品和解決方案服務于通信、金融、工業、政府、城市、農業、醫療、新零售等多個業務領域。343.12 第四代英特爾 至強 可擴展處理器助
96、力 GBase 8a MPP Cluster 提高性能與壓縮率“第四代英特爾 至強 可擴展處理器是一項重要的革新,其集成的英特爾 存內分析加速器(英特爾 IAA)等創新特性讓我們能夠更進一步加速 GBase 8a MPP Cluster 在壓縮率和 I/O 性能等方面的表現,同時提供更具經濟性的高性能數據庫方案。我們將與英特爾在硬件創新、軟件優化方面進行更加密切的合作,充分利用現有資源潛能,幫助用戶更加高效地處理海量數據,保障關鍵業務,為數字化轉型奠定堅實基礎?!睆埥B勇天津南大通用數據技術股份有限公司數據智能產品經營部總經理GBase 8a MPP Cluster 是在 GBase 8a 列存
97、儲數據庫基礎上開發的一款無共享(Shared Nothing)架構的分布式并行數據庫集群,其具備高性能、高可用、高擴展等特性,可以為各種規模數據管理提供高性價比的通用計算平臺,并廣泛用于支撐各類數據倉庫系統、商業智能(BI)系統和決策支持系統。GBase 8a MPP Cluster 采用 MPP+Shared Nothing 的分布式聯邦架構,節點間通過 TCP/IP 網絡進行通信,每個節點采用本地磁盤來存儲數據,實現非對稱部署。分布式管理集群、分布式調度集群、分布式計算集群支持獨立部署和混合部署。系統中的每一個節點都是相對獨立的、自給的,整個系統中不存在單點瓶頸,具備出色的擴展性。解決方案
98、圖 28.GBase 8a MPP Cluster 產品架構圖35 GBase 8a MPP Cluster 在海量數據壓縮存儲的基礎上,依托英特爾 IAA 提供了更高的壓縮率。得益于數據壓縮率的提升,數據庫 I/O 性能也得到了相應的提升。結合軟硬件創新,南大通用能夠有效提高 GBase 8a MPP Cluster 的性能/成本比,幫助用戶節省在數據庫上的投資。方案價值圖 29.原始性能測試數據對比00.20.40.60.811.21.41.61.8英特爾 至強鉑金 8380 處理器英特爾 至強鉑金 8480+處理器英特爾 至強 鉑金 8480+處理器與英特爾 IAA壓縮率與性能比較(基準
99、值,越高越好)相對性能相對壓縮率1111.581.661.5122 數據援引自南大通用與英特爾于 2022 年 10 月開展的測試。測試配置:基準配置 單節點,雙路英特爾 至強 鉑金 8380 處理器,40 核,啟用超線程,啟用睿頻加速技術,1024 GB 總內存(32x32 GB DDR4 3200 MT/s);新配置 1 和 2 單節點,雙路英特爾 至強 鉑金 8480+處理器,56 核,啟用超線程,啟用睿頻加速技術,1024 GB 總內存(32x32 GB 4800 MT/s)。英特爾并不控制或審計第三方數據。請您審查該內容,咨詢其他來源,并確認提及數據是否準確。實際性能受使用情況、配置
100、和其他因素的差異影響。更多信息請見 www.I 8a MPP Cluster 采用了第四代英特爾 至強 可擴展處理器集成的硬件加速器英特爾 IAA。測試數據如圖所示,較于基準配置,第四代英特爾 至強 可擴展處理器能夠將存儲性能提升 1.58 倍,而在開啟英特爾 IAA 之后,壓縮率提升了 1.51 倍,性能則提升了 1.66 倍22。掃碼獲取完整白皮書關于南大通用天津南大通用數據技術股份有限公司(簡稱:南大通用,GBASE)成立于 2004 年,注冊資金 1.6 億元,公司自成立以來始終堅持自主創新,產品的核心技術及底層代碼自主可控,構建了覆蓋數據管理全生命周期,包括分析型、事務型、分布式事務
101、型、云原生數據倉庫等全技術棧的數據產品體系及服務解決方案。363.13 第四代英特爾 至強 可擴展處理器助力 TiDB 開源分布式數據庫 大幅提升性能,優化存儲空間“作為一款 PingCAP 自主研發、面向全球用戶的開源數據庫,TiDB 走在了技術的前沿。得益于第四代英特爾 至強 可擴展處理器卓越的代際性能提升,以及其搭載的多種硬件加速器,我們進一步提升了 TiDB 的性能表現。我們將繼續堅持開源的創新理念,將 TiDB 打造成一個領先的數據庫產品?!秉S東旭PingCAP 聯合創始人兼 CTOTiDB 是 PingCAP 公司自主設計、研發的開源分布式數據庫,是一款同時支持在線事務處理與在線分
102、析處理(Hybrid Transactional and Analytical Processing,HTAP)的融合型分布式數據庫產品,具備水平擴容或者縮容、金融級高可用、實時 HTAP、云原生、兼容 MySQL 協議和 MySQL 生態等核心特性。TiDB 為用戶提供一棧式聯機事務處理過程(OLTP)、聯機分析處理(OLAP)和 HTAP 解決方案,適用于高可用、強一致、數據規模較大等應用場景。TiDB 開源分布式數據庫采用云原生架構,兼容 MySQL,能夠有效減少遷移工作量。數據庫同時具備交易處理與數據分析能力,在多模態可擴展性和性能方面表現卓越。解決方案圖 30.TiDB 開源分布式數
103、據庫產品架構與數據生態37圖 31.英特爾 至強 鉑金 8380/8480+處理器只讀性能與讀寫性能測試23 PingCAP 截止 2023 年 8 月的內部測試結果。測試配置 基準配置:雙路英特爾 至強 鉑金 8380 處理器 2.30 GHz,512 GB 總內存(16x 32 GB DDR4 3200 MT/s),9 TB 固態盤,兩張英特爾 以太網控制器 X710,一張英特爾 以太網控制器 E810-C,CentOS Stream 8;新配置:雙路英特爾 至強 鉑金 8480+處理器 2.0 GHz,512 GB 總內存(16x 32 GB 4800 MT/s),9 TB 固態盤,兩張
104、英特爾 以太網控制器 X710,一張英特爾 以太網控制器 E810-C,CentOS Stream 8。英特爾并不控制或審計第三方數據。請您審查該內容,咨詢其他來源,并確認提及數據是否準確。24 PingCAP 截止 2023 年 8 月的內部測試結果。測試配置 基準配置:雙路英特爾 至強 鉑金 8380 處理器 2.30 GHz,512 GB 總內存(16x 32 GB DDR4 3200 MT/s),9 TB 固態盤,兩張英特爾 以太網控制器 X710,一張英特爾 以太網控制器 E810-C,Red Hat Enterprise Linux 8.7;新配置:雙路英特爾 至強 鉑金 8480
105、+處理器 2.0 GHz,512 GB 總內存(16x 32 GB 4800 MT/s),9 TB 固態盤,兩張英特爾 以太網控制器 X710,一張英特爾 以太網控制器 E810-C,Red Hat Enterprise Linux 8.7。英特爾并不控制或審計第三方數據。請您審查該內容,咨詢 其他來源,并確認提及數據是否準確。在將 CPU 升級為第四代英特爾 至強 可擴展處理器之后,TiDB 開源分布式數據庫提升了性能,節約了存儲空間,為客戶帶來了以下收益:數據庫的只讀和讀寫性能分別達到基準配置的 1.62 倍和 1.43 倍,結合 TiDB 自身的性能優勢,能夠幫助客戶加速數據處理與分析效
106、率,應對大規模數據帶來的沖擊。英特爾 IAA 壓縮算法的壓縮率達到傳統壓縮算法的 1.4 倍,為用戶節省了大量的硬盤空間,降低成本;結合 CPU 的迭代,性能提升可達到原配置的 1.56 倍24,有助于客戶化解數據壓縮所帶來的性能困擾。結合軟硬件創新,TiDB 能夠有效提高數據庫系統的性能/成本比,幫助用戶節省在數據庫上的投資。方案價值在 OLTP 場景中,為了驗證 CPU 升級帶來的性能提升,PingCAP 進行了測試,驗證了在 Sysbench 基準測試中,英特爾 至強 鉑金 8380/8480+處理器的只讀、讀寫性能差異?;谟⑻貭?至強 鉑金 8480+處理器的 TiDB 在 Sysb
107、ench 只讀測試中性能達到基準配置的 1.62 倍,在 Sysbench 讀寫測試中性能達到后者的 1.43 倍23。00.20.40.60.811.21.41.61.8英特爾 至強 鉑金 8380 處理器英特爾 至強 鉑金 8480+處理器以 8380 處理器的結果為基準 只讀性能(提升比例,越高越好)00.20.40.60.811.21.41.6以 8380 處理器的結果為基準 讀寫性能(提升比例,越高越好)英特爾 至強 鉑金 8380 處理器英特爾 至強 鉑金 8480+處理器掃碼獲取完整白皮書關于 PingCAPPingCAP 成立于 2015 年,是一家企分布式數據庫廠商,提供包括
108、開源分布式數據庫產品、解決方案與咨詢、技術支持與培訓認證服務,致力于為行業用戶提供穩定高效、安全可靠、開放兼容的新型數據基礎設施,解放企業生產力,加速企業數字化轉型升級。383.14 第四代英特爾 至強 可擴展處理器助力星環科技分布式分析型數據庫 Transwarp ArgoDB 釋放大數據價值“Transwarp ArgoDB 借助在分布式向量化計算引擎、高性能列式存儲等技術方面的深度創新,結合第四代英特爾 至強 可擴展處理器提供的高級硬件能力,進一步將 ArgoDB 的性能提升 69%25,為用戶提供更加強大的數據處理能力,充分滿足聯機分析處理(OLAP)、實時數倉、數據集市和湖倉集一體等
109、場景的性能要求,助力用戶輕松釋放大數據價值?!敝飕B辰星環科技聯合創始人兼副總裁星環科技 Transwarp ArgoDB 分布式分析型數據庫采用創新型分布式架構,具備超大規模、高效性能、穩定運行、極簡使用等優勢。星環科技與英特爾合作,推出了基于第四代英特爾 至強 可擴展處理器的 Transwarp ArgoDB 分布式分析型數據庫解決方案,實現了高性能、高經濟性、高擴展性、高可用性的統一。解決方案圖 32.星環科技 Transwarp ArgoDB 分布式分析型數據庫架構Audit數據庫操作與權限審計Guardian安全與權限控制AquilaInsight監控 日志監管 告警Manager安裝
110、 升級運維 配置Transwarp Cloud Operating System星環云原生操作系統Transwarp Quark Gateway 星環引擎協調器Transwarp Quark 星環SQL編譯器Crux:Vectorized Computing Engine 星環向量化計算引擎Nucleon:Distributed Execution Engine 星環分布式執行引擎Gluon:Multi-model Database Optimizer多模型數據庫優化器Transaction Manager事務管理器Metastore Catalog 分布式元數據管理系統Transwarp D
111、istributed Data Management System TDDMS:星環分布式數據管理系統Transwarp Distributed File SystemTDFS:星環分布式文件系統關系型數據存儲時序數據存儲地理空間存儲寬表存儲搜索引擎事件存儲圖存儲鍵值存儲文檔存儲對象存儲25 截止 2022 年 9 月由英特爾開展的測試。測試配置 1:三節點,雙路英特爾 至強 鉑金 8380 處理器,40 核,啟用超線程,啟用睿頻加速技術,512 GB 總內存(16x32 GB DDR4 3200 MHz)。測試配置 2:三節點,雙路英特爾 至強 鉑金 8480+處理器,56 核,啟用超線程,
112、啟用睿頻加速技術,512 GB 總內存(16x32 GB 4800 MHz)。英特爾并不控制或審計第三方數據。請您審查該內容,咨詢其他來源,并確認提及數據是否準確。實際性能受使用情況、配置和其他因素的差異影響。更多信息請見 www.I 有效地化解了高性能數據庫的 CPU 性能瓶頸,滿足離線批處理數據倉庫、實時數據分析平臺等負載的計算要求。Transwarp ArgoDB 可以利用容器技術實現資源調度和資源隔離,支持彈性擴縮容,可以為多租戶彈性提供穩定可靠的數據庫服務。搭載基于 Raft 一致性協議的存儲引擎,可以幫助用戶有效應對服務器故障等問題帶來的可用性挑戰。方案價值圖 33.基于第三代/第
113、四代英特爾 至強 可擴展處理器的星環科技 Transwarp ArgoDB 吞吐性能測試11.6900.20.40.60.811.21.41.61.8英特爾 至強鉑金 8380 處理器 以英特爾 至強 鉑金 8380處理器的性能為基準QPH(越高越好)英特爾 至強鉑金 8480+處理器 26 截止 2022 年 9 月由英特爾開展的測試。測試配置 1:三節點,雙路英特爾 至強 鉑金 8380 處理器,40 核,啟用超線程,啟用睿頻加速技術,512 GB 總內存(16x32 GB DDR4 3200 MHz)。測試配置 2:三節點,雙路英特爾 至強 鉑金 8480+處理器,56 核,啟用超線程,
114、啟用睿頻加速技術,512 GB 總內存(16x32 GB 4800 MHz)。英特爾并不控制或審計第三方數據。請您審查該內容,咨詢其他來源,并確認提及數據是否準確。實際性能受使用情況、配置和其他因素的差異影響。更多信息請見 www.I 至強 可擴展處理器的 Transwarp ArgoDB 的吞吐性能差異。測試數據如圖所示,第四代英特爾 至強 可擴展處理器的采用使得 Transwarp ArgoDB 每小時查詢處理數(Query Per Hour,QPH)提升了 69%。26掃碼獲取完整白皮書關于星環科技星環科技致力于打造企業級大數據基礎軟件,圍繞數據的集成、存儲、治理、建模、分析、挖掘和流通
115、等數據全生命周期提供基礎軟件與服務,構建明日數據世界。經過多年自主研發,星環科技建立了多個產品系列:一站式大數據基礎平臺 TDH、分布式分析型數據庫 ArgoDB 及交易型數據庫 KunDB、基于容器的智能數據云平臺 TDC、大數據開發工具 TDS、智能分析工具 Sophon 和超融合大數據一體機 TxData Appliance 等,并擁有多項專利技術。4027 截止 2023 年 10 月由星環科技與英特爾共同開展的測試。測試配置:雙路英特爾 至強 鉑金 8480+處理器,56 核,啟用睿頻加速技術,關閉超線程,512 GB 總內存(16x32 GB DDR4 3200 MHZ)。實際性能
116、受使用情況、配置和其他因素的差異影響。更多信息請見 www.I 第四代英特爾 至強 可擴展處理器 助力星環科技分布式向量數據庫 Transwarp Hippo 釋放大模型價值“Transwarp Hippo 借助在分布式存儲和向量檢索等技術方面的深度創新,結合第四代英特爾 至強 可擴展處理器提供的高級硬件能力,使得向量查詢性能實現了 20%30%27 的提升,為用戶提供更加強大的向量數據處理能力,解決大模型局限性的同時,幫助用戶更好地應對大模型快速發展帶來的挑戰?!敝飕B辰星環科技聯合創始人兼副總裁星環科技 Transwarp Hippo 支持存儲、索引以及管理海量數據的向量式數據集,提供向量相
117、似度檢索、高密度向量聚類等能力,有效地解決了大模型知識時效性低、輸入能力有限、準確度低等問題,讓大模型更高效率地存儲和讀取知識庫,降低訓練和推理成本,激發更多的 Al 應用場景。在賦予大模型擁有“長期記憶”的同時,還可以協助企業解決目前最擔憂的大模型數據隱私泄露問題。解決方案圖 34.星環科技 Transwarp Hippo 分布式向量數據庫架構Manager安裝 升級運維 配置SophonModelCube模型倉庫AquilaInsight監控 日志監管 告警Vector Engine向量檢索引擎TDDMS:Transwarp Distributed Data Management Syst
118、em星環分布式數據管理系統Embedding Hub向量轉化模塊Python/Restful/Java數據接口星環云原生操作系統Transwarp Cloud Operating System41通過配置第四代英特爾 至強 可擴展處理器,星環科技 Transwarp Hippo 在向量索引層面實現了 20%30%的性能提升28,可全面滿足個性化推薦、智能問答、大模型應用對向量數據庫系統計算能力的要求。28 截止 2023 年 10 月由星環科技與英特爾共同開展的測試。測試配置:雙路英特爾 至強 鉑金 8480+處理器,56 核,啟用睿頻加速技術,關閉超線程,512 GB 總內存(16x32 G
119、B DDR4 3200 MHZ)。實際性能受使用情況、配置和其他因素的差異影響。更多信息請見 www.I 專業向量數據庫:解決大模型數據泄露隱私問題,拓展大語言模型的空間邊界,并通過多模態信息向量化存儲以及近似檢索、混合檢索等能力解決“Al 幻覺”問題。更高性能:應對大模型應用帶來的挑戰,更高效地挖掘大模型應用價值。高擴展:可以滿足企業大模型未來發展對海量向量數據的存儲和計算需求。降低 TCO:大幅降低大模型二次訓練成本,加速大模型業務上線和創新,提升大模型投資回報率。方案價值圖 35.基于第四代英特爾 至強 可擴展處理器 AVX512 的 Hippo 向量索引庫與開源 Faiss 查詢性能(
120、左)和 AVX2/AVX512 的 Hippo 向量索引庫查詢性能(右)00.511.5以開源 Faiss 查詢性能為基準QPS(越高越好)開源Faiss/HNSWLIB00.511.5以 AVX2 查詢性能為基準QPS(越高越好)AVX2AVX512掃碼獲取完整白皮書關于星環科技星環科技致力于打造企業級大數據基礎軟件,圍繞數據的集成、存儲、治理、建模、分析、挖掘和流通等數據全生命周期提供基礎軟件與服務,構建明日數據世界。經過多年自主研發,星環科技建立了多個產品系列:一站式大數據基礎平臺 TDH、分布式分析型數據庫 ArgoDB 及交易型數據庫 KunDB、基于容器的智能數據云平臺 TDC、大
121、數據開發工具 TDS、智能分析工具 Sophon 和超融合大數據一體機 TxData Appliance 等,并擁有多項專利技術。423.16 基于第四代英特爾 至強 可擴展處理器的亞信科技 AntDB 數據庫“AntDB 數據庫致力于為行業客戶,提供高效、安全、穩定的數據服務。在核心交易、萬物互聯等應用場景領域,AntDB 數據庫提供了大量的場景化方案與應用實踐。而在遷移到第四代英特爾 至強 可擴展處理器之后,AntDB 數據庫在性能方面的優勢將得到進一步凸顯,幫助用戶更有效地應對高并發業務帶來的挑戰?!睆垬鍋喰趴萍?AntDB 數據庫 運營管理中心總經理亞信科技 AISWare AntDB
122、 旨在建設成一款業內領先的高可用、高性能的分布式關系型數據庫,適用于高吞吐、低時延的聯機事務處理過程(OLTP)類應用,以及高性能要求的緩存服務。AISWare AntDB 至今已成功應用于運營商、能源、交通、金融、證券、電商、互聯網等行業的計費、實時交易、聯機交易、實時行情類業務場景。圖 36.亞信科技 AntDB 數據庫產品架構圖解決方案ODBC/GDBC APP 1.Client Network 計算節點 Coordinator 全局事務管理器 MGR Node DBOPS Private DataNetwork DB-M DB-S.ODBC/GDBC APP 2 ODBC/GDBC A
123、PP N Coordinator Coordinator GTMCOORD DB-M DB-S DB-M DB-S DB-M DB-S 43為了進一步增強數據庫在并發、時延等方面的性能表現,并提升投資回報,AISWare AntDB 采用了基于第四代英特爾 至強 可擴展平臺的服務器,同時進行了性能驗證。測試數據如圖所示,基于第四代英特爾 至強 可擴展處理器的 AISWare AntDB 吞吐量比第三代英特爾 至強 可擴展處理器提升了 43%左右29。助力用戶構建敏捷的應用場景,并獲得更佳的性能體驗。實現了卓越的性能表現,能夠有效應對超大并發量業務在吞吐、時延方面的挑戰,提升業務服務能力。方案價
124、值圖 37.基于第三代/第四代英特爾 至強 可擴展處理器的 AISWare AntDB 吞吐量對比050000100000150000200000250000300000350000400000450000三代至強+DRAM 四代至強+DRAM TPS(越高越好)29 截止 2022 年 9 月 6 日由英特爾開展的測試。測試配置 1:單節點,雙路英特爾 至強 鉑金 8380 處理器,40 核,啟用超線程,啟用睿頻加速技術,2 TB 總內存(32 插槽/64 GB/3200 MHz)。測試配置 2:單節點,雙路英特爾 至強 鉑金 8480+處理器,56 核,啟用超線程,啟用睿頻加速技術,2 T
125、B 總內存(32 插槽/64 GB/4400 MHz)。英特爾并不控制或審計第三方數據。請您審查該內容,咨詢其他來源,并確認提及數據是否準確。實際性能受使用情況、配置和其他因素的差異影響。更多信息請見 www.I 英特爾 至強 處理器平臺圖 38.英特爾 至強 6 處理器可滿足不同場景的需求英特爾 至強 6 處理器家族 引入強大的計算平臺,性能和能效表現雙優,對滿足現代數據中心不斷變化的需求至關重要。從支持計算密集型 AI 到賦能可擴展云原生微服務,該處理器家族均可靈活滿足不同的運營需求。憑借更多的內核、靈活的微架構、更大的內存帶寬和出色的輸入/輸出(I/O),英特爾 至強 6 處理器家族讓多
126、種工作負載的性能和能效表現再創新高。其全新功能和內置加速 器為目標工作負載帶來進一步助力,實現了更高的性能和能效。為實現更高的靈活性,英特爾 至強 6 處理器提供了兩種不同的 CPU 微架構版本,分別為性能核(P-core)和能效核(E-core)。這兩個版本采用了兼容的 x86 指令集架構(ISA)和通用的硬件平臺,包括 CPU 插槽類型。英特爾同時還與行業合作伙伴緊密合作,確保兩個版本能夠支持常見的操作系統、編譯器、庫和框架。借助這一共享軟件棧和全球硬件與軟件供應商生態系統,用戶將能夠根據自身的獨特需求選擇適合的解決方案。英特爾 至強 6 處理器滿足多樣化性能和效率要求的處理器P 核 性能
127、核E 核 能效核兼顧密集型通用計算和 AI 加速提供出色的核心密度和每瓦性能 借助行業領先的性能核,實現 AI 加速 能力躍升以共享硬件平臺和通用軟件堆棧簡化 開發、部署和管理以全新能效核更大限度提升機架密度,強化可持續性與廣泛的硬件和軟件供應商生態系統 相匹配,滿足復雜多樣的業務需求更多信息請訪問:https:/ 39.第五代英特爾 至強 可擴展處理器具備更強大性能第五代英特爾 至強 可擴展處理器擁有更可靠的性能,更出色的能效。它在運行各種工作負載時均可實現顯著的每瓦性能增益,在 AI、數據中心、網絡和科學計算的性能和總體擁有成本(TCO)方面亦有更出色的表現。相較上一代產品,第五代英特爾
128、至強 可擴展處理器可在相同功耗范圍內提供更高的算力和更快的內存。此外,它與上一代產品的軟件和平臺兼容,因此部署新系統時可大大減少測試和驗證工作。第四代英特爾 至強 可擴展處理器通過創新架構增加了每個時鐘周期的指令,每個插槽多達 60 個核心,支持 8 通道 DDR5 內存,有效提升了內存帶寬與速度,并通過 PCIe 5.0(80 個通道)實現了更高的 PCIe 帶寬提升。第四代英特爾 至強 可擴展處理器提供了出色性能和安全性,可根據用戶的業務需求進行擴展。借助內置的加速器,用戶可以在 AI、分析、云和微服務、網絡、數據庫、存儲等類型的工作負載中獲得優化的性能。第五代英特爾 至強 可擴展處理器第
129、四代英特爾 至強 可擴展處理器 30 詳情請見以下網址的 G11: 至強 可擴展處理器)。結果可能不同。31,32 詳情請見以下網址的 G1,A16: 至強 可擴展處理器)。結果可能不同。33 基于英特爾 2023 年 12 月進行的內部建模。詳情請見以下網址的 A1,A2,A16: 至強 可擴展處理器)。結果可能不同。多達 64 個內核(每個處理器)英特爾 AMX更高的 AMX 頻率,全新許可水平每個內核均內置 AI 加速器集成 IP 加速器英特爾 數據保護與壓縮加速技術(英特爾 QAT)英特爾 存內分析加速器(英特爾 IAA)英特爾 數據流加速器(英特爾 DSA)英特爾 動態負載均衡器(英
130、特爾 DLB)更高的能效內置加速器提供高效計算/更高的每瓦性能經優化的電源模式 2.0/針對工作負載優化的 SKU無縫固件升級縮短停機時間更全面的機密計算產品組合英特爾 SGX英特爾 TDX英特爾 Trust Authority 更高內存帶寬:高達 5,600 MT/s 更大三級緩存(LLC):高達 3 倍30(PCIe 5)UPI 2.0 速度:高達 20 GT/sCompute Express Link(CXL)1.1*Type 3 內存支持無需更改代碼即可直接兼容第四代英特爾 至強 可擴展處理器與第四代至強 相比平均性能提升3121%與第四代至強 相比,AI 推理性能提升32 42%運行
131、參數量在 200 億以下的 LLM 時,詞元處理時延低于33100ms更多信息請訪問:https:/ 40.第四代英特爾 至強 可擴展處理器為數據中心提供多種優勢34,35 如欲了解更多詳情,請訪問:https:/ Express Link(CXL)1.1 8 通道 DDR5傳輸速率高達 4,800 MT/s(1DPC)傳輸速率高達 4,400 MT/s(2DPC)每路 16 個 DIMM全新 RAS 功能(增強型ECC、ECS)高帶寬內存(HBM)(64GB/每路)經優化的電源模式80 條 PCIe 5.0 通道支持 1 至 8 路配置英特爾 UPI 2.0(高達 16 GT/s)更高的單核
132、性能每路多達 60 個內核英特爾 高級矩陣擴展(英特爾 AMX)英特爾 數據保護與壓縮加速技術(英特爾 QAT)創新、設計和交付均堅持工作負載優先CPU 內置多種加速器更出色的性能與能效,更好滿足客戶所需更全面的機密計算產品組合英特爾 存內分析加速器(英特爾 IAA)英特爾 安全引擎英特爾 SGX英特爾 TDX英特爾 數據流加速器(英特爾 DSA)面向 vRAN 的英特爾 高級矢量擴展英特爾 動態負載均衡器(英特爾 DLB)英特爾 至強 CPU Max 系列(配備 HBM)高達1.53 倍平均性能增益34(與上一代產品比較)高達10 倍PyTorch 實時推理和訓練性能提升35啟動英特爾 AM
133、X(BF16)時與上一代產品(FP32)的比較結果4.2 英特爾 至強 處理器平臺集成的指令集與加速器英特爾 至強 可擴展處理器內置了英特爾 AMX、英特爾 IAA 等加速器,以及英特爾 AVX-512 指令集,使其在數據庫應用中有更佳的性能表現。更多信息請訪問:https:/ AVX-512 指令集在向量數據庫等場景,并行計算能力成為數據庫性能的重要瓶頸。作為一種單指令多數據(Single Instruction Multiple Data,SIMD)指令集,英特爾 AVX-512 在密集型計算負載中有著得天獨厚的優勢。得益于其 512 位的寄存器寬度和兩個 512 位的融合乘加(Fused
134、 Multiply Add,FMA)單元,指令集能并行地執行 32 次雙精度、64 次單精度浮點運算,或操作 8 個 64 位和 16 個 32 位整數。圖 41.英特爾 AVX-512 指令集具備 512 位寄存器英特爾 高級矩陣擴展(英特爾 AMX)在向量數據庫等場景,常會涉及到向量檢索、海量特征匹配等操作,對于性能有著較高的要求。AMX 技術引入了一種用于矩陣處理的新框架(包括了兩個新的組件,一個二維寄存器文件,其中包含稱為“tile”的寄存器,以及一組能在這些 tile 上操作的加速器),從而能高效地處理各類 AI 任務所需的大量矩陣乘法運算,提升其在訓練和推理時的工作效能。例如在向量
135、檢索的過程中,如存在 n 個 batch 任務,進行相似度計算時就需要對 n 個輸入向量 x 和 n 個數據庫中向量 y 進行比對,這其中的距離計算會產生大量的矩陣乘法,而英特爾 AMX 能針對這一場景實現有效加速。圖 42.英特爾 AMX 架構由 2D 寄存器文件(TILE)和 TMUL 組成更多信息請訪問:https:/ 存內分析加速器(英特爾 IAA)在數據庫應用中,常需要對海量數據進行壓縮存儲,從而減少存儲數據所需的空間,降低相應的成本投入。這一過程會帶來較高的性能開銷,英特爾 IAA 則有助于提升數據壓縮率,同時降低性能開銷。英特爾 IAA 是一款硬件加速器,結合分析原始函數,能夠提
136、供出色的吞吐量壓縮和解壓縮性能。英特爾 IAA 主要針對大數據和內存分析數據庫等應用程序,以及內存頁壓縮等應用程序透明用途,能夠在分析查詢處理期間過濾數據。英特爾 IAA 支持零壓縮等輕量級壓縮方案以及霍夫曼編碼和 Deflate 等較重的壓縮算法。對于 Deflate 格式,它支持對壓縮流進行索引,以實現高效的隨機訪問。第五代英特爾 至強 可擴展處理器同樣集成了英特爾 IAA 加速器,能夠提供出色的數據吞吐壓縮和解壓縮性能。圖 43.英特爾 IAA 加速流程Source1Decompress BypassSQL Filter BypassDecompress OutputDecompress
137、 Config/StateSQL Filter Main InputFilter Optional Second InputAnalytics EngineSQL Filter OutputAnalytics Engine OutputCompress Config/StateDEFLATE DecompressorSQL Filter FunctionsDEFLATE CompressorSource2更多信息請訪問:https:/ 軟件防護擴展(英特爾 SGX)英特爾 SGX 能夠幫助用戶構建基于硬件的數據中心可信執行環境(TEE),通過將特權代碼排除在受信任的范圍之外,英特爾 SGX 能
138、夠更有效地抵御多種類型的攻擊。它可顯著加強數據安全,滿足對于機密計算的廣泛需求。英特爾 SGX 提供了一種基于硬件的內存加密機制,將內存中的特定應用代碼和數據隔離開來。英特爾 SGX 允許為用戶級代碼分配專用內存區域(Encalve,飛地),以免受到擁有更高權限的進程的影響。除了有助于防御基于軟件的攻擊外,英特爾 SGX 的驗證機制還能夠幫助用戶確保應用程序所在的飛地是一個真正的英特爾 SGX 環境,沒有受到相關攻擊,且處理器安裝了最新的安全更新。圖 45.英特爾 SGX 工作原理應用 硬件 應用 操作系統 虛擬機管理器 飛地 X X 英特爾 SGX 英特爾 動態負載均衡器(英特爾 DLB)英
139、特爾 DLB 是一個硬件隊列管理器和負載平衡器,開發人員能通過它獲得硬件輔助隊列,幫助實現每秒數百萬個傳入請求的負載均衡。在多核英特爾 至強 可擴展處理器上處理網絡數據時,英特爾 DLB 有助于提高系統性能,它實現了在多個 CPU 內核/線程上高效地分配網絡處理,并根據系統負載的變化而動態地在多個 CPU 內核上分配網絡數據以進行處理。同時,英特爾 DLB 能夠還原在多個 CPU 內核上同時處理網絡數據包的順序。圖 44.英特爾 DLB 在硬件中支持隊列管理隊列管理:采用英特爾 DLB 前、后生產者生產者入隊邏輯出隊邏輯/負載均衡器入隊軟件出隊軟件消費者出隊軟件消費者出隊軟件消費者消費者消費者
140、消費者生產者生產者入隊軟件頭指針和尾指針軟件隊列管理(不采用英特爾 DLB)軟件隊列管理(采用英特爾 DLB)頭指針和尾指針內存中的隊列更多信息請訪問:https:/ 信任域擴展(英特爾 TDX)英特爾 數據保護與壓縮技術(英特爾 QAT)借助英特爾 虛擬機擴展(Intel Virtual Machine Extension,英特爾 VMX)技術與英特爾 多密鑰全內存加密(Intel Multi-Key Total Memory Encryption,英特爾 MK-TME)技術,英特爾 TDX 為云實例提供了一種被稱為“信任域(Trust Domain,TD)”的全新虛擬訪客環境。TD 可與其
141、它 TD、實例,以及底層系統軟件、管理軟件實現相互隔離。而這些安全策略的實施,是由運行在安全仲裁模式(Secure-Arbitration Mode,SEAM)下的 TDX 安全服務模塊來完成。英特爾 QAT 是英特爾 至強 可擴展處理器上集成的工作負載加速功能,專為提高計算密集型流程的性能和效率而打造,面向 AI、分析、應用程序和內容交付、高速網絡等工作負載。隨著數據集持續呈指數級增長,這些高級用例需要更多的資源和更高的性能。這類要求苛刻的工作負載增加了對數據壓縮和解壓縮、加密密碼以及公鑰加密的需求,以便為各項操作提供支持并保護使用中數據、動態和靜態數據的完整性。雖然壓縮和加密使處理大型文件
142、和高級應用成為可能,但啟用過程本身會消耗大量計算資源。英特爾 QAT 可從 CPU 內核分載這些計算密集型操作,使 CPU 能夠更高效地執行其他任務,從而提高整體系統性能、效率和能力。英特爾 QAT 可提高工作負載性能,以滿足當今數據密集型和網絡相關工作負載的需求,幫助系統以更低的數據占用空間和更高的性能為更多客戶提供服務。英特爾 QAT 可以顯著加速數據壓縮以及對稱和非對稱數據加密和解密。圖 46.英特爾 TDX 技術更多信息請訪問:https:/ 數據流加速器(英特爾 DSA)英特爾 DSA 是一款用于復制和轉換數據的高性能加速器,旨在優化高性能存儲、網絡、持久內存和各種數據處理應用中常見
143、的流數據移動和轉換操作,為數據移動和轉換操作提供更高的整體系統性能,同時為更高級別的功能釋放 CPU 周期。英特爾 DSA 不僅提高了每瓦特性能,幫助企業實現可持續目標,還使企業能夠優化工作負載,在性能相同的情況下需要更少的服務器,從而有助于顯著降低總擁有成本。英特爾 至強 可擴展處理器結合英特爾 oneAPI DPC+/C+編譯器、英特爾 Open Analytic Toolkit 等英特爾軟件工具,能夠進一步提升數據庫性能。4.3 基于英特爾 架構的軟件工具英特爾 oneAPI DPC+/C+編譯器英特爾 oneAPI Toolkit 是基于新一代標準的英特爾 軟件開發工具,用于跨各種架構
144、構建和部署以數據為中心的高性能應用程序。它能夠通過充分利用一流的硬件特性加速計算進程,并全面兼容現有的編程模型和代碼庫,可確保開發者已經編寫的應用能夠在 oneAPI 上無縫運行。此外,開發者只需一個代碼庫,便可以將應用輕松遷移到新系統和加速器上,大幅縮短了遷移時間,減輕了遷移工作量。英特爾 oneAPI DPC+/C+編譯器適用于并行編程(parallel programming)程序,提供跨 CPU 和加速器的生產力和性能。利用該編譯器,團隊可以結合鏈接時優化(LTO)和配置文件引導優化(PGO)的方法,幫助用戶構建高性能數據庫。更多信息請訪問:https:/ 47.英特爾 oneAPI
145、DPC+/C+編譯器英特爾 Open Analytic Toolkit英特爾 FMAL 加速庫英特爾 Open Analytic Toolkit 是利用英特爾 硬件、高級硬件特性(如 AVX512 和 QAT 等)和軟件技術(如 JIT 編譯器、IPDK、SPDK 等)創建的一套開源、高性能和可擴展的工具和庫以及參考解決方案,使開發人員能夠在英特爾 平臺上快速創建高性能的數據處理與分析方案。作為分析框架和數據的工具包,英特爾 Open Analytic Toolkit 主要具備以下特性:高性能:充分使用了英特爾硬件特性,例如 AVX 向量化指令,QAT 技術等。開源:通過致力于建設開放和透明的
146、社區持續推動 Open Analytic Toolkit 發展。易于集成:提供組件級別的 API,易于集成和調試,對代碼侵入不大。在工具包中還包含了基于 PGSQL 的集成參考方案,為使用者提供了完整的參考實現,便于進行二次開發和性能對比。在海量向量數據處理時,暴力搜索有著非常多的使用,但這一場景對算力需求非常高,因此性能優化極為必要。作為針對向量暴力搜索場景開發的算法庫,英特爾 FMAL 在英特爾 AVX-512 和英特爾 AMX 的加持下,能對相似度計算進行加速并提供了相似度計算和 top-K 查詢的 API 接口。值得一提的是,英特爾 FMAL 能與英特爾 AMX 結合,對 INT8 數
147、據類型的性能實現進一步優化。同時,英特爾 FMAL 還能在多線程并發下對處理器資源進行合理地調配,以便讓用戶充分挖掘最新處理器所具備的多核心優勢。除此之外,加速庫也提供了對內存的非一致內存訪問架構(Non Uniform Memory Access,NUMA)優化和緩存數據對齊功能。54英特爾 VTune Amplifier英特爾 VTune 可視化性能分析(英特爾 VTune Amplifier)是一個通過圖形用戶界面,分析和優化程序性能的工具,且無需重新編譯。其能夠準確剖析 C、C+、Fortran、Python、Go、Java 或各種編碼語言組合;提供各種數據來優化處理器、內存和存儲;通
148、過提供快速解答,采用多元化的分析將數據轉化為洞察力,同時縮短優化代碼所需的時間。英特爾 VTune 可視化性能分析工具也可以在程序運行的系統平臺上自動收集性能數據,并將所獲得的性能數據在各個不同的層次,大到系統層,小到程序源代碼級,甚至可以到處理器指令集,進行不同粒度的交互式可視化,幫助查找可能的性能瓶頸,并提供可能的解決方案。其提供了以下能力:性能分析:可以對應用程序進行深入的性能分析,幫助用戶了解應用程序在不同的硬件和軟件環境下的運行情況。熱點檢測:可以識別出程序中的熱點部分,指導開發者進行優化。性能瓶頸分析:通過分析 CPU、內存、IO 等各個方面的性能,幫助確定應用程序的性能瓶頸。多線
149、程分析:對于多線程應用程序,能夠分析線程的運行狀況,包括線程的同步、競爭和死鎖等問題。圖 48.英特爾 VTune 可視化性能分析更多信息請訪問:https:/ Virtual RAID on CPU(英特爾 VROC)英特爾 VROC 是一款為 NVMe 固態盤設計的企業級 RAID 解決方案,能夠帶來出色的可靠性,同時全面釋放 NVMe 固態盤的卓越性能。這一優勢主要得益于英特爾 至強 可擴展處理器中的一項新特性。該特性名為英特爾 卷管理設備(英特爾 VMD),是一個位于 CPU PCIe 根聯合體內的集成控制器。由于 NVMe 固態盤直接與 CPU 相連,企業將能夠全面實現更低時延與更高
150、帶寬的潛在性能優勢。同時,由于英特爾 VMD 的存在,英特爾 VROC 省去了在固態盤和 CPU 之間部署 RAID 主機總線適配器(HBA)的成本和功耗。英特爾 VROC 不僅支持高性能 NVMe 固態盤 RAID 陣列,同時也支持傳統的 SATA 盤 RAID 陣列;不僅支持應用數據的 RAID 保護,同時也支持系統啟動盤的 RAID 保護,可以有效地解決企業用戶對高性能數據存儲和系統啟動盤數據冗余保護的雙重需求。如下圖所示,英特爾 VROC NVMe RAID 支持 NVMe 固態盤直連 CPU 上的 VMD 控制器,并且可以支持跨 VMD 控制器靈活組建 RAID 陣列,滿足不同業務場景對存儲容量和性能的不同需求。英特爾 VROC NVMe RAID 同時支持 NVMe 固態盤直連 PCH 上的 VMD 控制器,支持 NVMe RAID1 啟動盤。英特爾 VROC SATA RAID 支持 SATA 盤直連 PCH 上 SATA 控制器,提供啟動盤和數據盤 RAID 支持。與傳統方案相比,英特爾 VROC NVMe RAID 在節省硬件支出、消除相關故障點的同時,更能充分釋放 NVMe 存儲的性能。圖 49.英特爾 VROC 可節省部署 RAID HBA 的成本和功耗更多信息請訪問:https:/ www.I