《專場11.2-可計算存儲在數據庫應用場景的實踐-梅慶.pdf》由會員分享,可在線閱讀,更多相關《專場11.2-可計算存儲在數據庫應用場景的實踐-梅慶.pdf(19頁珍藏版)》請在三個皮匠報告上搜索。
1、可計算存儲在數據庫應用場景的實踐ScaleFlux 解決方案梅慶 數據存儲產能增長跟不上數據的增長速度,數據存儲成本在增加。單機 CPU 算力跟不上數據存儲的增長速度,計算向專有設備轉移??捎嬎愦鎯φQ生背景異構計算GPU/TPU智能加速互聯網絡SmartNICs/DPU網絡帶寬能力顯著增加10 100-400Gb/s閃存Accelerated SSD存儲性能和容量激增 2018年SNIA(存儲和網絡工業協會)成立了可計算存儲工作組,ScaleFlux為創始成員之一 該組織主要致力于可計算存儲標準及編程模型的規范定義。ScaleFlux:創立于 2014 年,從事可計算存儲的研究和生產銷售,是大
2、規模部署可計算存儲的領導者??捎嬎愦鎯ぷ鹘M 基于標準企業級NVMe SSD,內置計算加速引擎,在盤內實現數據加速處理的新型企業級NVMe SSDScaleFlux 的可計算存儲產品 SFX3000計算加速引擎企業級NVMe SSDThe Better SSD行業標準形態典型企業級特性標準NVMe驅動掉電保護端到端的數據保護IO原子寫硬件壓縮/解壓縮加解密可計算存儲設備Computational Storage Device,CSDSFX3000:企業級NVMe SSD掉電保護熱插拔熱插拔S.M.A.R.TLDPC糾錯NAND Die RAID在線固件升級TRIMMulti NSMulti S
3、tream透明壓縮透明壓縮/解壓縮解壓縮透明加密/解密SR IOV雙端口LinuxWindowsVMware ESXIPCIe 4.0 x4PCIe 4.0 x4NVMe NVMe 標準驅動標準驅動運維工具NVMe MI 1.4原子寫U.2U.2E1.xAIC 支持Linux/Windows/Vmware Gen4Gen4 產品,熱插拔,支持 U.2 接口 標準 NVMe 協議,支持 S.M.A.R.T 支持透明壓縮透明壓縮、加密、原子寫 支持 Multi NS、Multi StreamSFX 3000CSD 透明壓縮提升SSD讀寫性能原理 CSD 透明壓縮在SSD內部 ASIC 里,實時壓縮
4、。壓縮算法:zlib(level 6)。透明壓縮降低后端閃存(NAND)帶寬利用率。SSD 讀寫延時主要由后端 NAND 帶寬利用率決定(正比關系)。50%0%25%75%100%讀寫延時(await)NAND帶寬利用率應用/dev/nvme0n1Linux Block 層標準 NVMe 驅動PCIe Gen4 X4 接口前端:PCIe FE其他模塊收/發壓縮/解壓縮加密/解密SRAMDRAMARM CPU,CCS閃存(NAND)后端:閃存控制器OS硬件應用前端 PCIe 帶寬后端 NAND 帶寬CSD透明壓縮抑制SSD寫放大FreeFreeFreeFreeFreeFreeFreeFreeFr
5、eeFreeFreeFreeBlock YFreeFreeFreeFreeFreeFreeFreeFreeFreeFreeFreeFreeBlock XFreeFreeFreeFreeFreeFreeFreeFreeFreeFreeFreeFreeBlock YFreeFreeFreeFreeFreeFreeFreeFreeFreeFreeFreeFreeBlock XABCDFreeFreeFreeFreeFreeFreeFreeFreeFreeFreeFreeFreeBlock XFreeFreeFreeFreeFreeFreeFreeFreeFreeFreeFreeFreeBlock Y
6、EFGHABCDFreeFreeFreeFreeFreeFreeFreeFreeFreeFreeFreeFreeBlock YFreeFreeFreeFreeFreeFreeFreeFreeFreeFreeFreeFreeBlock XABCDEFGHABCDABCDFreeFreeFreeFreeFreeFreeFreeFreeFreeFreeFreeFreeBlock YFreeFreeFreeFreeFreeFreeFreeFreeFreeFreeFreeFreeBlock XABCDEFGHABCDABCDEFGHABCDIjKFreeFreeFreeFreeFreeFreeFreeF
7、reeFreeFreeFreeFreeBlock YFreeFreeFreeFreeFreeFreeFreeFreeFreeFreeFreeFreeBlock XABCDEFGH 透明壓縮降低數據占用的 NAND 容量。透明壓縮降低 GC帶來的數據搬遷,抑制寫放大。ABCD初始化狀態寫新數據異地更新GC寫新數據CSD 寫新數據擦除透明壓縮對SSD功能的促進作用1602202293494155105786787063.6 2.5 2.1 1.4 1.2 1.0 0.8 0.6 0.5 1.27 1.81 2.16 3.28 3.81 4.66 5.50 7.13 9.78 01002003004
8、005006007008000.02.04.06.08.010.012.011.071.121.261.351.451.571.822.29kIOPS寫放大(WAF)&DWPDFIO數據壓縮比CSD 3000 系列 3.84TB 數據壓縮比、寫放大與性能關系KIOPSWAFDWPD(5 Year)當數據的壓縮比增加時,CSD 指標 寫放大(WAFWAF)下降下降 壽命(DWPDDWPD)增加增加 隨機讀寫性能隨機讀寫性能 增加增加CSD透明壓縮提升順序/隨機讀寫性能0100020003000400050006000700080003.84TB7.68TB3.84TB7.68TB順序讀帶寬(Mi
9、B/s)順序寫帶寬(MiB/s)順序讀寫吞吐(MiB/S)物理可用容量 and IO PATTERNCSD 3000 3.84TB&7.68TB vs 友商 NVMe SSD 順序讀寫對比越高越好020040060080010001200140016003.84TB7.68TB3.84TB7.68TB隨機讀(4KiB)kIOPS隨機寫(4KiB)kIOPS隨機讀寫kIOPS物理可用容量 and IO PATTERNCSD 3000 3.84TB&7.68TB vs 友商 NVMe SSD 隨機讀寫對比越高越好 CSD 優勢 順序讀寫最大帶寬更高 隨機寫和混合讀寫IOPS更高 隨機寫延時更低、穩
10、定注:紫色背景的是 SFX3000,數據壓縮比 2.0.CSD透明壓縮提升混合讀寫性能 CSD 隨機讀寫混合的性能高于 SSD 標盤。SSD 隨機讀寫混合隨機讀寫混合的性能會隨著寫比例寫比例的增加而下降,CSD 下降速度要低于 SSD 標盤。1.00.60.50.50.50.50.50.50.40.40.31.00.90.80.80.80.70.70.70.60.60.60.00.20.40.60.81.01.201020304050607080901004KiB 混合讀寫跟純讀 IOPS 比值寫請求在混合讀寫中比例(%)4KiB混合讀寫跟純讀IOPS比值隨寫請求比例變化關系nvme0n1(s
11、sd標盤)nvme1n1(csd3000)02004006008001,0001,2001,40001020304050607080901004KiB 混合讀寫 IOPS(K)Write 在混合讀寫中比例(%)4KiB混合讀寫IOPS(K)跟寫請求比例關系nvme0n1(ssd標盤)nvme1n1(csd3000)CSD 在數據庫場景價值更低延遲3倍 QPS2倍存儲容量/單價更低延遲1.62倍 QPS2倍存儲容量/單價更低延遲2倍存儲容量/單價3-8倍耐久性1.22倍 TPSCSD透明壓縮降低數據庫實際存儲成本111.631.752.332.741.591.753.553.5700.511.5
12、22.533.54500GiB1500GiB數據壓縮比Sysbench 數據集規模壓縮方案效率對比MySQL 無壓縮MySQL 頁壓縮LZ4MySQL 頁壓縮ZLIBMySQL 表壓縮SFX 3000 透明壓縮82821005091200356767521120025761605001000150020002500500GiB1500GiB磁盤空間占用大小(GiB)Sysbench 數據集規模MySQL 物理空間占用(GiB)對比MySQL 無壓縮MySQL 頁壓縮LZ4MySQL 頁壓縮ZLIBMySQL 表壓縮SFX 3000 透明壓縮越低越好越高越好 CSD 透明壓縮效率高于MySQL的
13、壓縮降本方案。高壓縮比的好處是 CSD可以擴容降成本。CSD透明壓縮提升MySQL讀寫性能0%100%200%300%400%500%600%700%800%148163264128148163264128148163264128oltp_read_onlyoltp_write_onlyoltp_read_write1500GiB數據集-友商 TLC 3.84TB Gen4 vs CSD 3000 3.84TB TLC Gen4 壓縮方案-3.0 compress ratio-QPS(%)1500G_nocompress_dw_友商i5510_4T-QPS1500G_page_lz4_dw_友
14、商i5510_4T-QPS1500G_transparent_dw_tlc_4T-QPS1500G_transparent_nodw_atw_tlc_4T-QPSSSD標盤+MySQL(lz4 壓縮,開雙寫)SFX3000+MySQL(不開壓縮,開雙寫)SFX3000(原子寫)+MySQL(不開壓縮,關雙寫)只讀場景純寫場景讀寫混合 CSD 透明壓縮下 OLTP 的性能高于 MySQL 不開壓縮和開壓縮下的性能。使用SFX3000 原子寫代替 MySQL的雙寫緩沖(Double-Write Buffer)方案,可以極大提升OLTP的寫性能。SSD標盤+MySQL(不開壓縮,開雙寫)CSD 透明
15、壓縮降低PG空間成本和提升PG性能物理容量(TiB)讀寫性能QPS(K)壓縮比SSD(FF100)1.2028.41.00SSD(FF75)1.6034.71.00CSD(FF100)0.3267.73.91CSD(FF75)0.3389.74.58CSD(FF100),67.70CSD(FF75),89.70SSD(FF100),28.40SSD(FF75),34.7001020304050607080901000.320.331.201.60QPS(K)Size(TiB)PostgreSQL(FF100 VS FF75)READ-WRITE on SSD&CSD CSD 透明壓縮可以降低
16、PostgreSQL 的數據存儲成本 并提升 OLTP 讀寫性能。降低 PostgreSQL的填充因子(FillFactorFillFactor,簡稱FF,默認100),可以實現提升寫性能的同時還不浪費存儲空間。CSD 透明壓縮提升PG讀寫性能0.0%50.0%100.0%150.0%200.0%250.0%1816326412818163264128181632641281816326412818163264128oltp_point_selectoltp_read_onlyoltp_update_non_indexoltp_write_onlyoltp_read_writepercenta
17、gepostgresql sysbench QPS improvement ratioqps baseline(SSD&ff100)qps ratio(CSD3000&ff100)qps ratio(CSD3000&ff75)SSD標盤,基線數據SFX3000,性能增量數據SFX3000+PG(FF=75),性能增量數據只讀場景更新場景純寫場景讀寫混合 CSD 透明壓縮可以降低 PostgreSQL 的數據存儲成本 并提升 OLTP 讀寫性能。降低 PostgreSQL的填充因子(FillFactorFillFactor),可以實現提升寫性能的同時還不浪費存儲空間。點查場景總結享受更長的壽命享受更低的存儲TCO享受更高的性能可計算存儲可計算存儲是企業數據庫降本增效降本增效的強有力方案。歡迎掃碼,入群交流歡迎掃碼,入群交流