高性能、云原生湖倉體存儲架構探秘.pdf

報告預覽

高性能、云原生湖倉體存儲架構探秘.pdf

編號：121870

PDF 22頁 4.74MB 下載積分：VIP專享

下載報告請您先登錄！

高性能、云原生湖倉體存儲架構探秘.pdf

1、高性能、云原生湖倉一體存儲架構探秘?Juicedata?2023目錄湖倉一體存儲架構的演進不同類型存儲系統比較探索湖倉一體架構未來的存儲選型湖倉一體架構在 JuiceFS 上的實踐01湖倉一體存儲架構的演進大數據存儲系統的演進HDFS?云原、性能存儲系統機房時代云計算時代HDFS 起源于 GFS（Google File System），2006 年正式發布獨元數據存儲（NameNode），樹形結構元數據多副本數據存儲（DataNode）數據分塊存儲（Block），不可修改存算耦合架構（HDFS+YARN）適合存儲件，2 億左右的件數對象存儲 S3 于 2006 年發布以存儲海量結構化數

2、據為標能撐萬億級件數，件均適合低廉的存儲成本（持 EC），可靠的數據持久性（11 個 9）基于 HTTP 協議的 RESTful API KV 結構的元數據設計數據不持修改最終致性02不同類型存儲系統比較HDFS vs.對象存儲HDFS對象存儲存儲規模（單 namespace）億級萬億級致性強致性部分強致性容量管理動彈性原重命名持不持List 性能低隨機寫不持不持緩存加速不持不持運維復雜度低HDFS API 兼容性-部分兼容Hadoop 態權限管理兼容性-不兼容POSIX 兼容性不持部分兼容（需第三組件）HDFS 的阿喀琉斯之踵NameNode 單命名空間下的 NameNo

3、de存儲瓶頸聯邦架構 1.0：ViewFs+多集群聯邦架構 2.0：Router-based Federation（RBF）https:/hadoop.apache.org/docs/stable/hadoop-project-dist/hadoop-hdfs-rbf/HDFSRouterFederation.htmlHDFS 的阿喀琉斯之踵NameNode NameNode 的單點問題可架構：Quorum Journal Manager（QJM）https:/ 元數據操作的性能以及致性問題如何實現重命名？mv/foo/bar對象存儲的阿喀琉斯之踵元數據步驟 1：遞歸拷數據步驟 2：

4、更新索引步驟 3：刪除原路徑中的數據致性如何保證？對象存儲元數據性能及 API 限制 List 性能差：Hudi Metadata Table API QPS 限制：Iceberg ObjectStorageLocationProvider件數對象存儲 List P50 延遲10050ms1K131ms10K1062ms100K9932mshttps:/hudi.apache.org/docs/metadatahttps:/iceberg.incubator.apache.org/docs/latest/aws/#object-store-file-layout03探索湖倉一體架構未來的存

5、儲選型目標擴展性好可性能彈性伸縮存算分離海量件管理云原多種類型 API技術關鍵點擴展性好可數據可靠性能彈性伸縮存算分離海量件管理云原多種類型 API 不存在擴展瓶頸不存在單點，動故障切換冗余機制保證數據可靠性針對件系統設計的獨元數據數據存儲組件容易橫向伸縮緩存加速，分布式緩存，緩存親和性元數據存儲結構優化充分利云上資源針對不同 API 實現不同客戶端JuiceFS 強致性分布式件系統插件式元數據引擎使對象存儲作為數據存儲元數據引擎可橫向擴展件友好的元數據設計本地多級緩存多種類型客戶端完全兼容 POSIX 完全兼容 HDFS API

6、04湖倉一體架構在 JuiceFS 上的實踐湖倉一體架構元數據性能比較使 Hadoop 中專于壓測件系統元數據性能的組件 NNBench，將其單線程測試測試任務改成多線程，便于增加并發壓。使 3 臺阿云 4 核 16G 的虛擬機，CDH 5，HDFS 2.6 作為測試環境。HDFS 使 3 個 JournalNode 的可配置，使內 IP。OSS 使內接訪問。數據查詢性能比較左圖：使阿云 3 臺計算節點 4 核 CPU、16G 內存、200G x 2 硬盤，使 100GB TPC-DS 數據集，通過 Spark SQL 進基準測試。右圖：使阿云 5 臺計算節點 8 核 CPU、32G 內存、5500G x 4 硬盤，PrestoSQL 334，使 1TB TPC-DS 數據集。以上測試中 JuiceFS 啟了緩存，并使數據充分預熱。感謝您的觀看https:/

友情提示

1、下載報告失敗解決辦法
2、PDF文件下載后，可能會被瀏覽器默認打開，此種情況可以點擊瀏覽器菜單，保存網頁到桌面，就可以正常下載了。
3、本站不支持迅雷下載，請使用電腦自帶的IE瀏覽器，或者360瀏覽器、谷歌瀏覽器下載即可。
4、本站報告下載后的文檔和圖紙-無水印,預覽文檔經過壓縮，下載后原文更清晰。

本文（高性能、云原生湖倉體存儲架構探秘.pdf）為本站（2200）主動上傳，三個皮匠報告文庫僅提供信息存儲空間，僅對用戶上傳內容的表現方式做保護處理，對上載內容本身不做任何修改或編輯。若此文所含內容侵犯了您的版權或隱私，請立即通知三個皮匠報告文庫（點擊聯系客服），我們立即給予刪除！

溫馨提示：如果因為網速或其他原因下載失敗請重新下載，重復下載不扣分。

相關報告

聯系我們

0731-84720580
sgpjbg002
工作日 9:30 - 18:00

關于我們

侵權處理

關于我們

出版物經營許可證
工信部備案號：湘ICP備17000430號-2
公安備案號：湘公網安備43010402001071號

三個皮匠報告專業的行業報告下載站，每日更新，歡迎大家關注！

copyright@2008-2013 長沙景略智創信息技術有限公司版權所有
網站備案/許可證號：湘B2-20190120

客服

小程序

服務號

折疊

午夜网日韩中文字幕,日韩Av中文字幕久久,亚洲中文字幕在线一区二区,最新中文字幕在线视频网站