1-4 字節跳動基于 Doris 的數據湖倉探索.pdf

編號:102450 PDF 26頁 1.09MB 下載積分:VIP專享
下載報告請您先登錄!

1-4 字節跳動基于 Doris 的數據湖倉探索.pdf

1、字節基于DORIS的數據湖倉探索杜軍令 字節跳動數據平臺大數據工程師01當前的湖倉一體實踐03基于基于Doris的解決方案的解決方案02存在的問題與挑戰存在的問題與挑戰04未來規劃未來規劃目錄目錄CONTENT字節當前的湖倉一體實踐01當前的湖倉實踐業務線較多,實踐的數據模型也比較多純數據倉庫Lambda,Kappa架構湖上建倉當前的湖倉實踐典型Lambda架構兩套代碼,兩套架構當前的湖倉實踐典型Lambda架構歷史數據回溯問題數據服務對接困難批量計算較弱當前的湖倉實踐湖上建倉分鐘級數據延遲數據服務能力弱存在的問題與挑戰02存在的問題與挑戰n 無法支撐高并發查詢HiveSparkPrestoH

2、DFS/對象存儲并發能力不足,無法支撐高QPS查詢單點瓶頸,無法隨機負載橫向擴充數據應用存在的問題與挑戰n 數據延遲較高LakeHouse分鐘級數據可見無法查詢實時指標無法實時風控存在的問題與挑戰n 多維分析性能不足數據模型固定,需要預定義聚合維度查詢模式固定,非預定義維度查詢性能較差存在的問題與挑戰n 技術棧復雜運維困難技術棧復雜,人力成本較高運維困難數據割裂,在多個系統間ETL基于Doris的解決方案03字節的解決方案n 使用Doris作為數據服務層n 打通Doris與數據湖Hudin 打通Doris與HiveMetaStore(與社區共同進行中)Hudi字節的解決方案n 使用Doris作

3、為數據服務層p 打通Doris與數據湖存儲p 打通Doris與HiveMetaStoreu Doris支持高并發數據查詢u 支持橫向擴展,性能不足時擴充FE與BEu 支持亞秒級數據時延,數據秒級可見u 支持靈活維度分析字節的解決方案n 使用Doris作為數據服務層p 打通Doris與數據湖存儲p 打通Doris與HiveMetaStore字節的解決方案p 使用Doris作為數據服務層n 打通Doris與數據湖存儲p 打通Doris與HiveMetaStore支持創建Hudi表支持指定全部或部分Schema創建Hudi外表支持不指定Schema創建Hudi外表CREATE EXTERNAL TA

4、BLE table_nameENGINE=HUDI PROPERTIES(hudi.database=hudi_db_in_hive_metastore,hudi.table=hudi_table_in_hive_metastore,hudi.hive.metastore.uris=thrift:/127.0.0.1:9083”);字節的解決方案p 使用Doris作為數據服務層n 打通Doris與數據湖存儲p 打通Doris與HiveMetaStoreFEHiveMetaStoreHDFS/CFSBEBEHudiScanNodeFile ReaderHudi ClientJVM5,read d

5、ata files1,get hudi table base path from hms2,generate scan range locations3,filter file group with instantTime4,dispatch fragments字節的解決方案p 使用Doris作為數據服務層n 打通Doris與數據湖存儲p 打通Doris與HiveMetaStore支持查詢Hudi COW表支持分區表支持分區裁剪字節的解決方案p 使用Doris作為數據服務層n 打通Doris與數據湖存儲p 打通Doris與HiveMetaStore支持以Read Optimized方式查詢Hu

6、diMOR表支持分區表支持分區裁剪字節的解決方案p 使用Doris作為數據服務層p 打通Doris與數據湖存儲n 打通Doris與HiveMetaStore配置HiveCatalog后可以直接查詢HMS中table無需在Doris中創建外表支持Doris表與Hive表聯邦分析HMSselect*from hive_catalog.db.table未來規劃04未來規劃n 復雜數據類型n 主鍵索引n 存算分離業務靈活多變,需要更靈活的數據模式支持半結構數據分析未來規劃n 復雜數據類型n 主鍵索引n 存算分離構造內存主鍵index,提高更新刪除性能支持更新場景下查詢性能不劣化未來規劃n 復雜數據類型n 主鍵索引n 存算分離全量數據存放對象存儲系統熱數據存在本地緩存支持BE動態擴縮支持數據預加載非常感謝您的觀看

友情提示

1、下載報告失敗解決辦法
2、PDF文件下載后,可能會被瀏覽器默認打開,此種情況可以點擊瀏覽器菜單,保存網頁到桌面,就可以正常下載了。
3、本站不支持迅雷下載,請使用電腦自帶的IE瀏覽器,或者360瀏覽器、谷歌瀏覽器下載即可。
4、本站報告下載后的文檔和圖紙-無水印,預覽文檔經過壓縮,下載后原文更清晰。

本文(1-4 字節跳動基于 Doris 的數據湖倉探索.pdf)為本站 (云閑) 主動上傳,三個皮匠報告文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對上載內容本身不做任何修改或編輯。 若此文所含內容侵犯了您的版權或隱私,請立即通知三個皮匠報告文庫(點擊聯系客服),我們立即給予刪除!

溫馨提示:如果因為網速或其他原因下載失敗請重新下載,重復下載不扣分。
客服
商務合作
小程序
服務號
折疊
午夜网日韩中文字幕,日韩Av中文字幕久久,亚洲中文字幕在线一区二区,最新中文字幕在线视频网站