9-1 Apache Iceberg 在網易嚴選批流一體的實踐.pdf

編號:102502 PDF 31頁 2.64MB 下載積分:VIP專享
下載報告請您先登錄!

9-1 Apache Iceberg 在網易嚴選批流一體的實踐.pdf

1、Apache Iceberg在網易嚴選批流一體的實踐祝佳俊網易嚴選2022-04-232目錄/CONTENTS1234數據架構現狀基于Iceberg的批流一體實踐落地情況&未來規劃Iceberg表治理Chapter01數據架構現狀數據架構現狀數據架構現狀數據架構現狀lambda架構,實時離線兩套邏輯離線數據實效性低,依賴于快照制作同步鏈路組件多,可維護性差1.批流一體?2.存儲支持Upsert?Apache IcebergApache HudiDeltaLake文件合并ManuallyAutomaticManually數據清理ManuallyAutomaticAutomatic文件格式Parq

2、uet,Avro,ORCParquet,avroParquet計算引擎Hive/Spark/Presto/FlinkHive/Spark/Presto/FlinkHive/Spark/Presto存儲引擎HDFS/S3HDFS/S3HDFS/S3/AzureSQL DMLupsertACIDTimeTravel是否支持索引可擴展的元數據存儲Schema演進方案比對 通用表格式,解耦計算引擎 存儲批流一體 Upsert和ACID Schema變更 元數據管理 數據質量保障Iceberg簡介Chapter02基于Iceberg的批流一體實踐流批一體架構新的問題消息亂序&去重處理消息亂序&去重處理消息亂序&去重處理消息亂序&去重處理消息亂序&去重處理一致性快照一致性快照一致性快照Chapter03Iceberg表治理Iceberg表治理Iceberg表治理重寫DeleteFile重寫DeleteFile合并DeleteFile重排序治理效果Chapter04落地情況&未來規劃落地情況 已完成ODS層數據產出的批流融合 離線數據延遲縮短至5分鐘 所有ODS T+1快照的制作可提前半小時 已經有500+任務穩定運行未來規劃010302更多的場景特征工程數倉DWD更好的管理產品化更快的查詢PrestoAlluxioZ-orderBloom-FilterTHANK YOUTHANK YOU

友情提示

1、下載報告失敗解決辦法
2、PDF文件下載后,可能會被瀏覽器默認打開,此種情況可以點擊瀏覽器菜單,保存網頁到桌面,就可以正常下載了。
3、本站不支持迅雷下載,請使用電腦自帶的IE瀏覽器,或者360瀏覽器、谷歌瀏覽器下載即可。
4、本站報告下載后的文檔和圖紙-無水印,預覽文檔經過壓縮,下載后原文更清晰。

本文(9-1 Apache Iceberg 在網易嚴選批流一體的實踐.pdf)為本站 (云閑) 主動上傳,三個皮匠報告文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對上載內容本身不做任何修改或編輯。 若此文所含內容侵犯了您的版權或隱私,請立即通知三個皮匠報告文庫(點擊聯系客服),我們立即給予刪除!

溫馨提示:如果因為網速或其他原因下載失敗請重新下載,重復下載不扣分。
客服
商務合作
小程序
服務號
折疊
午夜网日韩中文字幕,日韩Av中文字幕久久,亚洲中文字幕在线一区二区,最新中文字幕在线视频网站