2025第九屆社交媒體風向大會演講課件合集
2025(首屆)中國低空經濟教育大會嘉賓演講PPT合集
2025年數據峰會(Data Summit 2025)演講PPT合集
1、Apache Iceberg在網易嚴選批流一體的實踐祝佳俊網易嚴選2022-04-232目錄/CONTENTS1234數據架構現狀基于Iceberg的批流一體實踐落地情況&未來規劃Iceberg表治理Chapter01數據架構現狀數據架構現狀數據架構現狀數據架構現狀lambda架構,實時離線兩套邏輯離線數據實效性低,依賴于快照制作同步鏈路組件多,可維護性差1.批流一體?2.存儲支持Upsert?Apache IcebergApache HudiDeltaLake文件合并ManuallyAutomaticManually數據清理ManuallyAutomaticAutomatic文件格式Parq
2、uet,Avro,ORCParquet,avroParquet計算引擎Hive/Spark/Presto/FlinkHive/Spark/Presto/FlinkHive/Spark/Presto存儲引擎HDFS/S3HDFS/S3HDFS/S3/AzureSQL DMLupsertACIDTimeTravel是否支持索引可擴展的元數據存儲Schema演進方案比對 通用表格式,解耦計算引擎 存儲批流一體 Upsert和ACID Schema變更 元數據管理 數據質量保障Iceberg簡介Chapter02基于Iceberg的批流一體實踐流批一體架構新的問題消息亂序&去重處理消息亂序&去重處理消息亂序&去重處理消息亂序&去重處理消息亂序&去重處理一致性快照一致性快照一致性快照Chapter03Iceberg表治理Iceberg表治理Iceberg表治理重寫DeleteFile重寫DeleteFile合并DeleteFile重排序治理效果Chapter04落地情況&未來規劃落地情況 已完成ODS層數據產出的批流融合 離線數據延遲縮短至5分鐘 所有ODS T+1快照的制作可提前半小時 已經有500+任務穩定運行未來規劃010302更多的場景特征工程數倉DWD更好的管理產品化更快的查詢PrestoAlluxioZ-orderBloom-FilterTHANK YOUTHANK YOU
1、下載報告失敗解決辦法 2、PDF文件下載后,可能會被瀏覽器默認打開,此種情況可以點擊瀏覽器菜單,保存網頁到桌面,就可以正常下載了。 3、本站不支持迅雷下載,請使用電腦自帶的IE瀏覽器,或者360瀏覽器、谷歌瀏覽器下載即可。 4、本站報告下載后的文檔和圖紙-無水印,預覽文檔經過壓縮,下載后原文更清晰。
【15-A01】葉賢勛-網易流批一體的實時數倉平臺實踐.pdf
1、胡家煊-流批一體在字節特征平臺的實踐.pdf
8-1 Apache?Flink?流批一體的規劃和在快手的進展.pdf
字節基于HUDI的批流一體存儲實踐.pdf
1-6 郭軼軒 - 流批一體在快手的探索實踐.pdf
5、金風-Flink流批一體在小米的實踐.pdf
4-1 流批一體的實時多維分析.pdf
3、韓飛-流批一體在京東的探索與實踐.pdf
2019年Flink流批一體的技術架構以及在阿里的實踐.pdf
驗證即登錄,未注冊將自動創建賬號