當前位置:首頁 > 報告詳情

數據湖 iceberg 在小米的應用場景.pdf

上傳人: 2*** 編號:122854 2023-04-03 28頁 2.90MB

報告標簽

數據湖iceberg應用場景
word格式文檔無特別注明外均可編輯修改,預覽文件經過壓縮,下載原文更清晰!
三個皮匠報告文庫所有資源均是客戶上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作商用。

相關圖表

李培殿,小米數據湖研發負責人,在2023年的演講中介紹了Iceberg的核心特性和在小米的應用場景。Iceberg是一個開放標準,支持SQL行為,具有事務性、全Schema Evolution等特性,允許字段類型提升、增加或刪除列、重命名列和調整列順序等操作。在小米,Iceberg用于日志集成入湖和近實時數倉建設,解決了數據重復、分區漂移等問題,并提高了數據正確性和計算資源效率。通過隱式分區,Iceberg簡化了分區管理,優化了數據掃描量和計算資源消耗。同時,李培殿也提到了Iceberg在小米的優化和挑戰,如分區完備性校驗、隱式分區帶來的不確定性、Spark timestamp問題以及changelog實時集成入湖等。最后,他概述了Hive升級Iceberg的不同方案和Iceberg的應用現狀,以及未來的規劃,包括物化視圖ChangelogView和數據上云。
"Iceberg 是什么?" "Iceberg 在小米的應用場景和未來規劃是什么?" "如何解決隱式分區在離線場景的問題?"
客服
商務合作
小程序
服務號
折疊
午夜网日韩中文字幕,日韩Av中文字幕久久,亚洲中文字幕在线一区二区,最新中文字幕在线视频网站