當前位置:首頁 > 報告詳情

2024數據湖峰會PPT-梁溪-終稿.pdf

上傳人: s**** 編號:157215 2024-03-16 23頁 3.21MB

word格式文檔無特別注明外均可編輯修改,預覽文件經過壓縮,下載原文更清晰!
三個皮匠報告文庫所有資源均是客戶上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作商用。

相關圖表

本文介紹了微信視頻號高級數據工程師梁溪在DataFunSummit 2024上的演講,主要討論了實時湖倉在視頻號場景的應用實踐。 關鍵點如下: 1. 業務概況:視頻號數據規模龐大,單log峰值TPS可達240W/s,單日記錄數達千億級,存儲量超4PB。 2. 架構概況:文章對比了Lambda架構、Kappa架構和Kappa變體,最終選擇了Iceberg作為數據湖技術。 3. 應用實踐:通過引入自動優化(AO)服務和合理配置參數,解決了小文件問題和查詢加速問題。同時,通過SQL化作業和Iceberg watermark checker,優化了實時join場景和開發鏈路。 4. 項目總結:基于Iceberg的數據湖方案,實現了數據計算、存儲和接入的優化,節省了大量的計算資源和存儲成本。 5. 未來展望:底座將全面切換至Iceberg,并共建完善Iceberg周邊能力。 綜上,梁溪在演講中分享了微信視頻號在實時湖倉應用實踐方面的經驗,以及采用Iceberg數據湖技術所帶來的優化和節省成本的效果。
"實時湖倉如何提升視頻號數據處理效率?" "如何通過Iceberg技術優化數據湖存儲與查詢?" 如何實現實時性與成本控制的平衡?"
客服
商務合作
小程序
服務號
折疊
午夜网日韩中文字幕,日韩Av中文字幕久久,亚洲中文字幕在线一区二区,最新中文字幕在线视频网站