當前位置:首頁 > 報告詳情

專場16.1-字節跳動數據質量管理實踐:流批數據質量解決方案-何舒青(脫敏版).pptx

上傳人: 2*** 編號:126865 2023-05-01 27頁 3.48MB

word格式文檔無特別注明外均可編輯修改,預覽文件經過壓縮,下載原文更清晰!
三個皮匠報告文庫所有資源均是客戶上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作商用。

相關圖表

本文主要介紹了字節跳動數據質量平臺——Manta的產品架構、功能、優勢、劣勢以及未來的演進方向。 Manta主要解決離線和流式數據質量監控問題。在離線監控方面,面臨數據量大、監控耗時長的挑戰,Manta通過優化Spark作業參數、引入OLAP加速等方式,縮短了監控平均運行時長,提高了執行效率。在流式監控方面,Manta通過優化資源使用、引入Flink等手段,提高了流式作業的性能。 Manta的產品功能架構包括數據探查、數據對比、離線數據質量監控和流式數據質量監控。其優勢在于調度系統低耦合、事件觸發高效、沒有Quota限制;劣勢在于對于非CPU密集型查詢有點重,依賴Yarn調度穩定性不夠高。 未來的演進方向包括底層引擎統一流批一體、智能化、便捷化、優化化等。字節跳動數據質量平臺已經應用于監控規模萬級別、DAU千級別的業務中,對于數據及其生產鏈路的數據質量管理起到了重要作用。
"如何實現流式數據的實時監控與質量保證?" "面對海量數據,如何優化數據質量監控的效率和準確性?" "數據質量監控在抖音集團的應用規模和挑戰是什么?"
客服
商務合作
小程序
服務號
折疊
午夜网日韩中文字幕,日韩Av中文字幕久久,亚洲中文字幕在线一区二区,最新中文字幕在线视频网站