當前位置:首頁 > 報告詳情

3-4 字節跳動全域數據集成演進歷程.pdf

上傳人: 云閑 編號:102529 2021-01-01 27頁 3.27MB

word格式文檔無特別注明外均可編輯修改,預覽文件經過壓縮,下載原文更清晰!
三個皮匠報告文庫所有資源均是客戶上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作商用。

相關圖表

本文主要介紹了字節跳動全域數據集成演進歷程。李暢,字節跳動大數據工程師,自2016年加入字節跳動開發套件團隊,從0到1設計研發了面向字節各業務線的數據集成服務。文章首先闡述了數據集成的背景,指出數據集成是數據中臺建設的基礎,主要解決異構數據源間數據傳輸、加工和處理問題。Dataleap是字節跳動自研的一站式數據中臺套件,服務于字節內部各業務線數據建設場景。文章詳細介紹了數據集成演進歷程,從2018之前的每個通道各自實現,到2018-2019年統一架構覆蓋批式場景,再到2020-2021年覆蓋流式場景,最后到2021-2022年覆蓋CDC場景。同時,文章還介紹了基于Flink的異構數據源傳輸架構的初始架構和主要升級點,以及湖倉一體的架構優化。在通用能力改造部分,文章提出了對外能力輸出,降低數據建設成本的目標,并提出了相應的解決方案。最后,文章展望了未來多引擎架構、流式數據湖、統一CDC數據入湖解決方案等方向。
"字節跳動數據集成如何演進?" "如何通過Flink實現湖倉一體?" "如何降低數據集成建設成本?"
客服
商務合作
小程序
服務號
折疊
午夜网日韩中文字幕,日韩Av中文字幕久久,亚洲中文字幕在线一区二区,最新中文字幕在线视频网站