當前位置:首頁 > 報告詳情

8-5 美團 Spark Shuffle 架構演進.pdf

上傳人: 云閑 編號:102518 2021-01-01 28頁 2.52MB

word格式文檔無特別注明外均可編輯修改,預覽文件經過壓縮,下載原文更清晰!
三個皮匠報告文庫所有資源均是客戶上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作商用。

相關圖表

本文主要介紹了美團在Spark Shuffle方面的優化實踐。美團Spark日作業數達60萬+,97%的ETL任務使用Spark,shuffle量達70PB+。針對Spark 1.x 2.x Shuffle問題,如熱點讀、Stage調度機制、資源調度等,業界提出了多種優化方案,如升級存儲、重新組織數據等。美團提出了RSS(Remote Shuffle Service)方案,旨在提高Shuffle穩定性,實現Shuffle成功率100%,并具備負載均衡、流控等功能。RSS通過Reducer請求RSS節點merge后的數據,降低請求數,采用一致性Hash解決負載不均衡問題,并通過CRC32校驗、元數據校驗等保證數據一致性。此外,美團還提出了Push-based Shuffle方案,主要解決隨機讀問題,但受作業資源、Reduce并發數等因素影響。后續計劃包括優化RSS讀放大問題、提高Shuffle獨立集群資源利用率,以及實現Shuffle模式的自動選擇等。
"美團Spark Shuffle如何優化?" "業內Shuffle優化方案有哪些?" "美團RSS如何解決Shuffle問題?"
客服
商務合作
小程序
服務號
折疊
午夜网日韩中文字幕,日韩Av中文字幕久久,亚洲中文字幕在线一区二区,最新中文字幕在线视频网站