當前位置：首頁 > 報告詳情

8-5 美團 Spark Shuffle 架構演進.pdf

上傳人：云閑編號：102518 2021-01-01 PDF PDF 28頁 2.52MB

該報告所屬合集： Data Fun Summit：2022年大數據計算架構峰會嘉賓演講PPT合集

打包下載報告合集

文檔加載中……請稍候！
如果長時間未打開，您也可以點擊刷新試試。

下載報告到電腦，查找使用更方便

VIP專享文檔

書簽

分享

收藏

已收藏

版權投訴

/28

立即下載

word格式文檔無特別注明外均可編輯修改，預覽文件經過壓縮，下載原文更清晰！

三個皮匠報告文庫所有資源均是客戶上傳分享，僅供網友學習交流，未經上傳用戶書面授權，請勿作商用。

《8-5 美團 Spark Shuffle 架構演進.pdf》由會員分享，可在線閱讀，更多相關《8-5 美團 Spark Shuffle 架構演進.pdf（28頁珍藏版）》請在三個皮匠報告上搜索。

1、美團Spark Shuffle架構演進路項浩技術專家|01美團美團Spark概況概況目錄目錄CONTENT02Spark基本原理基本原理03Spark 1.x 2.x Shuffle問題問題05美團美團RSS06Push-based Shuffle07方案對比方案對比04業內優化方案業內優化方案08后續計劃后續計劃|美團Spark概況01|美團Spark概況|美團Spark概況|60萬+每天Spark作業數20萬+Spark ETL數97+%ETL中使用Spark的比例90+%Spark作業占離線集群的資源比例70PB+天shuffle量500TB+單作業最大shuffle量Spark基本原

2、理02|Spark基本原理|Spark 1.x 2.x Shuffle問題03|Spark 1.x 2.x shuffle問題|熱點讀（時間&空間的負載均衡）Stage調度機制Container復用資源調度無流控隨機讀Block數M*R小Block數據無備份Mapper端local存儲業內優化方案04|業內優化方案|升級存儲：Local Disk改為External StorageSPARK-25299MemVerge重新組織數據：利用獨立Shuffle集群，面向Reducer重新組織數據FaceBook阿里百度京東騰訊美團美團RSS05|美團RSS 建設思路|目標提高Shuffle穩定性，新

3、的Shuffle模式下Shuffle成功率100%大Shuffle情況下（1TB），新的Shuffle模式下的效率不低于原生Shuffle具備的能力負載均衡Shuffle ReadShuffle Write流控降低磁盤IO數據有備份美團RSS Shuffle問題解決|熱點讀Reducer請求RSS節點merge后的數據，請求數降低負載不均衡Shuffle Write：一致性HashShuffle Read：HDFS負載均衡無流控反壓隨機讀順序讀面向Reducer組織的數據數據無備份HDFS三副本美團RSS 設計要點|數據一致性（丟失、重復、損壞）Mapper 端 At Least Once S

4、endCRC32校驗元數據校驗Reducer冪等處理穩定性超時未ACK重新發送自動剔除問題RSS節點流控指標負載均衡Ketama一致性HashAQE支持Skew Join讀放大，數據一致性SMJ 轉 BHJ讀放大美團RSS 測試上線|測試驗證TPC-DS驗證上線作業驗證回退策略參數化配置shuffle策略初期雙跑線上作業失敗自動回退原生Shuffle上線策略初期作業粒度灰度后續SLA作業默認使用白名單控制美團RSS 上線收益|0%不再因為Shuffle慢/失敗導致SLA打破70+%作業Shuffle Fetch平均等待時間下降10+%作業平均執行時間節省Push-based ShuffleSP

5、ARK-3060206|Pushed-based Shuffle 架構|Pushed-based shuffle 關鍵點考慮|能復用原來的離線集群資源，但硬件資源無隔離Push小Block后能解決隨機讀問題，但并非Push所有數據到MSS上Block Size較大的不Push超時不Push無全局視角，不能全局協調資源，負載均衡Push-based Shuffle效果受多種因素影響作業當時獲取的資源Reduce的并發數磁盤IO Util變化&數據存儲量增加Pushed-based shuffle Shuffle問題解決|熱點讀:部分解決無流控：未解決隨機讀：部分解決數據無備份：部分解決負載不均衡：未解決Pushed-based shuffle 測試驗證|磁盤IO Util變化HDFS ReadShuffle ReadShuffle Write磁盤存儲量變化Shuffle Read 時間變化15%-8%方案對比07|Shuffle方案對比|后續計劃08|后續計劃|美團RSS讀放大更精細的負載均衡Shuffle獨立集群的資源利用率Push-based Shuffle線上調優驗證&落地Shuffle資源的全局調配Shuffle服務Shuffle模式的自動選擇代碼融合引擎統一Q&A微信：luxianghao309|非常感謝您的觀看|

相關圖表

本文主要介紹了美團在Spark Shuffle方面的優化實踐。美團Spark日作業數達60萬+，97%的ETL任務使用Spark，shuffle量達70PB+。針對Spark 1.x 2.x Shuffle問題，如熱點讀、Stage調度機制、資源調度等，業界提出了多種優化方案，如升級存儲、重新組織數據等。美團提出了RSS（Remote Shuffle Service）方案，旨在提高Shuffle穩定性，實現Shuffle成功率100%，并具備負載均衡、流控等功能。RSS通過Reducer請求RSS節點merge后的數據，降低請求數，采用一致性Hash解決負載不均衡問題，并通過CRC32校驗、元數據校驗等保證數據一致性。此外，美團還提出了Push-based Shuffle方案，主要解決隨機讀問題，但受作業資源、Reduce并發數等因素影響。后續計劃包括優化RSS讀放大問題、提高Shuffle獨立集群資源利用率，以及實現Shuffle模式的自動選擇等。

"美團Spark Shuffle如何優化？" "業內Shuffle優化方案有哪些？" "美團RSS如何解決Shuffle問題？"

相關報告

聯系我們

0731-84720580
sgpjbg002
工作日 9:30 - 18:00

關于我們

侵權處理

關于我們

出版物經營許可證
工信部備案號：湘ICP備17000430號-2
公安備案號：湘公網安備43010402001071號

三個皮匠報告專業的行業報告下載站，每日更新，歡迎大家關注！

copyright@2008-2013 長沙景略智創信息技術有限公司版權所有
網站備案/許可證號：湘B2-20190120

客服

小程序

服務號

折疊

午夜网日韩中文字幕,日韩Av中文字幕久久,亚洲中文字幕在线一区二区,最新中文字幕在线视频网站