當前位置：首頁 > 報告詳情

Apache Celeborn和數據湖計算引擎云原生實踐.pdf

上傳人： 2*** 編號：121844 2023-03-29 PDF PDF 22頁 7.87MB

該報告所屬合集： DataFunSummit2023：數據湖架構峰會PPT合集

打包下載報告合集

文檔加載中……請稍候！
如果長時間未打開，您也可以點擊刷新試試。

下載報告到電腦，查找使用更方便

VIP專享文檔

書簽

分享

收藏

已收藏

版權投訴

/22

立即下載

報告標簽

：數據湖計算引擎云原生實踐

word格式文檔無特別注明外均可編輯修改，預覽文件經過壓縮，下載原文更清晰！

三個皮匠報告文庫所有資源均是客戶上傳分享，僅供網友學習交流，未經上傳用戶書面授權，請勿作商用。

《Apache Celeborn和數據湖計算引擎云原生實踐.pdf》由會員分享，可在線閱讀，更多相關《Apache Celeborn和數據湖計算引擎云原生實踐.pdf（22頁珍藏版）》請在三個皮匠報告上搜索。

1、Spark/Flink+Celeborn:更快，更穩，更彈性演講人：一錘阿里云2023 背景性能穩定彈性背景傳統Shuffle的問題傳統Shuffle的缺陷依賴大容量本地盤/云盤 IO放大高網絡連接磁盤隨機讀單副本限制不夠高效不夠穩定不夠彈性Apache Celeborn(Incubating)Celeborn:大數據引擎統一中間數據服務引擎無關 Shuffle+Spilled datahttps:/ 700+Commits 33 Contributors,7 Committers(3 in-coming)370+Stars性能核心設計Push Shuffle+Partitio

2、n數據聚合Partition切分存算分離寫放大磁盤隨機小IO網絡高連接小IO支持Spark AQEPartition合并Join Strategy切換Skew Join優化Partition范圍讀Map范圍讀12Split切分Sort On Read3Range Read列式Shuffle 行列轉換代碼生成解釋執行代碼生成行列轉換:(Int,String,Decimal)Shuffle Size縮減40%，行列轉換開銷低于5%多層存儲內存/本地盤/OSS(HDFS)可任選1/2/3層配置讓數據盡可能存在快存儲穩定原地快速升級向前兼容優雅重啟流控參考TCP的擁塞控制慢啟動擁塞避

3、免擁塞檢測其他實現:Credit Based Flink Shuffle Read負載均衡磁盤監控壞盤刷盤速率未來用量隔離壞盤盡量分配給快盤/大盤彈性Spark on K8S開源方案:spark.dynamicAllocation.shuffleTracking.enabled=true限制：幾乎無法釋放podEvaluation典型場景完全混部提升性能&穩定性Celeborn獨立部署提升性能&穩定性源數據和Shuffle數據分離部分彈性存算分離提升性能&穩定性計算，數據，臨時數據分離完全彈性超大作業混部場景：大作業穩定性&性能顯著提升 1000+Celeborn Worker 壓縮后4PB Shuffle Data存算分離存算分離場景 100臺Celeborn Worker 數萬pods，極致彈性性能和穩定性顯著提升TPCDS 3T TPCDS 20%性能提升感謝您的觀看演講人：一錘-阿里云

相關圖表

2200 專家認證

該用戶很懶，什么也沒介紹

關注

相關報告

聯系我們

0731-84720580
sgpjbg002
工作日 9:30 - 18:00

關于我們

侵權處理

關于我們

出版物經營許可證
工信部備案號：湘ICP備17000430號-2
公安備案號：湘公網安備43010402001071號

三個皮匠報告專業的行業報告下載站，每日更新，歡迎大家關注！

copyright@2008-2013 長沙景略智創信息技術有限公司版權所有
網站備案/許可證號：湘B2-20190120

客服

小程序

服務號

折疊

午夜网日韩中文字幕,日韩Av中文字幕久久,亚洲中文字幕在线一区二区,最新中文字幕在线视频网站