當前位置：首頁 > 報告詳情

【知乎】Alluxio在知乎的應用.pdf

上傳人：張** 編號：153234 2024-01-15 PDF PDF 26頁 1.66MB

該報告所屬合集： 2023全球AI前沿科技大會-北京站嘉賓演講PPT合集

打包下載報告合集

文檔加載中……請稍候！
如果長時間未打開，您也可以點擊刷新試試。

下載報告到電腦，查找使用更方便

VIP專享文檔

書簽

分享

收藏

已收藏

版權投訴

/26

立即下載

word格式文檔無特別注明外均可編輯修改，預覽文件經過壓縮，下載原文更清晰！

三個皮匠報告文庫所有資源均是客戶上傳分享，僅供網友學習交流，未經上傳用戶書面授權，請勿作商用。

《【知乎】Alluxio在知乎的應用.pdf》由會員分享，可在線閱讀，更多相關《【知乎】Alluxio在知乎的應用.pdf（26頁珍藏版）》請在三個皮匠報告上搜索。

1、Alluxio 在知乎的應用AI與大數據時代的加速方案賈承昆知乎大數據平臺負責人目錄背景和介紹 Alluxio for AI Alluxio for Data 總結和展望背景和介紹PART 1背景和介紹知乎，中文互聯網高質量的問答社區和創作者聚集的原創內容平臺，于 2011 年 1 月正式上線，以讓人們更好的分享知識、經驗和見解，找到自己的解答為品牌使命。截至 2020 年，已有超過 4000 萬名答主在知乎創作，全站問題總數超過 4400 萬，回答總數超過 2.4 億。大模型時代的新挑戰多機房多算力中心延時敏感非結構化數據增多架構圖Alluxio for AIPART 2 訓練加速的

2、場景超低的訪問延時長時間穩定運行支持 FUSE 的方式訪問場景一 AI 訓練加速緩存淘汰策略：TTL LRU No Evit緩存策略問題分析：FUSE 和 Alluxio 的 block size 沒有對齊優化思路：對齊 block size，難度較大 Client Memory CacheFUSE 讀放大優化 Alluxio FUSE 讀取性能達到 NVME 的 90%性能，對比之前 S3Proxy 方案提升 250%GPU 利用率上升，IO wait 明顯減少訓練加速效果寫立刻讀高并發跨機房場景二 Model Update S3 Proxy vs FUSE SSD Cache

3、Short-circuit Read Read Ahead優化策略主動預熱 Pros：實現簡單，性能好 Cons：用戶需要改造適配被動預熱 Pros：無需改造 Cons：性能差實時預熱 Pros：無需改造 Cons：開始較慢，整體快數據預熱Alluxio for DataPART 3場景三 Presto 緩存加速Presto RaptorX Based on Alluxio Local Cache Data Cache Footer Cache Fragment CacheWorker 軟親和性Worker 調度策略一致性 hash Fallback集群軟親和性集群調度策略根據 SQL 的 table 名字進行一致性哈希，選擇一個集群如果集群繁忙就選擇下一個加速效果平均緩存命中率 60%查詢 P50 在 2s，BI 場景更低排隊時間對比之前有大幅度降低場景四運維平臺加速數千節點基礎組件安裝包非常大一次滾動重啟需要數十小時總結和展望PART 4 AI 模型訓練和推理加速統一的數據接入大數據 OLAP 加速對象存儲加速應用場景總結進一步提升模型 save/load 的性能，優化大模型訓練任務的重啟時間和 checkpoint 時間平臺化管理數據集和模型，簡化算法工程師的工作未來展望Q&ATHANKS

相關圖表

Alluxio是一種大數據處理加速技術，知乎大數據平臺負責人賈承昆介紹了Alluxio在知乎的應用，主要集中在AI訓練加速、數據緩存加速和運維平臺加速三個方面。在AI訓練加速方面，Alluxio能夠實現訓練加速、超低訪問延時和長時間穩定運行，通過優化緩存淘汰策略、對齊block size和Client Memory Cache等方法，Alluxio的性能對比S3Proxy方案提升了250%，GPU利用率上升，IO wait明顯減少。在數據緩存加速方面，Alluxio應用于Presto緩存加速和運維平臺加速，平均緩存命中率達到60%，查詢P50在2秒內，大幅降低了排隊時間。未來，Alluxio將在模型save/load性能提升、數據集和模型管理等方面發揮更大作用。

"Alluxio如何加速AI模型訓練？" "Alluxio在知乎大數據平臺中的應用有哪些？" "如何優化Alluxio的緩存策略以提高性能？"

相關報告

聯系我們

0731-84720580
sgpjbg002
工作日 9:30 - 18:00

關于我們

侵權處理

關于我們

出版物經營許可證
工信部備案號：湘ICP備17000430號-2
公安備案號：湘公網安備43010402001071號

三個皮匠報告專業的行業報告下載站，每日更新，歡迎大家關注！

copyright@2008-2013 長沙景略智創信息技術有限公司版權所有
網站備案/許可證號：湘B2-20190120

客服

小程序

服務號

折疊

午夜网日韩中文字幕,日韩Av中文字幕久久,亚洲中文字幕在线一区二区,最新中文字幕在线视频网站