當前位置:首頁 > 報告詳情

會議13_在 MPI 中設計網絡內計算感知縮減集合.pdf

上傳人: Ch****l 編號:171254 2024-07-03 33頁 1.86MB

word格式文檔無特別注明外均可編輯修改,預覽文件經過壓縮,下載原文更清晰!
三個皮匠報告文庫所有資源均是客戶上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作商用。

相關圖表

本文主要介紹了在MPI中設計網絡計算感知的減少集合的方法。主要內容包括: 1. 背景介紹:現代高性能計算集群架構的驅動因素,包括多核/眾核技術、遠程直接內存訪問(RDMA)網絡、固態硬盤(SSD)、非易失性隨機訪問內存(NVRAM)、NVMe-SSD以及加速器(如NVIDIA GPGPU)。 2. 動機:減少集合(如MPI_Allreduce)在HPC和AI中非常重要,涉及計算和通信。使用CPU進行所有操作會導致擴展效率低下,因此需要將常見操作卸載到網絡設備,如交換機。 3. 問題陳述和貢獻:提出了一種算法,用于大型消息的AllReduce,該算法克服了SHARP運行時中的瓶頸和資源限制,通過高效利用節點和網絡級資源。 4. 設計:包括注冊緩存設計和提出的AllReduce設計。使用注冊緩存來攤銷SHARP運行時中的注冊成本,并設計了一個基于領導者的算法,使用流聚合進行大型消息減少。 5. 結果:實驗結果表明,該設計在某些情況下比現有技術高出86%的性能。 6. 結論和未來工作:該設計克服了各種瓶頸,通過使用基于領導者的算法和流聚合進行大型消息減少,優于現有技術。未來工作包括全面應用評估、在更大規模上的性能評估以及探索NUMA感知。
如何設計高效的大消息MPI_Allreduce算法? 如何在MPI中實現網絡計算感知的大消息減少集合? 如何在MPI中利用SHARP和單份方案的優勢實現大消息減少?
客服
商務合作
小程序
服務號
折疊
午夜网日韩中文字幕,日韩Av中文字幕久久,亚洲中文字幕在线一区二区,最新中文字幕在线视频网站