2020年終大會-機器學習平臺:13-1.pdf

編號:29905 PDF 15頁 1.54MB 下載積分:VIP專享
下載報告請您先登錄!

2020年終大會-機器學習平臺:13-1.pdf

1、CPU Node GPU Node GPU Node CPU Node XIAOMI CloudMl Model Trainnig Model Inference Thetis MIG Grid MPS cGPU vCuda Orion/vir taitech 減少資源浪費 提高集群的GPU任務量吞吐 減少任務排隊時間 實現方式不同 vGPU實現的層次不同 適用場景不同 優點: 上手容易,實現簡單 缺點: 沒有算力以及顯存隔離 適用場景: 測試集群,模擬GPU資源 https:/ 優點: 共用Cuda Context,減少切換時間 實現空間上的并行處理 缺點: 同一個Cuda Context中

2、的任務出現錯誤會互相影響,沒有強隔離 場景:MPI 類任務,小模型任務。 https:/ 優點: 適用于虛擬機,強隔離 缺點: 不適用容器 試用場景: 虛擬化平臺 https:/ 優點: 強隔離,軟硬件支持 缺點: 昂貴、無法兼容老機型、顯存和算力 大小無法定制 試用場景: 新集群、小模型 https:/ 優點: 實現了顯存和算力隔離,可以任意劃分 支持軟隔離 缺點: 影響應用運行時環境 試用場景: 容器平臺 https:/ 優點: 實現算力及顯存的隔離 不侵入應用運行時環境 缺點: 影響Nvidia Driver,維護困難 試用場景: 阿里云 https:/ GPU Node GPU Nod

3、e GPU Node GPU Node GPU Node GPU Node Kubelet GPU Node K8S Master Scheduler GPU 0 Idle GPU 2 Idle GPU 1 Idle GPU n Pod CPUMemory https:/ K8S Master Scheduler GPU Node CPU Node Orion Controller Scheduler GPUvGPU GPU Node GPUvGPU GPU Node GPUvGPU GPU Node GPUvGPU CPU Node CPU Node CPU Node apiVersionapiVersion: v1 kindkind: Pod specspec: Resource: requests: CPU、Mem、 GPU vGPU Pod 1. 應用的服務質量保證 2. 不侵入用

友情提示

1、下載報告失敗解決辦法
2、PDF文件下載后,可能會被瀏覽器默認打開,此種情況可以點擊瀏覽器菜單,保存網頁到桌面,就可以正常下載了。
3、本站不支持迅雷下載,請使用電腦自帶的IE瀏覽器,或者360瀏覽器、谷歌瀏覽器下載即可。
4、本站報告下載后的文檔和圖紙-無水印,預覽文檔經過壓縮,下載后原文更清晰。

本文(2020年終大會-機器學習平臺:13-1.pdf)為本站 (X-iao) 主動上傳,三個皮匠報告文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對上載內容本身不做任何修改或編輯。 若此文所含內容侵犯了您的版權或隱私,請立即通知三個皮匠報告文庫(點擊聯系客服),我們立即給予刪除!

溫馨提示:如果因為網速或其他原因下載失敗請重新下載,重復下載不扣分。
客服
商務合作
小程序
服務號
折疊
午夜网日韩中文字幕,日韩Av中文字幕久久,亚洲中文字幕在线一区二区,最新中文字幕在线视频网站