2020年終大會-機器學習平臺:13-5.pdf

編號:29908 PDF 41頁 2.09MB 下載積分:VIP專享
下載報告請您先登錄!

2020年終大會-機器學習平臺:13-5.pdf

1、58深度學習平臺在提高模型推 理性能和GPU使用率上實踐 陳興振 - 58同城 AI Lab 2020.12.20 58深度學習平臺介紹 模型推理加速 提升平臺GPU使用率 總結及計劃 分享大綱 58深度學習平臺 算力算力 CPUK40P40T42080ti 存儲存儲 RAIDHDFS 對象存儲 (WOS) 高性能網絡文件系統高性能網絡文件系統 (WFSWFS) KubernetesKubernetes 資源管理任務調度服務發現 ETCDCalicoDNS PrometheusGrafana DockerDocker、NvidiaNvidia- -Docker2Docker2 深度學習框架深度

2、學習框架 rsyslog 開發實驗開發實驗模型訓練模型訓練推理服務推理服務 負載均衡一鍵擴容 推理加速(TF-TRT、TensorRT、MKL、OpenVINO)單機單卡訓練 參數服務器(多機多卡訓練) 代碼在線調試 資源復用 監控 中心 日志 中心 鏡像 中心 ABTest WubaNLPWubaNLP 序列標注文本分類文本匹配 鳳凰圖像算法平臺鳳凰圖像算法平臺 圖像樣本庫圖像算法組件 搜索推薦NLP語音圖像風控 推理服務 通用預測接口 協議解析 流量轉發/負載均衡 模型1解析jar包 模型2解析jar包 模型n解析jar包 SCF 服務 業務方線上請求: 模型ID + 預測數據(Objec

3、t) Jar包熱加載 pod2 podn pod1 模型1預測實例 pod2 podn pod1 模型2預測實例 pod2 podn pod1 模型n預測實例 TensorFlow Serving PyTorch gRPC Serving 自定義模型 gRPC Serving Web 管 理 系 統 Kubernetes Jar 包 推 送 模 型 部 署 、 擴 縮 容 模型1協議實體模型n協議實體 模型推理加速 GPU上推理優化歷程 前期:主要支持TensorFlow框架 采用TF-TRT快速上線 后期:TensorRT+Triton Inference Server支持所有框架 Framework Integration UFF ONNX Model Import Network Definition API Custom Framework TensorRT Optimize r

友情提示

1、下載報告失敗解決辦法
2、PDF文件下載后,可能會被瀏覽器默認打開,此種情況可以點擊瀏覽器菜單,保存網頁到桌面,就可以正常下載了。
3、本站不支持迅雷下載,請使用電腦自帶的IE瀏覽器,或者360瀏覽器、谷歌瀏覽器下載即可。
4、本站報告下載后的文檔和圖紙-無水印,預覽文檔經過壓縮,下載后原文更清晰。

本文(2020年終大會-機器學習平臺:13-5.pdf)為本站 (X-iao) 主動上傳,三個皮匠報告文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對上載內容本身不做任何修改或編輯。 若此文所含內容侵犯了您的版權或隱私,請立即通知三個皮匠報告文庫(點擊聯系客服),我們立即給予刪除!

溫馨提示:如果因為網速或其他原因下載失敗請重新下載,重復下載不扣分。
客服
商務合作
小程序
服務號
折疊
午夜网日韩中文字幕,日韩Av中文字幕久久,亚洲中文字幕在线一区二区,最新中文字幕在线视频网站