《專場21.3-面向資效平衡的機器學習平臺的演進-高會軍.pdf》由會員分享,可在線閱讀,更多相關《專場21.3-面向資效平衡的機器學習平臺的演進-高會軍.pdf(16頁珍藏版)》請在三個皮匠報告上搜索。
面向資效平衡的機器學習平臺的演進高會軍+小紅書云原生負責人大綱 背景 解決方案 成果展示 未來規劃背景Inspire Lives,分享和發現世界的精彩每天百億次筆記曝光超過2億月活國內優選的生活分享社區背景遇到的問題背景MLOps發展趨勢MLOps+FinOpsCI/CD 流水線自動化ML 流水線自動化自動構建、測試新的pipeline組件并將其部署在目標環境成熟度級別2成熟度級別1資效平衡成熟度級別3手動過程通過自動執行機器學習流水線來持續訓練模型構建和部署機器學習模型的過程完全是手動成熟度級別0背景建設資效平衡的機器學習平臺解決方案整體建設情況解決方案模型部署serverless容器管理引擎kubernetes解決方案離線調度新增調度能力:大套餐優先調度、queue資源保障、CVM和公有云容器實例服務混合調度等,大幅度提升裝箱率。解決方案計算資源性能優化解決方案數據加速解決方案資源管理策略成果展示 降低用戶使用門檻,實現了低代碼模型開發 模型訓練效率提升 100%提供一整套覆蓋從推理到訓練的云原生高性能異構計算解決方案,更好地支持批處理作業和高性能服務,進一步提升資源使用效率和降低運維管理復雜性未來規劃 協同社區,進一步探究如何在云原生場景下更好地支持批處理作業和高性能作業 實現無差別混部