當前位置:首頁 > 報告詳情

15-Automated Model Serving in HP Cloud-John Zheng.pdf

上傳人: 張** 編號:620948 2025-03-31 37頁 1.36MB

word格式文檔無特別注明外均可編輯修改,預覽文件經過壓縮,下載原文更清晰!
三個皮匠報告文庫所有資源均是客戶上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作商用。

相關圖表

本文主要介紹了惠普(HP)云的模型服務自動化實踐,重點是構建一個基于KServe、Istio和Envoy的統一模型推理平臺。該平臺支持多種推理模型,包括生成式AI、傳統機器學習和深度學習模型,并允許項目組自主部署環境。平臺具備自動化部署、模型存儲支持、權限管理、動態擴展、可觀測性、限流等功能。 關鍵數據包括: 1. 平臺基于Amazon Kubernetes(EKS)、Istio、Harbor、Azure Pipeline等構建,實現基礎設施即代碼。 2. 支持多種模型存儲,如Hugging Face、S3、PVC、EFS等。 3. 集成Helm和Flux2實現自動化部署。 4. 模型訪問權限控制、HPA動態擴展、可觀測性、API限流等功能均通過Istio實現。 5. 利用Prometheus Adaptor支持基于自定義指標的HPA。 6. 通過Envoy實現模型服務的限流和統計。 7. 金絲雀發布通過Istio虛擬服務實現,注重模型版本的流量分配。 綜上所述,惠普云模型推理平臺通過整合KServe、Istio、Envoy和Prometheus Adaptor等工具,實現了一站式的模型服務自動化,具備高靈活性和可定制性,同時簡化模型部署和運維工作。
"如何實現模型的自動權限控制?" "如何使用HPA實現模型的動態擴展?" "如何在模型推理平臺中實現可觀測性?"
客服
商務合作
小程序
服務號
折疊
午夜网日韩中文字幕,日韩Av中文字幕久久,亚洲中文字幕在线一区二区,最新中文字幕在线视频网站