1、封面頁CATALOGUE|目錄01汽車/制造CAR/MANUFACTURERSKG 未來穿戴 基于 SAE 打通 CI/CD 流程,實現高效運維元戎啟行 基于 ACKEdge 加速云端協同管理極氪汽車 APP 全面升級云原生技術架構,高效提升用戶出行體驗小鵬汽車 基于云原生實現研發提效,加速探索未來出行來電科技 基于 MSE 無侵入式實現微服務治理硅基仿生 業務全面 Serverless 容器化的增效降本之旅TCL 擁抱云原生,實現 IT 成本治理優化蘇打智能 借力阿里云 AHPA 輕松應對突發流量致景科技 基于 MSE 一站式實現服務治理商米科技 借力 ASM 實現業務迭代大幅提效東風日產
2、借力 ASM 實現流量精細化管控節卡機器人 云撥測助力全面優化海外網站性能車主無憂 Kafka 商業版助力車主無憂系統穩健傳音 基于 ARMS 構建全球一體化可觀測平臺,高效支撐業務創新vivo AI 計算平臺的 ACK One 混合云實踐云快充 云原生穩定性建設之路8111417202326293235384144475053CATALOGUE|目錄02零售/電商/本地生活RETAIL/E-COMMERCE/LOCAL LIFE世紀聯華 基于函數計算實現一鍵部署和極致彈性貴州酒店集團 基于 SAE 實現幾乎零改造的微服務升級震坤行 基于云原生高效提升應急供應鏈管理能力識貨 基于阿里云容器服務
3、實現云原生提效降本餐道 基于 ACK 構建創新底座,加速 SaaS 規?;葸M廚芯科技 加速業務容器化進程,成功實現增效降本波司登 云原生架構升級,實現數字化業務創新斯凱奇 通過 MSE 提升業務迭代效率,輕松應對線上大促03交通/物流TRANSPORTATION/LOGISTICS 高德 基于函數計算實現毫秒級自動擴縮容龍湖千丁 基于 ACKEdge 高效落地云邊端一體化智慧停車業務貨拉拉 使用 ACK 輕松應對容器管理難題,實現精細化成本治理5759626568717478828588CATALOGUE|目錄04南瓜電影 基于SAE 7天內全面 Serverless 化實踐網易云音樂 基于
4、函數計算 FC 創建音視頻算法處理平臺唱鴨 輕松玩轉 DevSecOps,用 ACR EE 構建安全高效交付流程任意門 基于云原生 AI 套件打造人工智能的社交網絡平臺Wolai 使用函數計算相比傳統架構節省了一半以上的費用和人力合闊智云 通過 ASM 輕松實現微服務治理站酷 基于 ASM 解決多語言技術棧下服務管理難題,實現運維提效禾連健康 低容錯業務的增效之路魚傳科技 基于函數計算高性價比地支持了一個日活 50W+的小程序分眾傳媒 基于函數計算 FC 自研圖片識別處理系統匯量科技 通過容器技術加快全球業務拓展919598102105108111麗迅物流 通過 ACR EE 管理大規模容器鏡
5、像,快速響應業務需求申通 基于 ACKEdge 構建邊緣 PaaS 實現業務全面提效大搜車 云上多地域高可用消息系統的構建互聯網INTERNET114116119122125128130CATALOGUE|目錄05金融服務FINANCIAL SERVICES 視野數科運維提效 60%,SAE+Jenkins 打造云原生 DevOps眾安保險 云原生架構升級,貫通行業數字化轉型“快車道”費芮互動 通過 MSE 完成移動支付應用,穩定性和安全性雙提升友邦人壽 可觀測體系設計與落地152155158161偉東云教育 云撥測助力偉東云教育,全面提升全球用戶體驗核桃編程 基于 ARMS 構建可觀測體系,
6、全方位提升用戶體驗新東方 基于函數計算實現直播流實時轉碼心動網絡(TapTap)基于SAE實現簡單運維、不停機發布和分鐘級上線小邁科技 基于SAE打通 CI/CD,提升研發效能,縮短上線時間小七手游 MQTT 構筑運營平臺與游戲端的交互通道132135138141144147CATALOGUE|目錄06其他行業OTHER INDUSTRIES譜尼測試 基于 SAE 實現業務快速上線并從容應對流量洪峰Salesforce 容器化改造,成功落地安全可信軟件供應鏈165168間隔頁(待分享)汽車/制造CAR/MANUFACTURER SKG 未來穿戴/汽車&制造SKG 未來穿戴是一家專注于高端健康產
7、品的研發、設計與制造的企業。專注為消費者提供精致、時尚的高端產品,以及極致的按摩儀產品體驗。隨著市場需求的迅速變化,SKG 的 IT 系統也逐漸面臨著庫存不準確、線上線下渠道無法協同、部署架構不靈活、IT響應速度過慢等問題,為了能適配銷售拓展、提高效率、加強規?;\營,SKG 同阿里云達成戰略合作,打造基于線上線下打通,并覆蓋全渠道應用場景的渠道中臺項目??蛻艉喗閨SKG 未來穿戴基于 SAE 打通 CI/CD 流程,實現高效運維客戶痛點敏捷協同、DevOps 等成熟度低:過去項目迭代缺少全生命周期管控,對問題和任務進度的跟進主要靠線下溝通、缺少在線化追蹤工具;DevOps 流程缺少自動化的工
8、具支撐,如業務應用的發布上線,基本都是人肉發布,發布耗時長、流程低效、且容易產生線上安全故障。8應用上線部署繁瑣:上線進行資源評估、應用服務器購買、安裝配套軟件初始化等操作流程較長;此外還需要搭配集群監控、發布&調度腳本服務治理、配置管理、日志備份等能力,都需要單獨部署配套組件或系統。自行實施容器化存在上手成本:開發對 K8s 等容器管理平臺底層細節不熟悉,相對比較黑盒,出現問題排查進度較慢。彈性伸縮不方便:業務側有一定的峰谷,而在低谷期資源利用率很低;擴容需要重新走一套上線流程,且擴容后不容易下機器;后續中臺上線之后、預計會拆出更多的微服務應用,但這些應用因承接的業務場景不同流量不均勻,需要
9、有更靈活的彈性策略。后期運維成本高:不但需要維護應用本身,還需要維護整套基礎設施及對應的配套系統;需要投入較多的額外人力。13SKG 未來穿戴/汽車&制造9SKG 渠道中臺研發態&運行態大圖解決方案項目在實施過程中深度使用了阿里云飛天技術服務平臺大禹進行在線化交付,通過平臺進行統一的管控和賦能。項目交付過程中的直觀感受:13SKG 未來穿戴/汽車&制造10CI/CD 自動化部署至 SAE:通過大禹提供的 CI/CD 流水線能力將業務應用自動化部署至 SAE,徹底替換原來的人工部署、人肉運維的低效方式,在提升應用部署效率的同時,也有效降低了應用發布變更的風險,實現了可控部署、安全生產的效果。免運
10、維&聚焦業務:以往類似規模的集群和應用數、至少需要配置 2 個專門的運維;使用 SAE 后基本免運維,省去專門運維投入;一些 SAE 控制臺配置操作基本由開發兼職即可;以往維護應用集群,經常需要排查 K8s 集群和 ECS 底層的一些問題;使用 SAE 這塊基本不用關注。良好兼容各類微服務框架:對基于 Springboot、Spring Cloud、Dubbo等微服務框架開發的應用兼容較好,同時很方便的集成了 ACM、ARMS 等云產品;屏蔽了部分底層細節,可以做到一鍵低配置部署。彈性伸縮、快速擴縮容:彈性策略靈活,在做資源優化的時候較為方便調整。用戶價值全部 20+應用初始化配置-創建-部署
11、到SAE上只需要 2-3 個小時;資源成本比單獨購買機器節省30%以上;由于 SAE 支持 0.5core 的規格,開發測試環境資源開銷得以降低50%以上;擴容效率則從按天計提高到分鐘級。通過大禹平臺共計交付了近 20+應用,提交定開代碼超過 180 萬+行,流水線自動化發布應用超過 3000 次,平均發布時間在 100S 內;CI/CD 自動化部署效率提升 300%,零發布故障。相關產品Serverless 應用引擎 SAE元戎啟行/汽車&制造深圳元戎啟行科技有限公司是一家專注于研發和應用 L4 級自動駕駛技術的科技公司,擁有自動駕駛乘用車“元啟行”和自動駕駛輕卡“元啟運”兩大產品,覆蓋量產
12、汽車、Robotaxi 出行、輕卡運力三條業務線。其中,Robotaxi 出行搭載元戎啟行自研 L4 級自動駕駛解決方案,通過自營車隊和合作運營的模式落地。元戎啟行 L4 級自動駕駛前裝方案車隊已投入運營,為乘客提供城市出行服務??蛻艉喗閨元戎啟行基于 ACKEdge 加速云端協同管理客戶痛點傳統的交付模式易出錯:使用 deb 包進行部署與車端環境耦合,效率低下且容易出錯,同時容易污染車端環境并導致依賴沖突。11 應用層需要考慮安全問題,維護成本高:因為應用層需要在云端和車端設備之間進行雙向通信,所以必須注意安全問題。弱網環境下,多設備難以管理:當多個設備接入時,需要進行統一管理,并考慮每個設
13、備的獨立性,由于車輛經常移動,因此需要解決在弱網環境下狀態同步的復雜性。1312方案亮點統一的交付標準:使用 containerd+ACKEdge 進行應用交付,實現了統一的交付標準,簡化了交付流程并減少了對車端設備的耦合,同時不會污染車端環境。設備安全接入能力下沉,應用聚焦業務:設備安全接入能力下沉,應用可以專注于業務。通過 lite-kubelet(在車端設備上運行的代理程序)支持一機一密認證訪問MQTT,確保每個車載設備都使用自己的設備證書接入至 ACKEdge 集群,從而大大提高了接入安全性,整個過程對業務層透明。提供更豐富、靈活的設備管理能力:通過 OTA(軟件通過空中接口更新)和邊
14、緣側Pod 離線啟停管理,提高了車載應用的發布運維效率。元戎啟行/汽車&制造1313客戶證言“運營車輛的車載設備通過輕量化接入 ACKEdge,接入資源占用降低 50%,接入安全性大幅提升?;谶吘墏?Pod 的啟停、OTA 功能便捷化管理車載設備,業務發布運維效率提升 60%?!痹謫⑿?汽車&制造相關產品邊緣容器服務 ACKEdge極氪汽車/汽車&制造極氪汽車是吉利控股集團旗下高端純電汽車新品牌,2021年4月極氪發布首款高端智能電動車型極氪001,大獲市場好評,截至2022年12月,001車型累計交付量突破7萬臺。連續3個月問鼎自主品牌30萬以上豪華純電車型銷售冠軍??蛻艉喗閨極氪汽車
15、APP 全面升級云原生技術架構,高效提升用戶出行體驗客戶痛點隨著極氪 APP 的上線,注冊車主用戶數量呈爆發式增長,用戶身份及對應使用場景也不斷擴大。在這一過程中,APP 用戶體驗變得愈發重要。然后,如何在用戶規模高速增長的同時,保證 APP 滿足互聯網三高(即穩定性、流暢度、需求快速響應)的要求,對極氪來說是非常大的挑戰:14業務連續性要求:APP 核心服務需要保證 7*24 小時持續在線,對業務連續性要求非常嚴格。在面臨旺季銷售活動、新車型發布、突發熱點事件等情況時,系統需要再突發的大流量下保證可用性和用戶體驗的順暢。版本發布壓力大頻率快:業務快速發展需要保證快速的迭代,但為了保證業務的穩
16、定性,每次發布只能在業務低峰期(即凌晨)進行,這對開發、運維和測試同學來說是非常困難的。網關架構不一致,入口鏈路過長:網關架構不一致,包括 API 網關、安全網關和微服務網關,導致請求鏈路過長,增加成本同時也影響請求響應時間。1315方案亮點極氪汽車 APP 系統在阿里云上采用阿里云微服務引擎 MSE,以提升微服務系統的整體穩定性和開發迭代效率,降低入口網關的資源成本和請求的網絡延遲。該方案的亮點包括:流量防護和容錯提升微服務穩定性:利用 MSE Sentinel 實時監控和鏈路功能,快速定位慢調用和不穩定服務,及時進行流控和并發控制,保證系統可以從崩潰的邊緣迅速回到正常水平。全鏈路灰度發布實
17、現白天隨時發布:針對客戶核心業務鏈路上多個微服務同時需要發版的場景,基于 MSE 云原生網關和流量灰度打標來實現多業務的全鏈路灰度。容器化助力資源利用率與效率的提升:相比傳統的基于虛擬機部署方式,ACK 容器化部署方式幫助極氪提升了 20%的資源利用率和 50%的運維效率。極氪汽車/汽車&制造1316相關產品 容器服務 ACK 微服務引擎 MSE極氪汽車/汽車&制造建設成果極氪汽車 APP 已全面升級為云原生技術架構,大幅提升了用戶的出行體驗,同時也助力001 獵裝轎跑成為高端純電汽車銷量冠軍。通過深入的微服務化探索和云原生架構實踐,極氪汽車 C 端業務系統的穩定性和敏捷性得到了極大的提高,為
18、沖擊更高的銷量目標提供了堅實的技術支持。小鵬汽車/汽車&制造小鵬汽車成立于 2014 年,是一家專注未來出行的科技公司。一直堅持飽和式研發投入,構建全棧自研的核心能力,今天小鵬汽車已經成為中國領先的智能電動汽車公司之一??蛻艉喗閨小鵬汽車基于云原生實現研發提效,加速探索未來出行客戶痛點 數據處理鏈路復雜:自動駕駛車聯網數據鏈路長且數據增長快,因此數據時效性要求高。自動駕駛 AI 服務資源利用率低:缺乏有效的 AI 模型 GPU 訓練和推理優化??捎^測系統不完善:前端 Web 和后端服務缺乏有效的監控和分析,同時自建Prometheus 穩定性不佳。171318方案亮點阿里云云原生產品支持了小鵬
19、汽車多個業務的技術平臺建設。小鵬數據處理、AI 訓練與推理服務、工作流、SRE 運維設施均通過 ACK 統一容器技術棧進行承載。彈性算力支持復雜數據處理:通過容器服務 ACK 運行數據處理和數據脫敏任務,容器為實時任務提供了彈性算力。提升訓練和仿真資源利用率:ACK 云原生 AI 套件支持了小鵬自動駕駛大規模訓練和仿真任務的調度和管理,提高了訓練和仿真資源的利用率。同時 AI 套件還支持了小鵬互聯網技術中臺和鵬行業務的 NLP、ASR 等推理業務。ACK GPU 共享調度和隔離能力,成倍地提高了 GPU 資源的利用率。全鏈路可觀測保障業務穩定:小鵬基于托管在 ACK 上的全量業務,采用 ARM
20、SPrometheus 服務、前端監控和 APM 等工具實現全鏈路監控系統,有效洞察業務穩定性風險,保障業務穩定性。統一云原生技術棧簡化運維:除了通過容器服務 ACK 支持仿真、音視頻轉碼、視頻截圖、圖片處理、數據處理等相關業務外,小鵬還支持 Airflow/Argo workflow、Kubeflow/Arena 等工作流平臺。采用統一的技術棧運行各業務及其支撐系統,簡化了運維的復雜度。小鵬汽車/汽車&制造 支撐平臺技術棧復雜:技術平臺需要支持多種業務,并且需要建設如 Workflow CI 工作流、SRE 等工具平臺,技術棧較為復雜。1319客戶證言“小鵬汽車和阿里云攜手共建自動駕駛智算中
21、心 扶搖,為小鵬全場景智能輔助駕駛系統的訓練奠定算力基礎,我們相信跟阿里云一起能夠更快更好更強的發揮作用。阿里云的技術支持,使我們的成本降低,在過去及未來的時間里,阿里云的可靠性和穩定性,都是小鵬汽車最好的選擇?!毕嚓P產品 容器服務 ACK 應用實時監控服務 ARMS 容器鏡像服務 ACR Prometheus 監控服務小鵬汽車/汽車&制造來電科技/汽車&制造來電科技自 2014 年起開始進入共享充電領域,定義并開創了行業,屬于行業內最早的共享充電企業。主要業務覆蓋充電寶自助租賃、定制商場導航機開發、廣告展示設備及廣告傳播等服務。來電科技擁有業內立體化產品線,大中小機柜以及桌面型,目前全國超過
22、 90%的城市實現業務服務落地,注冊用戶超 2 億人,實現全場景用戶需求??蛻艉喗閨來電科技基于 MSE 無侵入式實現微服務治理客戶痛點 生產環境缺乏高效的流量管理手段:當業務有新版本需要上線時,只能全量上線,無法引導部分用戶到新版本。一旦出現問題,影響面過大。如果采用多套環境的硬隔離,會使成本大幅升高,發布方式變得復雜。201321方案亮點無侵入、接入簡單的全鏈路流量灰度管理:MSE 微服務治理能力基于 Java Agent 字節碼增強的技術實現,用戶無需修改代碼即可使用。簡單配置后,MSE 會自動為經過灰度環境的流量做標記,從而進行全鏈路的灰度路由,保證流量在灰度環境中閉環。無損的應用上下
23、線能力:MSE 提供的預熱能力使得流量按照一定的曲線進行緩慢增長,從而保證服務進行充分的預熱。即使在高并發大流量場景中,也能保護應用安全啟動。來電科技/汽車&制造 應用發布過程容易出現業務受損:當業務流量過大的場景下進行應用發布,系統服務剛啟動階段,應用由于存在冷啟動的過程,此時的應用容量往往會比正常情況下低。但是線上的流量是無法區分當前的服務是否是剛啟動的,依舊會有大流量持續涌入。這時系統就會過載而崩潰,導致業務受損。1322來電科技/汽車&制造建設成果MSE 微服務治理專業版以無侵入的方式提供了全鏈路灰度、離群實例摘除、微服務治理流量可觀測等核心能力,以更經濟的方式、更高效的路徑幫助來電科
24、技在云上快速構建起完整微服務治理體系。這有效提升線上穩定性,保證服務可用率達到 99.9%。相關產品微服務引擎 MSE硅基仿生/汽車&制造深圳硅基仿生科技股份有限公司成立于 2015 年,致力于慢病管理領域的創新醫療器械研發與產業化,公司規模超 500 人。核心團隊由清華、北大、加州理工、普林斯頓、華盛頓大學等名校理工科科學家帶領,主要項目包括連續血糖監測(CGM)、AI 眼底篩查、人工視網膜、膠囊胃鏡機器人等,在多個細分領域打破國外技術壟斷,引領基礎學科與行業技術發展??蛻艉喗閨硅基仿生業務全面 Serverless 容器化的增效降本之旅客戶痛點硅基仿生期望擁有一種新的技術架構,能夠按需使用
25、資源,節約使用成本,減少運維Kubernetes 集群,基于 Kubernetes 云原生標準 API,使用 Serverless 簡化應用運維部署,達到資源免運維的目的。硅基仿生的原有技術架構面臨兩個最大挑戰:231324方案亮點經過充分溝通和深入推敲業務應用場景和需求,硅基仿生選用了阿里云 Serverless 容器Knative+ASK 產品解決方案,以滿足業務需求:快速迭代:例如智能問答平臺需要多次測試和訓練,若使用以往的部署方案,可能會浪費大量時間在運維和部署上,從而降低產品的開發效率?,F在采用 Knative 快速部署服務到 Kubernetes,可以大大提高產品開發效率,實現數據
26、驅動的良性循環。極致彈性:以往的部署方案在面對脈沖式訪問流量時,容易出現服務器宕機以及低谷時浪費網絡資源的情況。而 Knative 的部署方案可以極致的彈性能力和靈活的彈性策略,構建出高效、穩定的架構,滿足部署需求的同時節省開支。業務穩定性:Knative 內置 queue-proxy 容器能夠與業務容器結合,實時觀察請求流量并進行流量告警。再結合基于請求的灰度發布和多版本管理,可以全天候隨時發布,極大提高運維效率和版本迭代速度。硅基仿生/汽車&制造 研發效率低下:例如智能問答模型,需要反復進行測試和訓練,而原有的技術架構需要運維人員不斷檢測部署,大大降低了產品的開發效率。資源成本嚴重浪費:使
27、用固定資源的服務器,在高峰期會出現資源緊張,甚至宕機的情況;而在低谷期,又會出現資源浪費的情況。1325客戶證言硅基仿生科技數據中心算法研發部 NLP 項目負責人表示:“使用阿里云容器服務Knative,解決了開發迭代慢的問題,加速了深度學習模型的性能提升;同時提供了彈性可伸縮的資源配置,滿足網絡服務需求,降低了服務部署成本?!毕嚓P產品Serverless 容器服務 ASK硅基仿生/汽車&制造建設成果當前通過 Knative 完全支撐了硅基仿生的業務系統,實現硅基仿生業務 100%Serverless化:糖尿病智能問答系統在內分泌專家和內測病友的支持下收集了 14 萬+的問答庫。糖尿病科普文章
28、推薦系統為病友及其家屬推薦個性化的科普文章。血糖分析助手和 AGP 分析助手助力患者達到更好的控糖水平。糖尿病事件知識圖譜標注平臺可更好地用于糖尿病相關的診斷、治療以及科研。TCL/汽車&制造TCL 創立于 1981 年,總部設于中國廣東省惠州市,目前已形成 TCL 實業和 TCL 科技兩大主體,布局智能終端、半導體顯示、新能源光伏三大核心產業,成長為一家具有全球競爭力的智能科技產業集團。TCL 目前擁有 13 萬名員工,在全球布局 43 個研發中心和32 個制造基地,業務遍及 160 多個國家和地區,全球累計服務用戶超 9.6 億??蛻艉喗閨TCL 擁抱云原生,實現 IT 成本治理優化客戶痛
29、點 整體資源利用率較低,成本洞察粒度不足,無法驅動策略優化。在早期上云的過程中,TCL 通過給不同的事業部分配獨立云賬號的方式,實現成本單元的規劃與核算。但是當工程師團隊希望洞察整體的資源使用和浪費情況時,單純從服務器等云資源的利用率來衡量業務的容量規劃浪費情況是不夠合理的。因為從單個業務的視角,容量規劃需要根據業務的峰值情況來規劃。261327方案亮點 洞察資源使用量,調控周期性業務成本,提高集群利用率。針對具體應用類型,選擇適合的機型和配置,并與業務團隊協商容量上限,在全鏈路壓測中確定容量水位和容量畫像,通過容器服務的成本分析功能,查看當前容量規劃下應用的真實利用率。對于存在周期性業務的情
30、況,采用定時伸縮模型降低資源成本,在生產環境和測試環境中調整超賣比配置,提高集群利用率。精細化成本管理,合理規劃容量,應對突發業務。定時查看、巡檢集群中應用的利用率和資源水位,匯總成本報表,通過云原生企業IT成本治理方案進行集群-部門-應用維度的實時成本預估,讓部門時刻關注成本的趨勢變化,開啟 HPA 自動伸等縮策略和報警,保障業務在流量突增場景的魯棒性。TCL/汽車&制造 業務高速發展,傳統容量規劃的周期無法滿足,影響業務使用。TCL 上云的過程經歷了上云遷移期、業務增長期、業務穩定期等多個階段。在上云遷移期和業務增長期中,發現傳統按照月度、季度甚至年度的 IT 成本治理周期無法跟上業務增長
31、的速度,造成很多業務處于無資源可用或超預算使用的情況。臨時作業/突發任務等短周期作業較多,對容量規劃帶來巨大挑戰。TCL 壓測平臺是一個被重點關注的業務,因為壓測任務具有短時間、大規模、低成本的要求,是傳統企業 IT 成本管理中最難以處理和解決的資源類型,但也是上云按需使用的最佳場景。業務容量、成本預估困難,缺少數字化指標支撐增效降本。在 TCL 工程師團隊定下增效降本的目標后,如何數字化衡量和評估應用的容量和成本情況,成為了最大的挑戰。只有當一個應用的資源成本畫像可以被準確繪制時,才能有針對性地建立優化策略。1328相關產品容器服務 ACK建設成果通過云原生企業 IT 成本治理方案,TCL
32、工程師團隊可以非常便捷地提供 Kubernetes 集群中的業務、組織等維度的成本數據,大大提升了部門之間的成本通曬的效率,配合技術、業務、財務“戰略同頻”的云原生 IT 成本治理流程,為集團優化了 10%閑置的資源,各類業務降低了 30%的配額,每年節省近千萬的 IT 成本投入。TCL/汽車&制造 快速預估成本,基于數字化指標精準繪制資源成本畫像。通過云原生企業 IT 成本治理方案提供的費用分攤功能,定期將拆分后的成本分析數據推送給不同角色的人員,并建立復盤機制,協同技術、財務、業務團隊迭代優化成本畫像的合理性。蘇打智能/汽車&制造高猛科技是一家硬件設備制造商,專注于為全國高校學生提供高品質
33、生活服務。服務項目包括自助洗衣、智能直飲水等。其“蘇打智能”品牌(原“蘇打校園”)成立于2016 年,專注于用高新科技的力量構筑智能生態,保障、提升消費者生活品質??蛻艉喗閨蘇打智能借力阿里云 AHPA 輕松應對突發流量客戶痛點隨著業務量的增長和業務微服務化以及容器化,應用程序的資源需求出現了周期性變化。當前客戶所面臨的主要難題是如何充分利用 Kubernetes 的資源彈性特性,使業務層更加靈活,同時降低成本??蛻粝M峁┑膹椥苑桨改軌驅崿F以下目標:按需分配資源:可以及時根據業務實時資源消耗進行資源消耗預測,判斷業務接下來對于資源的真實需求。291330方案亮點相比 HPA(水平 Pod 自
34、動伸縮器),阿里云容器服務的 AHPA 方案具有以下具體優勢:按需使用資源,自動彈性規劃,對業務所需資源提前預熱。全托管,免運維,提供開箱即用的彈性能力。提供標準 Kubernetes API,方便平臺集成和擴展。彈性組件自身高可用,基于阿里巴巴達摩院預測算法穩定高效。蘇打智能/汽車&制造 降低工具本身資源開銷:工具本身的資源消耗要盡可能小,不應成為運維的負擔。操作方便,擴展性強:能夠做到無需培訓即可快速上手,具有良好的擴展性和可自定義性。安全穩定:高可用,算法和實施手段高效可控。1331相關產品容器服務 ACK客戶證言高猛科技高級后臺工程師表示:“高猛科技已在幾個主要服務 ACK 集群上啟用
35、了 AHPA。相比于 HPA 的方案,AHPA 的主動預測模式額外降低了 12%的資源成本。同時 AHPA 能夠提前資源預熱、自動容量規劃,能夠很好地應對突發流量?!碧K打智能/汽車&制造建設成果高猛科技已在幾個主要的 ACK 服務集群上啟用了 AHPA。經過驗證,相比于 HPA 的方案,AHPA 的主動預測模式額外降低了 12%的資源成本。同時,AHPA 自動計算負載曲線,設定目標容器數等特點,減少人工運維工作量,優化業務容器化架構。致景科技/汽車&制造致景科技成立于 2013 年 12 月,是領先的紡織產業互聯網企業,國家高新技術企業。旗下擁有“百布”、“全布”、“天工”、“致景金條”、“致
36、景紡織智造園”、“致景智慧倉物流園”等業務板塊,致力于通過大數據、云計算、物聯網等新一代信息技術,全面打通紡織服裝行業的信息流、物流和資金流,幫助行業實現協同化、柔性化、智能化的升級,構建紡織服裝縱向一體化的數智化綜合服務平臺??蛻艉喗閨致景科技基于 MSE 一站式實現服務治理客戶痛點 項目測試環境搶占沖突:項目測試環境經常被缺陷修復的測試流程搶占,導致項目測試時斷時續,同時測試環節成為項目主要瓶頸,嚴重影響項目迭代的進度。321333方案亮點 全鏈路服務治理提升開發和交付效率:阿里云微服務引擎 MSE 標簽路由+云效應用編排 AppStack 的方案,幫助客戶定義了整個研發體系所需要的環境體
37、系,包括多套的開放環境、多套項目環境(含基礎環境)、集成測試環境、預發環境和生產環境。實現了默認按照域名進行項目/開發多環境邏輯動態隔離的效果,同時提供給研發團隊便捷的白屏管理工具,可以由項目組獨立拉起整個環境。通過三個場景化的實施方案,完美解決了項目測試環境被搶占、開發聯調環境不穩定、線上灰度環境等難題。致景科技/汽車&制造 開發聯調環境不穩定:為了提升開發效率,開發環境允許開發同學自由發布,由于使用一套環境,不同的同學進行開發環境發布,經常性地導致聯調中斷。不少開發同學轉而尋求端到端的線下聯調,在個人機器上部署上下游應用,這種模式面對眾多的微服務應用基本寸步難行。線上灰度能力缺乏:客戶缺少
38、專門提供給產品經理進行功能驗證的預發環境。新功能完成測試之后直接上線到生產環境,研發團隊為了避免對客戶產生不良影響,經常性地將發布計劃安排在晚上。線上環境缺乏灰度發布能力意味著新功能上線以后就會對全量用戶放開,一旦發生了產品設計缺陷或者代碼漏洞的情況,那么影響面將會是全網的,風險巨大且不可控。1334相關產品微服務引擎 MSE客戶證言“作為一支創業團隊,快速實現一站式解決服務治理問題是非??岬氖虑?。在整個方案的討論和實施過程中,我們的研發團隊對 Kubernetes、Nginx Ingress、MSE 都有較深入的理解。像我們部門的研發團隊一樣,沒有專門的運維團隊,每個開發人員都可以深入了解每
39、個產品的來龍去脈,這樣做非常有意義?!敝戮翱萍?汽車&制造商米科技/汽車&制造商米科技成立于 2013 年,總部位于上海市楊浦區創智天地,是一家極具產品創新基因和互聯網基因的公司??蛻艉喗閨商米科技借力 ASM 實現業務迭代大幅提效3513商米科技/汽車&制造客戶痛點隨著業務的快速發展,團隊規模不斷的擴大,商米科技面臨兩大挑戰:高昂的維護更新迭代和異常排查成本。隨著產品研發進度的加快,應用的快速更新與灰度驗證,使維護難度與人力成本急劇攀升。同時,微服務基礎平臺的穩定性與問題快速診斷也面臨較大挑戰。gRPC 服務負載均衡、鏈路追蹤以及流量統一管理難。gRPC 長連接的特性,在不借助服務網格的前提
40、下,很難實現負載均衡。且隨著業務的擴展及調用鏈路的復雜,在可觀測及統一流量管理上會帶來較大的運維成本。方案亮點商米科技引入阿里云服務網格 ASM,構建智能的數字化商業智能 POS 軟硬件一體化系統解決方案,基于 ASM 提供的免運維、易升級和豐富的產品能力,讓產研團隊享受ServiceMesh 帶來的技術紅利。成熟的治理能力:客戶主要使用 HTTP 與 gRPC 協議,ASM Sidecar 代理和 Gateway這些協議都有著很高的支持成熟度,能夠原生地支持請求的負載均衡、以及基于多種豐富匹配條件的請求路由等網關能力。完備的觀測能力:ASM 的可觀測管理中心中提供了完善的可觀測化方案,包括日
41、志、監控與跟蹤融合的一體化智能運維,以及直觀易用的可視化網格拓撲、基于顏色標識的健康識別體系。異常排查更高效:ASM 產品內置了豐富的最佳實踐,通過自助式網格診斷機制,幫助用戶縮短異常排錯的時長,提升更新迭代效率。361337相關產品建設成果服務網格 ASM 提供了免運維、易升級和豐富的產品能力,讓產研團隊集中享受 ServiceMesh 帶來的價值。ASM 縮短 75%服務網格技術落地周期,由月縮短為周,提升 70%更新迭代效率,節省 80%異常排錯成本,大幅節省了控制面的資源成本。商米科技/汽車&制造 服務網格 ASM 容器服務 ACK 彈性容器實例 ECI Serverless 容器服務
42、東風日產/汽車&制造東風日產數據服務有限公司(以下簡稱東風日產)成立于 2014 年,擁有員工 800 余人,是汽車全價值鏈數據服務供應商。專注為東風日產、東風啟辰等品牌提供數營服務、銷售服務、客戶服務、商城運營服務,全渠道數據價值挖掘分析及應用??蛻艉喗閨東風日產借力 ASM 實現流量精細化管控客戶痛點 成本控制難:除了能夠自動按需提供環境,還需要增量式部署以節省服務器資源,控制服務器資源成本等問題。生產環境灰度復雜度高:需要對 7 層流量進行精細化管理,可以按照設計的情況進行流量轉發(例如 Header),命中對應需求的應用;否則,命中默認應用(基準環境)。381339方案亮點 免運維、易
43、升級、企業級能力豐富:東風日產引入阿里云服務網格 ASM,構建了基于流量管理的無限生肖系統,滿足了自動按需提供環境的訴求?;?ASM 提供的免運維、易升級以及豐富的產品支持能力,讓產研團隊集中享受 Service Mesh 帶來的價值。這有助于東風日產縮短服務網格技術落地周期,減輕異常排錯成本,并節省控制面資源成本。數據安全更有保障:此外,東風日產數據服務有限公司非常注重信息安全。結合阿里云的云安全大數據能力,使用云防火墻保障業務和數據的安全。在對云資產的管理過程中,通過堡壘機的方式保障運維過程的安全,做到有據可依,有源可溯,切實保證云上應用和數據的安全可靠。東風日產/汽車&制造 服務鑒權機
44、制缺乏:公司非常注重信息安全,需要一個端到端細粒度的安全授權機制。1340相關產品客戶證言“借助云的能力,不僅加速向業務的延伸,進一步提升業務價值,降低運維成本,而且通過服務網格實現了高效、低成本的資源供給?!狈站W格 ASM 容器服務 ACK東風日產/汽車&制造建設成果客戶通過引入 ASM,高效解決 7 層流量的精細化管理難題,享受 Service Mesh 帶來的技術紅利,縮短 50%的服務網格技術落地周期,同時節省控制面的資源成本。節卡機器人/汽車&制造|節卡機器人,云撥測助力全面優化海外網站性能作為國際領先的新一代協作型機器人企業,節卡機器人經過多年發展,與全球超過 300家自動化方案
45、公司緊密合作,并部署逾萬臺機器人。這些機器人靈活高效地服務于汽車、電子、半導體等全球知名品牌的生產線,同樣也在眾多商業新消費領域從事與消費者直接接觸的服務工作??蛻艉喗榭蛻敉袋c為了更好地服務全球各地客戶,保證節卡機器人官網能夠在全球范圍內被正常瀏覽,成為運營團隊以及運維團隊面臨的主要問題。而這一問題也是出海企業遇到的普遍難題,但想要測試全球不同地區不同站點的訪問速度,企業無法在全球每個地區都找當地人進行實地測試。因此,節卡機器人希望能夠模擬全球不同地區用戶的真實網絡環境去體驗網站,了解實際訪問體驗情況。411342在了解用戶這一問題之后,阿里云與節卡機器人進行溝通,一致認為具備全球海量監測節點
46、以及非侵入式的云撥測是解決問題的最佳產品。覆蓋眾多海外用戶場景:根據節卡主要海外目標市場,借助云撥測全球超過 20 萬Last Mile,500余個IDC終端監測節點,海內外 400+運營商以及數十萬量級注冊會員,選取了北美、歐洲、南美洲、東南亞等主要國家的 LastMile(真實網民)監測點,配置瀏覽器撥測任務,對節卡的海外官網進行定時撥測。多維度解析目標訪問地址:結合云撥測提供的豐富指標體系與圖表類型,直觀定位問題、受影響范圍及其根因,通過對撥測日志與看板進行分析,發現節卡官網在歐洲和南美洲的 CDN 加速實現了就近訪問,但美東和東南亞地區 CDN 未達到預期效果。進一步分析發現,在 CD
47、N 達到就近訪問地區,整體性能也較慢,需具體分析官網頁面不同元素加載效果。建立主動發現機制:借助云撥測,主動了解網站訪問情況,進行問題驗證和故障復現,對網站性能進行評估與優化。并針對首屏用時、整體性能、可用性實現實時告警,通過與阿里云告警中心深度集成,有效縮短 MTTR。支持發現頁面元素級錯誤,問題歸因精準定位至單次網絡請求過程,提升問題定位效率。方案亮點節卡機器人/汽車&制造1343節卡機器人/汽車&制造最終成效經過與 CDN 供應商溝通后,優化了美東和東南亞的 CDN 調度邏輯,同時對頁面圖片進行壓縮,整體網站打開速度提升 50%??蛻糇C言節卡機器人數字化產品中心負責人表示借助云撥測,節卡
48、機器人有效挖掘性能瓶頸,經過優化,提升網站打開速度 50%以上,提高了運營推廣活動的 ROI,幫助節卡為全球用戶提供更加優質的服務。相關產品應用實時監控服務 ARMS車主無憂/汽車&制造車主無憂是屬于廣州小邁網絡科技公司服務于汽車后市場的重要產品。小邁網絡是一家以1、2線城市車主為目標用戶的移動互聯網公司,通過構建串聯車主與商家的 O2O 平臺,降低車主用車成本,提升車主用車品質。于2015.1成立,由納斯達克上市公司前高管創建,并獲得多輪風投的青睞。公司擁有一流的移動互聯網產品研發核心團隊,團隊年輕有活力,擁有多年移動互聯網產品研發運營經驗,在過去的工作中領導和創建了超過4億用戶規模的移動互
49、聯網產品。車主無憂提供了違章查詢、罰單處理、二手車、加油充值、車險服務,以及各種咨詢頭條服務,致力于打造汽車服務的生態圈子。目前車主用戶已破億,在艾瑞咨詢 APP 熱點指數“汽車護理”領域排名第一。|Kafka 商業版助力車主無憂系統穩健客戶簡介441345解決方案利用經過優化的阿里云商業版消息隊列 Kafka 開箱即用,完全兼容開源的無縫遷移的特性,結合最佳實踐在線遷移消息隊列 Kafka 的指導,自主高效地完成了遷移工作。由阿里云團隊進行專業的運維,利用 Kafka 的自動化內檢功能,保證 Broker 以及依賴組件 Zookeeper 的健康穩定。運維白屏化管理,可以協助用戶進行快速的分
50、鐘級擴容。提供了有效的故障管理。借助商業版本提供的監控告警能力,實時掌握硬件資源與服務可用性情況,指導我們的應用進行優化調整。車主無憂/汽車&制造 容量彈性:開源的 Kafka 在 partition 分區規模超過 1000 后有明顯的抖動,集群擴容小時級別,業務有感知。存儲開銷:開源的 Kafka 多副本存儲,存儲壓力大,且會在磁盤寫滿的情況下直接停止運行,沒有保護機制,需要額外提供告警人工處理。性能穩定:在處理冷數據讀的時候處理速度明顯下降,數據寫入有一定失敗幾率;拉取 G 級別的數據時,Full GC 高頻出現??蛻敉袋c1346相關產品客戶證言“商業版的 Kafka 完全兼容開源的生態,
51、接入方便容易,并且提供了優質的 SLA 保障,各種日常功能操作也簡潔易用,綜合使用成本有優勢??偟脕碚f就是省事省錢,質量有保證,是一款良心制作的基礎PaaS產品?!毙∵~ CTO 溫嘉銘消息隊列 Kafka 版車主無憂/汽車&制造 業務穩定:通過遷移到商業版本的 Kafka,消息無丟失,生產與消費端的抖動明顯好轉,整個消息集群平穩運行,有效地支持了業務的快速發展。效率提升:Kafka 提供了白屏化的管理方式,基于阿里云提供的控制臺,我們可以方便快捷地擴展實例,對 TOPIC 進行管理,以及擴展 PARTITION。另外還提供了堆積、消息查詢等實時監控功能,并且可以設定各種資源的報警規則,用于快速
52、定位問題、提升診斷效率、指導優化系統。成本控制:節省了大量的運維人力成本,解放了生產力,綜合比較,使用商業版本的使用成本更劃算。用戶價值傳音/汽車&制造作為“非洲手機之王”,傳音從事以手機為核心的智能終端的設計、研發、生產、銷售和品牌運營,是新興市場消費者喜愛的智能終端產品和移動互聯服務提供商。據 IDC 報告顯示 2021 年占據非洲智能手機出貨量的 47.9%。傳音移動互聯廣告平臺是傳音控股的重要業務之一,是非洲最為主流的營銷平臺之一??蛻艉喗閨傳音基于 ARMS 構建全球一體化可觀測平臺,高效支撐業務創新客戶痛點在技術架構方面,傳音控股采用 Spring Cloud 進行全面微服務化,應
53、用運行在阿里云容器服務 ACK 之上,并分布在歐洲、亞洲等多個地區,真正實現了多地區服務體系。對于該體系而言,要構建完整的可觀測體系,挑戰非常大。4713方案亮點 提供統一指標體系:通過阿里云 ARMS 和 Prometheus,建立了覆蓋資源層、容器層、服務層、應用層、用戶體驗層的統一指標體系,實現從零散單點到規?;娜娓采w。全鏈路追蹤診斷:接入 ARMS 應用監控后,可以非常方便地查看服務的健康狀況和依賴關系。在線上出現問題時,可以深入拉起全鏈路的調用鏈追蹤,并定位到代碼級別,極大程度地提高了排查問題的效率。無侵入式一鍵接入方案:只需要在應用部署時添加 2 行注解,就能自動注入 Agen
54、t 實現全鏈路監控,對代碼無侵入,不再需要運維團隊花費精力在可觀測平臺的推廣上。全局聚合:通過阿里云 Prometheus 的全局聚合實例以及智能報警中心,對部署在全球各地的業務系統進行統一大盤呈現和統一報警。觀測對象眾多:觀測對象分布在不同的技術棧和架構中,要實現全面覆蓋并有所側重,是非常大的挑戰。排查問線上問題慢:微服務化后,業務結構變得非常復雜,排查線上問題需要分析復雜的調用鏈路,需要花費很長的時間。推廣難度大:新業務上線頻率極快,有些業務為了快速上線減少工作量,不愿意接入可觀測平臺,需要花額外的精力進行推廣。監控數據分散:在實現多地區部署后,每個地區都有一套獨立的可觀測平臺,分散在多個
55、地區的可觀測數據無法聚合展示,日常使用非常不方便。傳音/汽車&制造4813相關產品 應用實時監控服務 ARMS 容器服務 ACK建設成果 運維技術全面升級:通過阿里云 ARMS 應用監控構建全鏈路追蹤系統,結合阿里云Grafana 提供的可觀測統一視圖,再對接至 ARMS 告警平臺,最終對接至飛書群,傳音成功實現告警群內協作閉環,實現了 ChatOps 的運維新范式。提升業務創建效率:傳音在建立全新的可觀測技術能力后,不僅提升了問題診斷效率,還提升了用戶體驗。在此基礎上,結合其他云原生新技術方案,業務上線效率提高了60%,對于高效業務創新起到了至關重要的作用。傳音/汽車&制造49vivo 是一
56、家以設計驅動創造產品,以智能終端和智慧服務為核心的科技公司??蛻艉喗閨vivo AI 計算平臺的 ACK One 混合云實踐客戶痛點 資源交付周期長:此前使用自建機房,新增資源的采購流程復雜,周期長,無法及時響應業務臨時的大量算力需求,例如大規模參數模型的訓練和在線服務的節假日活動擴容。同時由于服務器供應鏈形勢嚴峻,網卡、硬盤、GPU 卡等硬件設備都缺貨,采購交付存在較大風險。需要更高性能的基礎設施:AI 計算平臺對網絡、存儲有更高的性能要求,在私有 IDC里落地需要很高的時間和金錢成本。vivo/汽車&制造5013方案亮點采用 ACK One 方案,將云主機當做裸金屬/物理機,加入到客戶自有
57、容器集群,集群使用人員體驗感無差異,無需額外開發。云主機通過客戶云平臺申請,不改變當前資源申請流程。實施簡單,成本低:客戶原有集群無需改動,功能兼容,無需額外開發。提供一致性的體驗:將云主機加入集群的流程和物理機基本一致。先通過公司云平臺申請云主機,然后通過自動化平臺將云主機初始化并加到集群中。提供更好的混合云網絡:Kubernetes 的容器網絡要求 pod 和 pod、pod 和宿主機之間通訊正常。該平臺采用了 Calico+Terway 的網絡方案,主要表現為在客戶機房內的工作節點采用 Calico BGP,阿里云上的工作節點采用 Terway 共享網卡模式,以獲取更好的性能。vivo/
58、汽車&制造5113建設成果通過 ACK One 混合云的能力,該平臺可將阿里云上的 GPU 主機加入到客戶自有集群,提供給用戶在深度學習訓練平臺上使用,及時滿足業務的算力需求。用戶的使用習慣和之前保持一致。公共云資源根據不同業務的情況,使用周期在一個月到數個月。使用費用大大低于自行采購物理機的費用,有效降低成本。相關產品 分布式云容器平臺 ACK One 容器服務 ACKvivo/汽車&制造52|云快充云原生穩定性建設之路云快充/汽車&制造云快充成立于 2016 年,以充電服務和能源管理為核心,業務涵蓋九個方向。截止到2022 年11 月,業務覆蓋 370 個城市,接入電樁運營商 7400 人
59、,接入充電終端 31 萬家,與 640 個樁企達成合作??蛻艉喗榭蛻敉袋c為確保業務的穩定性運行,自2019年起,云快充采用百分百容器化技術指路線。然后,在容器化改造的過程中,云快充遇到了兩個挑戰:自建 Kubernetes 集成維護困難:Kubernetes 是一個大型復雜的分布式系統,云快充曾經遇到的過節異常,Pod 異常、網絡不通、etcd 性能瓶頸等問題,解決這些問題非常消耗精力,尤其是遇到 Kubernetes 本身的 bug 時更是無能為力。5313 業務變更帶來穩定性風險:隨著微服務架構的不斷演進,業務變更越來越頻繁。由于應用上下線不夠優雅以及缺少精細化和灰度策略,80%以上的線上
60、業務故障都與版本發布有關。高穩定性的托管版 Kubernetes 集群:容器服務 ACK 在確保 API 和標準完全兼容開源Kubernetes 的前提下,提供了一系列穩定性提升手段,如 master 節點托管、智能巡檢診斷、跨可用區的高可用等等。這些手段都經過阿里雙十一大規模場景和阿里云大型客戶的實驗驗證,升級集群版本也變得足夠簡單?;?eBPF 技術的應用診斷技術:一鍵開啟應用診斷能力,不需要對應用進行任何修改,它提供全局視角的應用拓撲,并從請求數、錯誤數、延誤三個黃金指標出發,發現異常的服務個體。通過微服務治理實現應用穩定性提升:采用基于 JavaAgent 字節碼增強的技術,實現無侵
61、入式微服務治理措施,讓微服務應用獲得無損上下線和全鏈路灰度能力,從而將版本發布對正常業務的影響降到最低。方案亮點云快充/汽車&制造5413建設成果 生產事故率顯著降低:云快充在一條業務線上落地了全鏈路灰度技術,將應用變更導致的生產事故降低了70%,后續還會將這項技術推廣到整個企業。業務高峰期系統穩定運行:從網關到微服務應用,到第三方依賴,每一層都配置流量防護規則,確保在業務高峰期不會有任何系統被用戶流量所壓垮。研發效率提升:通過云原生穩定性建設,云快充接入的電樁數量完成了20萬到30萬的增長,平均需求迭代周期從7人日降低到4人日,極大地促進了業務的快速迭代。相關產品 容器服務 ACK Prom
62、etheus 監控服務客戶證言“在阿里云的幫助下,云快充通過全面容器化與穩定性建設,極大地促進了業務的快速迭代。希望新能源行業的其他技術團隊可以和我們一起共同探索云原生穩定性方面的技術路徑?!痹瓶斐?汽車&制造55間隔頁(待分享)零售/電商RETAIL/E-COMMERCE 杭州聯華華商集團有限公司,成立于2002年7月,主要業務涵蓋購物中心、大賣場、綜合超市、標準超市、精品超市、便利店、無人值守智慧商店等零售業態,涉及全渠道零售、倉儲物流、餐飲、消費服務、數據服務、金融業務、跨境貿易等領域。2014 年世紀聯華的雙12活動中,因為業務遭遇爆炸性流量,多個門店支付時好時壞,短時間也無法維護,導
63、致用戶體驗差,這讓世紀聯華的技術人決心改進這套使用了十多年的老系統??蛻艉喗閨世紀聯華基于函數計算實現一鍵部署和極致彈性客戶痛點因為很難算準突發的定時搶購業務量,這就導致很難預估準備多少機器來應付相應的業務量。世紀聯華的技術人員了解到使用 Serverless 技術,陡升陡降的業務不需要提前做預算來準備購買多少臺存儲服務器。在緊張的測試驗證后,技術人員發現函數計算的優異表現很契合聯華的業務高度彈性的會員查詢系統。世紀聯華/零售&電商&本地生活571358解決方案Serverless 架構具有快速擴容、彈性高可用的特性,可以輕松應對突發流量。使用阿里云表格存儲代替傳統的關系型數據庫,通過函數計算
64、讀寫表格服務中的數據,快速返回處理結果給前端用戶。世紀聯華/零售&電商&本地生活相比傳統方案臨時增設服務器,極大地簡化運維。函數計算彈性擴容,根據請求量動態分配執行環境,部署上線簡單;OTS 訪問更快,吞吐量更強,不需要額外增加機器;API網關,可以控制訪問量,導出 API 文檔,非常方便。用戶價值 無需人工干預,瞬時彈性擴容很好地解決了流量的爆發帶來的服務全面不可用。運維管理簡單,一鍵部署更新函數,不需要了解網絡分發架構,部署流程變得更簡單,無需特聘運維人員,普通研發即可操作。不再需要提前做費用預算,用多少資源是多少錢,極大解決了技術和財務的溝通煩惱。因為定時秒殺場景請求波峰波谷明顯,不需要
65、預留大量機器,從而節省了大量費用。相關產品函數計算 FC貴州酒店集團有限公司于2019年2月28日注冊成立,是經貴州省人民政府批準并授權省國資委履行出資人職責的省管大型企業,全資及控股子企業23家,自營及委管酒店(項目)80余家,客房近1.3萬間??蛻艉喗閨貴州酒店集團基于 SAE 實現幾乎零改造的微服務升級客戶痛點酒店集團的信息系統最初部署在阿里云 ECS 上。系統按照微服務的架構拆分成多個組件,基于 ASP.NET Core 框架開發。在開發運維過程中遇到一系列問題:組件缺少擴展性:集團的業務有明顯的峰谷特性,平臺會定期上線一些活動,如土特產秒殺,酒店房間優惠,通過這些活動用戶可以獲取搶購
66、“貴州名牌白酒”的資格等。在活動期間訪問量巨大,峰值最高能達到十幾萬 QPS,是平時的幾十倍。貴州酒店集團/零售&電商&本地生活591360解決方案 對 CI/CD 的支持:SAE 支持云效、Jenkins、源代碼、Cloud Toolkit 插件、容器鏡像服務等多種部署方式,自動完成從代碼提交到應用和任務部署的 DevOps 完整流程,高效替代業內部署復雜、迭代緩慢的傳統方式,實現了高效的持續交付流程。多環境建設不完善:線下測試環境與線上生產環境隔離,線下測試中并不能完全覆蓋線上生產環境的場景,在上線時會出現需要上線的組件在線上真實環境中出現預期之外的異常,需要快速恢復,這就需要有很好的版本
67、管理,這一塊也是缺失的。團隊協同效率低:整個系統有多個模塊,分散在不同團隊,ECS 機器也都是獨立維護,發版過程需要上下游鏈路一起協同,按照依賴關系順序發布,消耗時間長,協同難度大。監控系統不完善:運行狀態沒有統一的觀測平臺,遇到問題也只能子系統分別排查,且缺少問題排查協助工具。貴州酒店集團/零售&電商&本地生活1361用戶價值結合這些 SAE 的能力,本次信息平臺2.0的建設,項目組沒有大的改造原來代碼邏輯的同時,基本完成了最初定下的目標,同時在開發,運維和協作的幾個方面建設了自己的流程規范,快速追平了業內的優秀實踐。新系統上線后,通過 SAE 白屏化的操作界面,運維難度和壓力都大大降低。根
68、據 RT 和定時的混合策略,應用有了很好的彈縮表現,并且這一切都是自動化的,不再需要運維同學人為的介入,這一點大大的降低了重復勞動。在團隊協作方面,通過阿里云的 RAM體系,開發,測試,運維同學都統一在 SAE 控制臺各司其職,減少了很多不必要的溝通消耗??傮w來看,系統上線 SAE 之后,開發運效率提升了50%+,機器成本下降了20%,運維人力成本下降了60%,擴容速度更是比之前快了十幾倍,很好的完成了之前定下的目標。高可用和穩定性的支持:SAE 支持批量發布,微服務無損上下線,使組件在發布更新時,不會影響影響整體鏈路的可用性,另外 SAE 還支持多可用區的部署,使得應用的穩定性得到進一步的加
69、強。權限助手:權限助手可以對 SAE 的權限進行可視化配置,精確到應用、任務的讀寫操作,并在 SAE 控制臺生成對應的權限語句,避免因直接在 RAM 控制臺手動編輯權限語句而出現紕漏。操作審計:SAE 記錄了所有應用及資源相關的操作詳情,包括操作時間、操作內容、操作人 ID 等信息,在出現問題時可以快速追溯原因。貴州酒店集團/零售&電商&本地生活相關產品Serverless 應用引擎 SAE震坤行工業超市(上海)有限公司(以下簡稱:震坤行)成立于 1996 年,是一家服務于工業領域與制造業的一站式工業用品服務平臺。震坤行經營了 32 條產品線,500 余萬種工廠使用的輔料和易耗品(MRO)。通
70、過產業的網絡協同、覆蓋全國的智能化供應鏈、數字化的采購平臺,震坤行工業超市線上平臺擁有 8000 多家供應商與國內外知名合作伙伴,以及與超過 20000 家先進制造企業??蛻艉喗閨震坤行基于云原生高效提升應急供應鏈管理能力客戶痛點業務穩定性和安全性問題突出。目前的業務系統在部署過程中經常出現發布不穩定、上線需要人工干預等問題,這導致效率低下、誤操作、無法穩定升級等問題。同時,在線業務需要完善的安全方案,以確保網關和內部調用的安全性。震坤行/零售&電商&本地生活62應用維護和異常排查成本較大。隨著業務的快速發展,應用更新迭代的維護以及異常問題的排查成本急劇上升,同時服務負載均衡、鏈路追蹤和流量統
71、一管理等需求痛點逐漸擴大。1363方案亮點引入阿里云服務網格 ASM,構建智能的數字化供應鏈解決方案?;?ASM 提供的免運維、易升級以及產品豐富的支持能力,讓產研團隊集中享受 Service Mesh 帶來的價值的同時,又避免了高昂的維護更新迭代和異常排查成本,并解決了諸如服務負載均衡、鏈路追蹤和流量統一管理等核心問題。穩定性提升:技術基座采用具備高可用、免運維、內建安全最佳實踐可開箱即用的ASM 服務網格實例,使開發人員可以更專注于業務應用而非基礎設施運維。無需復雜的配置即可獲得穩定的服務網格能力。將服務網格組件和集群拆分開,對服務網格組件進行升級不會影響到集群,解耦網格實例和 Kube
72、rnetes 集群的生命周期管理,使服務運行更加穩定,節省了運維成本。安全和可用性提升:通過 ASM 系統保障服務的安全和高可用性,輕松啟用 SDS,為服務網關提供 HTTPS 安全支持、證書動態加載,從而提升服務網關的安全性。支持以漸進方式逐步實現 mTLS 認證,并提供簡單易用的 RBAC 功能。極大簡化精細化應用流量管理策略與灰度發布:ASM 提供精細化的流量路由策略,幫助業務實現灰度發布、熔斷、故障注入等 DevOps 場景。ASM 極大簡化了遺留系統實現網格化的架構升級,同時支持某些老系統的極端場景,例如超長 header 請求(大約 40-60K)和超長 body 請求(大約 2-
73、10M 左右)。震坤行/零售&電商&本地生活1364建設成果通過業務云原生改造,容器化和網格化為業務帶來了更高的穩定性,缺陷密度下降了60%,DevOps 平臺的持續建設也幫助研發效率提升了 20%,交付速度提升了 200%。相關產品 服務網格 ASM 容器服務 ACK震坤行/零售&電商&本地生活識貨 App 是國內領先的年輕人生活社區與消費決策平臺,致力于為廣大年輕用戶提供專業的網購決策指導。2020 年起,識貨業務系開始整體業務平臺全容器化改造,有效提升系統穩定性,同時也迎來成本和效率的新挑戰??蛻艉喗閨識貨基于阿里云容器服務實現云原生提效降本客戶痛點識貨的主營業務是電商,其流量有明顯波峰
74、波谷的特點,并伴隨全年多次大促。然而,缺乏資源與業務的動態、精細化管理,具體表現在:業務大促響應慢:每次業務大促,資源準備、系統擴容過程持續長達數周,業務發展受制于 IT 基礎設施保障。識貨/零售&電商&本地生活651366方案亮點識貨通過阿里云容器服務 ACK 提供的 Serverless 彈性、智能預測 AHPA 以及混部能力,結合實際業務特征,實現了以下幾個方面的改進:按需 Serverless 提升業務彈性能力:平時業務使用固定 ECS 承載,大促或業務高峰流量使用 Serverless ECI 彈性,通過指定調度策略自動執行,無需上層業務框架改造適配。這一方案實現了高峰流量按需申請資
75、源,并隨著高峰結束自動回收資源,大促擴容從持續數周降低到小時級。智能預測彈性降低資源浪費:AHPA 通過彈性預測提前預熱資源,做到按需彈性,并根據業務趨勢自動進行彈性策略規劃,避免人工規劃導致預估不準資源引發浪費或業務穩定性問題,彈性計算成本節省了 20%?;觳刻嵘寐剩篴ck-koordinator 提供商業化的混部接入能力,降低混部門檻,并通過單機 QoS 等差異化能力,確保多種業務負載混合部署后的服務質量得到保障。這一方案安全、有效、便捷地實現了整體資源利用率提升 15%。IT 成本增加遠大于業務增長:公司考核業務增長與 IT 資源投入比例,CTO 要求技術費用零增長甚至負增長,運維面
76、臨極大的資源精細化管理挑戰。識貨/零售&電商&本地生活1367客戶證言識貨 CTO:識貨是典型的 Cloud First,將基礎設施完全交給云,不斷挖掘和利用好云產品的能力,讓應用架構更簡單、更快速。與阿里云合作期間,識貨 APP 充分利用了阿里云 ACK 彈性伸縮能力以及資源調度能力,以往在 618、雙十一大促期間的擴縮容時長和成本都非常高,但上云之后,擴縮容只要幾小時,完美實現大促期間的業績增長,同時實現成本的大幅下降。建設成果識貨基礎架構團隊構建的質量運維智能管控平臺,支撐了識貨 APP 全平臺 GMV 超 300億,MAU 超 5000 萬。在 618、雙十一大促期間,擴縮容時長縮短至
77、幾小時,完美實現大促期間的業績增長,同時實現成本下降 20%。識貨/零售&電商&本地生活相關產品 容器服務 ACK 彈性容器實例 ECI餐道為餐道信息科技有限公司旗下注冊品牌,品牌服務涵蓋全渠道管理 SaaS 平臺+業務數據雙中臺,主要為國內餐飲和零售企業提供一體化的 O2O 解決方案??蛻艉喗閨餐道基于 ACK 構建創新底座,加速 SaaS 規?;葸M客戶痛點 自建集群穩定性差:餐道早期采用 Kubernetes 部署其餐飲 SaaS 平臺,但自建集群穩定性不足,且缺乏與云原生監控和彈性集成的能力。彈性適配難:餐道 SaaS 平臺用戶訪問具有明顯的波峰波谷特征,實現應用的彈性適應業務特點可以
78、節省大量成本,但自建集群的適配難度很大。餐道/零售&電商&本地生活681369方案亮點 提升業務穩定性:餐道選擇將其部署在自建 Kubernetes 集群上的業務應用遷移到阿里云容器服務 ACK 以構建其餐飲 SaaS 平臺。ACK 經過阿里云大規模場景實踐驗證和優化,因此不需要花費過多精力進行應用優化適配。通過使用 ACK,不僅能提升系統穩定性,還能節省運維人力成本??焖購椥詰獙ν话l流量:ACK 可以快速彈性地應對突發流量,一次性擴容多臺 ECS,無論擴容多少臺,都能在 10 分鐘內完成。簡化用云體驗:ACK 整合了阿里云云原生的多種能力,例如 ACK 中集成的Prometheus 監控服務
79、,可以幫助快速定位性能問題,更好地保證業務的連續性。這些功能的集成簡化了云計算體驗,提高了企業運行云端 Kubernetes 容器化應用的效率。餐道/零售&電商&本地生活1370相關產品客戶證言作為國內最早一批涉足餐飲 SaaS 的先行者,餐道創始人認為,傳統餐飲走向互聯網化是順應時代的必然選擇。從技術上而言,餐飲 SaaS 已經能從最初的采購,貫穿到顧客買單、顧客維護、外賣訂單、騎手配送、人力管理以及供應鏈、數據中臺等各個環節。餐道將主要的業務應用,包括前端 Web 容器、網關、后端微服務通過 Kubernetes集群部署,以云原生的方式幫助業務快速迭代,靈活響應商業需求。容器服務 ACK
80、應用實時監控服務 ARMS建設成果 資源利用率提升:服務器資源利用率提升了 30%。支撐業務快速發展:出現問題后可快速隔離,當面對急劇增長的業務量,可以在短時間內完成擴容,原本自建集群需要 15 分鐘擴容一個節點,而現在 ACK 集群平均只需要 3 分鐘即可擴容出一個節點,擴容效率提升了近 80%。迭代效率提升:版本迭代期間,服務的更新速度有了明顯的改善,縮短了近 40%的版本發布時間。0 集群故障:集群的穩定性也給系統提供了充分的保障,截至目前,餐道各業務平臺上的集群故障次數為 0。餐道/零售&電商&本地生活廚芯科技是全球領先的餐飲設備和服務提供商。從一臺智能洗碗機開始,致力于改變餐廳后廚基
81、礎設施,驅動餐飲行業的智能化和自動化??蛻艉喗閨廚芯科技加速業務容器化進程,成功實現增效降本客戶痛點廚芯科技一年前將業務系統從 ECS VM 遷移至 Kubernetes 集群。盡管這提高了微服務運維效率,但由于 ECI 容器單位成本高于 ECS,如何充分發揮 Kubernetes 資源彈性從而降低成本,成為廚芯面臨的主要問題。目前存在兩個業務場景需要優化:Web 服務 HPA 彈性滯后:Web 服務每天有早、晚高峰和夜間低谷,而 HPA 擴容總是滯后于負載變化,會引入一些不必要的容器創建和刪除,導致資源浪費。廚芯科技/零售&電商&本地生活711372方案亮點經過充分溝通,對廚芯科技業務的應用
82、場景和需求有了深入理解后,決定使用阿里云容器服務彈性預測 AHPA 解決方案。方案的優勢如下:彈性預測,資源預熱。AHPA 可以根據業務歷史指標,自動識別彈性周期,提前擴容,解決彈性滯后的問題。簡化彈性配置,自動容量規劃。彈性根據業務趨勢變化,自動進行彈性規劃,無需人工干預,極大降低運維成本。彈性策略配置復雜:定時任務 CronHPA 配置復雜,定時任務有相對固定的周期性。對于 15-30 分鐘的周期,隨著 CronHPA 設置的時間段越來越多,運維成本逐漸提高且不夠靈活。目標容器數的配置也比較困難,太少則無法保證應對業務高峰,太多又達不到優化成本的效果,需要反復調整。廚芯科技/零售&電商&本
83、地生活1373相關產品客戶證言廚芯科技 VP 表示:“使用阿里云彈性預測 AHPA,降低 Kubernetes 容器成本同時減輕了運維工作量,加速了業務容器化的進程?!比萜鞣?ACK建設成果廚芯科技已在幾個主要服務 ACK 集群上啟用了 AHPA。經過驗證,相比于 CronHPA+HPA的優化方案,AHPA 的主動預測模式額外降低了 10%的 ECI 容器成本。同時,AHPA 自動計算負載曲線,設置目標容器數等特點,替代了人工運維的工作量,加速了業務容器化的進程。廚芯科技/零售&電商&本地生活波司登創始于 1976 年,專注于羽絨服的研發、設計、制作,是全球知名的羽絨服生產商,連續 26 年
84、全國銷量領先。在波司登全面上云以后,為了更好的支撐業務發展,CIO親自帶隊,圍繞著云原生技術體系,推動波司登的各條業務線進行技術升級改造??蛻艉喗閨波司登云原生架構升級,實現數字化業務創新客戶痛點隨著系統微服務化的全面推進,波司登面臨著應用復雜度和管理難度的雙重挑戰。波司登技術團隊在微服務架構的使用過程中遇到了兩個難題:性能問題定位困難:隨著業務規模的增長,應用之間的調用關系變得越來越復雜,鏈路變得越來越長。遇到線上性能問題需要投入大量的精力排查,效率特別低。波司登/零售&電商&本地生活741375方案亮點 全鏈路性能管理:通過快速定位出錯接口和慢接口、重現調用參數、發現系統瓶頸等方式,大幅提
85、升線上問題診斷的效率?;谌溌妨髁恐卫斫档蛻米兏L險:采用多版本邏輯隔離的方式實現端到端的全鏈路灰度,全面降低應用變更的風險。無侵入式接入:通過 Agent 技術,在不需要修改代碼的情況下,全面提升微服務治理能力。全面遵循開源開放的技術標準:云原生關網、注冊配置中心、微服務治理框架背后都有對應的開源項目,基于 Kubernetes 標準和 Spring Cloud 架構進行擴展,確保用戶的技術架構全面擁抱開源開放的技術標準,從根本上避免廠商綁定問題。應用變更頻繁造成事故:隨著業務的快速迭代,應用變更的頻次快速增長,包括新應用上線、新版本發布、新配置推送、應用擴縮容等方面。服務架構的復雜性讓
86、波司登的技術團隊在每次應用變更中都疲憊不堪,絕大多數生產環境的事故都由應用變更導致。波司登/零售&電商&本地生活1376建設成果 支撐海量并發和大流量場景:在 ACK 的彈性能力和 MSE 的全鏈路穩定性治理的幫助下,波司登全面建立了支持百萬級并發的技術能力,穩定支持近兩年的雙 11 大促活動。全面建立安全變更體系:在 MSE 的全鏈路流量治理和 ARMS 應用監控的幫助下,波司登建立了成熟的安全變更機制,對每一次應用變更都進行充分的灰度驗證,排查線上性能問題也變得更加輕松。該安全變更機制已被各團隊廣泛采納,波司登的業務迭代頻率提升了 2 倍以上,應用變更導致的生產事故降低了 70%。波司登/
87、零售&電商&本地生活1377相關產品 容器服務 ACK 微服務引擎 MSE 應用實時監控服務 ARMS波司登/零售&電商&本地生活客戶證言波司登的技術團隊與阿里云深入配合,在云原生微服務治理方面的不斷探索,在超大規模微服務架構領域積累了寶貴經驗。波司登會繼續擁抱云計算,通過更先進、更高效的技術,更數字化的運營方式,引領服裝行業激發創新活力,與各行各業的時代變革者共同成長。斯凱奇(SKECHERS)1992 年誕生于美國加州,遍布全球 170 多個國家地區,在美國是僅次于耐克的第二大鞋類品牌。2020 年 11 月斯凱奇宣布與阿里云達成合作,加速數字化升級。引入阿里云中臺后,進一步推動全渠道優化
88、,提升運營效率和供應鏈管理能力??蛻艉喗閨斯凱奇通過 MSE 提升業務迭代效率,輕松應對線上大促客戶痛點 自建網關性能和穩定性無法保障:斯凱奇的全渠道業務中臺通過統一接入網關提供API 接口供外部調用。由于斯凱奇業務場景豐富且系統眾多,近年來由于業務高速發展,雙 11 大促等活動的流量高峰對自建網關的性能和穩定性提出更多的挑戰。斯凱奇/零售&電商&本地生活781379方案亮點斯凱奇將傳統 API 網關升級成云原生網關,用于和外部渠道、內部老系統、第三方服務進行流量互通,在開發運維效率、性能、安全性上展現出更優異的表現。開發運維效率提升:MSE 云原生網關直接打通了已有的微服務注冊中心,直連后端
89、服務,快速實現微服務之間的互通互訪和統一管理。通過多種路由規則實現的灰度發布,能輕松滿足大促前業務快速迭代上線的需求。網關安全性不夠健壯:外部渠道、內部老系統、第三方服務需要與業務中臺互通或由中臺提供能力,由于接入系統形態各異,急需豐富的安全認證手段并進行統一管理。斯凱奇/零售&電商&本地生活13建設成果相比自建 API 網關,MSE 云原生網關給客戶提供了統一的微服務路由、流控、安全管理等能力,方便內外部多系統間的集成,極大地提高了中臺服務的開發效率,并降低運維成本。網關性能更強:相比 Spring Cloud Gateway 等微服務網關,MSE 云原生網關性能更好,同時其負載均衡、流量控
90、制能力可增強后端服務的可用性,確保中臺系統順利應對雙 11 流量洪峰。網關安全性更健壯:MSE 云原生網關集成了認證登錄系統,利用 JWT 認證功能和黑白名單,讓業務快速構建安全屏障。完備的可觀測:MSE 云原生網關提供了豐富的可觀測數據,包括流量全局看板、日志檢索、業務 TOP 榜、延遲/失敗率/錯誤碼等多種響應指標等,并輔以報警管理,使運維人員對服務的整體狀態及異常情況盡在掌握,減輕大促期間的工作負擔。80斯凱奇/零售&電商&本地生活相關產品 微服務引擎 MSE 應用實時監控服務 ARMS間隔頁(待分享)交通/物流TRANSPORTATION/LOGISTICS 高德/交通&物流高德是中國
91、領先的數字地圖內容、導航和位置服務解決方案提供商。自主出行是高德地圖的核心業務,涉及到用戶出行相關的功能訴求,承載了高德地圖 APP 內最大的用戶流量。自主出行核心業務中應用 Node FaaS 的部分場景包括主圖場景頁、路線規劃頁和導航結束頁等??蛻艉喗閨高德基于函數計算實現毫秒級自動擴縮容客戶痛點隨著功能的進一步拓展,高德地圖從導航工具升級為出行服務平臺和生活信息服務入口,進一步拓展了出行相關的生活信息服務場景,帶給用戶更全面的用戶體驗。例如新功能場景推薦卡片,旨在根據用戶出行意圖推薦信息,提升用戶出行體驗。此功能需具備快速迭代,樣式調整高靈活性的能力。因此,將卡片樣式模版存放于云端,通過
92、服務下發的形式渲染至客戶端無疑為最優選擇,可以滿足業務快速靈活迭代的目的。8213解決方案經過方案評估判斷,此場景類型屬于無狀態服務,基于阿里云 Serverless 成熟的生態,高德最終選擇接入 Node FaaS(阿里云函數計算)服務能力,出行前端搭建了場景推薦卡片服務??ㄆ?UI 模版獲取、數據請求聚合&邏輯處理、拼接生成 Schema 的能力均在 FaaS 層得到實現,客戶端根據服務下發的 Schema 直接渲染展示,達到更加輕便靈活的目標。在“十一出行節”峰值場景中,Serverless 整體服務成功率均大于 99.99%,總計 100W+次觸發/分鐘,QPS 2W+,各場景的服務
93、平均響應時間均在 60ms 以下,服務穩定性超出預期。用戶價值 簡單提效高德實現了 FaaS 層(阿里云函數計算)與研發體系的完全對接,因此,應用從開發、測試、灰度、上線的全生命周期,到具備流控、彈性、容災等標準化能力,所用的時間較以前縮短了 40%,大大提高了人效。高德/交通&物流8313 彈性高可用、降成本地圖場景流量特點高峰與低峰的落差十分明顯。按照傳統應用的資源準備,我們需要根據最高峰的流量進行資源準備,所以到了流量低峰期,多準備的機器會有很多冗余,這就造成了成本的浪費。使用函數計算,可以根據流量變化自動擴縮容,通過毫秒級別的啟動優勢,將快上快下的擴縮容能力普及給用戶,輕松幫助用戶實現
94、計算資源的彈性利用,大大降低了成本??捎^測阿里云函數計算率先與日志服務、云監控、tracing 平臺以及函數工作流編排做了完美的融合,用戶只需要配置一次,就可以完完整整的享受到以上這些功能,大大降低了用戶的學習成本,實現了對應用程序的快速診斷。高德/交通&物流相關產品函數計算 FC84龍湖千丁/交通&物流龍湖千丁是國內最早一批參與智慧城市、智慧社區建設的高科技企業,智慧停車是龍湖千丁生活服務的主要場景之一。依托龍湖千丁停車云系統,千丁智能已為全國范圍內自有及托管的 1000+車場的智慧停車業務提供統一的車管解決方案??蛻艉喗閨龍湖千丁基于 ACKEdge 高效落地云邊端一體化智慧停車業務客戶痛
95、點 分布式邊緣環境拖慢運維效率:由于客戶各個車場地理位置分散,彼此網絡隔離,車場內的計算資源無法直接被公網訪問,導致業務發布和問題排查需要相關人員現場處理,對開發、測試、升級和運維造成了巨大挑戰。異構環境差異導致穩定性問題突出:絕大部分車場的節點環境為 Windows PC 服務器,而車場之間的業務部署環境差異較大,需要屏蔽底層環境差異,確保業務平穩運行。8513方案亮點為解決以上問題,龍湖千丁停車云平臺選擇了阿里云邊緣容器服務 ACKEdge 提供的標準 Kubernetes 服務以及云邊一體化協同解決方案實現以下能力:云端管控提升運維效率:通過一條命令,可以快速將節點接入到 ACKEdge
96、 提供的標準 Kubernetes 集群中,并通過云端實現不同地域的計算資源的統一管理和統一的應用分發,提升運維效率。容器化封裝實現業務一致性:通過容器化封裝,可以在異構環境中最大程度保證業務的一致性,極大減少因環境差異導致的問題。單元化發布:根據業務特點,劃分不同的節點池,讓不同車場的算力接入不同的節點池,從而形成不同的發布單元。通過選擇不同的發布單元,可以實現分批發布和灰度發布。云端運維,遠程調試:借助 ACKEdge 提供的通道,開發運維人員可以快速查看容器日志和進入容器進行調試。弱網兼容:通過 ACKEdge 的邊緣自治能力,即使在云邊網絡斷開或主機重啟等極端情況下,本地邊緣服務器上的
97、業務也可以正常運行。龍湖千丁/交通&物流 應用發布效率低:由于接入龍湖千丁停車云平臺的運營主體不同,以及用戶需求的頻繁更迭,需要根據業務特點實現分批發布和灰度發布,以提高發布效率的同時保證業務的穩定運行。8613龍湖千丁/交通&物流建設成果通過龍湖千丁停車云平臺的自研新版停車云系統與 ACKEdge 提供的標準 Kubernetes服務以及云邊一體化協同解決方案相結合,我們成功將邊緣部署時間成本從1天縮短到了3小時,同時還將手動升級方式迭代為自動 OTA 升級,升級時間從3小時縮短到5分鐘。具體表現在以下幾方面:有效降低業務整體的報障率,提高了系統的穩定性。極大降低了停車云業務開發運維過程中的
98、人員和時間成本,同時也避免了日常派人巡檢的需要,提高了運維效率。發布時間從以前的需要數周時間縮短到了分鐘級別,大大提高了業務的發布效率。形成了邊緣場景的統一處理范式,內部相似業務形態可以復制該模式,從而減少了試錯成本。相關產品邊緣容器服務 ACKEdge87貨拉拉/交通&物流貨拉拉于 2013 年創立,成長于粵港澳大灣區,是一家從事同城/跨城貨運、企業版物流服務、搬家、零擔、汽車租售及車后市場服務的互聯網物流商城??蛻艉喗閨貨拉拉使用 ACK 輕松應對容器管理難題,實現精細化成本治理客戶痛點 自建集群穩定性差:貨拉拉內部運行大量微服務系統,錯綜復雜,對 Kubernetes 穩定性要求高。自建
99、容易出現穩定性問題,運維成本高。IT 成本治理難:IT 成本治理往往需要對 Kubernetes 進行擴展?;谌萜鞯哪芰嫿ㄐ枰M行一些核心能力的定制開發,比如在調度器、監控數據鏈路等方面的擴展,自建難以推進這些擴展。8813方案亮點 簡化云運維復雜度:貨拉拉基于阿里云容器服務 ACK,已經將大部分應用進行了容器化改造并遷移。容器服務 ACK 提供了高可靠穩定的基礎設施,與裸金屬實例、SLB、ALB/NLB 和 SLB 的集成,極大地簡化了用云復雜度。提供供多種工具優化成本治理:容器服務 ACK 幫助用戶在使用裸金屬實例時,能夠直達物理性能。同時,通過 ACK 差異化 SLO koordin
100、ator 容器調度,進行 cpuset 調度、綁核和負載感知調度等,有效地提升了應用性能和節點資源利用率。貨拉拉業務具有明顯的波峰波谷特征,同城貨運白天高峰期比較穩定,晚上低峰期流量會降低。用戶可以通過 HPA 和 CronHPA 進行定時擴縮容,滿足這類可預期的彈性場景。結合 ACK提供的監控數據鏈路,貨拉拉實現了容器成本的計量和分賬,有效地管理各團隊用云成本。核心系統異地備份:通過 ACK 備份中心,實現貨拉拉在 ACK 中運行的核心系統的異地備份,并通過 ACR EE 實現跨 Region 鏡像同步。貨拉拉/交通&物流 核心系統無備份容災:由于應用架構復雜,很多系統沒有單元化,核心系統容
101、災備份系統建設難。8913建設成果 穩定、低成本的容器基礎設施:貨拉拉使用阿里云容器服務,極大地增加了資源彈性能力和穩定性,實現了增效降本,成為穩定且低成本的容器基礎設施。為全面云原生轉型奠定堅實基礎:貨拉拉已應用 100%容器化,這是全面云原生轉型的第一步。通過建設堅實的容器基礎設施,貨拉拉為容災系統建設、大數據云原生化、混部系統建設等奠定了堅實的基礎。相關產品 容器服務 ACK 容器鏡像服務 ACR貨拉拉/交通&物流90麗迅物流/交通&物流麗迅物流是百麗旗下專注于時尚產業、為企業提供專業物流及供應鏈解決方案的服務商。目前麗迅物流已在全國擁有 70+全渠道實體云倉、5 大中心電商倉,總面積達
102、 100 萬+平方米,服務覆蓋 300+城市、3000+商圈。在技術架構轉型及業務快速發展的背景下,為了降低業務各環節中的運維成本、提高物流服務效率,2021 年 8 月起,麗迅物流開始了在阿里云上完成自身從 IDC 自建到全面云原生化的進程??蛻艉喗閨麗迅物流通過 ACR EE 管理大規模容器鏡像,快速響應業務需求客戶痛點在技術架構轉型和業務快速發展的背景下,麗迅物流的 IDC 自建 Harbor 托管容器鏡像制品方案面臨以下問題:9113方案亮點為實現大規模場景下的增效降本,綜合考慮以下優勢,麗迅物流選擇了容器鏡像服務企業版 ACR EE:便捷遷移,更易使用,免運維:基于 ACR EE 鏡
103、像導入功能,可以直接將 Harbor 鏡像數據導入 ACR EE 實例,無縫兼容鏡像使用習慣,只需要 1 小時即可完成 Harbor 全部鏡像實例向 ACR EE 的平滑遷移。此外,后續倉庫的運維工作完全托管,讓客戶更加專注于業務開發。高質量的鏡像分發能力:ACR EE 承諾 99.95%的業內最高 SLA 保障,并且具備大規模分發場景的 P2P 分發加速能力,可實現大鏡像分發場景的按需分發加速、跨海分發場景的全球分發加速等。端到端的鏡像安全治理:ACR EE 具有默認存儲加密、自動化鏡像安全掃描、鏡像加簽等功能,企業無需再擔心容器鏡像的安全可信問題。同時,ACR EE 還提供云原生應用交付鏈
104、功能,支持全鏈路自動交付、全鏈路可觀測、可追蹤,確保云原生 DevSecOps場景落地。大規模分發場景下 Harbor 運維復雜:盡管 Harbor 最初能夠滿足企業鏡像倉庫的基本需求,但隨著業務的發展和迭代,大規模分發場景需要考慮高可用性、網絡帶寬、安全性等問題。鏡像安全問題無法得到滿足:在生產場景下,對于鏡像安全的需求越來越高,一些鏡像版本的安全管理和部署需要進行二次開發。研發精力不聚焦:在市場環境和消費者需求快速變化的情況下,麗迅希望將精力集中于核心業務的研發,而不是對基礎設施需求的響應中。麗迅物流/交通&物流9213建設成果經過將自建 Harbor 倉庫遷移至 ACR EE 后,麗迅物
105、流已全面降低了應用的運維部署成本。ACR EE 除了提供自身完善的功能之外,還可以與阿里云的其他產品如容器服務 ACK、云效流水線 Flow 深度結合,為麗迅物流提供靈活易用的持續集成、持續驗證和持續發布功能,幫助其高質量、高效率地交付業務,并實現全鏈路云原生 DevSecOps。通過將核心鏡像遷移至 ACR EE,麗迅物流的鏡像管理及運維 Registry 實例復雜度降低 50%,容器鏡像分發效率提高 60%,同時還確保了容器鏡像端到端的安全。麗迅物流/交通&物流9313相關產品 容器鏡像服務 ACR 容器服務 ACK麗迅物流/交通&物流客戶證言“市場環境和消費者需求快速變化的現狀下,我們更
106、希望將精力專注于核心業務的研發。為了實現業務增效降本,我們直接選擇了 ACR EE 服務,可以讓我們將更多精力投入到快速響應業務需求當中?!?4申通/交通&物流申通快遞作為國內快遞行業的龍頭企業,目前在國內擁有上千家門店,經過 20 多年的發展,已在全國形成完善、暢通的自營快遞網絡,且業務仍在高速發展。在申通快遞整體單量持續不斷增長的前提下,不同實操場景下也需要應對包括時延、穩定性、高可用、可擴展性等在內的不同要求和挑戰??蛻艉喗閨申通基于 ACKEdge 構建邊緣 PaaS 實現業務全面提效客戶痛點隨著業務高速發展,申通傳統云到端模式下的業務場景包括攔截、預售、錯分等 6 大類,以下問題日益
107、凸顯:邊緣資源缺乏統一管理:在邊緣場景下,各種基礎設施條件參差不齊,依賴人工手動管理,容易出現配置遺漏或誤操作,而面單量持續增長時,系統的健壯性無法得到保證。9513方案亮點基于阿里云 ACKEdge 構建的申通快遞 IoT 云邊端架構,實現了云邊協同、邊緣側資源托管和應用管理:容器化隔離應用環境降低邊緣業務間相互影響:ACKEdge 提供一鍵初始裝機、開箱即用的容器化隔離應用環境,解決了原始進程隔離模式帶來的穩定性差問題,大幅縮小了申通邊端應用相互影響范圍,實現了邊緣高可用。針對性解決邊緣場景網絡問題,大幅縮短服務響應時長:ACKEdge 面向邊緣計算弱網絡連接場景提供節點自治和網絡自治能力
108、,保證邊緣節點和邊緣業務的高可靠運行,并消除抖動帶來的額外影響,從而大幅降低申通整體邊端服務響應時間。支持異構資源混合調度,減少邊端服務器裸機資源浪費:ACKEdge 支持豐富的異構邊緣節點資源,包括自建 IDC 資源、ENS/IoT 設備、X86/ARM 架構等,通過支持異構資源混合調度,為申通云管邊端、邊緣自治的混合云架構提供基礎。通過控制彈性策略和超賣比,可合理利用資源,降低整體投入成本。申通/交通&物流 邊緣弱網環境下面單掃描效率低:由于云邊網絡鏈路受到各種環境制約,無法滿足申通邊緣業務規范的 1 秒 3 單,實際操作人員明顯感覺到卡頓。邊緣服務器裸機資源浪費:由于邊緣節點常常具備很強
109、的區域性、地域性,不同地域節點之間存在資源不共享、資源異構等明顯隔離屬性,導致邊緣服務器的裸機資源被浪費。業務管理維護成本高:邊緣基礎設施薄弱,多套廠家的邊緣自動化設備子系統、研發模型不統一等問題突出,導致重復建設,增加了邊緣業務的管理和維護成本。9613建設成果在基于 ACKEdge 構建的 IoT 云邊端架構模式下,掃描校驗等操作在本地即可完成,減少了對云端的強依賴,幫助企業成本下降 30%,整體邊端響應時長降低至 50ms,穩定性從 99.9%提升到 99.95%。該架構實踐被信通院評選為“2021 年度分布式云與云邊協同十佳案例”,為快遞行業的邊緣云原生演進樹立標桿。相關產品邊緣容器服
110、務 ACKEdge申通/交通&物流 云邊一體化協同模式,助力邊緣 DevOps 實施:通過中心云進行統一交付、運維和管控,幫助申通構建統一的運維監控體系和研發模型,釋放運維人員精力,同時使研發只需關注代碼開發,無需關心部署問題。97大搜車/交通&物流汽車產業互聯網平臺大搜車由姚軍紅創立于2012年12月,先后獲得阿里巴巴集團、螞蟻金服、晨興資本、華平投資、春華資本等機構超過12億美元融資。2017年12月,大搜車列入由硅谷全球數據研究機構 PitchBook 評選的“2017年全球新晉獨角獸”名單。|大搜車云上多地域高可用消息系統的構建客戶簡介目前,大搜車已經搭建起比較完整的汽車產業互聯網協同
111、生態。隨著業務業務的快速發展,大搜車遇到了一系列的問題:大量微服務系統,總數在2000以上,這些系統之間的異步通信全部都需要通過消息隊列 MQ,導致消息量大幅增加,日均消息 TPS 在6000以上,消息系統的穩定性成為云上業務穩定保障的重中之重??蛻敉袋c9813方案亮點為了更好地支撐業務,大搜車利用云上 MQTT+消息隊列 RocketMQ+全球消息路由+消息隊列 Kafka 構建了完整的云上消息系統。通過全球消息路由功能將杭州地域的消息同步到北京地域,做到業務分地區就近部署。獨立消息隊列實例管理不同業務,可用性更高。利用消息隊列 Kafka 對接大數據生態,即開即用,快速擴容,可靠性更高。物
112、聯網設備通過 MQTT 進行接入,后臺開發物聯網設備管理平臺,通過 MQTT 連接設備端,并對設備的能力進行管理,可通過平臺調用設備端能力(比如發起會議、下發開機圖片、獲取設備信息等)。MQTT 與 RocketMQ 后臺消息打通,后端應用服務器無需保持設備端連接,以通用的RocketMQ 消息進行對接,服務器端更穩定,連接管理更可靠。由于有杭州和北京兩大研發中心,客戶在杭州和北京都部署了大量業務系統,多地域應用的消息同步需要有穩定可靠的機制。物聯網設備的管理和接入對消息系統提出了更高的要求。大數據領域大量應用 Kafka,需要更穩定可靠的商業版 Kafka 產品,減少運維工作量。大搜車/交通
113、&物流9913建設成果 業務穩定性:阿里云 RocketMQ 提供99.99999999%的數據可靠性和99.95%的服務可用性 SLA,確保服務高可用以及數據不丟失。高性能:RocketMQ 支持千萬級TPS以及億級消息堆積,在業務高峰期依然可以保持高性能。全球消息路由:利用穩定可靠的路由功能,將客戶多個地域的消息系統打通,實現業務就近訪問,滿足跨地域、遠距離、毫秒級消息流轉的需求。海量物聯網設備管理:利用阿里云消息隊列 MQTT,實現物聯網設備與云上業務應用可靠連接,輕松管理海量物聯網設備。云上托管版Kafka:兼容開源 Kafka 協議,全托管,高可用,高安全。無縫對接開源及云上大數據生
114、態。大搜車/交通&物流相關產品 消息隊列 RocketMQ 版 消息隊列 Kafka 版100間隔頁(待分享)互娛MUTUAL ENTERTAINMENT南瓜電影/互聯網南瓜電影成立于 2015 年,是國內近兩年發展非常迅速的流媒體平臺,憑借著無廣告、純付費的商業模式,在影迷圈中打響了一定的知名度;之后又靠著很強的社區互動性(AI 智能推薦、影評互動、通過放映廳實現線上“云觀影”等),迅速完成會員增長及流媒體市場占位;接下來將逐漸往多元化視頻平臺發展:如紀錄片、各類自制節目等??蛻艉喗閨南瓜電影基于 SAE 7 天內全面 Serverless 化實踐客戶痛點南瓜電影底層使用阿里云 ECS,基礎
115、設施、中間件、數據庫、大數據服務、云安全等也全部使用阿里云產品,但隨著業務的不斷發展,基于 ECS 的運維架構逐漸暴露了很多問題,主要有:彈性擴容太慢:流量洪峰時,需臨時購買新機器再逐臺部署,非常耗時也保證不了系統 SLA。10213103解決方案針對以上的問題,南瓜電影在權衡了幾個方案之后,最終選擇了阿里云 Serverless 應用引擎(簡稱 SAE),簡單上手,省時省力,不用做任何改造,WAR/JAR 包直接上傳部署,也不用買機器運維機器,節省開發大量時間。并且,SAE 就是一個超大規模的彈性資源池,想彈多少彈多少,想什么時候彈就什么時候彈,非常適合南瓜電影的業務場景。在正式遷移業務之前
116、,南瓜電影做的第一件事是基于 Travis CI+SAE 把 CI/CD 的流水線打通,提升發版效率。之后先用了3天完成核心應用 API 網關的遷移上線,第5天驗證結束100%流量打到 SAE 上,第67天把其余30多個系統快速遷移到 SAE,前后只用了7天就完成了整個系統的遷移,整個過程非常順利。發版慢&易出錯:互聯網頻繁發布是常態,但每次幾百臺服務器一臺臺部署發版非常慢,一不小心就出錯。也嘗試過腳本化部署,跑順確實省事,但當服務器組一多,腳本不斷修改過程中,萬一中間卡殼了,定位問題非常困難。系統維護成本高:傳統集群運維繁瑣,人員技能要求非常高。既要精通 lua/ansible腳本等,又要懂
117、云產品網絡配置和監控運維。早期公司并沒有專職運維人員,耗費了開發大量的精力,非常之痛。容量規劃難,資源利用率低:對流媒體行業,高峰期一般在中午或晚上,其它時間訪問都比較低,但很難精準備容。我們一般是按照峰值長期固定保有服務器,資源利用率相對比較低。權限分配繁瑣:面對企業多租戶時,權限隔離往往是一個非常頭疼的問題。尤其是新人到崗或者跨團隊聯調時,配置用戶組、RAM 權限,新機器登陸連接方式,非常繁瑣,賬號管理人員也時常會成為瓶頸。南瓜電影/互聯網13104用戶價值 擴容更快:再也不用考慮高峰期不夠、低谷期浪費,SAE 會按照最優化自動伸縮調整實例數,比以往方式節省了40%左右的硬件成本。發布更快
118、:通過 CI/CD 流水線提升發版效率以及 Cloudtoolkit 插件快速實現本地一鍵部署到云端 SAE,開發調試很方便。運維更省心:免運維不是不運維,對用戶來說當收到告警,登上控制臺,開始修復的一剎那,基本上就已經完成了,整個運維速度比人工更加快捷。查問題更快:SAE 自帶的監控能力,能給用戶排查問題節省大量的時間。相關產品Serverless 應用引擎 SAE南瓜電影/互聯網|網易云音樂基于函數計算 FC 創建音視頻算法處理平臺105網易云音樂/互聯網網易云音樂是一家以音樂為主體的公司,音視頻技術被廣泛應用于網易云音樂的眾多業務場景中。在音視頻算法的服務化部署工作中,需要了解很多相關音
119、視頻算法的特點,如部署環境、執行時間、能否支持并發處理等。網易云音樂基于阿里云函數計算 FC 創建網易云音樂音視頻算法處理平臺,為整個云音樂提供統一的音視頻算法處理平臺??蛻艉喗榭蛻敉袋c客戶需要有足夠大規模的彈性資源,讓開發音視頻算法服務的程序員不用再多去關注機器管理,具體痛點如下:存量資源和增量資源的差異變大和新算法落地的增多,花在處理存量和增量的資源協調時間越來越多。13106解決方案云音樂的開發環境與函數計算的適配是改造的重點,針對部署、監控和混合云支持進行了改造。部署上,網易云音樂充分應用了函數計算在 CI/CD 上的支持及鏡像部署的支持,實現了鏡像的自動化拉??;在監控設計上,一方面利
120、用云上的監控報警功能,另一方面把它轉化為內部已有監控系統的參數,讓整體的開發運維處理能夠維持一致性,最后是從代碼設計上,考慮能夠兼容混合云部署的實現,最終完成了我們音視頻處理平臺的Serverless 改造。隨著算法復雜度的增高,申請或采購機器的時需要關注機器的整體規格、利用率等。希望存量資源的處理能夠加快,在處理存量的時候有足夠大的資源,在海量音視頻數據處理時候,能夠壓縮存量與增量不一致的時間。實際改造不僅僅是關注最終服務能力,還需要綜合考慮投入的 ROI。具體來看:關注成本:包含兩方面,改造的實施成本和計算資源的成本。在改造成本能夠接受的情況下,未來的 IT 成本不會大額的增加。運行環境的
121、支持:開發人員不需要在此類事項上花費過多的時間和精力,更多的關注算法執行本身。彈性能力:除了云廠商提供的計算資源池的規模,還會關注彈性算力的啟動速度,是否能夠對固定場景進行實例預留,以及是否提供更符合業務訴求的靈活彈性能力,以更好的支持業務的發展。網易云音樂/互聯網13107用戶價值引入函數計算的第一階段,特征提取類的算法得到了 10 倍速的提升;稀疏類的算法,可以理解為日常使用率很低的算法,在成本上得到了極大的節約。除此之外,通過函數計算的鏡像緩存加速能力,優化了我們節點的啟動速度,讓所有的服務拉起可以在秒級完成。這些工作,降低了算法運維處理中大量的運維成本,讓開發人員能夠更聚焦關注在算法及
122、業務自身。相關產品函數計算 FC網易云音樂/互聯網作為國內首款彈唱 App,唱鴨在產品創新的不斷探索為音樂行業帶來了全新的用戶價值,包括彈唱、音效鍵盤等功能,讓它迅速成為了擁有千萬級別用戶量的音樂產品??蛻艉喗閨唱鴨輕松玩轉 DevSecOps,用 ACR EE 構建安全高效交付流程客戶痛點 業務交付壓力較大:2021 年初唱鴨團隊人數大概50+,研發人員30+,唱鴨自身業務基于微服務架構,服務的日發布頻率超過十次,需要提高研發迭代效率。容器安全風險:唱鴨業務采用大規模容器化部署,在業務快速迭代同時,也由于容器化存在高動態及高密度部署、不可信三方及開源軟件引入的情況。108唱鴨/互聯網1310
123、9方案亮點唱鴨采用阿里云容器鏡像服務企業版 ACR EE,實現了應用與算法上云構建的鏡像托管,更加便捷地構建了 DevSecOps 全自動化流程,具有以下優點:輕松構建云原生 DevOps:業務開發將算法代碼提交到 GitLab 代碼托管平臺,ACREE 收到 GitLab 代碼變更的 webhook 通知后,可自動將代碼構建成容器鏡像并加密托管于實例中。高效安全的容器化應用交付:ACR EE 上創建了云原生應用交付鏈的 DevSecOps 流程。交付鏈將保障容器鏡像自動安全掃描,如果發現高危漏洞則基于安全策略阻斷后續的交付部署。如果通過安全掃描流程,則自動將鏡像加簽并觸發后續不同環境的鏡像部
124、署。云上產品無縫集成:ACR EE 可與阿里云多產品實現無縫集成,唱鴨的 PAI-EAS 集群收到通知后,可自動從 ACR EE 實例中獲取最新的鏡像版本。唱鴨/互聯網13建設成果唱鴨團隊通過采用微服務架構、容器落地 DevSecOps,安全且高效地交付部署,提高了業務的敏捷迭代、降低了人工介入的成本。容器鏡像服務企業版 ACR EE 不僅具備高效的鏡像分發能力,也提供了安全的云原生應用交付鏈能力,使唱鴨可以從容不迫地完成每天 10+次的容器化部署,DevSecOps 的體驗非常順暢。唱鴨團隊依然處于快速發展階段,但團隊充滿創新力,整體架構選型緊跟技術前沿趨勢。110相關產品容器鏡像服務 AC
125、R唱鴨/互聯網Soul 是任意門旗下基于興趣圖譜和游戲化玩法的社交 APP,屬于新一代年輕人的虛擬社交網絡?;谟脩舻纳缃划嬒窈团d趣圖譜,通過機器學習來推薦用戶可能會產生的高質量的新關系,有豐富的 AI 業務場景,包括語音匹配、聊天機器人、文本 OCR 識別、圖像識別、多模態等??蛻艉喗閨任意門基于云原生 AI 套件打造人工智能的社交網絡平臺客戶痛點AI 機器學習是公司核心業務,但在傳統的虛擬機構建部署方式下,缺乏一個統一的管控平臺,導致業務工作流不流暢,開發迭代效率低下,運維管理復雜且資源利用率低下,具體表現為:業務迭代慢:研發工程師需要花費大量時間在底層基礎設施資源準備、業務集成部署、日志
126、監控等 AI 工程化上,無法專注于業務開發,難以快速響應業務研發需求。111任意門/互聯網13112方案亮點任意門在阿里云上,通過容器服務 ACK 云原生 AI 套件,構建了符合開源標準、自主掌控的 AI PaaS 平臺,實現了以下特點:全生命周期管理的一站式平臺提升迭代效率,包括數據管理、AI 任務發布和模型評測等,開發迭代效率提升 25 倍。統一的異構資源管理和運維平臺降低運維成本,自動化管理 GPU 節點、算法代碼與標準鏡像解耦以及自動彈性推理,節省1 倍運維成本。效率及資源利用率提升,提供專業的 GPU 共享及 Fluid 數據加速能力,在提升業務效能同時成本節約 50%。運維工作重復
127、:日常重復處理安裝 Nvidia GPU 驅動、CUDA 版本、OSS 數據源等環境問題,人力投入大,運維效率低。資源性價比低:CPU 機器處理慢,大量堆積機器,導致資源閑置浪費。GPU 機器效率高,但現有技術無法提升利用率,資源空置。任意門/互聯網13建設成果任意門 Soul 通過先進的算法驅動和數據分析技術,打造出“平行宇宙”中獨立的、沉浸式社區。作為下一代基于人工智能的移動社交網絡平臺,任意門 Soul 是中國社交 4.0 時代的領軍者。其 AI PaaS 平臺管理了從初期的數十張 GPU 卡到近千張的超大規模,日承載 AI 業務發布數百次,很好地支撐了業務的高速發展。是下一代基于人工智
128、能的移動社交網絡平臺,也是中國社交 4.0 時代的領軍者。其 AI PaaS 平臺管理了從初期的數十張GPU 卡到近千張的超大規模,日承載 AI 業務發布數百次,很好地支撐起業務高速發展。113相關產品容器服務 ACK任意門/互聯網Wolai 是一款辦公協同應用,具備多人同時在線編輯文檔功能。要實現這個功能,一個非常穩定的 Web 服務接口和一個具備伸縮能力、支持高并發寫入、讀取分離的分布式數據庫是非常重要的,使用 Serverless 產品能夠與分布式數據庫進行很好的搭配,非常符合 Wolai 的架構需求??蛻艉喗閨Wolai 使用函數計算相比傳統架構節省了一半以上的費用和人力客戶痛點Wol
129、ai 用戶不需要快速打開應用,然后即用即走。相反,他們對于應用的初始加載速度沒有特別高的要求,因此 Wolai 關注的重點并不是服務器端的渲染問題。通過研究用戶習慣,更關注用戶在打開應用后,操作的每一步是否能夠快速響應的問題:114Wolai/互聯網13115解決方案為了實現快速迭代,節省人力,Wolai 把應用的每一個小的功能點拆分的非常散,在函數計算上部署了非常多的服務,同時每個服務下又會有多個函數,通過人為拆散的方式實現了函數解耦。這樣做的優勢是當我們需要發布時,如果只針對一個函數做了某些優化或者 bug 修復的話,那就只需要發布這個函數,完全不需要做整體發布。因此可以每天快速累積發布,
130、大部分函數完全解耦,互不影響。盡量把所有的函數完全獨立開,變成獨立的業務邏輯。這樣可以保研發迭代的速度。目前團隊研發工程師有 10 個人。其中8 位都是前端工程師,大大提高了團隊人效。用戶價值經測算,使用函數計算比使用傳統框架節省一半以上計算費用,人力的投入能夠節省一半甚至更多。實現快速迭代,節省人力,Wolai 的前端工程師就可以把從前到后的一整套開發流程負責起來,我們的研發迭代速度非???。Wolai/互聯網 用戶把數據發到服務器上,服務器是否能快速、穩定的接收數據?當有大量并發出現時,會不會讓響應速度變慢?相關產品函數計算 FC合闊智云成立于2011年,核心是云原生和移動化設計的新一代全渠
131、道“云端一體”履約中臺和去中心化模式智能門店供應鏈業務中臺??蛻艉喗閨合闊智云通過 ASM 輕松實現微服務治理客戶痛點 開源項目易用性差:客戶采用 Linkerd 社區版搭建 Service Mesh 基礎設施,無法和阿里云提供的云上基礎設施進行很好的融合。例如,Sidecar 使用默認配置,控制能力相對較少,在應對一些復雜一點的場景,無法做到靈活配置;Linkerd 的應用可觀測性比較簡單,無法觀測到偶發的出現鏈路被熔斷、某個端口無法訪問的場景。116合闊智云/互聯網13117方案亮點 實施商業版架構和社區版一致、云上易用性強:服務網格 ASM 在架構上和 Istio 社區版、業界趨勢保持一
132、致,并在托管的控制面側提供了用于支撐精細化的流量管理和安全管理的組件能力,控制面的托管解除了與所管理的 Kubernetes 集群生命周期的綁定,使得架構更加靈活,提升了系統的可伸縮性;自帶的可觀測面板,清晰展現各種問題,例如不合理的應用補償策略、不合理的應用部署、不合理的應用報錯,問題一清二楚,進而非常方便的推動應用架構的改造。企業級治理能力豐富提升可用性:相比社區版 Istio,ASM 提供了更加豐富的企業級治理能力,如流量標簽、灰度發布、熔斷、限流等能力。配置推送優化資源利用率:ASM 的配置推送優化可以通過分析數據平面 Sidecar 產生的訪問日志獲取數據平面服務之間的調用依賴關系,
133、為數據平面中的每個工作負載自動推薦 Sidecar 資源,減少配置推送負擔,提升資源利用率。合闊智云/互聯網 鏈路調用復雜治理難:隨著應用數量的增加,應用鏈路調用變得更加復雜??蛻舨捎胓RPC 協議,應用端沒有做特別處理,導致基于 HTTP2 的長連接協議無法實現負載均衡,尤其是單一客戶端調用變大的情況下,服務端無法有效負載;應用本身比較薄,導致應用調用鏈路無法透明化,每次新的發布部署容易出問題。數據平面集群的資源消耗大:客戶的數據平面 Kubernetes 集群中的工作負載數量比較多,默認情況下會增加 Sidecar 對數據平面集群的資源消耗,同時控制平面會面臨較大的配置推送負擔,降低控制平
134、面的效率與可用性。13118建設成果通過將 Linkerd 社區版本遷移到服務網格 ASM(阿里云提供的 Istio 云上商業版),高效解決了多語言技術棧情況下,應用鏈路調用復雜的運維難題,以及和云上其他產品搭配使用的易用性問題,運維效率提升40%;借助 ASM 提供的豐富的企業級能力和完備的可觀測能力,縮短了構建服務網格的實施周期50%。相關產品 服務網格 ASM 容器服務 ACK Serverless 容器服務 彈性容器實例 ECI合闊智云/互聯網站酷(ZCOOL)深耕設計領域多年,聚集了1500萬設計師、攝影師、插畫師、藝術家、創意人,在設計創意群體中具有一定的影響力與號召力。業務使用了
135、 Node.js、Java、PHP 等多種技術棧進行開發,開發、運維協作成本高??蛻艉喗閨站酷基于 ASM 解決多語言技術棧下服務管理難題,實現運維提效客戶痛點 多語言、多集群服務統一納管難:站酷面向互聯網用戶,提供站酷網、站酷海洛、站酷學習等各項服務,這些業務使用了 Node.js、Java、PHP 等多種技術棧進行開發,并部署在多個 Kubernetes 集群中,如何通過統一的業務中臺統一納管這些業務是一個很大的技術挑戰??捎^測體系構建難:對于上述的業務架構而言,很難對于不同的應用服務實現統一的可觀測體系、進行服務指標的統一實時監控。119站酷/互聯網13120方案亮點 高效管理多集群、多
136、語言下的應用服務管理:通過使用服務網格 ASM,對多集群、多形態、多語言服務的統一納管成為了非常簡單的工作。托管式服務網格 ASM 在成為多種異構類型計算服務統一管理的基礎設施中,提供了統一的流量管理能力、統一的服務安全能力、統一的服務可觀測性能力、以及實現統一的代理可擴展能力,以此構筑企業級能力。南北向與東西向流量統一治理:在社區 Istio 的網關基礎上,ASM 企業版提供了更多的企業級高級特性,包括指標伸縮(HPA)、基于 Intel MultiBuffer 技術的軟硬結合性能優化、網關無損升級、SLB 優雅下線等,使網關真正達到了生產可用級別,可以很好地支持各種企業級服務。ASM 可觀
137、測中心實現全業務的實時監控:在生產環境中,站酷主要利用了日志中心進行了網格可觀測性的建設。ASM 通過與日志服務集成提供網關與網格內 Sidecar 日志的自動采集,同時針對網關與網格內 Sidecar 訪問日志分別提供了日志儀表盤,提供包括請求錯誤率、P95 延遲等實用指標監控,實現了對多集群異構應用的統一可觀測性。插件市場完善:服務網格 ASM 在插件拓展中心中提供了即插即用的插件市場。針對各種實際業務場景,提供了多種即插即用式插件,經過簡單幾個參數的配置即可快速啟用數據面 Sidecar 的各種拓展能力。通過對 ASM 插件市場的利用,站酷在很短時間內就解決了業務遷移中遇到的問題。服務治
138、理自動化集成難:由于站酷建設了統一的業務中臺,對于服務的部署、維護、治理等有著較強的自動化配置需求,對于多集群服務治理的場景需要一定的自動化集成能力。站酷/互聯網13121建設成果客戶通過 ASM 高效解決了多語言技術棧情況下多集群的應用服務管理難題,運維效率提升40%;并借助 ASM 統一流量治理、全業務的實時觀測能力,大幅提升了線上業務穩定性。相關產品 服務網格 ASM 容器服務 ACK 應用實時監控服務 ARMS站酷/互聯網 支持自動化 API 集成:作為阿里云云產品,服務網格 ASM 除了通用的 OpenAPI/SDK集成方式之外,也提供了其它多樣化的產品功能模塊集成方式,包括 Kub
139、e API、Terraform 等,產品所提供的各大功能模塊不僅能夠通過 ASM 控制臺進行訪問,也能以 API 的形式集成進廠商的自有業務中臺之中,助力網格運維自動化。禾連健康成立于2014 年,是一家從體檢場景切入的健康管理服務公司,目前已經覆蓋全國200 多個城市、2000 多家醫院??蛻艉喗閨禾連健康低容錯業務的增效之路客戶痛點 自建性能低效:通過開源 Dubbo2+Nacos 進行微服務重構,業務發布峰值觸發Nacos 性能瓶頸,導致服務異常下線,引發業務故障。人工運維風險高:客戶服務2000 家醫院,每家醫院的需求差異大、且變更頻繁,會存在大量的特性開關,此類開關的人工運維操作非常
140、危險,一旦出現誤操作,會導致嚴重的線上故障。122禾連健康/互聯網13123方案亮點禾連健康采用 MSE(Dubbo+Nacos)的微服務技術棧,提升了整體性能、減少了資源成本,并避免了一些安全風險。性能強大、降低資源成本:微服務引擎 MSE 幫助客戶扛住了頻繁發布的壓力,具有良好的兼容性,后續客戶跟隨社區升級至 Dubbo 3,解決了 Dubbo 2 服務模型的問題。另外,從內存視角看,MSE 具有出色的調優能力,使業務性能提升4倍,降低了客戶的資源成本。動態配置,無需重啟:微服務引擎 MSE 的特性開關支持動態配置,無需重啟應用,用戶無感知,很好地解決了客戶的痛點,提升了業務的穩定性,同時
141、集成 KMS 解決敏感配置存儲問題。禾連健康/互聯網13124建設成果相比于自建,MSE 注冊配置中心性能提升50%,解決了業務高速發展中的擴展性問題,保障全國200 多個城市、2000 多家醫院體驗業務的穩定性超99.99%??蛻糇C言“我們以橫向的訂單、落單、數據同步為主,重新梳理了模塊和服務,同時部署架構換成了 Kubernetes,并把用于服務治理的一些中間件替換成阿里云微服務引擎 MSE 這類云服務,這個時候,整個系統總體就比較穩定了??偨Y來看,圍繞業務來構建微服務,結合云的優勢,提升了開發運維效率和線上穩定性?!毕嚓P產品 微服務引擎 MSE 應用實時監控服務 ARMS 容器服務 AC
142、K禾連健康/互聯網深圳魚傳科技有限公司是專注以精準營銷和互聯網生態產品運營為核心的綜合互聯網營銷推廣服務商。通過整合全網優質媒體資源,并結合智能數據模型和 AI 標簽算法,向企業提供包括流量矩陣搭建運營、媒介流量采買、投放模型設計、產品營銷策劃、數據監控分析、效果運營等多層次服務??蛻艉喗閨魚傳科技基于函數計算高性價比地支持了一個日活50W+的小程序客戶痛點 突增流量問題:“多多有禮”是公司旗下一款主打互動領獎的小程序,目前已經積累了百萬日活的規模。為了抗住高并發流量,企業準備大概三、四臺高配服務器做負載均衡,然而在業務并發高峰期,服務崩掉的情況還是經常發生。因為這個小程序涉及到的業務邏輯,和
143、應用后端交互比較多,有很多復雜流程,比如打卡、簽到、莊園運營等,所以遇到突增流量,單純增加服務器數量很難扛住。125魚傳科技/互聯網13126解決方案 方便的開發流程:函數計算配合 Serverless Devs 工具支持了多語言 Web 框架的“0”改造遷移,每個開發人員會獨立負責一個函數服務,服務下面每個函數會作為一個小的應用。函數計算支持層功能,后面會用層來部署公共函數、依賴,比如給用戶發紅包,代碼只用寫一份。另外對新招進來的開發來講,函數計算上手門檻還是很低的,不用管理服務器搭環境,可以直接在線編輯代碼、部署、測試。流水線和灰度發布:我們本地一直采用的 SVN 存儲代碼,SVN 提交代
144、碼支持觸發Action,我們封裝了函數計算的 API 接口,可以通過關鍵字觸發函數和服務的發布。為了避免發布影響線上服務,我們還使用了函數計算的版本和別名的功能。正常線上業務會發布成新的版本,同時把 HTTP 流量入口綁定的 release 別名指向新的版本,這樣就完成了發布過程,如果最新的代碼出現問題,可以更改別名的指向,就能達到一鍵回滾到上個版本。同時我們也會創建一個測試別名,會先完成版本的測試后,才會把承載現網流量的 release 別名指向到新版本。這樣通過別名的能力就區分出了線上環境和測試環境,非常方便。運維管理:函數計算集成了 SLS,每次請求都會生成一條日志,可以比較方便的過濾出
145、錯誤日志,對線上問題排查比較方便的。另外函數計算也提供了比較全的監控視圖,我們最常用的就是請求量、錯誤次數、并發、執行耗時等指標,針對錯誤次數也加了告警,這樣開發就可以直接兼業務運維,效率成倍增加。資源利用率低的問題:“多多有禮”在初期上線的時候,業務高峰期并發大概在1000-2000,但業務低峰期可能也就幾十,這是因為小程序設計的用戶打卡、簽到等動作,使得用戶量非常容易在早上、晚上,或者某一個特定時間暴增。在這種情況下如果再用 ECS 的話,不僅需要按照峰值流量預留足夠的 ECS 資源,維護起來也會變的非常復雜,資源利用率很難做上去,費用也會成倍的增加。魚傳科技/互聯網13127用戶價值 穩
146、定性增強:開發不需要去關心后端服務的搭建運維,只需要編寫函數就能夠為小程序提供穩定可靠并且彈性伸縮的服務。開發上手快,不用維護服務器:開發新人在生產過程中直接使用函數計算,上手非???,他們只需要關心自己的代碼就可以了。價格低服務好,想買技術支持:支撐一個日活超過 50 萬人的小程序,使用函數計算費用大約在 200 元/日左右,這個費用還是很便宜的。函數計算團隊能及時、耐心的給予技術支持,服務非常好。相關產品函數計算 FC魚傳科技/互聯網|分眾傳媒基于函數計算 FC 自研圖片識別處理系統128分眾傳媒/互聯網分眾傳媒在主流城市主流人群必經的電梯空間中每天形成了高頻次有效到達,覆蓋 3.1億中國城
147、市主流消費人群,超過 260 萬個電梯終端。除了電梯終端外,還會印發大量的廣告海報,怎樣確保這些靜態資源的張貼效果,成為分眾的重要業務指標之一??蛻艉喗榭蛻敉袋c分眾傳媒自研了圖片識別處理系統。當工作人員更換好海報后,會通過 APP 端拍照上傳到后臺服務端。而每個周末,靜態海報會批量進行更換,后臺系統就會迎來處理高峰,大概需要集中處理幾百萬張圖片。工作日的時候,更換頻次相對較低,后臺系統就會相對空閑。周末和工作日的流量峰值平均相差 10 倍以上,如果按照周末的峰值保有資源,會導致工作日產生大量的閑置資源。隨著業務規模的增長,業務方對后臺服務的彈性訴求也越來越強,怎樣能讓后臺系統能更加從容應對波峰
148、波谷,又能平衡資源開銷成為最大的痛點。13129解決方案分眾最早是采用單體架構來處理圖片識別功能,切到函數計算后,采用前后端分離的架構,后端部分使用 API 網關+FC,使用 API 網關是為了規范化 API。對于 FC,每個請求都可以獨占實例資源,通過水平彈性擴展來承載大流量。經過實際測試,發現2G/約1.33C 的資源規格可以滿足大部分的圖片識別場景,部分操作如加水印,還可以縮減到512MB/約 0.33C(最小規格 128MB 內存/約 0.1C),達到最佳的資源使用配比,以節省費用。而針對體積較大的算法包,通過掛 NAS 盤的方式,也可以解決。在彈性方面,函數計算可以做到百毫秒級的彈性
149、伸縮(冷啟動),對 APP 端的 API 接口,端到端平均響應大約在 300ms 左右,基本可以滿足;對圖片識別來講,因為是異步調用,所以對延遲并不敏感。最終上線后,大致的業務架構如下:用戶價值 降本增效:按需使用、按需付費的模式,極大釋放了閑置資源,成本節省50%+。極致彈性:分鐘級彈性6000實例,快速完成圖片識別任務,處理效率提升200%。相關產品函數計算 FC分眾傳媒/互聯網匯量科技是全球領先的技術服務公司,憑借全球化網絡和本地化服務能力,為 112 個國家 7000 多個活躍的應用開發者提供從獲客到變現的全棧式廣告產品,每天觸及超 35 億活躍移動設備,覆蓋 247 多個國家和地區。
150、客戶簡介|匯量科技通過容器技術加快全球業務拓展客戶痛點 全球業務發布復雜度高:客戶需要在全球多云環境下進行業務開發、部署、運維,需要通過標準化的方式實現業務發布和服務提供;需要在全球范圍內敏捷發布業務,并用最低成本進行管理。業務訪問量波動大,資源成本高:客戶需要應對每天上百億的廣告交易請求處理數量;需要海量計算資源完成高并發的處理;客戶的業務高峰低谷非常明顯,按照峰值業務需求準備資源會造成嚴重浪費。130匯量科技/互聯網13131方案亮點采用 ACK 容器化彈性技術方案作為核心技術架構后:容器技術簡化全球業務拓展:實現業務全球范圍內標準化部署、遷移和運維。彈性促進增效降本:業務大量使用彈性的計
151、算資源,通過 HPA 及 CronHPA 實現按需擴縮;驅動 ACK 彈性節點池按需彈出預留+搶占式競價實例,極大地節約了資源成本。建設成果業務系統容器化改造后,在降低單點擊成本的同時還保障了業務高峰期的快速彈性,單點擊成本降低30%,同時彈性按需擴縮的敏捷架構幫助業務在全球快速開服快速擴容,幫助客戶增效降本。相關產品 容器服務 ACK ECS-搶占實例匯量科技/互聯網|云撥測助力偉東云教育,全面提升全球用戶體驗132偉東云教育/互聯網作為全球知名職業培訓平臺服務商,偉東云教育以教育應用為核心,提供面向職業教育、高等教育的資源、產品與服務,打造“數字化人才發展平臺”。為全球 25 個國家及國內
152、 25 個省級行政區的政府、院校、企業、機構提供相關人才培養服務,深耕家政、應急、交通運輸、退役軍人就業創業培訓、人工智能等多個領域。彌合區域數字鴻溝,助力教育信息化建設,為推動全球教育事業均衡發展貢獻力量??蛻艉喗榭蛻敉袋c作為教育行業獨角獸,面對全國乃至全球不同地區 ToB 客戶及眾多 ToC 終端用戶,如何保障終端體驗與平臺可用性成為關鍵。在服務過程中,偉東云服務團隊遭遇以下問題。13133 無法快速定位不同地域網絡故障:在為某地建設教育信息化平臺過程中,時常因為當地網絡環境的限制,從而造成用戶訪問異常。偉東云服務團隊在遠程測試時檢查正常,導致無法更快速定位問題位置,使得故障恢復時長被拉長
153、。難以及時發現 DNS 劫持問題:在服務西南某地某客戶的過程中,偉東云服務團隊收到某地區用戶上報,在瀏覽平臺網站時會跳轉到非法賭博平臺,存在造成用戶資產損失風險。在進行遠程測試及通過 VPN 代理進行相關測試時,偉東云服務團隊也無法發現相關問題。經測試,發現是由于某運營商造成了劫持。面對這樣的問題,如何確保全國乃至全球不同地區用戶的可用性,全面掌握當地真實網絡環境以及網站性能各個指標,盡可能壓縮故障恢復時長,成為偉東云教育服務團隊的重要痛點。方案亮點如何保證日常服務的穩定性與安全性,成為偉東云服務團隊的重要議題,具備全球海量監測節點以及非侵入式的云撥測成為解決問題的最佳產品。重點城市城市可用性
154、主動監控:通過配置網絡監控任務,選擇主要幾個重點城市 IDC監測點,對目標網站的重點頁面進行網絡連通性監控,同時配置較快的監測頻率,一旦出現可用性問題,告警會及時通知出來。IDC 監測點相對應 LastMile 監測點來說更穩定,可以降低誤報的概率。頁面訪問性能分析:網頁打開速度也是偉東云教育需要重點關注點問題,對于他們的客戶來說網頁速度直接影響他們的客戶在線教育的質量。針對網頁打開速度,偉東云選擇了全部主要省份城市的 LastMile 監測點,并配置了瀏覽任務對網站首頁和重點頁面進行性能分析,重點會關注網絡連接延時、頁面請求元素的總數及 CDN 解析對質量,定位問題根因后會推動相關供應商或內
155、部研發團隊進行優化。偉東云教育/互聯網13134建設成果借助云撥測,偉東云教育服務團隊進一步完善監控體系。利用最低成本全面掌握全國乃至全球不同地區終端用戶的實際訪問體驗情況??s短故障恢復時長 20%以上,大幅提高故障響應效率以及用戶滿意度。相關產品應用實時監控服務 ARMS偉東云教育/互聯網核桃編程作為少兒編程教育行業的領導者,致力于以科技手段促進編程教育,通過人工智能、自適應學習等先進技術和科學的教育方法,啟發中國孩子的學習能力??蛻艉喗閨核桃編程基于 ARMS 構建可觀測體系,全方位提升用戶體驗客戶痛點隨著核桃編程業務快速增長,微服務架構變得越來越復雜,在用戶體驗提升方面遇到了很多困難:無
156、法及時發現站點故障:用戶體驗是決定品牌形象的核心要素,客戶 IT 團隊在其用戶多次投訴后才發現站點故障,導致用戶體驗下降。135核桃編程/互聯網13136方案亮點 實時洞察用戶體驗:全面并實時的了解應用端到端健康程度,包括 PV/UV 情況統計、頁面加載速度情況,JavaScript 執行情況,API 請求成功率等多個方面??蛻舳诵畔⒍嗑S度聚合:ARMS 前端監控能夠從地理位置、瀏覽器、操作系統、分辨率、網絡運營商、應用版本等多個維度,對客戶端性能指標進行聚合分析,從而幫助核桃編程更好地定位性能瓶頸。前后端統一鏈路追蹤:ARMS 前端監控能夠自動生成 TraceID 串聯前后端鏈路,這樣可以從
157、完整鏈路的角度洞察瓶頸點,對于排查系統故障和性能瓶頸帶來了非常大的幫助。接入簡單:只需在客戶端 HTML 頁面的 Body 元素中加入一段由 ARMS 提供的統計接入腳本(一段 JavaScript 代碼),就能完成監控數據的自動上報??蛻舳吮O控手段缺失:相對于成熟的服務端監控技術,整個行業在客戶端監控領域的技術方案一直比較欠缺。僅僅擁有服務端監控手段,很難第一時間確認問題的根源到底在于前端還是后端。核桃編程/互聯網13137建設成果 降低運維工作量:相對于傳統的前端日志埋點方式,ARMS 提供的前端可觀測方案幫助核桃編程節省了30%以上的運維工作量??焖俣ㄎ痪€上問題:定位線上問題的平均時長減
158、少60%。提升用戶體驗:通過前端可觀測技術,全方面提升用戶體驗,帶來了業務量的快速提升,核桃編程在成立后3 年內付費學員數突破200 萬,并實現了單月營收過億。相關產品應用實時監控服務 ARMS核桃編程/互聯網新東方教育科技集團定位于以學生全面成長為核心,以科技為驅動力的綜合性教育集團。新東方線上教育業務的云教室系統支持了視頻直播、轉碼、點播等新東方所有在線教育場景。隨著業務量的增大,由于直播轉錄及視頻轉碼任務處理平臺具有明顯的波峰波谷特性,自建機房較低的資源利用率成為了業務的核心痛點??蛻艉喗閨新東方基于函數計算實現直播流實時轉碼客戶需求直播+錄播是新東方主推的課程交付模式。新東方開始對接大
159、學生線上教育業務,對錄播課程的質量提出了更高的要求。團隊開始考慮采用服務端錄制的方式解決問題。服務端錄制的兩個核心點在于直播錄制和視頻標準化生產。我們的業務模式決定了我們很難準確預測業務量,因此,新東方關鍵的技術任務是實現計算彈性。138新東方/互聯網13139解決方案新東方在錄播轉碼場景下使用了阿里云函數計算 FC。錄播轉碼的核心訴求是對直播流進行實時轉碼,保存為標準的視頻格式,方便后續加工使用。老師進入房間發起轉碼請求后,可快速啟動函數實例進行轉碼。在上課結束后,結束轉碼任務,將臨時音視頻結果上傳至云存儲后即可立即釋放函數實例,不會存在任何計算資源的浪費。接下來在云端錄制項目嘗試使用函數計
160、算。使用 Chrome 瀏覽器加入直播房間,對瀏覽器界面進行截屏錄制,該方案的關鍵在于彈性提供瀏覽器實例。利用阿里云函數計算啟動 Linux 容器,在 Linux 容器運行 Chrome 瀏覽器實現彈性提供瀏覽器實例。新東方/互聯網13140用戶價值 彈性高可用:百毫秒拉起上萬個實例,定時預熱徹底解決冷啟動困難,承載了直播轉碼和錄屏業務業務洪峰。降本增效:有效應對大規模突發在線流量,按量付費,提高資源利用率,減少20%資源成本開支,極大程度降低運維成本,專注業務創新。架構升級:用較少的人力資源以較低的成本實現高性能的架構模式。標準化模版:通過應用中心快速完成 demo 驗證,縮短業務驗證周期,
161、提升部署效率。相關產品函數計算 FC新東方/互聯網心動創立于 2003年,是一家全球游戲開發和發行商,擁有豐富的研發、發行和代理運營經驗。截至 2022 年中,心動運營 38 款免費和付費游戲,在全世界擁有 5000 萬月活躍用戶,主要分布在大中華地區、東南亞、北美和南美。2016 年,心動推出手機游戲社區和應用商店 TapTap,玩家可以通過官方渠道免費或付費購買下載手機游戲,亦可在社區中與其他玩家交流,2022年中,TapTap 在全球有 4400 萬月活躍用戶??蛻艉喗閨心動網絡(TapTap)基于 SAE 實現簡單運維、不停機發布和分鐘級上線客戶痛點TapTap 的廣告屬于站內的原生廣
162、告,與其他非商業化在內容上形態保持高度一致,給用戶更好的體驗。比如首頁的游戲推薦,發現頁的內容推薦,搜索引導頁的底紋詞,以及搜索輸入時會出現的搜索建議詞,還有搜索最后的落地頁等等,廣告的部分就穿插在這些戰略內容之間。141心動網絡/互聯網13142解決方案預估服務整合了搜索、推薦、廣告都需要的模型推理、特征開發以及樣本回傳的能力,本身是一個中臺型微服務,所有業務線都可以非常低成本的接入目前組內最成熟的線上預估服務。例如現在的搜索頁的推薦詞的點擊率預估,國際版的游戲點擊率預估等。通過 SAE,TapTap 的服務快速具備了 Serverless 的能力,因為 SAE 本身屏蔽了很多資源管理、環境
163、管理以及基礎運維組件管理工作,使得 TapTap 可以快速地為國內國外的新場景、新業務上線一套獨立的預估服務。與此同時,TapTap 也集成了 SAE 的告警平臺,事件中心以及日志服務,通過釘釘告警就可以實時感知線上業務的狀態,例如是否發生了 OOM 還是重啟、錯誤日志之類的。另外,SAE 也是接入了 Dubbo Go 框架使服務直接具備了服務注冊發現,IP 直連,優雅上下線等微服務能力。相比之前使用 ECS 的模式,這套方案在運維管理以及開發上線和后續的成本管控上都有較大的優勢,基本可以覆蓋從開發上線后續運維的全流程,大大節省的組內的開發成本。早期,TapTap 絕大部分的后端服務都是部署在
164、 ECS,通過 Rundeck 來進行管理和部署,在效率和管理上并不是那么理想。在基建升級方案的需求上,主要是4點:能大幅提升開發運維效率。以較低的人力成本來滿足業務需求。服務足夠可靠,能夠具備良好的性能。因為我們工程目前主要是以 Go 語言為主,所以在后續基建升級上需要對 Go 有良好的支持。心動網絡/互聯網13143用戶價值 簡單運維,省心省力:開發可以輕松搞定應用開發、部署、管理全流程,讓自己更專注于業務,也大大節省了運維的投入和成本。不停機發布+分鐘級上線:SAE 支持灰度發布、滾動發布的能力,還提供了較為完善的Open API,可以集成到 Git 中快速部署,使我們的服務具備了分鐘級
165、發版的能力,這個對于新業務尤其具有吸引力。秒級彈性縮擴容:SAE 支持配置像 CPU、內存、QPS、RT、定時等不同維度指標的擴縮策略,可以幫助提升資源利用率。尤其是業務規模大了之后,通過配置更加精細的彈性策略,可以顯著降低機器成本。多語言微服務能力:SAE 提供了 PHP、Python、GO 等多種運行時,并且基于 K8sService 多語言服務注冊發現,實現了 Go 語言低成本微服務化。相關產品Serverless 應用引擎 SAE心動網絡/互聯網|小邁科技:基于 SAE 打通 CI/CD,提升研發效能,縮短上線時間144小邁科技/互聯網小邁科技于2015年1月成立,是一家致力以數字化領
166、先為優勢,實現業務高質量自增長的移動互聯網科技公司,累計開發400余款產品,累計用戶下載安裝量破七億。對于大部分休閑類游戲來講,在游戲的生命周期內,會出現非常大的波峰波谷,一般集中在游戲剛開始推廣、以及每天相對固定的時間節點上。比如晚上8點會是業務的最高峰,凌晨2點到 6點幾乎沒有流量,但是又不能停服。另外,每次運營活動又會拉來大量的新客戶涌入,就需要后臺服務能夠快速響應流量的變化。并且,大部分休閑類游戲都是無狀態的,還可以拆分成不同的服務模塊來提升服務性能和質量,如聊天、紅包、背包、升級、用戶數據獲取、視頻處理、廣告投放等;因此就可以采用微服務架構來部署。最后,游戲在上線期間也會迭代增加很多
167、新的功能模塊,需要頻繁的發布升級??蛻艉喗?3145客戶需求 系統的穩定性和容災能力 平臺的自動彈性伸縮能力 對微服務架構的支持 便捷的發布回滾能力,甚至是不停服升級解決方案 小邁的游戲團隊主要采用的是 Spring Cloud 和 Dubbo 技術棧,可以無縫遷移到 SAE平臺。實現容器化的同時,可以直接使用微服務的健康檢查、優雅下線腳本、配置管理、灰度發布、一鍵回滾等功能。采用 Jenkins 封裝了 SAE 的 API 接口,實現了 CI/CD 能力,業務從本地推到線上縮短到了分鐘級,并且在部署的時候通過選擇多可用區,可以直接實現跨可用區的容災?;?SAE 的 CPU、內存、QPS、R
168、T 等指標來進行設置,對于小邁的線上游戲,主要還是通過 CPU 和內存的使用率來觸發擴縮;另外定時彈性和監控指標彈性還可以混用,對于有運營活動時,可以通過兩種彈性方式共用的方式,來確保資源的彈性。通過 SAE 自帶的應用監控,查看服務接口的調用情況,快速定位和診斷問題。小邁科技/互聯網13146用戶價值截止到目前,小邁在 SAE 上累計已經部署了 50 多個服務和應用,涉及十幾款游戲,比如愛上猜成語、成語最強答人、我找茬賊快、多多短視頻等。使用了 SAE 之后,小邁的游戲團隊只需要關注自身的業務邏輯,資源層面托管給了 SAE 平臺,極大的簡化了運維復雜度,尤其是資源的彈性伸縮方面,實現了秒級彈
169、性,更加貼合業務。另外對比原來的部署效率,整體研發效能也有了極大的提升,新項目上線時間從天級縮短到了分鐘級。并且,SAE 還提供了環境“一鍵啟?!惫δ?,針對開發測試環境,可以設置定時關閉和開啟,優化非線上環境的資源占用,進一步優化費用。相關產品Serverless 應用引擎 SAE小邁科技/互聯網小7手游是深圳尚米網絡技術有限公司(尚米網絡)旗下的手游運營平臺。尚米網絡從2012年至今在游戲行業深耕細挖多年,積累了豐富的游戲運營經驗并樹立了專業的品牌形象。小7手游于2016年上線,產品包括 iOS APP、安卓 APP,運營游戲范圍包括手機網游、手機 H5 游戲。主打福利特色,通過提供極致的游
170、戲體驗、優質的用戶服務,讓手游用戶享受游戲樂趣。目前小7手游已與超3000家手游研發/發行廠商合作,運營數千款手游產品。憑借健康的商務洽談、合作、結算體系,成為廣大游戲廠商值得信賴的合作伙伴。|小七手游:MQTT 構筑運營平臺與游戲端的交互通道客戶需求運營平臺中關于運營消息以及廣告推送等場景,如:147小七手游/互聯網客戶簡介13148 各類服務器運維升級等跑馬燈信息 賬號被踢下線信息 懸浮窗廣告 普通消息推送消息由平臺主動推送,當游戲接入端在近百萬、千萬級的情況下,如何選擇安全、穩定、可靠的接入方式是一件頭痛的事情。運營方推送的特點與要求如下:海量的用戶觸達:一款成功的游戲總客戶數經常超百萬
171、、千萬。日活及同時在線數量巨大。消息的時效性不同:有些消息是在某時間段內都生效的(例如主游戲服運維升級通知),無論客戶當前的狀態是否在線,都需要游戲在線時收到。有些消息是對于當前在線的客戶(例如賬號踢下線信息)才有意義。精準的消息投遞:消息對某類特征的客戶群體進行廣播(例如,不同的廣告推送不同等級的游戲玩家)。連接的輕量級消耗:這類數據的交互對比游戲本身操控來說,并不會很頻繁,要求鏈路占用的客戶端運行資源盡可能的少。SDK 依賴資源簡潔:在游戲領域里,由研發團隊會產生游戲母包,而運營發行方會在母包的基礎上嵌入運營所需要的 SDK 包,例如包括支付功能、數據推送功能,那么對于推送功能本身所依賴的
172、資源包就越小越好。小七手游/互聯網13149用戶價值 平穩支持業務的變化發展:在使用了微消息隊列 MQTT 版方案后,充分利用了云上資源的彈性可得特性,在我們游戲客戶體量本身會隨著游戲的熱度變化而變化的同時,非常穩定地支持著業務的潮汐變化。合理技術選型簡化了工作:使用商業的微消息隊列 MQTT 版方案后,復雜的鏈路與訂閱關系以及推送問題全交給微消息隊列 MQTT 版,這樣簡化了基礎設施的建設運維,可以把精力全心全意地投入到業務上的實現。解決方案通過阿里云微消息隊列 MQTT 版產品來實現平臺的推廣運營功能,微消息隊列 MQTT 版有協議非常簡潔,支持各種語言 SDK,接入簡單的特性,也支持各種
173、訂閱關系,支持可配置的消息觸達 QOS 質量,而且可以觀測客戶端的連接情況,支持百萬級的連接,契合推廣運營平臺的場景。小七手游/互聯網13150客戶證言“微消息隊列 MQTT 版這種資源占用小,連接數量多,維護簡單的產品,特別適合我們這種游戲第三方以 SDK 接入的運營推送類應用,在比較完 http 輪詢與 socket 方案后,還是 MQTT 方案為最優選擇。而使用阿里的商業化產品,除了無需擔憂穩定性外,還高度靈活地匹配我們游戲客戶大規模變化的情況,讓我們享受了技術帶來的便利與快樂?!鄙忻准夹g負責人相關產品微消息隊列 MQTT 版小七手游/互聯網間隔頁(待分享)互聯網INTERNET視野數科
174、是專注服務于一級市場、公司信貸、產業規劃招商、面向多層次資本市場的大數據金融信息服務商。深度理解大型銀行/金融機構/政府/企業集團等用戶對于數據的需求,為客戶呈現專業加工后的數據,提供企業/產業/財務數據整合、數據加工處理、數據中臺、系統開發和大數據模型分析咨詢服務的一整套解決方案??蛻艉喗閨視野數科運維提效 60%,SAE+Jenkins 打造云原生 DevOps客戶痛點數據是核心資產,數據的安全、穩定和效率是服務大型客戶的關鍵。視野數科測試環境無法獲取客戶全量真實數據,很多 case 覆蓋不到,只能等上線前,在灰度環境(等同預發)頻繁發版&測試,過程中暴露了較多問題:開發迭代效率慢:單體煙
175、囪式架構,代碼耦合度高,開發效率慢。152視野數科/金融服務13153解決方案針對這些問題,視野數科借助阿里云 Serverless 應用引擎(SAE),完成兩方面的升級:從 0 到 1 打造 Git+Jenkins+SAE 的云原生 DevOps 體系。零門檻從 ECS 單體架構,升級為微服務+K8s+Serverless 架構,一步邁進云原生。上線流程復雜,成本高:使用 SVN 代碼管理+人工部署,缺少規范化 DevOps 流程,每次上線前都要在灰度環境來回折騰 2030 次數據校驗,頻繁發版測試,開發和運維幸福感差。容器化自建成本高:嘗試過 ECS+Docker 方案,但 Docker
176、Daemon 升級、鏡像registry 管理、配置管理、調度打散等均需要自維護/研發。容量預估無法自動化:每次客戶側有營銷活動/重要事件(如新華財經金融排名等),需提前一周告知視野數科備容 ECS,存在備容不準風險和閑置浪費問題。視野數科/金融服務用戶價值視野數科在實踐 SAE 的過程中,采用了獨立業務+用戶灰度的策略,逐漸放大流量,將一部分業務陸續上線,接下來計劃整體架構全面遷移到 SAE,充分享受云原生技術紅利。標準化部署流程,降低運維成本:借助 SAE,開發自助完成 CICD,提升發版效率。運維人員得到徹底解放,從重復繁雜的垂直業務上線事務中抽離出來,專注于橫向高可用體系和監控平臺的建
177、設,運維效率提升 60%。13154視野數科/金融服務 低門檻微服務架構轉型:將業務拆成微服務之后,無需關心微服務周邊配套和穩定性容災,SAE 提供了開箱即用的歷經雙 11 考驗的全套微服務治理能力。無需容量規劃,秒級擴容:借助 SAE 靈活多樣的彈性策略,視野數科再也無需提前備容,營銷活動峰值時秒級自動擴容,峰谷時回收資源降本。無感擁抱 K8s,查看日志更方便:借助 SAE 零門檻容器化,沿用原有部署方式管理應用。不用再 care 堡壘機權限、機器賬號密碼等,直接通過 SAE+SLS 方便查看日志。相關產品Serverless 應用引擎 SAE眾安保險作為國內首家互聯網保險公司,完全通過互聯
178、網展業。眾安專注于應用新技術重塑保險價值鏈,圍繞健康、數字生活、消費金融、汽車四大生態,以科技服務新生代,為其提供個性化、定制化、智能化的新保險??蛻艉喗閨眾安保險云原生架構升級,貫通行業數字化轉型“快車道”客戶痛點以傳統技術架構為基礎,在開發、運維、安全管理等方面都面臨著諸多挑戰,其中包括:研發效率低:無法快速響應多元化且更新頻繁的市場和用戶需求。業務上線速度慢,以周為單位。運營成本高:無法降低 IT 成本以及做到數據驅動的精細化運營。業務資源利用率低,造成 IT 資源浪費。155眾安保險/金融服務13156方案亮點利用阿里云容器服務 ACK 平臺,采用 Kubernetes、Docker、
179、istio 等云原生技術構建容器云平臺,同時建立 DevOps 體系。使用 ServiceMesh、SpringCloud、Nacos 等技術建立全司微服務架構,構建眾安研發管理一體化平臺,實現以下能力:100%云原生兼容:研發一體化解決方案基于阿里云容器服務 ACK 承載 PaaS,以DevOps 層支撐業務場景研發需求,同時佐以度量中心提升研發效能。研發一體化解決方案基于云原生設計,100%兼容其他云原生方案的產品,實現自主可控。安全、快速、穩定:業務上線縮短到以小時為單位,年發布次數超過 4w 次;線上問題分鐘級捕獲及處理,業務系統穩定性達到 99.99%。IT 成本降低:硬件資源投入持
180、續下降,平均投入減少 10%。自動化運維保障體系,在系統穩定性提升的同時,運維投入大幅下降。運維壓力大:應用發布方式過于傳統,不夠自動化、不具備灰度發布、基于時間控制的自動彈性伸縮等,業務系統與基礎設施耦合深,不易于管理或觀察。眾安保險/金融服務13157眾安保險/金融服務建設成果眾安研發管理一體化平臺已經成功應用于實際場景,其承保保單量已達到每天 2 千萬、每年數十億的規模。在雙十一等重要時間節點,眾安系統成功承接海量保單且運行穩定。六年來,眾安系統累計承保逾 260 億張保單。升級后的系統能夠支持千億保費,并擁有以客戶為中心的保險業務中臺,支持各業務線快速展開。相關產品容器服務 ACK客戶
181、證言眾安保險 CTO 表示:“眾安的 新保險 業務和技術都原生于云,未來我們將通過 微服務+實現更加彈性的服務治理,將 CPU 利用率從 15%提升到 60%。同時通過云原生研發體系和工具結合低代碼智能編程,保守估計可以提升 20%的研發效能?!辟M芮互動隸屬于電通安吉斯安索帕集團,專注于移動營銷、O2O、社交媒體、移動電商領域的創新與研發。費芮互動自主研發的自媒體平臺運維超過 2 億粉絲;有超過 4 萬家線下門店采用費芮 O2O 解決方案。費芮的主要客戶包括優衣庫、必勝客、肯德基、星巴克、SPG、歐萊雅、Innisfree、迪卡儂、頂新集團等??蛻艉喗閨費芮互動通過 MSE 完成移動支付應用,
182、穩定性和安全性雙提升客戶痛點 網關層性能受限:客戶的業務應用在容器中運行,使用基于 Nginx 的 kubernetesIngress 入口網關。由于網關和業務部署在同一集群中,面對突發流量時,網關層的橫向擴縮容能力有限,導致性能受限。此外,當海量用戶發起 HTTPS 請求時,需要進行大量的 TLS 加解密操作,給服務器的 CPU 帶來極大的壓力。當性能無法承載時,會影響業務系統的穩定性。158費芮互動/金融服務13159方案亮點費芮互動基于 MSE 云原生網關將流量網關、微服務網關、安全合三為一,建立高集成、高性能、易擴展、熱更新的新一代網關??s短網關轉發鏈路,提升網關性能:利用 MSE 云
183、原生網關的路由管理能力,可實現南北向和東西向流量調度。云原生網關直連業務 Pod IP,RT 更低。通過對 OS 內核參數與組件調優,QPS 比 Nginx 提升約 40%。硬件卸載 TLS 證書驗證加速,HTTPS QPS提升 80%。擴展服務治理和安全能力,提升穩定性:MSE 云原生網關作為托管型的獨享實例,與部署業務應用的資源解耦,直連后端服務,打通多種服務來源,支持過載保護、故障自愈、限流降級等功能,確保流量高峰時的穩定性。云原生網關內置 Waf 模塊,使得用戶的請求鏈接可以同時完成 Waf 防護、流量分發、微服務治理,提升鏈路 RT,降低網關的運維復雜度。豐富的可觀測性:MSE 云原
184、生網關提供 Access Log、Tracing、Metrics 及報警的全棧能力,幫助客戶更高效地定位問題。費芮互動/金融服務 網關鏈路運維復雜度高:客戶的南北向網關和東西向網關是獨立部署和運維的。流量從網關層到后端服務的整個訪問鏈路中存在許多跳轉,這增加了線上問題的排查難度,導致網關鏈路的運維復雜度較高。13160建設成果費芮互動通過 MSE 云原生網關構建了零信任架構,無需重配 Nginx Ingress 規則即可平滑遷移,性能提升 90%,響應時間下降 50%,并大幅提升業務入口的穩定及安全性,高效支撐每日 1 億+粉絲交互,4 萬+線下門店、每月 3000 萬+筆的移動支付需求。相關
185、產品 微服務引擎 MSE 應用實時監控服務 ARMS 性能測試 PTS 容器服務 ACK費芮互動/金融服務友邦人壽是香港聯合交易所上市的人壽保險集團,覆蓋 18 個市場。截至 2021 年 12 月31 號,總資產 3400 億美元。友邦人壽于 1992 年在上海設立分公司,是改革開放后最早一批獲發個人人身保險業務營業執照的非本土保險機構之一,也是第一家將保險營銷員制度引進國內的保險公司。2020年6月,友邦獲批將友邦保險有限公司上海分公司改建為友邦人壽保險有限公司。2020年7月,友邦人壽正式成為中國內地首家外資獨資人壽保險公司。友邦友享 App在2021年榮獲最佳保險科技平臺??蛻艉喗閨友
186、邦人壽可觀測體系設計與落地161友邦人壽/金融服務客戶痛點 觀測復雜度提升:云原生微服務化帶來高 HA 的同時,提升了系統復雜度,加大可觀測難度。業務需要提供全局視角觀測整個保單生命周期里重要業務節點的運行情況,并獲取研發態具體情況。13162 統一觀測困難:由于歷史原因,內部應用技術選型不一、版本各異,導致可觀測技術和調用鏈追蹤面臨很大的困難。同時,開發系統與應用運維完全分開,日志也完全分開存儲和維護,因此在同一個大盤里呈現關聯數據有較大難度。難以快速故障定位:在 IDC 機房時代,沒有直觀方式讓應用查看相關資源安全水位。雖有商業 APM 工具,但其價格高昂。問題發生時,因只有少量應用安裝
187、APM,造成調用鏈不完整,無法實現快速故障定位。友邦人壽/金融服務 全鏈路追蹤提升故障定位效率:結合業務設計,借助 ARMS 應用監控及鏈路追蹤構建相應鏈路追蹤、應用性能監控,將應用 API 接口翻譯成業務可讀懂的語言。在線上出現問題時,可直接拉起全鏈路的調用鏈追蹤,結合應用診斷工具 Arthas、JVM 調優工具、應用日志及資源級別監控來進行問題定界與故障排查,極大程度地提高了排查問題的效率。Prometheus 統一觀測:借助 Prometheus 服務對運行態進行觀測,并聚焦系統層、應用層和業務層對應的不同核心指標,實現應用服務與資源的統一觀測。Grafana 統一展現:根據設計的觀測指
188、標,借助 Grafana 的豐富圖表進行統一展示。從而實現通過大屏、中屏和小屏,三屏聯動方式形成指揮決策、研發儀表盤&應用性能展示以及告警推送、多維度的監控能力。方案亮點建設成果友邦為了滿足業務發展需求,在技術層面進行可觀測技術架構的升級和改造。觀測體系全面升級:通過阿里云 ARMS 應用監控構建全鏈路追蹤系統,結合Prometheus 監控進行統一的指標觀測,并借助 Grafana 形成可觀測統一視圖,幫助友邦搭建面向業務的完整可觀測體系。13163 觀測體系全面升級:通過阿里云 ARMS 應用監控構建全鏈路追蹤系統,結合Prometheus 監控進行統一的指標觀測,并借助 Grafana
189、形成可觀測統一視圖,幫助友邦搭建面向業務的完整可觀測體系。更高效的故障定位能力:針對服務資源追蹤,將服務運行節點上的 CPU 內存、網絡磁盤 I/O、應用指標進行聚合。問題發生時,能夠輕松觀察到異常指標。同時,調用鏈關聯服務上下游,實現從 Trace 關聯到日志,獲取到鏈路問題所在。全面提升了問題診斷效率,還提升了 用戶體驗。友邦人壽/金融服務相關產品 應用實時監控服務 ARMS Prometheus 監控 鏈路追蹤間隔頁(待分享)金融服務FINANCIAL SERVICES譜尼測試集團創立于2002年,現已發展成為擁有逾6000余名員工,由近30個大型實驗基地及近100家全資子、分公司組成的
190、服務網絡遍布全國的大型綜合性檢測集團。譜尼測試是北京市批準的生物醫藥類工程實驗室、北京市科委認定的工程技術研究中心、北京市經信委認定的企業技術中心。2020年4月15日,北京市發布承擔新冠病毒核酸檢驗服務單位,譜尼測試集團旗下全資子公司北京譜尼醫學成為首批新冠病毒核酸檢驗機構之一,承擔北京新冠病毒核酸檢驗工作??蛻艉喗閨譜尼測試基于 SAE 實現業務快速上線并從容應對流量洪峰客戶痛點身負新冠病毒核酸檢驗服務單位的重任,面對疫情的不斷反復,核酸檢測預約系統每天都經歷著業務洪峰,對系統穩定性、高可用性,對運維和研發人員都帶來了極大的考驗:165譜尼測試/其他行業13166解決方案經過和阿里云的溝通
191、交流,譜尼測試一致認為阿里云 Serverless 應用引擎(SAE)可以有效幫助譜尼測試解決以上痛點:完美支持 Java 微服務架構:譜尼通過 SAE 快速構建了 Java SpringCloud 技術棧微服務應用全生命周期管理和服務治理的平臺。無需在花費額外資源和成本去搭建配套組件,極大提升了系統的構建效率。靈活的彈性策略和極致的彈性速度:譜尼通過 SAE 極致的彈性能力和靈活的彈性策略輕松構建了可以高效、穩定應對不定時的核酸預約流量洪峰的機制和架構??梢愿鶕I務流量自適應的擴縮服務實例,整個過程用戶無感知、無需人工介入。極大保障業務應用的穩定性:譜尼通過 SAE 內置的 APM 應用監控
192、能力,從縱向指標到橫向鏈路兩個維度全方位的分析應用的健康狀態,對整體應用的健康程度了如指掌。同時配合健康檢查和無損上下線能力實現了在白天也可以發布應用,極大提高運維消息和版本迭代速度。運維成本高:面對業務洪峰時每一次都要提前進行容量預估、準備環境、部署應用等繁瑣操作,存在大量的重復工作。應對業務洪峰能力不足:面對突然的流量激增,往往需要臨時部署應用進行應對,整個流程不僅耗時,同時影響客戶側的用戶體驗。版本迭代風險大:系統上線、版本迭代流程需要一套完整的解決方案,每次上線新的版本都需要進行繁瑣的配置來實現發布,并且無法保證發布之后的穩定性。譜尼測試/其他行業13167用戶價值通過 SAE 的彈性
193、速度、彈性策略、對應用全生命周期管理的能力,極大的提高了譜尼測試的運維研發人員的效率,最重要是的保證核酸預約系統可以平穩的應對每天的業務洪流,為全國的抗議疫事業增添一份可靠??焖贅嫿ń训暮诵南到y:得益于 SAE 集成的各種能力,譜尼使用 Java SpringCloud技術棧,在很短的時間內就開發構建好了整個系統,并且穩定、可靠。極大提高運維效率并降低運維成本:通過 SAE 彈性策略解決方案,可以從容應對固定周期的業務洪峰,省去了原來預估資源、部署應用的操作,大大節省了運維團隊的工作量。從容應對業務洪峰:通過 SAE 極致彈性的特性,可以做到在面對突增業務流量時的從容應對,無需臨時部署應用。
194、大大提升了用戶側的體驗。時刻感知業務應用健康狀態:通過 SAE 平臺提供的微服務生命周期管理能力和微服務治理能力,縮短上線周期和增加版本迭代穩定性,快速發現應用的性能瓶頸制定優化策略。相關產品Serverless 應用引擎 SAE譜尼測試/其他行業Salesforce 是一家提供云計算服務的軟件公司,專門從事客戶關系管理。Salesforce 的服務可以讓企業利用云技術更好地與客戶、合作伙伴和潛在客戶進行連接??蛻艉喗閨Salesforce 容器化改造,成功落地安全可信軟件供應鏈客戶痛點在進行容器化交付改造的過程中,需要解決云原生場景下的軟件供應鏈風險挑戰,主要包括環境復雜化、多樣化等問題。三
195、方及開源組件帶來的安全隱患:企業軟件項目越來越依賴于來自供應商、三方或開源社區的組件。這些組件常以基礎鏡像的方式在軟件供應鏈中傳遞。攻擊者可能利用組件中存在的漏洞,植入惡意代碼或控制第三方機器環境,進行從加密貨幣挖礦、發送垃圾郵件,到通過大型僵尸網絡發起 DDoS 攻擊等惡意行為。168Salesforce/其他行業13169方案亮點為了幫助客戶更便捷地實現軟件供應鏈安全,阿里云容器服務團隊提供了端到端的解決方案:容器應用交付階段,ACR EE 可提供云原生應用交付鏈能力:ACR EE 融合訪問控制、鏡像構建、內容安全、二進制認證、全球化分發等能力,支持預置風險攔截策略,實現發現即阻止、安全控
196、制左移。容器應用運行階段,ACK 保障容器應用一致性安全:ACK 集成云安全中心提供了容器運行時安全監控和告警能力,覆蓋 ATT&CK 殺傷鏈的 200 余項安全檢測模型,提升整體業務負載運行環境安全性?;?ISV 應用運行場景,ACK 也提供了安全沙箱容器作為運行時解決方案,確保更好的安全隔離能力和更高的穩定性。安全運營階段,ACK+ACR 實現全局風險感知:客戶可通過 ACR 自動同步、自動掃描、自動加簽功能和 ACK 自動驗簽、自動策略實施,以及風險識別后自動阻斷后續流程功能,實現容器化 DevSecOps 自動化流程。通過訂閱 ACR、ACK、云安全中心的風險事件,實現鏡像內容、鏡像
197、交付、容器部署、容器運行時全流程安全的風險感知,可以更及時高效地處理安全風險。軟件交付長鏈路帶來的風險:軟件供應鏈的周期鏈路長,在各個環節中均可能存在安全風險,包括軟件漏洞、軟件后門、惡意篡改、知識產權風險和信息泄露等。容器化運行可能引入更多攻擊面:容器應用部署依賴 Linux 內核特性,很多黑客攻擊者利用內核系統漏洞,從容器運行時組件和容器應用部署配置等多個維度發起針對性的逃逸或者入侵攻擊。Salesforce/其他行業13170相關產品 容器服務 ACK 容器鏡像服務 ACR建設成果2022 年 6 月,“阿里云助力 Salesforce 軟件供應鏈安全落地實踐”成功獲評“2022 安全守衛者計劃優秀案例”,通過使用基于 ACR EE+ACK 的云原生 DevSecOps 能力,Salesforce 安全軟件供應鏈實現萬次鏡像掃描、千次風險鏡像攔截阻斷,千次加簽/驗簽安全交付;基于全自動化軟件供應鏈安全流程,應用安全交付效率提升 3 倍。Salesforce/其他行業