《云原生可觀測套件ACOS構建無處不在的可觀測基礎設施 - 周小帆.pdf》由會員分享,可在線閱讀,更多相關《云原生可觀測套件ACOS構建無處不在的可觀測基礎設施 - 周小帆.pdf(10頁珍藏版)》請在三個皮匠報告上搜索。
1、云原生可觀測套件ACOS構建無處不在的可觀測基礎設施周小帆阿里云智能資深技術專家云原生時代,落地可觀測“三大難題”難以估量的價值回報落地可觀測基礎設施的“收益”到底如何衡量高昂且難以預估的成本微服務架構下指數級上升的可觀測數據計算、存儲成本數據與工具的割裂開源、商業化產品與存量資產之間的艱難選擇阿里云云原生可觀測套件 ACOS高效構建開放、高質量、低成本的統一可觀測體系通過開放標準連接孤島 阿里云 Prometheus 服務、阿里云 Grafana 服務、鏈路追蹤 OpenTelemetry,全流程無鎖定 連接所有阿里云可觀測產品,高質量全鏈路觀測 連接存量可觀測數據資產,融合觀測開箱可見的價
2、值與低廉、可預估的成本 覆蓋用戶體驗(UEM)、應用觀測(APM)、云服務觀測、成本管理、應急協同效率等場景 與阿里云應用托管平臺默認集成 成本低于開源自建、可預估的計費模型客戶案例一:友邦人壽可觀測性覆蓋研發生產全周期研發態與運維態相關指標的關聯與展現,度量研發效率運維服務效率大幅提升應用性能指標、全局調用鏈、日志,快速定位跟因素多容器集群及應用服務的統一觀測通過應用統一觀測平臺,形成指揮決策、儀表盤展示、告警推動多維度監控能力IE、Chrome、Firefox、Opera等瀏覽器容器 CaaS 資源監控物理機/虛擬機層監控業務指標監控應用調用鏈監控應用性能監控CPU、內存、網絡、磁盤、TC
3、P、Load JVM 堆內存、GC、Thread,Method性能.POD內存、CPU、健康度(Running、Pending、Failed)、集群資源監控、核心組件、運行事件服務調用全景、RT、TPS、Exception、慢sql、MQ、Redis業務核心指標,如:訂單數量、訂單金額、日活、月活、投保人數及其它業務指標自上而下設計云監控Prometheus+GrafanaARMS+SLS應用日志業務日志、應用日志、異常日志自下而上設計X客戶案例二:飛凡汽車快速構建全??捎^測異構分布式云統一觀測成本相較于自建與傳統方案大幅下降使用 Prometheus 聚合實例構建分布式云系統健康狀況全景涵蓋
4、應用層、云服務、基礎資源,連接數據孤島觀測數據就近計算存儲,降低公網傳輸費用阿里云容器服務ACK集群阿里云ECS集群自建Kubernetes集群(ACK注冊集群)自建Prometheus阿里云云服務Prometheus聚合實例提供全局統一聚合查詢,統一Grafana數據源,統一告警配置等能力部署在ACK的開源組件指標ACK內的業務指標ACK基礎組件指標部署在ECS上組件及業務指標自建K8S集群內的指標云服務指標將阿里云 Prometheus作為自建Prometheus存儲源一鍵接入ARMS Prometheus AgentRemote Write/Read Endpoint集成exporter
5、集成exporter&服務發現for 容器服務for VPCfor 云服務for Kubernetesfor 遠程存儲從專精容器,到全棧觀測Prometheus 版企業云監控:50+款云服務一鍵集成Prometheus 版ARMS應用監控:APM 監控指標+eBPF 指標+OpenTelemetry 指標全新包年包月計費:一價全包,成本無憂覆蓋 Prometheus for ACK/for remote Write 等不同實例類型同等業務規模下,平均相較于自建成本降低60%*一鍵開啟全球化可觀測中心Prometheus 版ACK、ECS監控、Remote 實例:ECS(非K8s集群)、K8s集
6、群、非阿里云集群統一觀測Prometheus 聚合實例:數據去中心化計算存儲,快速生成全球統一視圖性能提升,降維打擊支持十億級別的時間線抓取與讀寫高基數、長周期查詢優化,平均相較于自建性能提升5倍以上*阿里云 P r ometheus,無處不在的可觀測基礎設施根據CNCFCloud Native Observability MicroSurvey調查,84%受訪者在可觀測技術棧中使用 Prometheus阿里集團核心容器調度(千萬核規模)與APM系統(PB級吞吐)以及 50+款云產品,全面基于 Prometheus 架構構建可觀測體系以上數據來源于阿里云技術團隊多次自建對比測試結果現已接入50
7、+款云服務,并持續加入PolarDB云監控CDN企業級分布式應用服務EDAS應用高可用服務AHAS日志服務SLSElasticsearch應用實時監控服務ARMSRedisAPI網管云服務器ECSOSSWAFMSE網關性能測試PTSServerless KubernetesGrafana 9.0 煥新升級全新 Prometheus 和 Loki 查詢語句生成器全新交互頁面與搜索 Explore 功能強化企業級特性全面增強一鍵導入/導出自建實例 自動數據導出報表一鍵數據備份、恢復 用戶操作審計統一運維&業務觀測界面150+款可觀測存儲服務集成向用戶提供跨 Region 的安全私網數據通道Graf
8、ana Alerting&Smart Metrics高可用、高準確率的動態閾值智能告警基于AI算法的自動異常巡檢與根因定界阿里云 G r afana 服務,“觀測界面”事實標準2021年末,Grafana Labs 攜手阿里云提供 Grafana 托管服務截止目前(2022.11),用戶通過阿里云 Grafana 服務創建了超過 170000 張大盤ARMS Java Agent 提供高質量自動埋點,免去維護開銷通過 OpenTelemetry 補充業務、自定義組件埋點實現廠商無鎖定通過 TraceExplorer 實現多來源 Trace 統一查詢Continuous Profiling 洞察
9、最后一公里瓶頸與Alibaba Dragonwell 團隊聯合推出生產環境性能問題定位至代碼級別低功耗實現全天候主動剖析智能化再升級告警自動聯動智能根因定位客戶端-服務端聯動診斷、數據/緩存連接池自動診斷基于 eBPF 技術的“輕量版應用監控”開放預覽無侵入、支持全語言的應用監控快速獲得集群全局拓撲結構在最新的 Grafana 9.X 中查看應用實時監控服務 ARMS,開啟應用多維觀測視角阿里云上的應用,“天生可觀測”容器服務ACK、Serverless應用引擎SAE、函數計算FC、企業級分布式應用服務EDAS等應用服務默認集成OpenTelemetry 與Prometheus生態融合阿里云云原生可觀測套件,全面提升企業觀測力用標準連接數據孤島釋放更多隱形價值覆蓋全棧場景賦能多角色預算更可控更高性價比THANKS