2025第九屆社交媒體風向大會演講課件合集
2025年AERO氫能與電池峰會嘉賓演講PPT合集
2025年AI+IM全球峰會(AI+IM Global Summit)嘉賓演講PPT合集
1、CNCF云原生專場李平輝 2021年08月01日本期議題:如何進行多集群統一監控大綱1.云原生監控概覽2.多集群場景的監控需求3.方案的對比選型4.實踐總結Prometheus是Kubernetes監控的事實標準為什么是Prometheus多維度數據模型 基于鍵值對,類似于Kubernetes用label組織數據,可以提供靈活的時序數據存儲查詢。簡單直接的指標格式和接口 Prometheus指標由HTTP協議暴露,是自描述、可讀的格式??梢院唵蔚赜脼g覽器作檢查。服務發現 可以自動發現和更新指標采集的目標,從而適應容器平臺易變的應用負載。模塊化組件 指標采集、告警、圖形化交給不同組件去做,各組件
2、支持高可用。Prometheus does one thing,and it does it well.Brian BrazilPrometheus的局限基于指標(Metrics)的拉取(Pull)模型 非事件驅動。統計誤差,如速率函數推斷,降采樣降低數據精度。HA的數據一致性 多副本普羅米修斯不保證數據一致性。橫向擴縮容 不能支持靈活的橫向擴縮容。管理多集群是普遍的需求:77.8%的受訪者表示在使用多云或混合云 K8s和云原生運維報告,Canonical,2021多集群場景的監控需求全局視圖 能聚合查詢多個集群的基礎設施和應用服務的監控指標提供良好的擴容能力 避免全局監控系統隨集群/服務數量
3、的增加成為瓶頸。監控系統與受監控服務之間的可達性 監控系統需要能采集到不同集群的服務指標??捎眯?監控系統的高可用。多集群監控方案對比1.Prometheus2.Cortex3.ThanosPrometheus Federation示意圖Prometheus Federation示意圖Prometheus Federation示意圖Prometheus Federation架構簡單橫向擴容數據子集重復采集多副本數據去重總結:Cortex示意圖Cortex示意圖Cortex提供鑒權和訪問控制提供整合的全局視圖高可用架構較復雜要調整Prometheus配置總結:Thanos示意圖Thanos示意圖Thanos總結:架構簡單無侵入配置提供整合的全局視圖高可用沒有鑒權和訪問控制Cortex vs.Thanos特性CortexThanos多租戶可用性長期持久存儲壓測性能架構復雜度社區活躍度產品化方案定型經驗總結1.監控系統本身的穩定性-配置監控系統本身指標相關的告警-失能開關2.Prometheus性能主要受樣本量影響,三百萬以上規??紤]分片3.容量規劃-大規模場景Prometheus內存占用較大-指標存儲用量:size_per_sample*scrape_rate*series_number-遠端存儲輪換4.減少不必要的指標采集,避免告警泛濫THANKS
1、下載報告失敗解決辦法 2、PDF文件下載后,可能會被瀏覽器默認打開,此種情況可以點擊瀏覽器菜單,保存網頁到桌面,就可以正常下載了。 3、本站不支持迅雷下載,請使用電腦自帶的IE瀏覽器,或者360瀏覽器、谷歌瀏覽器下載即可。 4、本站報告下載后的文檔和圖紙-無水印,預覽文檔經過壓縮,下載后原文更清晰。
李楓-A GraalVM-基于eBPF和WebAssembly的統一運行時(GOTC深圳會場)(19頁).pdf
驗證即登錄,未注冊將自動創建賬號