1、SLS可觀測存儲分析平臺的最佳實踐孟威 阿里云智能產品專家|體驗是關鍵競爭力1秒的延遲增加,帶來7%的用戶流失基礎設施與架構在革新混合云,云原生容器化,微服務,DevOps創新在加速55%的應用每周或每天會發布更新運維數據多樣化運維依賴的數據容量、種類、可變性在增加Source:CNCF SURVEY 2019Source:Aberdeen Group數字化正在各行業推動業務創新,從運維平臺看數字化帶來的趨勢業務數字化帶來的趨勢|面對業務數字化,傳統的IT運維方案,存在多種挑戰當前的IT運維方案,面臨的挑戰數據孤島日志/監控/鏈路/事件/審計數據散落在多個系統告警事件過載60%的企業,每月收到
2、超50,000條告警運維工具碎片化72%的企業,需要依賴9種或以上運維工具缺乏預防手段難以在影響客戶體驗前,發現、預防問題Source:TechValidateSource:MIT Sloane Management Review|數據聯合打通可觀測數據,融合分析系統全鏈路的“可觀察”降低噪聲減少噪聲,有效通知便于正確響應更易使用無需維護多套系統,易使用、易擴展、免運維減少故障時間自動檢測異??焖俑蛟\斷與問題定位我們需要新一代的運維方案|基于SLS構建企業云原生智能運維平臺,助力業務數字化創新阿里云SLS 升級為 云原生可觀測平臺方案優勢數據聯合智能檢測與響應一站式可觀測數據統一存儲分析打破
3、數據孤島告別運維工具多、雜、亂更多數據價值與應用能力多地域、多系統、多賬號 統一日志審計,操作可追溯,并可滿足等保等合規要求操作可審計客戶價值優化體驗生產力工具全局運維視圖在影響客戶前,發現、定位、解決問題業務系統更全面的視圖全棧的可觀測性方案易開始、易擴展、易集成免運維,彈性擴容易用彈性減少噪聲,高效、有效響應智能告警響應中樞,告警消噪與on-Call管理異常檢測,無需AI技術背景,快速開始可觀測數據統一采集第三方系統對接集成10+數據采集開源協議兼容嵌入集成自建系統輕松潛入數據消費對接開源與一方引擎SIEM投遞到三方SIEM40+數據采集方式全棧多架構、多系統、多端Metrics可觀測數據
4、統一存儲分析平臺Logs數據加工實時分析日志審計告警與響應中樞智能異常檢測可視化阿里云 SLSAll-in-one Cloud Observability PlatformTracesTrailsEvents數據分發云原生可觀測平臺|全棧視圖,打通可觀測數據關聯分析,提升問題排查效率、提升體驗可觀測數據統一存儲分析!#$#%()#(*+*自定義協議,-./012/034567*89$:#;?($A/0BC/0!#!#PrometheusOpen-FalconADE云產品監控(對接云監控)$%&()$%&()AgentSDK!#$%&()*+,-SQL秒級查詢PromQLTrace依賴 上下
5、游 Compare可視化報表可觀測數據關聯分析根因分析監控告警Cloud Observability PlatformSLS!#$%&()*+,-./01234)*2567%&89客戶端服務端混合云 公共云應用/系統/審計數據可觀測數據統一存儲分析?數據難打通?LogsTracesMetricsEventsTrails工具碎片化規模/穩定/性能挑戰一站式關聯分析性能與擴展性可觀測數據統一存儲分析多類型/多地域/多系統匯總數據聯合分析快速定位、洞察海量規模穩定高可用極致查詢打破孤島易使用提升體驗全棧的可觀測數據視圖數據融合,產生價值統一平臺,無需維護多套系統易使用、易擴展、易集成提升排查問題效率
6、保障用戶體驗!#$%&()*+),-+)./0123456!789:;%?A0BCD3EFGHIJKL7K8?($(#8#L#G%7MNOINP|SLS智能告警與響應中樞,助力企業減少噪聲,更快速有效響應,成為生產力工具企業IT系統的神經中樞高質量告警值班管理響應閉環易用彈性全鏈路智能降噪管理開放對接各類告警源與企業值班表關聯,分派、升級及時有效通知正確的人快速開始、彈性擴展一站式、免維護減少噪聲高效行動聚焦創新減少噪聲,避免重點事件被淹沒正確的消息通知到正確的人,響應跟蹤,快速有效行動從海量低效事件中釋放,聚焦創新和體驗告警質量低觸達低效響應難閉環告警風暴、過載重點事件被淹沒無動態分派、
7、無通知升級無排班輪崗,通知不到正確的人上下文缺失,任務無跟蹤流程難自動化各類設備/系統可觀測數據統一存儲研發運維安全運營(DevOps)(ITOps)(SecOps)(BizOps)SearchSQLAIPrometheus Alert開放告警接入Grafana Alert各類監控系統告警監控協同編排檢查恢復告警管理合并靜默去重抑制處理人事務管理響應(行動)管理分派升級節假日代班值班組 輪崗用戶組語音釘釘短信郵件鏈路中心 規則中心WebHK資源ML巡檢規則庫路由分組評估PromQL./0102345678,-9:;78?9A45BCDEFGHI9JKLM3NOPQRSTU9 VWXY9Z_ab
8、cdee fghij,-阿里云SLS 智能告警與響應中樞傳統方案痛點SLS優勢客戶價值|通過智能異常檢測,發現隱患,避免演變成嚴重事故自適應機器學習異常檢測,防范與未然多與雜監控對象、規則太多嚴重事故發生前,如何發現“隱患”?每一起嚴重事故背后,必然有29次輕微事故和300起未遂先兆以及1000起事故隱患。海恩法則(Heinrichs Law)傳統監控規則泛化弱無法自適應,新業務無法復用組件日志數據程序日志數據組件指標數據機器指標數據系統事件數據LogMetricTraceETLSQL智能巡檢半結構化結構化關系推斷結構化異常事件跟蹤用戶反饋異常巡檢實時建模自適應反饋優化SLS自適應機器學習異常
9、檢測人工設置監控規則的挑戰|日志統一審計,操作可記錄、可回溯、可審計三方SOC接入方案優勢統一采集審計自動化一站式合規保留模式跨賬號、跨地域、跨產品、跨系統日志統一采集審計支持“修改刪除保護”支持保留180天以上開放對接第三方 SOC開放對接客戶價值審計合規省時省力系統更安全多業務、跨地域、跨賬號統一審計,滿足等保等合規需求運維操作全面可記錄、可追溯內置威脅檢測,生成威脅報告即開即用,彈性擴展開放對接靈活使用新增實例自動發現,無需人工添加,避免遺漏,節約時間實時采集,新增實例自動發現內置威脅分析與審計規則庫,即開即用SLS 日志統一審計方案某全球能源巨頭某支付終端企業某傳媒企業某Top手機品牌
10、|SLS云原生可觀測平臺,助力企業構建智能運維系統更優的業務競爭力更多創新生產力釋放更少的故障時間更全局的“數據”視圖!#$%&()*+,-./01234)*2567%&89:;=在線教育電商平臺互金交易游戲視頻平臺手機新制造可觀測數據統一采集第三方系統對接集成10+數據采集開源協議兼容嵌入集成自建系統輕松潛入數據消費對接開源與一方引擎SIEM投遞到三方SIEM40+數據采集方式全棧多架構、多系統、多端Metrics可觀測數據統一存儲分析平臺Logs數據加工實時分析日志審計告警與響應中樞智能異常檢測可視化阿里云 SLSAll-in-one Cloud Observability PlatformTracesTrailsEvents數據分發云原生可觀測平臺非常感謝您的觀看|