《2019年銀行領域大規模X86分布式系統的無閾值智能監控應用實踐.pdf》由會員分享,可在線閱讀,更多相關《2019年銀行領域大規模X86分布式系統的無閾值智能監控應用實踐.pdf(30頁珍藏版)》請在三個皮匠報告上搜索。
1、GOP S 全 球 運 維 大 會 2019上 海 站GOP S 全 球 運 維 大 會 2019上 海 站銀行領域大規模X86分布式系統無閾值智能監控應用實踐GOP S 全 球 運 維 大 會 2019上 海 站目錄銀行領域大規模X86分布式系統監控現狀1無閾值監控的理念及技術2規?;瘧藐P鍵點及解決方案3推廣成效及展望4GOP S 全 球 運 維 大 會 2019上 海 站1.銀行科技體系架構轉型背景銀行領域大規模X86分布式系統監控現狀主/小機集中式架構研究起步加速穩定并存X86分布式架構高潮GOP S 全 球 運 維 大 會 2019上 海 站2.架構轉型帶給運維的挑戰規模及風險銀行領
2、域大規模X86分布式系統監控現狀主/小機集中式架構X86分布式架構風險分散發展較慢不易擴散風險緩釋高潮中間件中間件角角 色色節節 點點監控對象多監控場景復雜工作量激增DUBBOELK。缺少專用工具GOP S 全 球 運 維 大 會 2019上 海 站X86分布式系統運維資源調整版本部署日常操作集中化一鍵化工單變更應急監控GOP S 全 球 運 維 大 會 2019上 海 站一刀切不能個性化設置各節點監控閾值傳統監控問題固定不能隨著業務、壓力、資源等場景的變化,自動調整閾值誤報不能反映真正風險滯后不能感知觸發告警閾值之前的異常孤立不能做多個監控項之間的關聯分析GOP S 全 球 運 維 大 會
3、2019上 海 站X86系統監控技術現狀與發展異常檢測流量監控分段閾值多個確定場景固定閾值傳統、簡單、普遍無閾值面向風險概率自適應GOP S 全 球 運 維 大 會 2019上 海 站目錄銀行領域大規模X86分布式系統監控現狀1無閾值監控的理念及技術2規?;瘧藐P鍵點及解決方案3推廣成效及展望4GOP S 全 球 運 維 大 會 2019上 海 站1.【業務時序特征】生產系統就像人的軀體,時刻處于有規律的運行當中。2.【普適性】體現不同系統(節點、角色)的個性化差異。3.【自適應性】適應系統動態變化。4.【風險完全可控】密切監測系統健康狀況,且須“無創”。無閾值智能監控理念與目標GOP S 全
4、 球 運 維 大 會 2019上 海 站無閾值智能監控能力歷史自適應風險根據歷史積累的經驗,預測出當前時間點“正?!钡谋O控值。自動判斷當前監控值是否有較高風險??呻S系統結構和功能的變化自動調整。GOP S 全 球 運 維 大 會 2019上 海 站無閾值智能監控技術時序預測根據監控值歷史數據建立監控項預測模型,預測出當前的監控值異常概率根據差異歷史數據建立分布模型,判斷當前監控值是否異常風險告警根據異常持續累積值的歷史數據,判斷當前監控項是否需要預警GOP S 全 球 運 維 大 會 2019上 海 站目錄銀行領域大規模X86分布式系統監控現狀1無閾值監控的理念及技術2規?;瘧藐P鍵點及解決方
5、案3推廣成效及展望4GOP S 全 球 運 維 大 會 2019上 海 站1.非侵入2.漏報率低3.誤報率低4.成本低銀行生產系統對監控工具的要求支持規?;瘧肵86分布式系統GOP S 全 球 運 維 大 會 2019上 海 站規?;瘧玫年P鍵點多場景預測準確性并行建模及預測跨平臺數據治理模型自動選擇自適應告警十萬量級模型訓練/監控項巡檢100個節點GOP S 全 球 運 維 大 會 2019上 海 站多場景下預測準確性GOP S 全 球 運 維 大 會 2019上 海 站并行建模及預測GOP S 全 球 運 維 大 會 2019上 海 站跨平臺異構監控數據治理GOP S 全 球 運 維 大
6、 會 2019上 海 站跨平臺異構監控數據治理GOP S 全 球 運 維 大 會 2019上 海 站模型自動選擇及預測GOP S 全 球 運 維 大 會 2019上 海 站自適應的告警模型GOP S 全 球 運 維 大 會 2019上 海 站自適應的告警模型系統架構圖(示意)GOP S 全 球 運 維 大 會 2019上 海 站應用效果(示意)1.準確感知異常cpuTXN_ALL交易響應時間交易響應時間GOP S 全 球 運 維 大 會 2019上 海 站2.提前捕獲異常應用效果(示意)GOP S 全 球 運 維 大 會 2019上 海 站應用效果(示意)3.定位異常原因GOP S 全 球 運
7、 維 大 會 2019上 海 站目錄銀行領域大規模X86分布式系統監控現狀1無閾值監控的理念及技術2規?;瘧藐P鍵點及解決方案3推廣成效及展望4GOP S 全 球 運 維 大 會 2019上 海 站1.應用推廣原則 先試點,再逐步推廣 先并存,再逐步替代2.目前推廣范圍 以X86分布式系統為主 從核心銀行系統開始試點 推廣至渠道、外圍多個系統推廣成效及展望GOP S 全 球 運 維 大 會 2019上 海 站1.告警數減少2.誤報率降低推廣試點成效誤報10%3.服務可靠性提升123GOP S 全 球 運 維 大 會 2019上 海 站1.配合主/小機下移繼續推廣2.拓展監控場景 多維向量時序特征分析 未來風險預測3.推廣服務范圍 為雙十一等場景提供趨勢預測范圍未來展望