《09-楊華-網絡設備監控中的陷阱及解法.pdf》由會員分享,可在線閱讀,更多相關《09-楊華-網絡設備監控中的陷阱及解法.pdf(36頁珍藏版)》請在三個皮匠報告上搜索。
1、網絡設備監控中的陷阱及解法夜鶯SNMP監控最佳實踐大綱1網絡設備可觀測性4Categraf 采集 SNMP 最佳實踐2網絡設備指標監控3網絡設備 SNMP 采集陷阱網絡設備可觀測性#01網絡設備可觀測性指標(Metrics)和日志(Log)網絡設備指標 通過 SNMP 和遙測(Telemetry)收集 反映設備性能、狀態和資源使用情況 常見指標:CPU 使用率、內存使用率、網絡接口流量、錯誤率等網絡設備日志 記錄設備運行過程中的事件和操作 幫助檢測和診斷問題、追蹤設備活動 常通過 Syslog 協議進行采集和傳輸網絡設備可觀測性#02網絡設備指標監控背景和架構網絡設備監控背景 網絡設備領域還是
2、以 Zabbix 為主,Prometheus 體系弱勢 內部統一監控告警平臺都是基于 Prometheus 體系 網絡設備廠商封閉,還不夠擁抱開源網絡設備指標采集協議網絡設備指標采集器網絡設備監控架構l 采集器:Categraf 中的 SNMP 插件l 遠程寫:夜鶯l 時序庫:VictoriaMetricsl 可視化:Grafana夜鶯最新版本可直接集成 Grafana,實現了直接在夜鶯中管理。網絡設備可觀測性#03網絡設備采集陷阱SNMP設備網絡設備可視化網絡設備可視化常見陷阱01 MIB文件解析程序模式選擇 gosmi+path netsnmp+PATH常見陷阱01l path:mib 文
3、件路徑l transtator:gosmil 位置:內置庫,系統無需做其他操作l mib:放入全部的mib即可path+gosmi 模式強烈推薦常見陷阱01l PATH:mib 文件路徑設置為環境變量l transtator:netsnmpl 位置:外置庫,系統需要安裝 netsnmpl mib:放入全部的mib即可PATH+netsnmp 模式兼容性更強常見陷阱01常見陷阱02 MIB 引入依賴文件缺失 MIB 文件格式錯誤常見陷阱02 建立對應文件夾管理不同品牌的MIB文件,私有MIB庫和公有MIB庫分開管理常見陷阱03 指標數據只采集數值,不采集字符串,標簽維持穩態結構 合理規劃標簽和指
4、標,避免浮點數陷阱常見陷阱03 Gauge、Counter、Integer 可直接作為指標值和標簽采集 String 只可作為標簽采集常見陷阱04 performing bulk walk request timeout after 3 retries常見陷阱04 GetNext 一次請求單個回復 GetBulk 一次請求批量回復常見陷阱04常見陷阱04 Max PDU size Max repetitions網絡設備可觀測性#04采集SNMP最佳實踐使用Categraf下SNMP插件網絡架構網絡層開啟 SNMP Agent采集層可選擇 Categraf、SNMP Exporter、Teleg
5、raf等存儲層可選擇VictoriaMetrics、Prometheus、InfluxDB等可視化可選擇夜鶯和Grafana,結合自身開發的前端大屏告警層可選擇夜鶯告警、或者Grafana告警、或者其他自研的告警平臺等最佳實踐品牌品牌設備類型設備類型目錄目錄華三交換機/路由器/防火墻/無線/opt/categraf/mibs/h3c/華為交換機/路由器/防火墻/無線/opt/categraf/mibs/huawei/思科交換機/路由器/防火墻/無線/opt/categraf/mibs/cisco/公共MIB公共依賴MIB/opt/categraf/mibs/public/MIB庫文件準備并上傳
6、到對應品牌管理目錄中最佳實踐品牌品牌網絡網絡Layer角色角色配置文件配置文件華三核心交換機snmp_h3c_switch_core.toml華三匯聚接入無線snmp_h3c_wireless_access.toml華三出口防火墻snmp_h3c_firewall_egress.toml華為核心交換機snmp_huawei_switch_core.toml華為匯聚接入無線snmp_huawei_wireless_access.toml華為出口防火墻snmp_h3c_firewall_egress.toml根據類型、品牌、角色、架構層次的不同做采集配置文件的分類最佳實踐配置文件采集前段配置定義采集間隔和網絡設備管理IP自定義標簽添加 labelsSNMP 版本選擇 v2c 還是 v3 版本MIB文件解析模式選擇網絡設備管理IP標簽名定義重試次數和超時時間以及 GetBulk 最大重復次數設置最佳實踐配置文件實際網絡指標采集配置標量:instances.field 采集表量:instances.table 采集整個表節點的 oid 字段,String類型值無法作為指標存在表量:instances.table.field 采集并加工表中的具體 oid 字段最佳實踐最佳實踐最佳實踐感謝聆聽Thank you for listening