1、阿里云數據庫團隊 高銘杰POLARDB DBA法寶-性能洞察02PART自我介紹行業痛點排查難,運維苦性能洞察系統瓶頸,資源等待,SQL查詢關聯分析展望未來展望未來,充滿更大挑戰CONTENTS目 錄16年畢業于西安電子科技大學15年在淘寶技術保障部門實習負責數據庫中間件開發華為技術有限公司2016.3 入職華為2012中央軟件院負責數據庫內核開發阿里云計算有限公司阿里云RDS CloudDBA開發阿里云DBA阿里巴巴集團DBA2016.32018.0902PART自我介紹行業痛點排查難,運維苦性能洞察系統瓶頸,資源等待,SQL查詢關聯分析展望未來展望未來,充滿更大挑戰CONTENTS目 錄實
2、例資源監控 CPU IOPS 內存使用率 磁盤空間 連接數 問題定位困難問題定位困難 間接反映問題 依賴經驗推斷傳統數據庫監控的痛點 監控指標人工日志排查 大海撈針傳統數據庫監控的痛點 排查審計日志數據庫的統計信息視圖對數據庫的原理有深刻的理解過度依賴經驗統計信息無法回溯到某一時間段pg_stat_databasepg_lockspg_stat_statementspg_stat_all_tablespg_stat_activity傳統數據庫監控的痛點 排查數據庫視圖數據庫視圖定時采樣用戶等待事件SQL數據庫HOST原始信息視圖可讀性差統計需要二次加工統計匯總結果單一維度匯總統計組合維度匯總統
3、計歷史時間窗口查詢數據庫診斷系統的演進02PART自我介紹十年兩公司行業痛點排查難,運維苦性能洞察系統瓶頸,資源等待,SQL查詢關聯分析展望未來展望未來,充滿更大挑戰CONTENTS目 錄阿里云用戶控制臺性能洞察產品入口性能洞察是CloudDBA產品中一項專注于用戶數據庫實例性能調優、負載監控和關聯分析的利器,使用直觀簡單的方式幫助用戶迅速評估數據庫負載,找到性能問題的源頭和對應的查詢SQL語句,以此來指導用戶在何時、何處、采取何種行動進行數據庫性能優化。性能洞察是什么性能洞察核心算法:Sampling性能洞察界面組成關鍵的性能指標變化趨勢(實時)實時AAS變化趨勢圖數據庫實例中活躍會話變化趨
4、勢(實時)多維度實例負載信息(AAS)(聚合30次采集結果)性能洞察界面組成-AS:Active Session當前活躍的會話個數-AAS:Average Active Session一段時間內,AS的平均值-Max Vcores:8當前實例的CPU Cores數等待CPU資源的活躍會話數超出該值 可認為系統存在CPU資源瓶頸數據源:用戶、等待事件SQL、HOST數據庫、會話狀態性能洞察 架構圖承載產品思路終端用戶可見應用層系統API提供服務服務層實時計算統計匯總數據層四層兩鏈路基礎數據數據輸入采集層性能洞察 案例一:為什么CPU 100%了CPU在XX時間段內使用率很高達到了100%問題描述
5、常規處理性能洞察優點性能指標趨勢圖,找到關鍵資源利用率排查慢SQL,全量SQL選擇時間范圍系統瓶頸,資源等待,SQL查詢三維一體,關聯分析一目了然直截了當1234性能洞察 案例二:X時間點SQL變慢-問題描述xxx時間點原本執行很快的update SQL變慢審計日志中發現大量update-常規處理排查性能監控排查慢SQL日志排查海量審計日志-性能洞察選擇問題出現時間范圍選擇不同維度反映問題的不同側面定位原因定位SQL性能洞察 案例三:相同SQL時快時慢-問題描述相同查詢SQL在不用的Client主機,執行時間差距很大Client主機在不同機房-常規處理排查性能監控網絡抓包分析-性能洞察選擇問題
6、出現時間范圍主要觀察Hosts維度綜合多維度信息定位問題性能洞察-成果展示 數據說話CPU下降33%推薦準確率90%內部客戶:性能洞察,優化CPU使用率,下降33%,活躍會話下降33%。外部客戶:RDS for MySQL,SQL 優化推薦,準確率達90%以上。202596492493RDS for SQL Server 缺失索引推薦,客戶累計創建20.2W個。RDS CloudDBA 核心功能,SQL 優化建議累計調用次數達49.2W次。226820RDS CloudDBA接口平均每天調用22.6W次。02PART自我介紹行業痛點排查難,運維苦性能洞察系統瓶頸,資源等待,SQL查詢關聯分析展望未來展望未來,充滿更大挑戰CONTENTS目 錄展望未來-技術引領業務系統瓶頸資源等待SQL查詢關聯分析是什么索引缺失、碎片數據類型轉換Non-SARG查詢TOP SQL為什么索引優化索引碎片SQL Tuning統計信息維護怎么辦性能優化采取行動,優化索引,統計信息,TOP SQL。診斷分析性能洞察,瓶頸診斷,資源等待,SQL語句。自動索引索引碎片整理執行計劃分析統計信息更新自動辦系統瓶頸預測資源等待預測規格自動彈性預測應對