《騰訊云數據庫智能運維發展和實踐(26頁).pdf》由會員分享,可在線閱讀,更多相關《騰訊云數據庫智能運維發展和實踐(26頁).pdf(26頁珍藏版)》請在三個皮匠報告上搜索。
1、騰訊云數據庫-王云龍個人簡介個人簡介王云龍王云龍騰訊云數據庫專家產品經理主要經歷:曾任百度DBA、數據庫運維平臺研發、公有云數據庫產品研發1.數據庫智能運維時代的演進2.數據庫智能運維的分級3.騰訊云數據庫智能運維的探索和實踐4.數據庫智能運維時代的價值Part 1 數據庫智能運維時代的演進 石器時代工具時代專家時代智能時代業務驅動開源技術驅動單機少量集群分散式管理單機大量集群集中式管理分布式,多種類型集群平臺化管理彈性、集約成本云化管理成本和效率數據庫開源數據庫中間件等組件開源數據庫運維管理平臺的建設KVM、K8s等虛擬化技術開源和Tbase等數據庫技術開源數據庫運維-石器時代client
2、Aclinet Bclient CDB ADB BDB C主要問題:業務不出問題就行了主要手段:人主要階段:知識積累階段數據庫運維-工具時代鳥槍換鳥炮鳥槍換鳥炮client Aclinet Bclient CDB ADB BDB C數據庫中間件主要問題:運維效率問題主要手段:人+腳本工具主要階段:知識轉化生產力數據庫運維-專家時代知識共享的時代知識共享的時代數據庫實例自動化管理日志服務監控服務審計服務SQL自助主要問題:運維效率,流程管理,資源成本主要手段:人+腳本工具+平臺主要階段:知識共享時代,但還需要自己把知識轉化為生產力數據庫運維-智能時代云云+智能的時代智能的時代統一云管平臺主要問題
3、:彈性,智能主要手段:人+腳本工具+云平臺+智能引擎主要階段:數據庫能力和經驗共享 全鏈路日志和監控 機器學習和大數據分析 專家經驗最大化輸出石器時代工具時代專家時代智能時代第一次數據集中公司內:從分散管理到集中管理第二次數據集中行業內:從云下到云上技術和能力共享的時代請擁抱這個時代的到來Part 2 數據庫智能運維的分級 數據庫智能運維的分級人工參與智能運維運維人工化運維工具化基礎平臺化高級自動化服務智能化Level 0Level 1Level 4Level 3 Level 2 人工完成數據庫的部署、監控、SQL上線、故障處理等操作 常用運維操作腳本化,通過腳本+預案的方式輔助DBA進行管理
4、 數據庫運維平臺具備基礎管控能力的自動化 主要包括自動化部署、監控、故障切換、災備、上線等能力 數據庫運維平臺具備高級管控能力的自動化 主要包括容量管理、異常診斷、數據審計、優化分析、流量管控等能力 服務完全由數據庫系統接管,不需要人工處理 主要包括自適應、自修復、自優化、自決策等高度自治的管理能力Part 3騰訊云數據庫智能運維的探索和實踐騰訊云數據庫智能運維體系數據采集全量存儲數據加工計算智能實時診斷智能化數據庫管控平臺智能化數據庫管控平臺智能化決策引擎智能化決策引擎自適應數據庫引擎自適應數據庫引擎訓練數據深度強化學習配置推薦TencentDB自適應自動化自決策數據庫實例自動化管理日志服務
5、監控服務審計服務SQL自助實例管理度量指標采集云數據庫自動性能優化系統 CDBTuneAn End-to-End Automatic Cloud Database Tuning System Using Deep Reinforcement Learning-SIGMOD 2019 用戶很難發現導致數據庫系統性能下降的原因并有效地解決 對于擁有數十萬計用戶實例的云服務提供商來說,完全依賴數據庫專家進行數據庫參數調優并不現實 利用 AI 技術解決數據庫系統性能問題,為用戶及時地調整數據庫系統參數,以保證數據庫的性能維持在一個較優的狀態 性能調優結果首次全面超越數據庫專家 在線性能調優需要的時間最
6、短,比otterTune快一倍 降低學習門檻和提升調參效率基于時間序列的預測模型(Prophet)在容量管理上的應用初始數據預測趨勢和實際結果的對比累加回歸模型:y(t)=g(t)+s(t)+h(t)+etg(t):growth(增長趨勢)s(t):seasonality(季節趨勢)h(t):holidays(節假日對預測值的影響)et:為噪聲項對我們的價值:容量管理:知道在什么時間點進行資源擴容挖掘大客戶:發現未來需求量巨大的潛在客戶對客戶的價值:對自己使用的資源量進行分析,提前預測在什么時候需要進行擴容方便預算和資源配置騰訊智能化數據庫運營管理平臺數據倉庫日志分析系統J管控平臺健康報表DB
7、實例DB實例DB實例DB實例宿主機宿主機DB狀態信息:連接數,QPS,主從延遲等DB系統信息:表結構,表索引SQL信息:歷史SQL,SQL執行情況系統信息:Cpu、mem、io、network元數據鎖鎖等待慢查詢空間資源會話 主備切換主從延遲SQL優化事務信息資源采集存儲索引分析展示故障預警故障自動診斷歷史事件剖析優化建議操作管理控制臺自動化專家知識庫積累降低DBA工作復雜度,提升幸福感騰訊云智能運維云化產品 全局大盤展示全局大盤展示 實時異常診斷實時異常診斷 深度優化分析深度優化分析 安全威脅識別安全威脅識別 提升提升 效率效率技術技術賦能賦能規避規避風險風險 移動移動 辦公辦公騰訊云圖-一
8、站式數據可視化平臺 46款豐富組件款豐富組件 24個擴展大屏個擴展大屏 15種數據源種數據源 12張行業模板張行業模板 零門檻設計,所零門檻設計,所見即所得見即所得騰訊云圖-拖拽式自由布局,快速打造炫酷專業大屏Part 4 數據庫運維智能時代的價值開源開源可控可控共享共享合作合作TencentDBTDSQL(Tencent Distributed SQL)TBaseCynosDBDBBrainMySQLSQLserverPostgreSQLRedisMongoDBTDataMariaDBCTSDBTcaplusDBDTSDatabase Expert ServiceCDBTencent Cloud Visualization未來智能數據庫定義?自驅動自適應自安全自修復自決策自優化數據庫的無人駕駛仰望星空,腳踏實地仰望星空,腳踏實地期待和大家一起探索數據期待和大家一起探索數據庫智能的未來!庫智能的未來!