《中國信通院:2022分析型數據庫標準發展與行業觀察報告(13頁).pdf》由會員分享,可在線閱讀,更多相關《中國信通院:2022分析型數據庫標準發展與行業觀察報告(13頁).pdf(13頁珍藏版)》請在三個皮匠報告上搜索。
1、分析型數據庫標準發展與產業觀察 分析型數據庫標準發展與產業觀察 馬鵬瑋 中國信息通信研究院大數據與區塊鏈部業務主管 標準化的意義1一種公認的刻度 標準化的意義2一個合適的門檻 p 分布式分析型數據庫國內相關產品已經達到30余款 p 數據庫公司、IT服務公司、云公司、大數據公司均推出相關產品 p 研發模式囊括基于開源二次開發、商業收購、自研等形式的產品 p 各產品性能的新聞稿都是“客觀存在的某種第一”產業點滴產業點滴?門檻有沒有門檻有沒有?放在哪放在哪?怎么擺怎么擺?劃多高劃多高??15 標準參與單位標準參與單位:中國信息通信研究院 華為技術有限公司 北京百度網訊科技有限公司 騰訊云計算有限公司
2、 阿里云計算有限公司 電信云計算有限公司 聯合網絡通訊有限公司 中移(蘇州)軟件技術有限公司 天津南大通用數據技術有限公司 星環信息科技(上海)有限公司 中興通訊股份有限公司 標準編制工作標準編制工作11基礎能力標準 基礎能力標準 分布式分析型數據庫基分布式分析型數據庫基礎能力評測標準礎能力評測標準,已正已正式成為式成為行業標準 行業標準 YD/T 1213-2016 YD/T 1213-2016 大數據大數據 分布式分析型數據庫技術要求與測試方分布式分析型數據庫技術要求與測試方法法 TPC-DS SQLTPC-DS SQL 混合負載 混合負載 壓力測試 壓力測試 穩定性測試 穩定性測試 I/
3、OI/O密集型任務 密集型任務 加載 加載 2 2小時持續時間 小時持續時間 1212小時持續時間 小時持續時間 CPUCPU密集型 密集型 插入 插入 復雜查詢負載 復雜查詢負載 復雜查詢負載 復雜查詢負載 報表任務 報表任務 精確查詢 精確查詢 CPUCPU達到達到80%80%CPUCPU達到達到60%60%分析型任務 分析型任務 復雜查詢 復雜查詢 交互式查詢 交互式查詢 p 分布式分析型數據庫性能專項認證包括分布式分析型數據庫性能專項認證包括SQLSQL任務任務、混合混合負載負載、壓力測試和穩定性測試四類任務壓力測試和穩定性測試四類任務。p 混合負載以及混合負載以及SQLSQL測試覆蓋
4、測試覆蓋30TB30TB數據規模數據規模 p 混合負載測試覆蓋四種類型負載同時發生混合負載測試覆蓋四種類型負載同時發生 組件?配置?臺數?CPU?2*英特爾至強E5-2620 v3 2.4GHz,15M緩存?32?內存?8*16GB RDIMM,2133 MT/s?32?硬盤?10*1.2TB 10K RPMSAS6Gbps 2.5英寸?熱插拔硬盤?22?10*1.2TB 10K RPMSAS12Gbps 2.5英寸?熱插拔硬盤?10?網卡?單口萬兆網卡?32?交換機?銳捷RG-S6220-48XS4QXS?萬兆交換機?1?測試環境測試環境:3232服務器節點 服務器節點 =22=22*戴爾戴
5、爾 +10+10*聯想聯想 內外兩套網 內外兩套網 =千兆外網千兆外網 +萬兆內網萬兆內網 全時服務 全時服務 =7=7*2424小時不停機小時不停機 標準編制工作標準編制工作22性能衡量標準 性能衡量標準 公司名稱?產品名稱?測試類型?天津神舟通用數據技術有限公司天津神舟通用數據技術有限公司?神通數據庫管理系統神通數據庫管理系統?基礎能力基礎能力?天津南大通用數據技術股份有限公司天津南大通用數據技術股份有限公司?GBaseGBase 8a8a MPPMPP Cluster?Cluster?基礎能力基礎能力/性能性能?中移(蘇州中移(蘇州)軟件技術有限公司軟件技術有限公司?中移軟件分布式混合型
6、并行關系型數據庫系統軟件中移軟件分布式混合型并行關系型數據庫系統軟件?基礎能力基礎能力/性能性能?貴州易鯨捷信息技術有限公司貴州易鯨捷信息技術有限公司?易鯨捷數據庫管理系統易鯨捷數據庫管理系統 簡稱簡稱:EsgynDBEsgynDB?基礎能力基礎能力?北京酷克數據科技有限公司北京酷克數據科技有限公司?HashDataHashData數據倉庫數據倉庫?基礎能力基礎能力?百度網訊科技有限公司百度網訊科技有限公司?百度數據倉庫百度數據倉庫Doris Doris V3V3.4?4?基礎能力基礎能力?杭州數夢工場科技有限公司杭州數夢工場科技有限公司?數夢工場大規模分析型數據庫數夢工場大規模分析型數據庫D
7、ThinkDThink ADBADB?基礎能力基礎能力?廣州巨杉軟件開發有限公司廣州巨杉軟件開發有限公司?SequoiaDBSequoiaDB巨杉數據庫巨杉數據庫?基礎能力基礎能力?星環信息科技(上海星環信息科技(上海)有限公司有限公司?星環分布式閃存數據庫軟件(星環分布式閃存數據庫軟件(TranswarpTranswarp ArgoDBArgoDB)?基礎能力基礎能力/性能性能?北京國雙科技有限公司北京國雙科技有限公司?國雙并行數據倉庫系統國雙并行數據倉庫系統 簡稱簡稱:GridsumGridsum ZETAZETA PDWPDW?基礎能力基礎能力/性能性能?騰訊云計算(北京騰訊云計算(北京
8、)有限責任公司有限責任公司?TBase?TBase?基礎能力基礎能力?新華三技術有限公司新華三技術有限公司?H3C DataEngine MPP?H3C DataEngine MPP?基礎能力基礎能力/性能(大規模性能(大規模)?華為技術有限公司華為技術有限公司?GuassDB 200?GuassDB 200?基礎能力(大規?;A能力(大規模)?南威軟件股份有限公司南威軟件股份有限公司?天河大數據基礎平臺天河大數據基礎平臺?基礎能力基礎能力?標準落地工作標準落地工作11基于標準測試產品 基于標準測試產品 標準落地工作標準落地工作2 2:識別產品 識別產品 各大項測試結果統計各大項測試結果統計
9、公司公司 完成總數 功能功能 運維 兼容性 安全性 容災性 擴展性 A 47 16 15 3 6 3 4 B 46 16 15 3 5 3 4 C 42 15 13 2 6 3 3 D 39 17 10 2 5 3 2 E 32 16 7 1 4 2 2 真理真理:是騾子是馬拉出來溜溜是騾子是馬拉出來溜溜?開源的恩賜開源的恩賜:分析型數據庫發展加快,部分原因是Greenplum的開源,據統計參與評測的14款MPP數據庫中43%都是基于GreemplumGreemplum,14%基于PostgreSQL。規模的突破規模的突破:分布式分析數據庫正在努力突破擴展性的限制,大規模部署能力有很大突破。阿
10、里巴巴完成1900節點的委托測試,華為完成了512節點基礎能力的標準測試,華三完成了200節點性能的標準測試。永遠的永遠的SQLSQL:分布式分析型正在重新回暖,一部分原因是Hadoop的逐漸衰落和學習成本太大,一部分原因是人們對于SQL的依賴根深蒂固。等待全能戰士等待全能戰士:分布式分析型數據庫能力目前沒有能夠完全滿足標準的?;诨赑G PG 14%14%基于基于GreenpluGreenplum m 43%43%自研 自研 43%43%標準落地工作標準落地工作3 3:觀察產業 觀察產業 標準落地工作標準落地工作4 4:推動應用 推動應用 1 1、輔助選型輔助選型:?通過委托咨詢,直接成為
11、銀行、交易所、運營商、政府機構等行業機構的選型依據 測試標準和結果成為2019央采招標參考 2 2、市場依據市場依據:?測試結果及數據上報相關部委,成為產業現狀評估依據以及未來政策規劃依據 同步市場調研及投融資機構,為相關產業測算及投融資提供事實依據 3 3、企業指南企業指南:?降低企業之間信息差,通過公開標準要求,為企業提供未來研發參考 為相關產品部門提供拉動內部資源的參考 標準化的工作全家福 DB Engines 2019DB Engines 2019年年8 8月月 數據庫排名 數據庫排名 DB EnginesDB Engines排名方法 排名方法 相關站點多?搜索多?專業網站討論多?招人
12、多?職業網站討論多?社交網站討論多?技術指標?除了技術本身除了技術本身,生態完整性是新產品生態完整性是新產品、新技術發展的關鍵要素 新技術發展的關鍵要素 工作思考工作思考:做好什么才能讓我們被世界認可 做好什么才能讓我們被世界認可 1 1、技術門檻高技術門檻高 2 2、缺乏相應國際經驗與成熟商用方案缺乏相應國際經驗與成熟商用方案 3 3、轉型的路徑不明確轉型的路徑不明確,標準不統一標準不統一 4 4、配套組織及體系不成熟配套組織及體系不成熟 5 5、推廣發聲渠道難以拓展推廣發聲渠道難以拓展 標準標準:新型產品技術要求新型產品技術要求 原有體系遷移規范原有體系遷移規范 運維服務保障準則運維服務保障準則 測試測試:基礎能力基礎能力 性能水平(金融場景性能水平(金融場景)服務能力 服務能力 試點試點:開發行業模型開發行業模型 聯合單位試點聯合單位試點 推廣落地經驗 推廣落地經驗 配套配套:甲乙聯合平臺甲乙聯合平臺 運維服務社區運維服務社區 政策指引力度 政策指引力度 宣傳宣傳:政策渠道政策渠道 產業渠道產業渠道 國際渠道 國際渠道 下一步工作下一步工作:做好國產數據庫的生態支撐 做好國產數據庫的生態支撐 THANKS!