《國家工業信息安全發展研究中心:2022分布式數據庫發展趨勢研究報告(39頁).pdf》由會員分享,可在線閱讀,更多相關《國家工業信息安全發展研究中心:2022分布式數據庫發展趨勢研究報告(39頁).pdf(39頁珍藏版)》請在三個皮匠報告上搜索。
1、 分布式數據庫發展趨勢分布式數據庫發展趨勢研究報告研究報告 國家工業信息安全發展研究中心 中國電子學會 北京國家金融科技認證中心 前前 言言 隨著信息技術的迅猛發展,各行各業產生的數據量呈爆炸式增長,傳統集中式數據庫的局限性在面對大規模數據處理中逐漸顯露,從而分布式數據庫應運而生。分布式數據庫是在集中式數據庫的基礎上發展起來的,是分布式系統與傳統數據庫技術結合的產物,具有透明性、數據冗余性、易于擴展性等特點,還具備高可靠、高可用、低成本等方面的優勢,能夠突破傳統數據庫的瓶頸。分布式數據庫目前已應用到金融、電信等大數據行業,未來將走向更廣闊的領域。本報告旨在梳理我國分布式數據庫技術路線和產業現狀
2、,分析分布式數據庫的技術特點以及面臨的問題與挑戰,對未來分布式數據庫技術的發展趨勢進行展望與研判,并提出發展建議。報告的第一章基于目前的技術發展情況,給出分布式數據庫的概念及分類;第二章闡述分布式數據庫的產業現狀;第三章指出當前分布式數據庫面臨的機遇和挑戰;第四章對分布式數據庫未來的技術發展趨勢進行展望;第五章提出推動分布式數據庫發展的建議。I 目 錄 前 言.2 一、分布式數據庫的定義及分類.1(一)分布式數據庫的定義.1(二)分布式數據庫的分類.3 二、分布式數據庫發展現狀.7(一)發展背景.7(二)產業政策.9(三)市場格局.11 三、分布式數據庫發展面臨的機遇和挑戰.13(一)軟硬件協
3、同為分布式數據庫的設計提供新思路.13(二)新技術發展為分布式數據庫的架構帶來新挑戰.13(三)多租戶管理為分布式數據庫的運維提供新方法.14(四)數據遷移對分布式數據庫的兼容性提出新目標.15(五)安全合規對分布式數據庫的安全性提出新要求.17(六)數據增長對分布式數據庫的存儲技術帶來新挑戰 17 四、分布式數據的發展趨勢.19(一)分布式數據庫走向原生設計.19(二)分布式數據庫架構的設計走向一體化.20(三)分布式數據庫的能力將向混合負載發展.22(四)分布式數據庫的場景將向云化發展.24 II (五)分布式數據庫的高可用能力不斷在提升.26(六)分布式數據庫對數據一致性的支持將日臻完善
4、.27(七)分布式數據庫的生態建設亟需推動.28(八)分布式數據庫需要支持異構芯片的混合部署.29(九)分布式數據庫應支持數據透明加密.30 五、分布式數據庫的發展建議.32(一)補短板,聚集技術研發力量,推動標準體系建設 32(二)鍛長板,依托應用豐富生態,打造自主技術體系 32(三)重測評,建立專有測評體系,提高產品質量水平 33(四)推政策,加強頂層設計引導,提升產品的成熟度 34(五)促開源,借助開源生態建設,優化國際合作形勢 35 1 一、分布式數據庫的定義及分類 當前數字化浪潮席卷現代社會的每一個角落,以數據作為關鍵生產要素的數字經濟時代,數據庫技術成為數字產業化的核心關鍵技術,數
5、據庫成為了構成新型基礎設施建設的堅強底座。作為 IT 系統的核心之一,數據庫是企業級用戶交易數據、客戶信息、存貨庫存等海量數據的載體,數據庫產業發展事關國家戰略全局。據統計,2020 年全球數據庫市場規模為 671 億美元,其中中國數據庫市場規模為 35 億美元(約合 240.9 億元人民幣),占全球 5.2%;預計到 2025 年我國數據庫市場規模將達到 688.02 億元,2020-2025 年復合增長率為 23.4%。隨著數據形態發生變化及數據體量爆發增長,分布式數據庫的提出為解決企業數據承載困難的問題提供了一個較好的解決思路。根據 IDC 調研,目前約 26.8%的企業級市場用戶部署了
6、分布式數據庫,超過 90%的企業認可分布式數據庫部署后的效果,其中,約 66%的被訪企業看到數據庫系統性能的明顯改善,切實解決數據庫企業級應用痛難點。(一)分布式數據庫的定義 根據國際權威咨詢機構(參考 Gartner1,Forrester2)對 1 Gartner:“分布式事務數據庫是允許在任何分布式數據庫實例節點集上執行事務的數據庫。接受來自地理上分布的一組節點的寫入,同時保持數據完整性和一致性并提供可接受的性能的能力使這項技術具有差異化?!? Forrester::“一個全球性的實時數據平臺,2 于分布式數據庫的定義:分布式數據庫是一種能夠提供跨地域數據訪問能力的數據庫。分布式數據庫需要
7、保證區域間數據一致性,在部分節點故障或者網絡故障時仍舊能持續保持數據庫的可用性,同時在集群內提供數據存儲區域的管控,滿足合規要求。圖 1 分布式數據庫特點 分布式數據庫具備以下三個特點:跨區域提供一致且可信的數據跨區域提供一致且可信的數據。分布式數據庫可以存儲來自多種來源和格式的統一數據,以跨區域提供一致和可信的數據,從而支持現代業務應用程序和混合工作負載,有助于最大限度地減少應用層的數據集成,并確保數據的一致性和完整性。改善業務連續性。改善業務連續性。業務連續性已變得至關重要,特別是在支持區域和全球需求方面。分布式數據庫提供了內置 支持跨地理分布區域的分布式數據處理和訪問,使用高速網絡連接,
8、通過自動復制確保數據的一致性、完整性、安全性和保護?!笨鐓^域提供一致且可信的數據改善業務連續性支持法規遵從性任務 3 的高可用性(HA)功能,可在各個地理分布區域提供全天候數據可用性,并且零停機時間防止服務器或數據中心故障。支持法規遵從性任務。支持法規遵從性任務。分布式數據庫可以通過存儲和保護綁定到某個區域的敏感數據,確保受 GDPR 和 CCPA等法規遵從性要求驅動的數據本地化。通過利用訪問控制、審核以及動態和持久數據屏蔽功能,保護機密數據不被區域外訪問。(二)分布式數據庫的分類 分布式數據庫與單機數據庫的不同在于其可以將核心功能,即查詢、事務管理、存儲等擴展到多臺節點,甚至多個地域。從實現
9、方式上看,當前主要包含 3 條不同的技術路線。圖 2 分布式數據庫分類 第一條技術路線為分布式中間件第一條技術路線為分布式中間件+單機數據庫。單機數據庫。這條路線是在單機數據庫系統上進行改造,主要解決了擴展性的問題。上層無狀態的計算節點維護一套統一的分片規則,提供 4 SQL 解析,請求轉發和結果合并的能力,下層實際是增強的單機數據庫,提供單機數據庫的存儲和執行能力。這一架構通過數據在邏輯層的切割,可近似線性地對計算性能和存儲容量進行擴展,具有可規?;瘮U展的能力。圖 3 分布式中間件+單機數據庫技術路線架構 優勢:優勢:由于實際的執行仍舊在傳統單機數據庫執行,這種路線的兼容性好,學習成本低;從
10、原理上說,如果有足夠的資源投入,比如:硬件資源、開發運維人員等,節點的擴展可以做到很大規模。劣勢:劣勢:首先,由于每張表只能有一個分片規則,業務建模需要重新規劃,業務代碼也要相應修改,改造成本高;其次,由于分片規則是基于算法提供的,下層計算節點之間并不會進行數據交互,擴展下層計算節點的時候無法按需擴展,而要成倍擴展,數據分割過程需要停機人工介入。第三,這個路線本質上把單機數據庫進行了二次處理,在全局事務 5 能力、全局 MVCC、副本控制、高可用等方面存在短板,需要有針對性增強。最后,整個方案的復雜度很高,機器冗余多,上層節點要保持高可用,分庫規則的存儲需要高可用,每個數據分片也需要一寫多讀的
11、一組節點維持高可用。第二類技術路線是通過構建分布式共享存儲實現擴展第二類技術路線是通過構建分布式共享存儲實現擴展,采用非對稱計算節點采用非對稱計算節點,大部分公有云數據庫是這條路線。,大部分公有云數據庫是這條路線。這條路線有限地解決了擴展性問題,跨地域數據一致性主要依賴分布式存儲引擎。共享存儲能夠跨多個節點提供讀寫,上層的計算部分是無狀態的一組節點組成。當有寫能力的計算節點出現故障時,會自動從可用的讀節點中自動選出一個作為寫節點,實現寫能力的高可用。圖 4 非對稱計算節點+分布式存儲技術路線架構 優勢:優勢:由于上層運行的來自單機數據庫改造,兼容性好;日志和數據在分布式共享存儲中保持冗余和一致
12、性,產品整合度相對較高;應用不需要改造。6 劣勢:劣勢:擴展性有限,尤其是寫節點,當數據處理規模要求較高時,仍舊需要分庫處理;并且很難做到跨地域高可用。另外,這種架構需要對底座有比較重的依賴,需要對基礎設施進行大范圍替換。第三條技術路線是原生分布式數據庫第三條技術路線是原生分布式數據庫,各計算節點提供,各計算節點提供對等的讀寫服務對等的讀寫服務。這條路線是根據分布式一致性協議做底層設計,與傳統數據庫有本質區別。原生分布式數據庫將分布式存儲、事務、計算有機的結合在一起,數據由系統自動打散并存儲多個副本,通過一致性協議保證多個副本和事務日志的一致性,對分布式事務、全局 MVCC 等支持更為徹底。整
13、個分布式結構是包裹在集群內部的,應用對此無感知,對應用來說,與使用傳統數據庫沒有區別,大多數應用不需要做分布式改造。7 圖 5 原生分布式技術路線架構 優勢:優勢:系統不需要改造;集群的擴展和收縮對應用透明,并可以按需擴展,沒有數量和規模限制;數據一致性是在事務層被一致性協議保護的,安全性更高;原生的多副本機制支持跨地域的訪問和容災;硬件依賴少,可靈活進行混合云和多云部署,以及跨多云的數據管理;多活架構,硬件利用率高,可以通過普通 PC 服務器實現集群和高可用。劣勢:劣勢:多數產品成熟度不足,仍需沉淀,沒有經過長時間核心系統驗證;架構與傳統數據庫不同,目前雖然一些金融、能源、電信等行業的業務場
14、景已嘗試原生分布式數據庫的部署,但整體上下游生態適配還有待進一步完善。二、分布式數據庫發展現狀(一)發展背景 習近平總書記在中共中央政治局第三十四次集體學習時強調“數字經濟發展速度之快、輻射范圍之廣、影響程度之深前所未有,正在成為重組全球要素資源、重塑全球經濟結構、改變全球競爭格局的關鍵力量?!痹跀底纸洕?、產業數字化轉型的大背景下,數據要素尤為重要,而數據庫作為各行業數據的存儲、管理和分析的軟件,是數字經濟、產業數字化轉型的基礎。數字化轉型對于大多數行業來說是知之非艱、行之惟艱。在數字化轉型過程中,云計算、5G、IOT、人工智能、區塊 8 鏈等新興技術的發展,帶來了產品和應用在各行各業的不斷更
15、新和落地,隨之而來的是數據量呈現幾何級增長、數據結構復雜度與日攀升。根據國際數據公司(IDC)的監測數據顯示,2013 年全球大數據儲量為 4.3ZB,2014 年和 2015 年全球大數據儲量分別為 6.6ZB 和 8.6ZB。近幾年全球大數據儲量的增速每年都保持在 40%,2016 年甚至達到 87.21%的增長率。2016 年和 2017 年全球大數據儲量分別為 16.1ZB 和21.6ZB,2018 年全球大數據儲量達到 33.0ZB,2019 年全球大數據儲量達到 41ZB,2020 年全球大數據儲量達到 47ZB,預計到 2025 年全球大數據儲量達到 163ZB。圖 6 2013
16、-2020 年全球大數據儲量及其增長情況 如今,除了要求數據庫提供完善的管理功能、數據存儲等功能之外,若能夠自如地利用數據庫對數據進行采集、存儲、傳輸、展現、分析和優化等,就可以實現企業對數據資產的治理、增值與科學決策,對數據庫的高可靠、高可 9 用、高安全以及數據分析,發揮數據價值的能力需求進一步提升。但傳統數據庫在處理高并發、實時處理等數據業務時,明顯力不從心,同時,高昂的建設成本也難以迎合數字化時代的潮流趨勢。相較于傳統數據庫,分布式數據庫的優勢盡顯:首先是傳統數據庫遇到的性能瓶頸首先是傳統數據庫遇到的性能瓶頸,快速發展更新的業務驅動著數據規模無限增長,傳統集中式數據庫面對數據量的增長時
17、難以維持性能,然而分布式數據庫的性能可以水平擴展;其次是傳統數據庫面臨其次是傳統數據庫面臨分析能力的缺失分析能力的缺失,傳統解決方案通常需要構建獨立分析系統,數據存在冗余且獲取延時,而分布式數據庫的混合負載能力可大幅度提升分析時效性,并減少數據冗余,靈活性大大提高;最后是傳統數據庫的最后是傳統數據庫的成成本頗為高昂本頗為高昂,集中式數據庫系統水平擴展難,需要按最大容量設計,可靠性需要付出高額的成本,反觀分布式數據庫,其架構支持靈活擴展,并可實現低成本的高可用解決方案。多重因素驅動下,分布式數據庫的崛起,將為企業數字化轉型提供新的思路。(二)產業政策 當前,國家已出臺多項政策扶持數據庫行業的發展
18、,并且信創政策也已經上升到國家戰略層面,近三年部分相關政策見下圖。10 圖 7 產業政策 借助政策紅利,從市場層面,從市場層面,國產數據庫的應用越來越廣泛,主要體現在黨政、金融、電信、交通等行業領域;從從技術層面技術層面,國產數據庫技術也處于加速提升的關鍵階段,各方面能力突飛猛進,在與國外高端數據庫技術的抗衡中逐漸不落下風。金融業是數據密集型行業,金融業是數據密集型行業,移動互聯網和電子支付的蓬勃發展對金融系統能力帶來全新的挑戰。比如金融行業的數據量急劇增長,對數據存儲和管理提出了更高要求,同時面臨高并發業務和大用戶量帶來的系統壓力,這就要求移動應用響應速度更快;目前我國絕大部分金融核心運行在
19、大型機系統上,運行速度尚能滿足,但安全風險逐漸上升。分布式數據庫在金融領域的應用能夠極大的提升行業的安全與效率,同樣,金融產品的日新月異也對分布式數據庫技術 11 的成熟與穩定有著極高的要求。除金融外,電信行業也是一個典型的大數據行業,電信行業也是一個典型的大數據行業,數據是其重要的生產要素。隨著 5G 的發展與普及,電信運營商需要處理的數據業務呈指數級增長。在助力各行各業數字化的進程中,如何利用好數據、技術等資源,釋放更強大的生產力,實現對其他行業的快速支撐,是對電信行業的考驗,也是對數據庫技術的創新與突破的考驗。(三)市場格局 我國分布式數據庫自 2011 年陸續起步,經過 10 年的發展
20、,國產分布式數據庫百花齊放,比如技術路線為分布式中間件+單機數據庫的有 TDSQL、GoldenDB、PolarDB-X 等;技術路線是通過構建非對稱計算節點與分布式存儲實現擴展的有 GaussDB(for MySQL)、TDSQL-C、SequoiaDB 等;技術路線為原生分布式數據庫的有 OceanBase、TiDB、ZNBase等。以下整理了部分國內分布式數據庫的典型企業及其產品。第一條技術路線:分布式中間件第一條技術路線:分布式中間件+單機數據庫單機數據庫 圖 8 分布式中間件+單機數據庫技術路線典型企業及產品 12 第二類技術路線:非對稱計算節點第二類技術路線:非對稱計算節點+分布式
21、存儲分布式存儲 圖 9 非對稱計算節點+分布式存儲技術路線典型企業及其產品 第三條技術路線:原生分布式數據庫第三條技術路線:原生分布式數據庫 圖 10 原生分布式技術路線典型企業及其產品 13 三、分布式數據庫發展面臨的機遇和挑戰(一)軟硬件協同為分布式數據庫的設計提供新思路 硬件和軟件是信息系統的核心組件,兩者之間相輔相成,互相制約、互相促進,所以新型硬件的發展為分布式數據庫的發展帶來新的挑戰,軟硬件協同設計為分布式數據庫架構提供更多的想象空間。比如:由于市場競爭帶來的性能效率問題,多核 CPU 技術走向成熟,但實際應用中 CPU 核數的簡單疊加并不能實現數據庫處理能力的無限擴張,核數增加帶
22、來的性能增益會出現拐點和瓶頸,所以如何進行多核 CPU調度優化為分布式數據庫的架構設計提出新的難題。另一方面,由于非易失內存具有掉電不易失、高速讀寫負載等優點,那么“把數據存儲在內存中”便為數據庫設計提供了更多的空間,但隨著大容量內存和高速硬盤的普及,如何搭配新存儲介質設計新的分布式數據庫架構也有待探索。(二)新技術發展為分布式數據庫的架構帶來新挑戰 隨著大數據、人工智能、云計算等數字技術蓬勃發展,傳統數據庫產品與新興技術的緊密融合促使數據形態發生變化,分布式數據庫產品也不斷迭代升級。然而,在分布式的前提下,還有許多待探索的問題。一是分布式事務的一是分布式事務的一致一致性保證性保證。對于單機較
23、容易實現的 ACID,分布式環境中出現了更多的難題。分布式數據庫將需要處理的事務進行拆分,再部署到不同的服務器上進行處理,理想狀況下,整個過程 14 需要全局一致性協議的保護,而分庫分表兩階段的方式在一些意外情況下容易出現問題。二是架構的創新。二是架構的創新。當前各廠商在進行分布式改造時,分布式數據庫的架構要么是對中間件負擔過重,可擴展性較差,要么是在多并發和低延時上還存在升級改造的空間,因此分布式數據庫的架構需要再創新。三是數據分片的智能化。三是數據分片的智能化。分布式通過分庫分表進行數據拆分,從而各表的數據量保持在閾值以下,從而應對高并發和海量數據,但如何高效的、高質量的進行分片,還需再探
24、索。四四是企業級能力的提升。是企業級能力的提升。傳統的數據庫產品能夠為用戶提供很多企業級的服務,但分布式數據庫的企業級能力還有眾多挑戰,比如:分庫分表后會影響原有集中式數據庫的功能,如存儲過程的調用等,因此,分布式數據庫自身的企業級能力還需進一步加強。(三)多租戶管理為分布式數據庫的運維提供新方法 從從管理難度的管理難度的角度,角度,相較于傳統集中式數據庫,分布式數據庫的前后端工具使用均體現出差異,分布式數據庫對運維人員的工作增加了許多新要求。比如:基于分布式數據庫分片特性,需要更準確地管理不同節點不同類型的數據表;基于分布式數據庫多節點特性,運維節點的數量也大幅增長;基于分布式數據庫架構特性
25、,運維過程中更加需要注意節點故障中留存的數據不一致問題。這就需要數據庫廠商提供全生命周期的運維管理工具,覆蓋遷移、開發、運維全流程。15 從管理資源角度,從管理資源角度,多租戶架構中一個集群中可以同時運行多個數據庫租戶,每個租戶單獨配置數據副本數量、副本類型、存儲位置及計算資源等,租戶之間的數據和資源互相隔離。多租戶架構具備在現有服務器資源下的彈性,可以自動在不同業務之間靈活分割資源、不同時間段之間靈活調整資源,進而提升運維效率。從從管理數量的管理數量的角度,角度,用戶的業務系統種類不斷增加,分布式數據庫的實例數量也不斷增加,運維管理變得更困難。另外,用戶既存的大量應用系統相互隔離、分別建設,
26、導致硬件資源利用率低,通過多租戶管理等解決方案,將多個傳統數據庫實例并入一套分布式數據庫集群,能夠有效提升資源利用效率,結合方便易用的管理工具,從而為分布式數據庫的運維提供新方法。有可能實現一個企業一個數據庫解決所有應用的目標,最大限度地減少企業開發和運維的投入,專注于業務發展,實現降本增效。(四)數據遷移對分布式數據庫的兼容性提出新目標 大部分行業經過企業信息化的長期積累與革新,在企業內部積累了大量的業務系統。傳統的企業級數據庫產品提供了強大的能力,協助開發者快速便捷地構建應用程序,但同時也導致應用設計過度依賴數據庫功能。適配新的數據庫產品必須對應用代碼進行大量修改,比如:當一款經過長期迭代
27、發展的業務系統需要進行數據遷移時,由于源數據庫與目標數據庫在底層架構、實現邏輯上存在差異,在進行數據遷 16 移過程中,各數據表的數據類型、函數、語法規則需要進行系統、全面、細致的改造。這就要求分布式數據庫對原有數據庫都能夠很好的支持,降低遷移的代碼改造成本。目前大多數分布式數據庫還不完全具備主流數據庫生態的兼容能力,兼容的種類還不夠豐富,兼容度還有待提高。個別技術路線還不能做到數據庫架構對應用系統的完全透明,需要單獨對數據庫架構做分布式改造。另一方面,將數據從傳統集中式數據庫遷移至分布式數據庫是一項復雜且龐大的工程。企業對于能否在不影響業務的條件下,實現安全的無損遷移,是尤為重要的。遷移前對
28、兼容度和性能進行評估和模擬測試,在遷移過程中,支持在較大數據量的背景下快速、準確完成遷移,并且不影響線上生產環境應用正常運行。完成之后還需要進行多輪全量數據校驗和業務測試,以保證遷移正確性。但是目前大多數分布式數據庫還無法提供遷移流程的全生命周期管理,流程缺失,或者準確性不足。值得一提的是,高度的商業數據庫兼容能力意味著大量的設計和研發工作,涉及產品整體架構的多個方面,十分考驗廠商對代碼的理解和掌控能力。完全自主研發的產品在這方面具備先天的優勢,未來無論在兼容性適配還是產品能力的研發上都更具潛力。17 (五)安全合規對分布式數據庫的安全性提出新要求 當前信息安全已經上升到國家戰略高度,諸多行業
29、監管機構和政府部門對數據存儲和使用都有明確的安全合規性要求,而數據庫系統對維持企業核心數據的安全性和業務的穩定性具有重要作用,任何數據的丟失和長時間的服務中斷都將給企業造成無法挽回的損失。另一方面,隨著“互聯網+”與產業結合愈加密切,數據環境日趨復雜、業務創新加速、新技術蓬勃發展,企業越來越重視數據庫的可用性、可擴展性、穩定性以及安全性。由于分布式數據庫天然對數據有頻繁調度,不論是地理位置方面還是節點方面,都增加了傳輸過程的風險性。盡管分布式數據庫會設計一些安全措施,但企業仍會持審慎的態度,所以如何有效預防分布式數據庫的數據泄露,保證分布式數據庫滿足安全合規的約束,對分布式數據庫的發展提出了新
30、的要求。(六)數據增長對分布式數據庫的存儲技術帶來新挑戰 在當今的數字化時代,隨著業務的迅速發展,每天產生的數據量驚人,數據庫存儲的成本將會越來越大。通常的做法是,對歷史數據做歸檔,即將長期不使用的數據遷移至以文件形式存儲的廉價存儲設備上,然而在部分核心業務的應用場景下,會存在典型的如針對幾個月甚至幾年前的“舊”數據依舊存在實時的、低頻的查詢甚至更新需求。如果這時從歷史備份中還原后查詢,那么查詢時間將會是以天為單位。18 如果將這些低頻但實時的查詢需求的歷史數據與近期活躍存儲在同一套分布式數據庫集群下,同樣會帶來一系列挑戰,如:存儲成本巨大,進而導致成本遠大于收益,比如釘釘聊天信息數據量在高度
31、壓縮后接近 50PB,很難想象這些數據不做壓縮會帶來多大的資金開銷。性能挑戰巨大,隨著數據量越來越大,即使針對數據做了分布式存儲,單實例容量超過大概 5T 以后性能也會急劇下滑,進而影響到近期活躍數據的查詢性能,拖垮整個集群。運維難度巨大,比如針對海量數據下發一個表數據結構變更操作,很難想象全部完成需要多長時間。正是基于上述情況,數據增長對分布式數據庫的存儲技術帶來了諸多新挑戰。鑒于存儲成本是考核數據庫的關鍵指標之一,分布式數據庫需要具備數據壓縮能力、HTAP 數據混合處理的能力等,以解決成本可控、統一查詢入口、改造成本低廉等問題。19 四、分布式數據的發展趨勢(一)分布式數據庫走向原生設計
32、隨著數據處理規模指數級增長,眾多系統面臨著性能和成本的雙重壓力。為應對新的業務需要,數據庫領域急需革命性產品開啟未來。分布式數據庫的核心理念是讓多臺服務器協同工作,完成單臺服務器無法處理的任務,尤其是高并發或者大數據量的任務。而原生分布式高可用設計能夠在普通服務器上實現無限水平擴展,通過添加低成本服務器即可擴展算力,提升數據庫集群的整體性能。所有節點均支持讀寫,對外提供統一的數據庫服務,支持全局索引、全局一致性事務。特別是對客戶來說,用法與傳統集中式數據庫沒有區別,從而省去了定制改造的步驟,減少大量人工成本。除此之外,在高可用方面,容災能力是關鍵業務系統的重要衡量指標。原生分布式在設計之初就假
33、定硬件是不可靠的,它可以支持多個數據副本分散存儲在不同地域,實現跨機架、跨數據中心、跨地域的容災部署,能夠最大程度提高業務系統的容災能力。在強一致事務的保護下,變更操作在多個地域保證成功提交,因此當災難發生時,數據不會丟失,達到高級別的容災標準。原生分布式架構是一個全新的設計,具備集群的擴展和收縮對應用透明,并可以按需擴展,沒有數量和規模限制;原生的多副本機制支持跨地域的訪問和容災;多活架構,硬 20 件利用率高等優勢??梢灶A見的是,未來更多的產品會走向原生分布式的技術路線,原生分布式數據庫也將迎來更好的發展機遇。應用案例:某電信公司核心計費系統原生分布式數據庫替換應用案例:某電信公司核心計費
34、系統原生分布式數據庫替換 計費系統是電信公司的核心業務系統,日處理各類詳單數據百億條,數據處理性能和準確性至關重要。某電信公司過去使用的集中式單機數據庫,面對互聯網和 5G 時代不斷激增的用戶數和并發量,經常出現容量不足的情況,遷移應用還需要在復雜的業務邏輯中梳理 Oracle 數據庫對象進行適配,故需要一款數據庫產品具備很高的 Oracle 兼容性,并可以自動做評估、轉換并支持在線搬庫。某原生分布式數據庫基于 Paxos 協議和分區等技術整合多套原先的分散系統,多機房部署實現高可用和容災,業務遷移后不再需要搭建災備系統。通過性能無損的數據高壓縮比,分區、讀寫分離、LSM TREE 存儲等技術
35、,提升了 OLTP 事務效率;通過高兼容性和遷移服務 OMS 保障了多個核心業務系統的平滑遷移,核心數據庫源系統數據類型、對象、存儲過程僅經過少量修改便能達成應用適配,實現一站式數據庫無損切割。另外,該原生分布式數據庫使用普通 PC 服務器替換線下小型機+集中式存儲等傳統架構,相比原有的架構幫助電信公司大幅降低硬件成本。圖 11 某電信公司核心計費系統數據庫替換架構圖(二)分布式數據庫架構的設計走向一體化 目前國內數據庫主要分為存量替換和增量市場兩個部 21 分。其中,增量市場主要以開源語法兼容為主,絕大部分業務邏輯在應用中實現,對數據庫能力要求相對較低,很多開源產品也能滿足。而對廠商來說,增
36、量市場研發投入相對較少,因此大部分新興分布式數據庫廠商都在追逐這個市場。而存量替換則是多數國內企業真正遇到的難題,絕大部分企業的核心業務系統運行在功能強大的集中式商業數據庫上,目前面臨著原有數據庫系統無法升級的困境,存在License過期的風險,而業務系統重構又存在成本高、風險大的問題。商業數據庫功能靈活、語法支持多等對分布式數據庫的兼容能力設計提出極大的挑戰。廠商要用一體化設計的思路,將傳統商業數據庫的強大的單機能力與分布式融合,將多種負載能力在一套數據庫上融合,甚至將多種兼容能力體現在同一套數據庫中,這些是國內各重點行業的企業迫切需要的,能夠為企業節省大量的遷移適配成本。此外,未來分布式數
37、據庫應提供數據遷移過程的全生命周期管理,在管控界面上完成數據遷移的創建、配置和監控,交互簡便。同時提供多種方式的數據校檢和保護,全面高效的保證數據正確性,展示差異數據,提供快速修復能力。因此,未來分布式數據庫產品將具備全方位、高標準、高可靠性的平滑遷移能力。應用案例:某大型保險公司核心業務系統分布式數據庫替換應用案例:某大型保險公司核心業務系統分布式數據庫替換 某保險公司業務種類多、覆蓋范圍廣,隨著業務的快速發展,支撐系統面臨著巨大的挑戰。一是由于業務分布不均勻,原有數據庫系統只能按不同省份 22 或業務劃分,造成業務運行在上百套數據庫集群的狀況。二是由于業務的持續快速增長,原有集中式共享架構
38、的部署模式已不能有效支撐,且分散的集中式集群存在擴展瓶頸,導致數據庫擴展成本、運維成本和管理復雜性的大幅提升。三是公司部分核心系統是基于 Oracle Tuxedo 中間件和 Pro*C 編程接口開發,對象類型復雜、系統龐大、數據量巨大,如果不能有良好兼容性的新技術支撐平臺,業務代碼將面臨大規模修改,系統實施的難度和復雜性以及成本的消耗將無法估量。某分布式數據庫為保險公司在兩地規劃雙機房,采用兩地部署跨城主備庫方案,滿足異地城市級容災要求。同城采用三副本的分布式部署架構,利用多租戶支持多業務,實現系統統一管理。多活模式支持高并發,保證高可用。利用數據遷移工具實現數據實時同步,在應用系統遷移到分
39、布式數據庫后,數據回流原 Oracle 數據庫,保證系統回切能力。通過對數據庫的改造,該保險公司數百個業務數據庫整合到幾個集群實現集中管控,有效節約硬件和運維管理成本。圖 12 某大型保險公司核心業務系統數據庫替換架構圖(三)分布式數據庫的能力將向混合負載發展 企業級應用的業務場景通??梢苑譃槁摍C交易和實時分析兩種,通常稱為 OLTP 和 OLAP 的業務應用,由于是不同的應用場景,大型企業往往會選擇多款數據庫產品分別支 23 持。這種組合式的解決方案要求數據在不同產品間進行流轉,數據的同步過程就帶來了時間延遲和數據不一致的風險,而且還會產生冗余數據,成本開銷被迫提高,這在一定程度上限制了企業
40、的發展。HTAP(混合事務/分析處理),是近年來提出的一種新興的應用框架,旨在打破事務處理和分析之間“壁壘”。未來分布式數據庫應具備混合負載能力,即在支持高并發、事務性請求的同時,也對分析型的復雜查詢提供了良好的支持,實現計算、I/O資源互不干擾的OLTP/OLAP混合負載管理,提供高性能并行執行計算,充分釋放資源,進一步提升系統穩定性。并且可以靈活配置兩種負載的資源占比,使得在線交易和分析互不影響,一站式地解決企業級應用的各種需求,從而大幅度降低成本,同時提高了企業決策的效率?;旌闲褪聞蘸头治觯℉TAP)能力能夠幫助企業提高諸多特定場景的分析決策的實時性,比如:金融防欺詐、證券交易決策、信用
41、風險評級等。一個對數據多種查詢和計算的 HTAP 系統于用戶而言更加友好,性價比更高,省去了數據抽取轉化加載的過程并保證了查詢結果的實時性,將成為更多用戶的選擇。應用案例:某石化公司加油卡系統分布式數據庫替換應用案例:某石化公司加油卡系統分布式數據庫替換 某石化公司計劃基于新基建技術構建新一代智慧加油站,推進自身向生活綜合服務商的戰略轉型。然而,原有加油卡系統為異構分散式系統,無法滿足業務轉型對系統高可用的要求,也無法適應互聯網化客戶營銷服務體驗和模式的創新需求。24 某分布式數據庫整合了該公司 23 套 Sybase 和 Oracle 數據庫,基于分布式數據庫架構實現省級和跨省分布式交易。整
42、個系統將分區、讀寫分離、異地雙活等技術進行應用,實現負載均衡和 OLAP 查詢效果提升,LSM Tree 等技術同時也提升了 OLTP 事務效率,能夠支持互聯網化應用類型負載,體現了分布式數據庫的 HTAP 混合負載能力。該分布式數據庫提供的兼容性和一鍵遷移能力,確保了原有的 Oracle 和 Sybase 數據庫應用無損遷移,在節省大量人力成本的同時確保了遷移安全?;?Paxos/分區/OMS 等技術實現異地雙中心容災和高可用能力,滿足了業務轉型對高可用的要求。圖 13 某石化公司加油卡系統數據庫替換架構圖 該分布式數據庫通過賦能“數據+平臺+應用”的架構設計理念,使得公司加油卡系統實現了
43、南北雙中心和系統遠程災備,可支持單位客戶多級賬戶管理,是一個全國集中、全天候連續運行、交易與管理分離的全新加油卡系統。(四)分布式數據庫的場景將向云化發展 全球知名咨詢公司 Gartner 指出,“到 2022 年,75%的數據庫將被部署或遷移到云平臺,只有 5%的數據庫會考慮本地部署?!痹苹療o疑代表了未來,當前,云已經成為中小型企業和互聯網公司進行數字化轉型的首選 IT 架構,在傳統行業,云的使用度也在逐步攀升。在此趨勢下,數據庫也加速了與云環境融合。分布式數據庫可以將傳統部署和 25 公有云資源有機結合,有效解決私有部署靈活度低,成本過高的問題。多云支持具備快速部署、快速銷毀、前期投入低等
44、特點。利用公有云資源能夠低成本實現容災和算力擴展。另外,部署靈活特性意味著不被特定硬件和服務綁定,能夠做到機房部署,任意公有云部署,甚至集群內跨多基礎設施的混合云,多云部署。因此,在數據庫產品設計層面要充分適配云環境、兼容更多云技術,從而添加更多資源管控、靈活購買、多部署形態等云化方面的能力。面對未來越來越多的用戶選擇業務上云,企業如何在云原生架構下使用數據庫以及提升自己跨云數據管理的能力,就成為必須要思考的問題。應用案例:某應用案例:某頭部財險公司新一代頭部財險公司新一代車險系統公有云分布式改造車險系統公有云分布式改造 在“互聯網+”的大背景下,保險公司的傳統業務面臨向互聯網化轉型的挑戰。某
45、頭部財險公司在轉型過程中遇到幾個大的挑戰。首先,該公司一直使用傳統集中式架構,原有約 150 個數據庫實例包含了 4 種數據庫產品,給運維工作造成了極大的復雜性,運維工作的復雜性增加了風險和故障的概率。其次,隨著保險業務量的不斷擴張,公司重點發展的 2C 業務交易量面臨爆發式增長,未來對數據中心規模的需求無法估量,成本難以預測。某分布式數據庫多租戶、大集群的管理能力,實現數據庫的技術棧歸一,減少了管理實體的數量,提升了運維穩定性。同時,引入金融云公共平臺,基于現有的私有云機房和公有云環境進行混合部署。利用公有云服務構建災備中心,從傳統冷備升級到雙活,進而實現單元化部署。業務方可以在公有云上基于
46、數據庫快速搭建完整分布式架構,降低私有云的交付運維成本。26 圖 14 某頭部財險公司新一代車險系統公有云分布式改造架構圖 通過分布式改造,該財險公司利用公有云資源,低成本的實現容災能力、算力擴展,達到了集群內跨多基礎設施的混合云部署。該財險公司基于分布式數據庫構建新一代的車險系統,在全國多個省區市實現業務線上化、智能化,為車主提供便捷穩定的車險服務。(五)分布式數據庫的高可用能力不斷在提升 提高分布式數據庫的可用性包括了容災能力建設及可靠性建設。在容災方面,傳統的高可用容災方案依賴操作系統、存儲、數據庫等多組件整合分級實現,與業務自身應用配合度低,容災切換要求高、難度大,風險難以估計,亟需變
47、革升級。在可靠性方面,由于各行業迅猛發展和信息量爆發式增長的現狀對數據庫的高可用能力要求更高,724 小時的服務不中斷和數據零丟失往往超出了傳統數據庫可以承受的能力,同時應對的成本也十分高昂。因此,未來分布式數據庫應采取更好的方案來提升其高可用能力。應用案例:某大型國有銀行對公理財系統分布式數據庫替換應用案例:某大型國有銀行對公理財系統分布式數據庫替換 對公理財系統是銀行重要業務系統之一,支撐著企業客戶萬億級別的資 27 產,需要保證 7x24 小時持續服務,容災等級要求達到金融容災規范的 5 級標準。某大型國有銀行長期以來采用傳統大機和 DB2 數據庫的封閉模式運動架構,軟件采購成本居高不下
48、;隨著近年來業務并發量的不斷增加,也出現了處理能力不足的情況。因此該銀行決定遷移到分布式系統,并采用國產 ARM 芯片服務器、國產操作系統和國產分布式數據庫的全國產分布式架構。某分布式數據庫為該銀行搭建了橫跨兩地三中心的分布式集群,以五副本+主備模式提升高可用水平,為業務提供堅實的連續性保障,同時保證了系統性能和穩定性?!爸鱾鋷臁狈桨笇⒖捎眯赃M一步提升,當主集群出現故障時,備集群可以接管服務。備庫提供最大可用、最大性能、最大保護三種保護模式,可以根據實際情況選擇,最大限度滿足實際業務需要。圖 15 某大型國有銀行對公理財系統數據庫替換架構圖 通過分布式數據庫的替代,整個系統從原有的大機生態系統
49、下移,有效降低了軟硬件成本,并為銀行核心系統國產化分布式轉型提供了一條可行的技術路線,對金融行業全棧國產化替換有很好的借鑒和推廣意義。(六)分布式數據庫對數據一致性的支持將日臻完善 研究表明,在可靠數據庫管理系統中,事務應該具有四個特性:原子性(Atomicity)、一致性(Consistency)、隔離性(Isolation)、持久性(Durability)。以往在處理單一事務時,事務的原子性和持久性可以確保在一個事務內,操作 28 多條數據要么都成功,要么都失敗。這樣在一個系統內部,可以使用數據庫事務來保證數據一致性。但是在微服務日益廣泛的今天,一項操作會涉及到跨多個系統、多個數據庫的時候
50、,用單一的數據庫事務就沒辦法解決了。并且,數據一致性不僅指在事務發生時的數據一致性,還需要考慮到主備副本之間、集群之間的數據一致性,以及是否有類似區塊鏈似的校驗,具備防篡改的能力和應對磁盤靜默錯誤的能力。目前,從數據庫行業看,不論是 Oracle、MySQL 還是其他大多數數據庫都沒有校驗主備副本之間的數據一致性。傳統數據庫技術面臨巨大挑戰,無法有效保障數據一致性。因而,在數據服務場景越發多樣化的趨勢下,對分布式數據庫所具備的數據一致性級別要求將會越來越高。當前支持跨區域的數據一致性只是基本,隨著微服務的廣泛應用,還需要分布式數據庫能夠支持跨集群、跨表分區、跨數據塊的數據一致性。(七)分布式數
51、據庫的生態建設亟需推動 數據庫作為基礎軟件,需要與整個上下游軟硬件廠商適配,需要很好的產業建設和人才培養,才能為用戶提供更完整、更便利的服務。分布式數據庫作為數據庫產業的下一步發展趨勢,要積極推動生態建設,與國產芯片廠商、硬件廠商、操作系統廠商、中間件廠商等相互認證,與上游 ISV 共 29 建行業解決方案,為用戶提供一整套的產品服務體系。先行的分布式數據庫廠商要積極參與國家行業標準制定,推動整個行業發展。另一方面,要積極參與制定人才培養體系,與高校深入合作,為國家培養更多的基礎軟件人才,助力行業基業長青。而分布式數據庫生態建設的核心,便是開源的思想。開源是做基礎軟件的必經之路,也是社會組織分
52、工的一種新形式和新趨勢,開源社區本身就是基礎軟件商業化當中重要的一環。分布式數據庫之所以需要開源,是因為需要更多人去理解和使用,使用和為其貢獻代碼的人越多,才能越有助于構建出一個完整和健康的生態。因此,開源生態建設既是企業商業布局的利器,也是促進技術發展和推廣的重要手段。當更多的分布式數據庫廠商通過開源方式將技術共享給開發者、社區、合作伙伴進而推進共建生態環境時,分布式數據庫將會步入快速高品質迭代的大道,提升產品質量,擴大品牌力,吸引更多、更廣的用戶群體,為分布式數據庫的推廣與發展,起到跨越式的推動作用。(八)分布式數據庫需要支持異構芯片的混合部署 異構計算時代已經到來。所謂異構,即將 CPU
53、、DSP、GPU、ASIC、FPGA 等不同制程架構、不同指令集、不同功能的計算單元,組合起來形成一個混合的計算系統。所謂異 30 構芯片的混合部署,就是在允許異構內核以分離模式運行的同時,集成內核的共享集群邏輯以鎖定模式運行。這就在不同的層級上既提供了鎖定模式的安全機制,又提供了分離模式的性能。未來,數據庫要為操作系統、芯片的灰度替換提供支持,而在關鍵行業及軟件領域,數據庫還需要提供對異構芯片的支持,從而提升數字化解決方案的嚴謹性,降低應用風險,分布式數據庫也不例外。而對于企業,從成本角度上看,如A 芯片漲價,企業可選擇采購 B 芯片,提升采購自由度的同時,可降低芯片成本;從安全層面上看,如
54、果 A 芯片爆出安全漏洞,企業可隨時替換 B 芯片,尤其在核心系統,可以選擇安全性更高的芯片,從而保障業務的連續性。(九)分布式數據庫應支持數據透明加密 2021 年 11 月 1 日中華人民共和國個人信息保護法正式施行之后,監管部門已在金融等行業中推廣數據加密,要求敏感數據采用加密的方式進行存儲。而數據庫、存儲產品等作為數據的承載媒介,有義務為此提供堅實的數據安全保障。目前,敏感數據加密業界普遍的做法是通過代碼直接調用加密機進行加密,這在實際的應用中帶來了負擔,因為每次應用代碼的迭代都要考慮是否完成了對敏感數據的加密。同時,應用開發人員需要與安全、審計人員協作完成這塊工 31 作,一旦出現遺
55、漏,就易造成信息的泄露。因而在分布式數據庫的發展中,亟需實現更加簡易的數據加密機制,而數據透明加密的出現不失為一種有益思路。其通過數據庫層配置即可完成,開發人員無需修改代碼,因而能夠使應用完全無感。目前,數據透明加密的實現在透明傳輸加密及透明存儲加密兩個層面都取得了突破。具體而言,透明傳輸加密使得即使網絡包被拷貝走以后,網絡包中傳輸的數據也無法解密,其需要實現 SQL 代理到數據庫服務器之間的通信加密。而透明存儲加密使得即使數據庫的文件被拷貝拿走,也無法解密其中的數據。透明存儲加密采用兩級密鑰管理,第一級密鑰為根密鑰,在國家認證的加密機里,而第二級密鑰即數據密鑰的密文需在分布式數據庫的內部表里
56、管理。32 五、分布式數據庫的發展建議(一)補短板,聚集技術研發力量,推動標準體系建設 我國分布式數據庫起步較晚,且數據庫的技術壁壘高,長期以來一直面臨著緊張的外部壓力。在核心技術研發上,強強聯合比單打獨斗效果要好,要充分調動產學研用多方力量,協同攻關,解決技術瓶頸問題,持續加強關鍵核心技術突破,不斷完善分布式數據庫產品在高性能、高可靠、高安全、海量數據支撐等方面的核心技術研發,集聚資源力量協同攻堅。另一方面,隨著商業模式向云化、微服務等方向發展,分布式數據庫產品需要結合商業模式的轉變,注重技術攻關與商用模式創新有機結合,完成技術攻關與融合創新的更新迭代。由此來建立面向我國分布式數據庫自主技術
57、路線的標準體系,從關鍵技術、技術遷移、適配兼容、行業應用等多維度建立標準規范,實現行業規則統一、互聯互通、高效發展,探索出特色發展路徑,抓住機遇盡早實現分布式數據庫領域的換道超車。(二)鍛長板,依托應用豐富生態,打造自主技術體系 對于數據庫廠商來說,做好產品是硬道理。好的產品是“用出來”的,要經歷足夠的應用實踐,由用戶推動成熟,在應用中解決層出不窮的問題,才能讓產品更健壯,所以行業應用是推動數據庫發展的關鍵要素,用戶和廠商需共同為數據庫產業良性發展而努力。當前,我國正在構建以內循環 33 為主,國內國際雙循環相互促進的新格局。我們應當抓住這次以外力促進提升內功的機會,轉變思維,從“模仿跟隨”走
58、向“創新創造”,堅持以行業應用需求為牽引,以典型核心業務場景為突破口,找準產品市場競爭力的落腳點和發力點,研發高性能、高可靠、高安全的國產分布式數據庫產品,打造我國自主技術路線體系。同時通過示范應用,以點帶面逐步樹立用戶(特別是重點行業領域用戶)對國產分布式數據庫產品和服務的信任度。(三)重測評,建立專有測評體系,提高產品質量水平 分布式數據庫測評體系的建立是提升產品質量水平,實現產業高質量發展的根基,我們建議我國的分布式數據庫測評體系,一方面,從單一評價轉向綜合評估,以性能評價轉一方面,從單一評價轉向綜合評估,以性能評價轉向多維度能力評估體系。向多維度能力評估體系。我國測評體系的建立應該緊密
59、圍繞產業發展實際,建立多維度能力評估體系,既包括數據庫的性能指標,同時也包括數據庫與應用系統的適配能力評價,數據庫的安全性等。因此,由原有單一以性能評價為主,轉向場景化測評、安全性評估、自主可控度評估等多維度能力評估體系至關重要。另一方面,從閉源走向開源,分布式數另一方面,從閉源走向開源,分布式數據庫測評體系的建立與開源數據庫的發展緊密結合。據庫測評體系的建立與開源數據庫的發展緊密結合。當前開源技術已成為全球基礎軟件發展的主流趨勢,首先,最關鍵最核心的技術要立足自主創新、自立自強。此外,要加大國內外開源發展趨勢研究,探索建立我國自主開源社區和開源 34 治理模式,分布式數據庫測評體系的建立應與
60、開源數據庫的發展緊密結合。(四)推政策,加強頂層設計引導,提升產品的成熟度 近年來在國家政策引導和各方努力下,國產分布式數據庫在金融、互聯網等行業得到了重點應用,同時也促使產品技術不斷迭代,兼容性、易用性、可擴展性等問題一一克服。在此過程中,由于適配工作缺乏統一的組織管理,大大增加了分布式數據庫適配的難度和工作量。很多廠商把大量的時間、資金和精力用在重復性的適配上,客觀上遲滯了行業的技術水平和產業水平的提升。另一方面,國內數據庫產業鏈尚不健全,各企業力圖獨自開展分布式數據庫設計、研發、交付、運維、服務、遷移等全環節,導致力量分散、企業多而不強,產業內部優勢互補、分工協同的產業生態模式有待加強。
61、我們建議加強適當的政策引導,充分利用好數據庫以及基礎軟件領域的創新中心、適配基地及重點實驗室等機構,加強供需雙方的產用協同,形成良性的問題反饋機制,共同解決一些共性的技術和產品問題,逐步打磨優秀的分布式數據庫產品。與此同時,未來隨著分布式數據等的標準體系及評價體系的健全,分布式數據庫產品的生態體系也將逐漸完善,在運維保障、數據遷移、運行監測等方面的配套工具也要逐步成熟。35 (五)促開源,借助開源生態建設,優化國際合作形勢 發展我國分布式數據庫產業,開源是一條重要的發展路徑,而開源生態建設既要遵循世界開源強國的基本經驗,又要根據內外部形勢探索顛覆式創新,把提升原始創新能力擺在更加突出的位置,避
62、免一味盲目追趕。開源社區本質上是一種人才、智慧的聚合,是產業升級的強大助推器,我們建議要加強開源社區建設,積極參與開源全球體系建設和生態治理。對于數據庫廠商來說,圍繞開源社區去做增值工具組件或者增值服務,也恰恰是其圍繞開源社區的一種商業模式。優秀的開源社區會成為一個平臺,先把有類似想法、類似需求和類似技術能力的人匯聚在一起,再把有能力提供專業級服務的人和需要專業服務的人對接在一起,最終形成一個健康的正向循環。目前優秀公司的核心程序員大都在國外開源社區分享及貢獻,我國也應該鼓勵大家在社區上做出貢獻,成立權威組織等吸引優秀程序員分享。同時號召生態工具能夠讓利合作伙伴,數據庫體系內的工具產品不應全部是廠商自己閉環使用。另一方面,發揮開源基金會及開源組織等機構職能,與國內外開源組織建立良好合作,有序推動項目、開發者、社區聯動,提高開源組織影響力,在全球范圍內構建有話語權的國際開源機構,深化數據庫領域的多邊國際互利共贏。