信息化、數字化是當前各行業發展的目標,但由于異構數據分散在不同的信息系統中,造成了大量的“信息孤島”問題,于是,數據整合營運而生。那么,什么是數據整合?方法有哪些?特征是?本文將具體梳理。

1.數據整合
數據整合指的是將不同數據源的數據集成到一個統一的數據集合中。作為信息整合的基礎,數據整合的本質就是借助某些技術手段,從邏輯層面或物理層面,將異構數據進行相互關聯,并通過可視化視圖的方式對關聯結果進行展示。
數據整合的對象是異構的數據資源。異構不僅僅指數據的異構,還包括了各種應用系統和運行平臺中的硬件、存儲位置的異構。
2.數據整合方法
異構數據的整合可以采用兩種方式,一種通過數據聯邦技術,另一種基于數據倉儲。
聯邦數據庫是構造信息集成系統較早的方式,基本思想是面向多個數據庫系統,通過各數據源之間的數據交換格式進行一一映射,實現數據共享。
數據倉庫整合方式是將異構數據庫系統中的數據復制并提取出來,建立一個消除了差異性的、穩定的數據倉儲集合,以提供集中的、統一的檢索服務。中介模式的數據整合即是通過諸如中間件、請求代理、標準協議等中介媒介,來完成數據的邏輯集成。其中中間件集成是目前比較通行的基于中介模式的數據整合方法。
3.數據整合的特征
(1)數據獲取的直接性
通過不同方式集成后的信息集成系統,應是各異構數據源的有機集成。對一個查詢請求,可以直接一次查詢多個數據源系統,不需分別訪問不同的資源系統。
(2)數據訪問的一致性
通過不同方式集成后的信息集成系統,應提供訪問數據的全局統一數據視圖,以一個統一的界面,使對異構系統中不同信息資源的訪問不受數據格式、數據位置和訪問接口差異的限制。
(3)數據顯示(提取)的完整性
從信息集成系統中獲取的數據信息,應保持其在原系統的狀態,不可產生數據要素丟失的現象。
已上梳理了數據整合的定義、方法及特征,希望對你有所幫助,如果你想了解更多相關內容,敬請關注三個皮匠報告的行業知識欄目。
推薦閱讀:
數據倉庫是什么?特點是?與數據挖掘、數據湖的區別與聯系
我國大數據企業有哪些?企業排名一覽
大數據分析是什么?方法有哪些?