1.數據倉庫的定義
數據倉庫是指一種對海量數據的存儲,它把那些異構數據源、異地數據源以及數據庫中經過加工轉換之后的數據加載到數據倉儲中來進行數據的維護、存儲和提取。與其他數據庫應用不同的是,數據倉庫更像一種過程,對分布在企業內部各處的業務數據的整合、加工和分析的過程。而不是一種可以購買的產品。

2.數據倉庫的特征
(1)面向主題的:主題是指宏觀分析領域涉及的分析對象,面向主題的數據組織是指在較高抽象層次上對分析對象的數據給予完整、一致的描述。而傳統的操作型系統是面向功能性應用進行數據組織的。
(2)集成的:數據倉庫中的數據是從原有多個分散的數據源中抽取來的。數據源中的數據進入數據倉庫之前,要經過必要的轉換和集成,以達到數據的一致性,具體包括格式轉換、消除沖突與冗余、運算、綜合、設置時間屬性、設置缺省值等。在數據倉庫的所有特點中,集成是最重要的。
(3)相對穩定的:數據倉庫中的數據在某個時間段內保持不變,數據定期加載,加載后以快照的形式存在于數據倉庫中,一般不再進行修改。過期數據可根據需要從數據倉庫中移出。
(4)隨時間變化的:數據倉庫的數據隨時間不斷追加、積累,反映較長歷史范圍內的數據變化,加載到數據倉庫中的數據均包含時間屬性。
3.數據倉庫和數據庫的區別
雖然數據倉庫是以數據庫為基礎發展起來的,但是它們之間由存在著不同,這些不同主要有以下幾點:
(1)它們之間的面向對象不同:數據庫的使用者一般都是企業的業務人員,主要的工作便是對企業的日常數據進行處理和維護;而數據倉庫的使用者一般是企業的管理層,主要是為管理層做出正確的決策提供數據依據,數據倉庫本身不負責業務的處理,而是通過將企業運行的數據進行收集,在以后企業管理者分析和決策時提供依據,其主要來源是業務數據庫、Excel
表格等;
(2)數據庫主要是收集并記錄企業最原始的業務數據,沒有任何的加工和處理,只是企業運行的當前數據的簡單記錄;而數據倉庫主要是從企業的數據庫中提取到相關數據經過處理和加工,再提交給企業管理層,它記錄的是企業的一個歷史數據。
數據倉庫本身就是一個信息提供平臺,以星型和雪花型這兩種模型方式獲取數據并進行組織,最終達到為客戶提供獲取信息和知識的手段的目的;數據倉庫項目就是為了實施企業級數據倉庫建設而建立的IT項目或者IT服務。
以上就是有關于數據倉庫的定義、特點及其與數據庫的區別的全部梳理,如果還想了解更多數據倉庫的相關內容,敬請關注三個皮匠報告的行業知識欄目。
推薦閱讀
數據治理是什么?數據治理包括哪幾個方面?
什么是數據架構?大數據架構特點有哪些?
什么是數據可視化?對企業有什么好處?