
技術架構:數據倉庫的分析對象主要來自 OLTP 數據庫的結構化數據,通過預先定義Schema 的方式,運用 ETL(抽去、轉換、加載)操作將數據導入數據倉庫后,用戶可以較為便捷地鏈接 BI 系統和報表系統。由于與 OLTP 數據庫高度結合,數據倉庫對于元數據的要求十分嚴格,很多數據倉庫同樣滿足 ACID 事務能力。早期數據倉庫主流采用 MPP(大規模并行處理)架構,通過一定的節點互聯網連接多臺 SMP 服務器,每個節點之間采用完全無共享(Shared Nothing)結構,具有獨立的 CPU、內存和磁盤資源。在實務過程中,來自 OLTP 數據庫的數據將根據來源場景、應用特點分配到不同的節點上,在每個處理單元上并行地進行計算分析,最終每個節點計算完成后再統一匯總得到最終結果。