1.元數據
元數據(Metedata),通俗來講就是關于數據的數據或者是描述數據的數據,其概念起源于計算機科學,在20世紀60年代,為了描述數據集,JackMayers就定義了Metadata—詞的概念:
它可以是數據的數據結構、數據的類型等數據。例如一個學生有姓名、年齡、班級、性別、學號等信息,這些信息就構成了一個學生基本信息的元數據,通過這些數據我們可以找到該學生。元數據所涵蓋的范圍很廣,它包括了數據的名稱、類型及數據源、數據間關系等信息。在關系型數據庫中,元數據描述了數據庫中數據表的名稱、屬性、表字段的名稱、類型、表字段之間的關系等數據元數據也是數據倉庫不可缺少的一部分,元數據描述了存儲在數據倉庫中數據的數據模型,例如數據表字段的名稱、屬性、類型等。
此外,美國信息標準組織( National Information Standards
Organization,NISO)從其本身的詞源進行定義,即元數據是關于信息或關于數據的數據,是用來創建、解釋和共享所描述事物的信息。元數據是一個具有抽象概念的結構化信息,主要用于對數據資源進行定位、描述、解釋,幫助用戶更快更好地檢索、利用和共享信息。
2.元數據分類
根據元數據的狀態,可以分為靜態和動態元數據。靜態元數據描述了業務規則、域、類別、索引、來源、格式、名稱等;動態元數據描述了處理、存儲大小、存儲位置、狀態、數據質量等。
根據使用情況,可以分為技術元數據和業務元數據。技術元數據是為了從操作性環境向數據倉庫轉換而建立的元數據,包含源數據庫名稱等信息;還描述數據倉庫技術細節的數據,包括了數據倉庫中的表結構、屬性、維度、數據轉換的映射規則等。業務元數據從業務的角度描述了數據倉庫中的數據,提供了一個的語義層,便于用戶可以理解數據倉庫中的數據,還包括一些進行決策支持的分析工具等信息。

3.元數據作用
元數據在對數據的管理、共享等方面起著重要的作用,通過元數據的管理可以有效的對數據進行獲取、保存等操作。元數據的主要作用包括:提供數據的類型、格式、屬性等方面的信息;可以對數據進行檢索、添加、刪除等操作;可以對數據的類型、格式等進行轉換,便于對數據進行分析;實現數據的共享等。
元數據在數據倉庫中作用有一下幾個方面:對數據的提取,從不同的數據庫提取所需的數據;數據的轉換,不同類型的數據庫數據的格式類型是不一樣的,需要將抽取的數據格式類型統一轉換;數據的清洗,不同數據庫中的數據可能存在缺失或錯誤等,通過對數據的清洗,確保數據的正確性;數據倉庫中數據庫的設計;查詢與報表的設計等。
以上梳理了元數據的定義、分類及作用,希望對你有所幫助,如果你想了解更多相關內容,敬請關注三個皮匠報告的行業知識欄目。
本文由@2200 發布于三個皮匠報告網站,未經授權禁止轉載。
推薦閱讀:
大數據服務產業鏈及其發展趨勢分析
什么是大數據服務?大數據服務類型有什么?
什么是大數據營銷?特點是?與傳統營銷的區別