1 數據治理的定義
數據治理是20世紀90年代興起的概念,起初數據治理的主要目標是進行客戶數據的清理、完善數據標注,確保組織數據的完整性。伴隨著企業規模的不斷擴大,數據技術管理的相關理論不斷成熟和完善,企業數據治理的重要性也在業界達成了廣泛的共識,即數據不但有價值而且還是企業有競爭價值的資產。為了能夠讓數據一致、準確和及時的提供給數字化建設的使用者,讓數據能夠被使用者更容易理解,發揮數據資產的最大價值,企業需要對現有數據進行治理。
數據治理是數據資源及其應用過程中相關管控活動、績效和風險管理的集合,是將數據作為治理對象,從元數據管理開始,進行數據標準、數據安全建設,逐步擴展到流程建設、組織保障,最終形成全生態體系。
數據治理不同于傳統的數據管理,后者更關注管理的過程,例如數據質量管理、數據標準管理等,而數據治理重點聚焦于數據管理組織的架構、職責、制度保障和治理的流程等管理要素執行情況。
2 數據治理包括幾個方面
數據治理的目標是在企業各業務體系內部組織建立起統一的數據管理體系,以滿足業務發展對數據的依賴。關注數據的完整性和一致性,特別是關注業務體系數據的質量。具體有如下幾個方面:
① 數據有明確和準確的定義:企業內部的數據必須要有明確的定義和說明,包含業務定義和技術定義等。
②數據有明確的責任方:數據的用戶者對數據有明確的職責,數據責任人可能包括以下幾類:數據所有者、數據管理者、數據提供者和數據使用者,不同數據用戶對應數據治理體系中的不同職能。
③數據內容符合標準的要求:數據要符合企業定制監管統計管理辦法以及監督統計工作實施細則的規定和要求。
④數據內容符合質量要求:數據質量要有明確的標準,滿足數據用戶使用的要求。
⑤數據的成本和價值是可計量的:作為企業最重要資產的數據,它的使用和存儲成本與業務價值必須是可量化的,構建可量化的數據成本與業務價值評估體系是數據治理工作的重要內容。
⑥數據集中存儲與管理:為降低數據治理的難度、成本和復雜度,通過建立數據集中管理的制度減少數據復制和分散存儲,提高數據的集中度和集成度。
⑦數據存儲有合理的期限和方式:數據存儲有明確的生命周期管理,并且能夠根據數據的重要性和數據用戶的訪問情況,在數據存儲生命周期的不同階段采用有針對性和差異化的存儲策略。
⑧數據進行統一的加工和整合:為了能夠達到數據治理組織制定的數據標準和質量要求,數據需要采用統一的工具和規則進行處理和整合。
⑨數據是易訪問的:數據要能夠非常方便的為數據用戶獲取和使用,但是要在滿足數據治理要求的數據標準、數據質量和信息安全的情況下。
⑩數據訪問有安全控制:因為數據資產的重要性和可復制性,就必然要求數據的訪問、獲取和存儲需要有安全的管控,避免企業的核心資產泄露,造成無法挽回的損失
以上是關于數據治理的定義及相關知識的分享,獲取更多信息請關注三個皮匠報告的行業知識欄目
推薦閱讀:
《賽迪智庫:2019中國數據治理發展報告(46頁)(景略咨詢).pdf》
《阿里研究院:數據生產力崛起:新動能 新治理(183頁).pdf》
《中國電子技術標準化研究院:數據治理發展情況調研分析報告(32頁).pdf》
《騰訊研究院:2020年數據治理年度報告(96頁).pdf》