1 什么是數據治理
當前數據治理并沒有一個標準的概念界定,數據治理可從微觀、中觀和宏觀的角度分別來理解。
微觀上,數據治理指的是個體的數據管理,即對數據的實用性、 可用性、完整性和安全性的整體管理。中觀上,數據治理是指公共治理,即區域和國家對其主權范圍內的數據質量、權屬、流動機制等方面的宏觀管理。宏觀上,數據治理指的是全球治理,即在大數據時代,以國家、國際組織、多利益攸關方等為主體,對數據權利、流通、管理等方面的治理
國際機構和不同學者也提出了自身對數據治理的理解。國際數據治理研究所(DGI)和ECAR應用研究中心認為數據治理是對活動的每一個參與者進行角色劃分,并配置行動指南,每個參與者完成行動指南,所有參與者的行動就是完整的數據治理。

2 數據治理能解決哪些問題
(1)從宏觀上來看,數據治理能夠優化數據質量、保障數據安全、維護數據主體權利、提高數據流通效率
①優化數據質量,發掘數據資產價值。大數據時代的數據具有5V特征(數據體量大(Volume)、數據類型多(Variety)、
處理速度快(Velocity)、價值密度低(Value)準確性 (Veracity))。數據治理能夠壓縮數據體量、提高價值密度,促進數據資產價值最大化。
②保障數據安全,確保國家社會穩定
③建立數據規則,維護數據主體權利。數據治理能夠工業大數據、商業數據和公共數據流動保駕護航。
④降低邊際成本,提高數據流通效率。日前數據掌握在諸多不同的主體中,各個主體之間信息不流通,數據無法真正得到重復利用,信息孤島效應明顯,數據治理能夠有效改善這種狀況。
(2)從微觀上看,數據治理能夠實現數據共享、數據準確和數據可用
①共享:知道公司有哪些數據。業務視角上來看,業務內部多載體(PRD、郵件、wiki、共享文檔)知識記錄,受入離調轉的影響,“考古成本”高;公司視角:跨組織數據流通黑盒,數據不流通
②準確:業務知道該用哪個數據。數據語義記錄不明晰;業務自我迭代變更過程中數據記錄不同步;好多數據不知道該用哪個?業務迭代數據定義變更如何準確修改定義及觸達關注方
③可用:數據質量需要保障。已經下線了文檔還存在;不同數據健康狀態監控;數據血緣追溯問題排查;不同數據格式導致下游消費解析成本過高;上游變更下游無感知
3 數據治理的內容
ITSS WG1認為企業數據治理包含以下幾方面內容
(1) 確保信息利益相關者的需要評估,以達成一致的企業目標,這些企業目標需要通過對信息資源的獲取和管理實現;
(2) 確保有效助力業務的決策機制和方向;
(3)確??冃Ш秃弦庍M行監督
從技術實施角度看,數據治理包含“理”“采”“存”“管”“用”這五個步驟,即業務和數據資源梳理、數據采集清洗、數據庫設計和存儲、數據管理、數據使用。
來源:《賽迪智庫:2019中國數據治理發展報告(46頁)(景略咨詢).pdf》
推薦閱讀:《阿里研究院:數據生產力崛起:新動能 新治理(183頁).pdf》
《中國電子技術標準化研究院:數據治理發展情況調研分析報告(32頁).pdf》
《騰訊研究院:2020年數據治理年度報告(96頁).pdf》