《IBV:2024破解數據化運營困境:建立價值導向的企業級數據字典體系研究報告(17頁).pdf》由會員分享,可在線閱讀,更多相關《IBV:2024破解數據化運營困境:建立價值導向的企業級數據字典體系研究報告(17頁).pdf(17頁珍藏版)》請在三個皮匠報告上搜索。
1、IBM 商業價值研究院|專家洞察破解數據化 運營困境建立價值導向的企業級數據字典體系 2主題 專家張玉明IBM 副合伙人,IBM Consulting 金融核心銳變團隊 數據轉型與創新負責人張玉明先生是 IBM 副合伙人,IBM Consulting 金融核心銳變團隊數據轉型與創新負責人,主要關注于金融行業數據中臺、大數據戰略與分析咨詢、數字化戰略轉型、數據架構規劃、企業級數據治理及數據資產管理解決方案等方面。他領導過多個金融企業的大數據分析與人工智能技術應用、大數據應用架構、數據運營體系、業務咨詢乃至系統實施項目。韓玲玲IBM Consulting 金融核心銳變團隊 數據轉型與創新咨詢經理韓
2、玲玲女士是 IBM Consulting 金融核心銳變團隊的咨詢經理,她擁有超過16年豐富的數據咨詢與實施項目經驗,在數據戰略規劃、數據治理管控、數據資產管理等領域具備成熟的實踐背景和專業知識。她服務于多個重要行業,如銀行、保險和制造業等,為客戶提供了一系列高質量的咨詢服務和解決方案,涵蓋企業級數據戰略、數據治理、數據資產等領域的解決方案。侯志偉IBM Consulting 金融核心銳變團隊 數據轉型與創新咨詢經理侯志偉先生是 IBM Consulting 金融核心銳變團隊的咨詢經理,他具備超過 18 年豐富的數據咨詢與實施項目經驗,他在數據治理、IT 戰略規劃、數據戰略規劃、數據中臺建設以及
3、數字化戰略轉型等領域均有著深厚的實踐背景。憑借卓越的專業知識和經驗,為金融業和制造業等大型機構提供企業級數字化轉型策略、數據治理方案以及數據戰略規劃等全方位的解決方案。張微IBM Consulting 金融核心銳變團隊 數據轉型與創新咨詢經理Wei.zhw.Z張微女士是 IBM Consulting 金融核心銳變團隊的咨詢經理。她擁有15年以上的數據咨詢與實施項目經驗。在數據質量、數據標準、數據架構、數據模型、數據資產盤點等方面均擁有成熟的實踐經驗,為銀行、證券、電信等大型機構提供數據治理、數據集市等解決方案。程傾IBM Consulting 金融核心銳變團隊數據轉型與創新高級咨詢顧問Qing
4、.C程傾女士是 IBM Consulting 金融核心銳變團隊的高級咨詢顧問。她擁有5年以上的數據咨詢與實施項目經驗。在數據標準、主數據、數據安全等方面均擁有成熟的實踐經驗,為銀行、券商、汽車等大型機構提供企業級的數字化轉型、數據治理、AI 智能應用等解決方案。王莉IBM 商業價值研究院高級咨詢經理王莉女士是 IBM 商業價值研究院的高級咨詢經理,擔任 IBM 全球高管調研項目和對標分析項目的大中華區項目負責人。她擁有 17 年以上的管理咨詢和管理研究經驗。王莉女士目前所關注的研究領域包括數字化轉型、無邊界企業、人工智能等,旨在幫助各行業客戶創造新的商業機會、發現和傳遞價值。1難以掙脫的“數據
5、旋渦”數據管理挑戰嚴峻,眾多數據治理措施仍難以有效根除頑疾,陷入漩渦。數據字典建設之“營造法式”數據字典建設的關鍵策略:頂層設計,精益求精,彰顯價值,反哺業務。未來行動指南數據字典成為企業數字化轉型關鍵:全員參與、融合 AI技術、獲得高層支持。摘要2前言隨著數字化轉型的深入發展,數據作為新生產要素有望成為企業增長和創新的核心驅動力,其重要性被提到了空前高度。2023 年 8 月,財政部發布了企業數據資源相關會計處理暫行規定,1為企業如何合理有效地管理和利用數據資源提供了指導和規范,強調了清晰界定和準確計量數據資源的重要性。2024 年 1 月,國家數據局啟動了“數據要素”三年行動計劃(2024
6、2026 年),2旨在推動數據要素市場的發展,從國家層面對企業如何利用數據進行了深入規劃和布局,強調了發揮各領域數據要素乘數效應,推動數據要素應用的廣度和深度。在這樣的大環境下,各領域各行業如何打造自身的數據要素基礎,尤其是構筑規范化、標準化的數據要素底座將成為企業數據管理的首要任務,其重要性不言而喻。近年來,越來越多的大型機構開始意識到企業級數據字典的重要性,并相繼開展企業級數據字典的建設和落地工作,這也成為數據要素建設的基礎性工作。IBM 認為,企業級數據字典是“企業范圍內數據項的集合(去重),覆蓋企業內各業務和技術活動中涉及的所有數據信息,通過對數據信息的表達、格式及定義的一致約定,實現
7、對數據標準化、結構化的描述,為企業的業務、技術人員提供統一的數據項規范”。相比于傳統 IT 開發過程中使用的數據字典,企業級數據字典將數據標準化工作范圍拓廣到全領域的數據,并且更關注跨業務領域、跨應用系統間的數據共享,以及業務與技術間的對數據理解和實現的一致性。在數據治理領域,數據字典曾被視為一種強化管理的工具。然而,隨著大模型技術的日臻成熟,數據字典的角色已悄然轉變。企業級數據字典對企業內部數據元素的標準化定義和描述,構建起一套統一的數據語言和知識體系,幾乎涵蓋了企業內所有業務相關的知識信息。它不再僅僅是管控數據的技術手段,而是成為企業構建專業領域知識庫的關鍵能力,能夠助力企業在智能化的大模
8、型應用中脫穎而出。3在數據驅動的商業環境中,企業面臨著日益嚴峻的數據管理挑戰。數據的處理和利用效率已成為衡量企業競爭力的新標桿。然而,數據生命周期中的采集、存儲、分析和應用環節常常問題重重,讓企業應接不暇。如果企業僅僅依賴臨時性的應對措施,例如“搞運動”式的數據治理專項整改,雖能暫時緩解眼前之困,卻無法從根本上解決問題,這將嚴重制約企業和組織的發展。數據碎片化是企業普遍面臨的問題。盡管企業每日生成海量數據,但這些寶貴的信息資源往往散落在各個部門和系統之中,從而形成信息孤島。企業內部信息壁壘難以打破,難以實現數據價值的最大化。此外,數據質量問題亦不容忽視。在許多情況下,由于數據采集和處理的非標準
9、化,大量噪音和錯誤數據隨之產生,嚴重影響了數據的準確性和可靠性。盡管企業坐擁龐大的數據資源,如何從中提煉出具有價值的信息,并將這些信息轉化為切實可行的洞察和行動,仍然是一項極具挑戰性的任務。IBM 商業價值研究院的調研表明,有 40%的全球CEO 和 38%的大中華區 CEO 認同,他們的企業在很大程度上面臨的數據挑戰是難以識別有意義的洞察。3挑戰:難以掙脫的“數據旋渦”4美國管理學家弗雷德里克泰勒的科學管理思想體系的核心就是標準化。當代諸如國際化標準組織(ISO)、良好操作規范(GMP)等標準化管理體系,沿用的基本也是泰勒的標準化思想和工作方法。4雖然科學管理的標準化思想誕生于 100 年前
10、,但仍然對今天的企業推動數字化轉型具有重要的借鑒意義。企業級數據字典是標準化管理思想在企業數字化轉型過程中的一種科學實踐。數據字典通過提供統一的數據定義、格式和標準,確保整個組織內部數據的一致性,這對于跨部門協作和系統集成至關重要。此外,數據字典作為一個數據資產全域目錄,使得數據更容易被發現和重用,促進了數據驅動的創新和業務增長。但在具體實踐中,企業級數據字典的構建與應用常常陷入認識誤區。首先,數據字典的重要性尚未得到充分認識,往往被視為技術部門的專屬責任,缺乏高層支持。如果沒有業務部門的積極參與,數據字典的建設將變得異常艱難。其次,數據字典的落地實施也面臨挑戰。它要求改變現有的產品研發流程,
11、而這往往容易遭到業務用戶和科技人員的抵觸,他們對于遵循標準化要求常常持保留態度?;趯π袠I領先實踐和項目實施經驗的深入分析,IBM 系統地提煉了一套高效的企業級數據字典工作方法及其應用策略。通過綜合考量宏觀和微觀兩個層面的因素,我們提出了三項關鍵策略:提高站位,收益導向企業級數據字典超越了單一系統的局限,與傳統數據標準有著明顯的區別。它融合了企業內多個業務領域和信息系統的數據資源,其應用范圍橫跨整個集團或企業分支機構,而不僅限于個別部門或局部系統的使用。這種數據字典能夠支持跨部門、跨流程、跨系統對數據的使用,實現了數據的全方位整合和共享。相較于數據標準,企業級數據字典的覆蓋范圍更廣泛、更全面,
12、它是對數據標準的深化和延展,提供了一個更為豐富和具體的語義描述和管理框架。策略:數據字典之“營造法式”5業務收益的績效歸因企業級數據字典的建設不僅是技術問題,更是涉及企業戰略、管理、文化和流程的全面變革。因此,企業高層領導的重視和參與至關重要。而企業高管層的重視往往建立在數據字典工作對企業的業務價值提升的基礎之上。為此,IBM 根據多年數據治理的實踐經驗,總結出數據字典工作提升業務價值的績效歸因指標,示例如下:表 1建設數據字典所帶來的業務價值示例數據字典賦能的典型業務領域業務收益指標歸因分析預估收益客戶營銷1.客戶滿意度2.客戶流失率3.銷售收入數據字典支持企業構建更全面的客戶視圖,通過整合
13、和分析客戶數據,企業可以更深入地了解客戶需求,提供個性化的產品和服務,增加精準營銷度,提高客戶滿意度和忠誠度,從而增加重復購買和口碑推薦,直接或間接幫助企業提高營業收入。例如:幫助企業提高銷售收入 2%5%財務管理1.財務對賬時間通過數據字典統一科目體系和各類數據的標準化,使得財務人員在核對賬目時能夠快速追蹤數據來源,驗證數據的準確性和可靠性,從而減少了對賬過程中的混淆和錯誤。數據字典有助于企業實施統一的數據整合和轉換流程,減少了在財務對賬過程中對數據進行手工調整和轉換的需要,從而降低了時間成本。幫助企業縮短對賬周期,提高財務管理的整體效率和準確性,實現業財一體化。例如:財務對賬時間從每月 N
14、 天縮短到每月 M 小時例如:年報發布時間提前N 天5產品研發1.產品從需求到交付的周期2.項目成本超支的概率通過數據字典的使用,業務需求能夠在早期階段變得更為明確和詳細,這有助于減少在開發過程中因需求不明確導致的變更次數。減少返工和修正的次數,可以縮短需求分析和確認的時間。通過減少需求變更和返工,可以降低項目成本超支的風險。從而縮短整個產品從需求到交付的周期。例如:銀行產品系統的平均上線周期從原來的 6 個月縮短為 5 個月風險與合規1.(集 團)風 險 報告及時率和準確率2.企業因違反監管要求而受到的罰款金額數據字典在(集團)風險管控方面的作用主要體現在提高信息透明度、確保數據一致性、加強
15、風險識別和監控等方面,有助于降低集團風險管理的成本,包括人力成本、時間成本。同時降低因數據錯誤或不一致導致的合規風險和潛在合規處罰。例如:在一年內,企業因違反監管規定而收到的罰款減少 XX 萬元數據管理1.數據資產利用率2.分析決策及時率和準確率數據字典促進了企業內部數據資源的更廣泛利用,提高了數據的整體價值。有助于提高數據分析的準確性,減少因數據誤解或誤用導致的錯誤。提高數據分析師為業務決策提供支持的效率。例如:數據資產利用率可提升 20%40%3.數據質量問題 數量4.數據治理活動所耗費成本(時間 人力)數據字典降低了部門間責任推諉的事件數量,提高了數據溯源的效率,縮短了溯源所需的時間,減
16、少了數據轉換和整合的工作量,加快了數據治理問題的解決速度,有助于降低數據治理的成本,包括人力成本、時間成本等。提高了企業內部對數據治理工作的滿意度,包括員工滿意度和管理層滿意度。例如:數據治理活動成本(人月)降低 30%以上績效歸因指標證明了數據字典工作對業務收益增加所帶來的貢獻和價值,也論證了數據字典工作的有效性和成本持續投入的合理性。有了高層領導和相關利益干系人的支持(包括資金支持、資源支持、政策支持等),數據字典工作的開展才會更加順利。6案例人人參與,人人有責企業級數據字典的編制是跨部門的協作成果,尤其需要業務部門的深度參與?,F實中,技術或數據管理部門牽頭、業務部門輔助的模式常因缺乏業務
17、部門的充分投入而效果不佳。建議由公司“一把手”直接督導,以業務部門為核心,使其提供專業知識輸入,確保數據字典的準確性和實用性。同時,還需要明確各部門的職責劃分,確定每個數據項的責任主體,為數據的歸屬提供堅實的依據,確保數據字典的實施有據可依。通過這種協同作業,不僅能夠提升數據字典的質量,還能夠促進跨部門的溝通與協作,為企業信息系統的穩健發展奠定堅實基礎。某股份制銀行在開展企業級數據字典編制工作時,通過公司董事長領導掛帥、業務部門牽頭、科技部門配合、數據管理部門復核的協同方式,積極調動全行超過 20個業務部門參與數據字典的編制工作。其中,董事長直接過問數據字典建設進程和落地進展;業務部門負責對數
18、據中文名稱、業務定義、業務規則等進行初稿編制;科技部門負責對數據類型、長度等內容進行定義;數據管理部門負責對數據字典整體內容進行復核、完善和確認。各部門充分發揮各自的專業領域知識和經驗,共同努力、高效配合,對全行關鍵系統進行多輪滾動整合和萃取,最終形成了覆蓋對公、零售、同業等業務領域的萬余項企業級數據字典。6確保數據字典的權威性企業級數據字典不應僅存于紙上,而應深入融合到企業的信息系統與業務流程中,充分發揮其應用潛力。為此,數據字典的發布質量與權威性顯得尤為重要。通常情況下,企業級數據字典的規??蛇_數萬級別,涵蓋眾多參與者及復雜的定義規范,牽涉到大量的細節問題。若完全依賴人力投入,不僅耗時耗力
19、,而且難以保證質量。因此,有必要借助自動化、智能化工具來提升數據字典的精確度、實用性與時效性。例如,依據數據項的名稱自動生成數據的分類、業務定義等屬性,同時實施規范化檢測以提高數據字典編制的質量,并對不符合規范的內容提供相應的提示。此外,數據字典的發布應經過廣泛的意見征集,并嚴格遵循審批流程,確保其全面性和適用性。建立清晰的數據字典版本管理機制,是維護其穩定性和可追溯性的關鍵。同時,針對現有和新建系統,采取差異化的實施策略,確保數據字典能夠在不同環境中有效落地。案例縱橫平臺智能匹配工具(Smart Data Mapping,以下簡稱為 SDM)是 IBM 以通用數據字典為核心,利用 NLP自然
20、語言處理算法、深度學習模型等 AI 技術,通過內置的 IBM 行業數據字典規范與預訓練的 AI 算法模型,進行數據匹配和自動映射的工具。IBM 曾使用 SDM 的智能映射匹配、詞根分析等功能,為某股份制銀行完成數萬項數據字典的編制工作。其中包括:1)自動化檢核字典項屬性值的內容,完成對共計超過 30 萬個字典項屬性值的內容進行質量檢核,相較于純人工質檢節省了 80%時間;2)自動化生成字典項英文名稱與簡稱,大幅減少人工逐項編寫的時間成本,同時保障詞根英文翻譯的一致性。7精益求精,做到“統、實、嚴”在編制數據字典的過程中,確立一套統一的標準和規范是至關重要的。這意味著對數據字典中的每個元素,包括
21、業務屬性、技術屬性和管理屬性,都需要有一套明確的編制規范。業務屬性包括數據字典項的中英文名稱、業務含義、業務規則和引用出處等,技術屬性涉及數據類型、格式、長度和約束等,而管理屬性則包括數據字典項的安全級別、責任歸屬和生命周期等。對于這些屬性的每個元素,都應制定清晰的定義和描述規則,以確保數據字典的一致性、準確性和易用性。字典項命名規范字典項的命名包括中文命名和英文命名,需要遵循一系列的命名原則,確保命名的合理性與一致性。IBM 總結了字典項中文名稱的六大命名原則(見圖 1):句法原則,即規范中文命名的基本結構及詞語的排列順序。準確性原則,即確保中文表達的信息準確,避免含混、歧義等情況的發生。語
22、義適度原則,即兼顧抽象語義與具象語義的平衡,避免名稱表義過于寬泛或者過于細節。一致性原則,確保名稱與業務定義間的內涵一致性。唯一性原則,中文名稱的全局唯一,所承載的業務含義信息有且僅有一個。類詞匹配原則,中文名稱結尾參照類詞語數據類型對應關系加以約束,避免隨意造詞。圖 1數據字典項中文命名原則句法原則語義適度原則唯一性原則準確性原則一致性原則類詞匹配原則中文名稱命名原則詞語組合有序排列:【限定詞術語(0.n)】【對象類術語(1)】【表示術語(1)】兼顧抽象語義與具象語義,應在抽象與具象語義中有所取舍中文名稱及其所承載的含義應有且僅有一個名稱中不應該出現讓使用者產生歧義、概念不清的詞匯名稱應與業
23、務定義保持一致中文名稱結尾參照類詞與數據類型對應關系加以約束8以下是具體實踐中參考國家標準7使用的字典項中文名稱句法原則示例(見圖 2)。中文名稱的句法原則要求如下:【限定詞術語(0.n)】、【對象類術語(1)】、【表示術語(1)】。句法原則 1:當沒有限定詞時,名稱中應當有且僅有一個對象類術語且置于名稱中的最左側/首位。句法原則 2:名稱中應有且僅有一個表示術語且應置于最右側/末尾。句法原則 3:限定詞術語應置于所限定部分的前面,不應使用限定詞的順序區別名稱。限定詞術語是可選的。值得注意的是英文名稱和簡稱關乎到未來數據字典項的落地實現,既要確保全局唯一,又要確保詞義和語義的準確,單純依靠人工
24、編制、復核是難以實現效率與質量并重的目標。所以有必要利用詞根分析工具,提升同詞同譯的規范化效率,制定英文縮寫重復情況的處理方法與步驟,以確保英文簡稱的結構化和英文縮寫的范式化。圖 2中文名稱的句法示例個人證件類型【限定詞(0.n)】“個人”“證件”“類型”【對象(1)】個人為特定語境,限定含義證件為描述對象,關心的人事物描述對象的有效值為類型【表示術語(1)】字典定義,既是重點也是難點業務定義和業務規則為數據字典項提供了必要的業務上下文,使得數據不僅僅是數字和文字的組合,而是具有明確含義和用途的業務資產。它們是數據理解和正確應用的基礎,確保了所有用戶對數據項的理解一致,減少了誤解和混淆。定義業
25、務定義和業務規則時,語言的使用需簡潔明了且精準,既要符合描述規范,又要易于理解,以準確反映實際業務含義。需明確指出業務定義中業務對象和適用業務范圍,并應與字典項名稱所指范圍一致,業務場景的定義應清晰明確,特殊詞匯應給予適當的解釋,業務用途的描述必須符合業務實際,規則的描述亦需做到準確嚴謹,口徑統一。字典編制的“實用性”理念數據字典編制按照各類數據的表現形式,對數據類型進行統一規范,定義數據更細粒度的規范參考,包括數據長度、精度、代碼取值等,保證數據格式的統一。例如,針對文本類、編碼類數據長度,涉及中文字符時,需要結合各系統字符集規則,從邏輯上規定可包含字母、數字、漢字字符的數量,以確保數據字典
26、貫標的可操作性。為了確保數據字典的科學性和實用性,其制定不僅需滿足企業內部的業務和系統使用需求,還應充分借鑒外部相關的法律法規、行業標準、監管要求和最佳實踐。這樣的做法旨在避免數據字典內容出現歧義或誤導,使其成為可靠的信息資源。案例某股份制銀行在推進企業級數據字典的實施過程中,采取了“明確主體認責、實施分層授權、確保源頭落地、靈活分類施策、保持優化迭代”的落地策略,確保數據字典能夠高效、準確地應用。為實現這一目標,該銀行構建了三層數據字典落地防御體系,強化了總行與各分行的標桿責任,使每個部門都能夠積極履行數據字典的主體責任,形成合力共同推動其落地實施。同時,根據數據的覆蓋范圍和應用場景,將數據
27、字典劃分為通用類和專有類,并據此進行分層授權管理。在新系統建設中,堅持“應落盡落”原則,確保系統能夠嚴格按照標準采集和生成數據。對于已有的存量系統,該銀行則結合項目建設的契機,有計劃、有步驟地推進貫標工作。此外,各部門還制定了現有系統的貫標總體規劃,確保貫標工作的有序開展。整個貫標過程從源系統開始,帶動相關聯的系統參與貫標。同時,總行及各分行制定了自我檢查方案,并由數據管理部門負責檢查和評估,確保數據字典的落地效果符合預期。審計部門則作為獨立的第三方,負責執行日常的或專門的審計工作,確保整個過程的合規性和準確性。910字典落地,“嚴”字當頭數據字典的落地執行與監督過程需保持高度的責任感和紀律性
28、。對違反數據字典的行為要進行及時的糾正和處理,確保數據字典的權威性和有效性。明確責任主體、夯實責任。從業務、技術和管理維度,明確數據字典的責任主體類型,為有效的數據管理提供支持和保障。根據數據屬性信息,結合部門職責建立數據責任認定原則,為數據的歸屬提供有力依據。制定數據字典貫標總體策略。結合流程制度、應用軟件開發工藝,明確誰(Who)來落標、落什么(What)內容、何時(When)落標、在哪(Where)落標、如何(How)落標的總體策略,推動數據字典在企業中的有效落地。賦能應用,彰顯字典價值在企業環境中,企業級數據字典的規模往往達到萬量級,這龐大的知識庫如何有效地應用于企業內部的各個業務環節
29、,以提升業務效率并降低成本,成為了一個關鍵問題。為了充分發揮數據字典的價值,我們建議針對企業內不同類型用戶的核心需求,在以下典型場景中加強數據字典與業務需求的融合。嵌入業務場景的智能助手數據字典是企業內部最有價值業務信息的集合。在生成式人工智能技術的助力下,數據字典可以更加輕松和便捷地融入到員工日常工作的工具和平臺中,例如 ERP系統、客戶關系管理系統(CRM)、產品管理系統(PMS)、管理駕駛艙、風險看板、業務研發一體化平臺等。11這樣的集成旨在提升數據字典的普及度和員工接觸面,確保數據字典中蘊含的高價值知識能夠輔助員工高效地完成各項任務。此外,數據字典的分類體系還能夠為營銷人員提供設計精準
30、客戶畫像的參考,輔助產品負責人構建更加全面和靈活的產品配置條件及屬性設置。通過這種方式,數據字典不僅增強了企業數據資產的管理效率,還提升了員工的工作效率和業務決策的質量,為企業的數字化轉型和持續創新提供了堅實的支撐。業務需求標準化業務需求的標準化是許多組織在產品快速設計和研發過程中面臨的核心挑戰之一。一方面,業務需求人員往往難以提出與IT開發實現相符合的需求輸入;另一方面,業務需求對場景和用例的設計往往過于籠統,常常需要在后續的迭代過程中逐步完善,這大大降低了產品設計和研發的效率。如果在業務需求編制過程中引入數據字典的使用,則可以顯著提升業務需求的標準化程度。數據字典能夠提供業務流程和場景所依
31、賴的詳細數據信息,使用戶能夠更深入地理解業務需求及其上下文。這有助于業務需求方在業務需求中建立與實際業務流程相一致的場景和用例。同時,數據字典為業務術語和定義提供了統一的參考,有助于所有用戶對業務需求的理解保持一致。這支持用戶在業務需求分析和設計中建立一致和可靠的標準,從而提高業務需求的可理解性、可維護性和可執行性。例如,一些領先的金融機構早已經在業務需求模板中嵌入對數據字典的強制引用,其目的是為了加強標準化數據的貫標,增強業務需求的一致性和準確性??此圃黾恿斯芸毓濣c,但實質上提升了產品設計和研發的效率,使得組織能夠更快地推出滿足市場需求的產品。支持快而準的數據分析和決策當下許多先進組織在企業
32、內部及其分支機構設立了數據分析崗位,致力于深入的數據分析和為決策提供支持。然而,在日常工作實踐中,數據分析師常常面臨諸如“我要的數據在哪里?”、“多個系統都有這個數據,哪個才是準確的?”等挑戰。數據字典的引入能夠有效減輕數據分析師的工作負擔。首先,數據字典作為一個關鍵的數據資產目錄,允許數據分析師迅速定位到所需的數據,并指導他們如何訪問這些數據,從而大幅提升數據檢索的效率。其次,數據字典詳盡地記錄了數據的業務規則和邏輯,包括計算公式、取值范圍和合法性檢查等。這些信息幫助數據分析師深入理解數據的生成和處理機制,確保他們所依據的業務邏輯是準確無誤的。第三,數據字典揭示了數據之間的復雜關系和依賴,如
33、引用和被引用關系。這有助于數據分析師識別并分析數據之間的相互作用,從而做出更為全面和精準的決策。例如,一些領先的組織正在建立數據字典標簽視圖體系,旨在實現針對各類數據應用場景的數據視圖,從而實現從“人找數據”到“數據找人”的轉變。這種體系不僅提高了數據分析師的工作效率,還增強了數據分析的深度和廣度,為企業的數據驅動決策提供了強有力的支持。12降低數據治理活動的復雜度數據治理活動已經成為每一個先進數字化企業的共同認知和基本配置。然而,在實際推動數據治理的過程中,由于責任體系不明確和系統架構復雜多變,數據治理的有效性往往受到影響。數據字典的引入能夠顯著降低數據治理的復雜性。首先,數據字典明確了數據
34、元素的所有者和責任部門,使用戶能夠在數據治理活動中建立清晰的數據管理和維護責任,從而提高執行效率,并解決部門間責任推諉和整改落實困難的問題。其次,數據字典記錄了數據的系統來源、轉換過程和使用情況,使用戶能夠追蹤數據在整個數據生態系統中的流動。這有助于用戶深入理解數據的來龍去脈,簡化數據溯源和影響分析的工作流程。第三,數據字典定義了數據元素的標準格式、度量精度和取值范圍,使用戶能夠在數據治理活動中實施標準化策略,減少數據轉換和整合的工作量,提高數據治理的效率和質量。通過這些方式,數據字典不僅提升了數據治理的效率,還增強了數據治理的執行力和效果,為企業的數據資產管理和數字化轉型提供了堅實的支持。緩
35、釋數據合規風險在近年來的數據合規領域,監管合規報送、數據安全、數據出境以及個人信息保護等方面已成為數據合規風險的關鍵焦點。8 企業面臨著政策密集發布、合規要求日益增多、監管手段不斷升級等挑戰。在這種背景下,數據字典的引入成為合規人員有效識別和管理合規風險的重要工具。數據字典為合規人員提供了一個詳盡的數據資產清單,其中包括個人數據和敏感數據的分類。借助數據字典,合規人員能夠確保數據收集和處理活動符合各種數據保護法規,如個人信息保護法(PIPL)、通用數據保護條例(GDPR)等。數據字典詳細記錄了數據的安全分類和合規要求,使得合規人員在業務需求提出和開發過程中,能夠確保數據的使用嚴格遵守相關法規和
36、政策,從而保護數據隱私和安全。此外,數據字典還規定了每一項數據的質量標準和規則,包括完整性、準確性和一致性要求等。這些質量檢核規則可以部署到數據質量檢核平臺中,幫助監管報送崗位人員在 EAST5.0 報送以及各地試點的一表通報送中,檢查數據的準確性和可靠性,降低因數據錯誤或不一致導致的合規風險和潛在合規處罰。數據字典建設行動指南一些領先的組織已經將企業級數據字典視為數據驅動的核心工具。盡管在行業內對數據字典的理解和應用尚存在差異,但普遍認為,數據字典很可能成為推動企業數字化轉型、數據要素市場化和創新發展的關鍵力量。首先,構建全面的企業級數據字典需要企業內所有業務和科技部門的共同參與。鑒于所涉及
37、的系統范圍廣泛、資源投入巨大,多數領先組織選擇分階段推進,逐步完善數據字典的規模、落地機制和配套的管控流程。其次,雖然數據字典的建立相對容易,但保持其長期的有效性和更新卻更具挑戰性。因此,在建設初期就應著手構建動態保鮮機制,尤其是加強元數據的基礎能力建設,以確保數據字典的時效性和準確性。第三,企業應積極探索將 AI 技術與數據字典相結合,以提升數據字典的自動化和智能化水平,從而在數據字典的編制、貫標和業務賦能過程中提高效率。最后,企業級數據字典不僅是數據資產的重要組成部分,甚至可以說是數據資產的代名詞。在未來的數據資源入表實現路徑中,數據字典將扮演至關重要的角色。例如,未經有效治理且無法帶來實
38、際經濟收益的數據將無法被認定為資產。正如前文所指出的,數據字典在降低數據治理活動復雜度方面起著重要作用。因此,企業的首席執行官(CEO)或首席數據官(CDO),不應將數據字典的建設視為可有可無的輔助工作,而應從數據要素的視角,為這項工作提供必要的資源保障和投入。1314IBM 商業價值研究院IBM 商業價值研究院(IBV)站在技術與商業的交匯點,將行業智庫、主要學者和主題專家的專業知識與全球研究和績效數據相結合,針對公共與私營領域的關鍵議題提供可信的戰略洞察。訪問 IBM 商業價值研究院中國網站,免費下載研究報告:https:/ IBM,我們積極與客戶協作,運用業務洞察和先進的研究方法與技術,
39、幫助他們在瞬息萬變的商業環境中保持獨特的競爭優勢。關于專家洞察專家洞察代表了思想領袖對具有新聞價值的業務和相關技術主題的觀點和看法。這些洞察是根據與全球主要的主題專家的對話總結得出。要了解更多信息,請聯系 IBM 商業價值研究院:15 Copyright IBM Corporation 2024國際商業機器(中國)有限公司北京市朝陽區金和東路 20 號院 3 號樓 正大中心南塔 12 層 郵編:100020美國出品|2024 年 4 月IBM、IBM 徽標和 是 International Business Machines Corporation 在世界各地司法轄區的注冊商標。其他產品和服務
40、名稱可能是 IBM 或其他公司的商標。以 下 Web 站 點 上 的“Copyright and trademark information”部分中包含了 IBM 商標的最新列表: 可能隨時對其進行更改。IBM 并不一定在開展業務的所有國家或地區提供所有產品或服務。本文檔內的信息“按現狀”提供,不附有任何種類的(無論是明示的還是默示的)保證,包括不附有關于適銷性、適用于某種特定用途的任何保證以及非侵權的任何保證或條件。IBM 產品根據其提供時所依據的協議條款和條件獲得保證。本報告的目的僅為提供通用指南。它并不旨在代替詳盡的研究或專業判斷依據。由于使用本出版物對任何企業或個人所造成的損失,IBM
41、 概不負責。本報告中使用的數據可能源自第三方,IBM 并未對其進行獨立核實、驗證或審查。此類數據的使用結果均為“按現狀”提供,IBM 不作出任何明示或默示的聲明或保證。1“財政部印發 企業數據資源相關會計處理暫行規定”。20230822.https:/ 年)的通知”。20240104.https:/ 9078060945.htm#3“AI時代的CEO 決策力:運籌帷幄,決勝未來(大中華區 洞察)”。IBM 商業價值研究院。202308.https:/ 企業精細化成本管理:核算、分析與管控。侯立新、崔剛。2022 年 7 月。5“詳解馬明哲全面數據化經營術,為何他家年報能提速22 天?”。20200222.https:/ GBT+18391.5-2009+信息技術+元數據注冊系統(MDR)+第 5 部分命名和標識原則。20091201.https:/ 23 億!透視 2023 年銀行業罰單:信貸、內控 仍 是 重 災 區”。20231213.https:/