《6-4 百信銀行數據治理實踐.pdf》由會員分享,可在線閱讀,更多相關《6-4 百信銀行數據治理實踐.pdf(24頁珍藏版)》請在三個皮匠報告上搜索。
1、數據治理實踐任增濤 百信銀行 數據治理架構師01數據治理概覽03數據治理組織架構04數據治理落地目錄 CONTENT02數據治理痛點01數據治理概覽負責保監會要求各保險機構落實數據報送職責,建立數據報送和質量管理責任機制,加強數據源頭管理銀保監會 首次將數據治理與監管評級掛鉤,標志著數據治理在我國銀行業全 面實踐時代的到來人民銀行 規劃指出要加強金融科技審慎,建立健全監管基本規則體系,增 強金融監管的專業性、統一性和 穿透性 監管首次針對數據治理開出罰單,中小銀行因數據治理問題被監管開 出罰單,意味著金融機構數據治理 越來越受到監管的重視銀保監會 要求各金融機構開展為期一年監 管數據質量專項治
2、理工作,開展 自評自查,并向監管機構提交自 查報告 8家銀行合計遭罰1770萬元,本 次處罰可以視為指引 中要求 的 “不滿足要求的金融機構可依 法采取監管措施及實施行政處罰”的實際執行銀保監會 指出部分保險公司在數據報送中存 在數據報送不及時、不完整、不準 確,數據整改不積極、效率低等問 題,要求各保險機構及時整改,完 善數據報送監控和數據質量檢查機銀保監會 要求21家全國性銀行明確牽頭部門,完成管理及運用情況調研,并做好數 據準備銀保監會 規范要求各人身保險公司于2021年 1月15日前按要求完成2017-2020 年全量標準化監管數據報送,并對 報送數據一致性、真實性、及時性銀保監會 要
3、求各金融機構應當加強數據治理,完成檢查分析系統所需數據整理、報送等工作,保證相關數據的全面、真實、準確、規范和及時 銀行業金融機構應當建立組織架構健全、職責 邊界清晰的數據治理架構銀行業金融機構應當制定全面科學有效的數據 管理制度、確立數據質量管理目標并建立質量 控制機制、建立數據質量監控體系和數據質量 考核評價體系、建立數據治理問責機制、建立 數據治理自我評估機制、建立數據質量整改制 度 02數據治理痛點范圍大數據治理涉及數據范圍廣,主要包括業務主題基礎數據、指標數據、特征數據、標簽數據領域廣涉及含數據標準、數據質量、數據安全、主數據、數據生命周期、數據資產等領域部門多需全行各部門協同配合,
4、各管理部門、各業務部門及各科技部門 2020畢馬威企業咨詢 (中國)有限公司 中國外商獨資企業,是與瑞士實體 畢馬威國際合作組織(“畢馬威國際”)相關聯的獨立成員所網絡中的成員。版權所有,不得轉載。中國印刷。24數據標準落地難由于業務系統的頻繁變動和新系統的上線,如果要在流程中進行人工審批,需要大量的人力物力,往往處于疲于奔命的狀態數據質量整改難推動數據質量問題整改經常被詬病是否有價值,尤其是在解決業務主題基礎數據質量問題過程中尤為突出數據安全管控難數據安全經常受到強勢業務部門的挑戰,通常以影響業績為由對管理部門施壓,造成安全原則難堅守組 織、流 程、制 度推 動、落 地、工 具組織,流程制度
5、、管理、績效考核方案非常健全組織不能推動、流程制度不能落地、工具不健全03數據治理組織架構數據管理執行層是集 團數據管理日常工作 的執行機構,由全體 成員共同組成。負責 參與、配合數據管理 的管理工作,根據管 理要求,制定數據標 準、數據管理等內容,評審數據管理結果,執行數據管理要求。數據需求數據質量推動本業務條線的數據管理 相關工作數據架構依據數據管理整體目標制定 業務標準歸類匯總問題并發送相關執 行部門進行數據管理發現數據管理問題數據標準完善涉及數據管理的業務需 求確定數據問題的原因數據管理歸口管理部門數據管理委員會董事會業務部門違反數據安全法或監管制度,管理部門受到強勢業務部門的挑戰,通
6、常需要有更高層組織進行審議數據安全01數據標準前置管控以犧牲開發效率為代價,需要向更高層組織講請價值,獲取管理力度。數據標準03數據質量推動業務系統數據質量問題整改,難以體現價值,業務和科技部門配合度低,需借助強需求向上爭取管理力度0204數據治理落地一、基礎數據標準二、指標數據標準1.如何制定適合企業發展的數據標準?2.數據標準檢查工作量大,如果確保落地?3.動輒幾十萬字段,有沒有必要全部按照標準執行?1.指標是否有必要全部管理?2.是否有必要對數據倉庫進行管理?3.如何確保指標質量?數據標準企業業務數據特性行業規范名稱編碼類型枚舉值是否個人金融信息等級金融信息等級是否加密質量規則是否行級其
7、他發現符合標準項的字段分類模型服務特征模型服務基于自然語言的治理引擎表一字段數據標準項cust_id客戶名稱idnumber身份證號bankcard銀行卡號表二字段數據標準項customer_id客戶名稱id_number身份證號card銀行卡號數據標準項發現涉及標準項字段打通字段和標準項的關系業務系統建表SQL提交AI模型判斷元數據涉及的標準項對標準項進行逐一校驗通過方可上線生成問題跟蹤單拒絕不能上線基于生成數據進行模型訓練在實際業務場景中,經常出現同一指標口徑不一致,在實際業務場景中,經常出現同一指標口徑不一致,同一指標內容不一致同一指標內容不一致、指標產出延遲、指標準確性指標產出延遲、指
8、標準確性差等一系列問題,造成管理者、運營分析人員對指差等一系列問題,造成管理者、運營分析人員對指標可信度質疑。標可信度質疑。每張報表的每個指標保存在不同結果表中,即同每張報表的每個指標保存在不同結果表中,即同一指標為滿足不同場景,需要開發多次,浪費開一指標為滿足不同場景,需要開發多次,浪費開發資源的同時,也增大了管理難度。發資源的同時,也增大了管理難度。指標開發周期往往不能滿足業務需要,如在報表指標開發周期往往不能滿足業務需要,如在報表中增加一個指標或維度,往往需要完成一個完整中增加一個指標或維度,往往需要完成一個完整的需求開發流程,很難支持企業快速決策的需求開發流程,很難支持企業快速決策指標
9、往往分布于數據倉庫、數據集市、報表平臺指標往往分布于數據倉庫、數據集市、報表平臺等多個系統中,很難保證同一指標在多個系統等多個系統中,很難保證同一指標在多個系統中的一致和準確中的一致和準確 指標平臺集成了【指標管理】、【維度管理】、【模型管理】、【OLAP分析】、【固化報表】等功能對數倉中的表進行建模管理,依托模型進行【指標】、【維度】創建,統一口徑和名稱,將多元的表存儲和設計抽象為模塊化的字段管理,通過對字段級別的管理和加工,賦能上層應用用戶自由拖拽【指標】、【維度】即可完成即席查詢1.新需求:加工新指標即可2.更改指標:同步更新模型中所有對應字段無論是加工效率亦或是維護成本均大幅度提升,應用層的報表、看板、歸因分析、移動端數據口徑絕對統一,保障用戶數據的一致性指標平臺推動機制問題分析責任到人質量監測績效考核質量提升成立專項工作小組,跟蹤相關問題整改歸口管理部門對問題進行分析整理確認相關問題牽頭部門,責任到人,歸口管理部門強配合提供數據質量問題監測手段制定績效考核方案數據質量體系,產生價值定期服務發現自動識別新增數據庫自動識別新增表、字段增量數據運營存量數據運營定期DB掃描自動識別數據量動態變化自動識別表、字段動態變化情況數據存儲3級以上數據必須加密不應留存4級以上 數據訪問紅線管控敏感數據管控表權限管控字段權限管控敏感數據權限管控 數據共享非常感謝您的觀看