1、銀行業數據治理與數據資產管理Datablau(數語科技)創始人&CEO主講:王琤時間:2024年4月2022 Datablau All right reserved議程安排Agenda 數據治理專項案例-數據模型管控 數據治理專項案例-數據安全 數據治理專項案例-數據血緣 數據治理專項案例-數據資產運營2 曾任CA ERwin全球研發負責人,2006年加入CA,十幾年經驗在數據建模領域,客戶多來自世界500強,美國銀行(BOA),SunTrust,AT&T,殼牌等。深度參與建設銀行新一代系統數據模型設計。2016年創立Datablau,成功服務多家國內大型企業的數據治理項目,包括華為、建設銀行
2、、平安銀行、中國人壽、華泰證券、中金、嘉實基金、美的、海信、南方電網、國電集團、稅務等大型企事業單位,具有豐富的數據治理項目咨詢,管理和實施經驗。信通院數據資產專家委員會成員,數據資產白皮書主要撰寫人 IEEE member,OMG member,DAMA CDMP 復旦大學、人民大學、北京航空航天大學 客座講師 國資委“數據要素”專家委員王琤(Allen Wang)Datablau創始人&CEO2022 Datablau All right reserved專注數據治理創新,擁有多項數據治理專利,具有國際化視野和經驗。以AI驅動治理工作。支持信創體系,兼容國產化操作系統、中間件、數據庫等。滿
3、足信創要求,不斷豐富完善。自主研發,由前Erwin全球研發團隊2016年創立,擁有多位模型產品研發和咨詢專家。n 行業引領:國內首個企業級建模軟件,源頭治理先行者n 專業認可:數據資產管理代表廠商,Gartner、Forrestern 產品創新:全棧數據治理平臺,自動化、AI驅動服務關于Datablau制造業等客戶,擁有良 好的市場口碑服務300+企業客戶覆蓋全國2626個城市賦能10+10+行業行銀型大家多于保險、證券、基金金融業頭部客戶制造業、能源、其他行業頭部客戶2022 Datablau All right reservedDCMMDCMM數據管理能力成熟度評估模型7組織技術流程制度數
4、據生存周期數據戰略數據應用數據安全數據質量數據標準數據架構數據治理1.初始級2.管理級3.穩健級4.量化級5.優化級項目或系統級別,規范不完善,過程不可預測業務領域或部門層面開展數據管理,形成了制度規范,但缺乏組織級管理通過量化分析提升管理能力,不斷優化完善數據管理能力在組織層面形成統一的工作流程、標準和規范成為行業數據管理能力標桿,對外輸出數據管理經驗 工業和信息化部于2018年發布了國內首個數據管理領域的國家標準數據管理能力成熟度評估模型(Datamanagement capability maturity assessment model,簡稱DCMM)(GB/T 36073-2018)
5、,定義了數據管理8個能力域,包括數據戰略、數據治理、數據架構、數據應用、數據安全、數據質量、數據標準和數據生存周期,細分為28個能力項,從組織、制度、流程和技術四個方面考察企業數據管理能力,劃分為5個能力等級。DCMM標準框架DCMM能力等級2022 Datablau All right reserved 銀行業DCMM平均達到DCMM3級穩健級水平,數據管理能力集中于3、4、5級,呈現階梯化分布,占比分別達到69%、27%和8%。銀行業的數據管理能力發展穩步成長。我國股份制以上銀行信息化建設起步早,在數字經濟時代加快跟緊數據管理能力建設步伐,銀行加速其在金融技術領域的布局速度,逐步由“電子銀
6、行”向“數字銀行”轉變,始終保持領先水平。銀行業8大能力域分數相對均衡,數據治理能力較有優勢。銀行作為數字化轉型的先行者,普遍認識到轉型不是單一技術或者局部業務的變革,而是包含組織結構、管理模式、經營模式、企業文化等內的全方位的變革,是一項系統性工程,因此將數據組織架構調整、制度體系建設、數據文化重塑作為數據管理的核心。初始級受管理級穩健級量化管理級優化級DCMM成熟度水平基線123450數據戰略數據治理數據架構數據標準數據質量數據安全數據應用數據生存周期2.99分3.30分3.07分3.12分3.20分3.20分3.21分3.09分銀行業能力域成熟度水平基線3.15分全行業水平基線銀行業能力
7、等級分布情況2022 Datablau All right reserved銀行業能力等級分布情況9 銀監會于2018年發布了銀行業金融機構數據治理指引明確將數據治理納入公司治理范疇內。2020年5月銀保監會下發關于開展監管數據質量專項數據治理工作的通知,開展為期1年的監管專項數據治理工作;2020年7月,人民銀行發布關于建立金融基礎數據統計制度的通知,進一步要求銀行加快數據治理體系建設。銀行業行業主管機構一系列數據治理政策推動銀行業以監管為抓手,建立了多層次、相互銜接數據治理體系,加大監管數據質量控制機制。創新業務發展:全量數據融合,提升賦能能力,數據應用百花齊放監管合規要求:數據質量、數據
8、合規雙管齊下改進客戶體驗:通過數據建立360度客戶視圖助力定制化服務3.453.453.893.893.483.483.753.753.793.793.823.823.683.683.53.52.752.753 32.872.872.942.942.92.92.92.92.852.852.892.8900.511.522.533.544.55國有商業銀行、全國性股份制銀行城商行、信用社、網商銀行兩類銀行業各能力域得分情況對比銀行業數據管理的三大驅動力從DCMM評估得分結果入手進行觀察,國有商業銀行和全國性股份制銀行的數據管理能力明顯高于城商行、信用社等中小銀行2022 Datablau All
9、 right reserved數據治理整體規劃-三年規劃 2026年2025年治理組織架構逐步細化到部門級,人員角色匹配組織架構設定并明晰職責;發布治理管理制度,制定并最終完善管理規范及流程。2024年治理提升夯實成果全面提升組織制度流程風險、信評等項目關鍵數據的標準、質量等治理專項(重點業務域)保障措施(工具、資源)關鍵活動(對標、執行)推廣風險、信評等項目治理成果;全公司執行數據治理。全公司執行數據治理可輸出治理組織、制度、流程成功案例1、對標DCMM3級要求,制定并發布數據治理各能力域制度、規范和流程。2、根據風險、信評等項目,對數據字典、數據標準、數據質量進行公司級建設。3、完成數據安
10、全、主數據、數據資產目錄的建設。4、DCMM3級自評。1、總結并在企業中推廣風險、信評等項目的數據治理成果。2、對標DCMM3級及4級要求,拉齊現狀與3級差距,根據4級要求制定數據治理評價體系及相關量化指標。3、通過DCMM3級認證。4、進行數據資產入表研究。1、總結企業數據治理成功案例并在行業進行分享。2、企業全公司開展數據治理活動。3、DCMM4級自評。4、數據資產入表。數據治理平臺/數據湖管理平臺、人力資源、財務支撐、高層支持數據管理平臺群、人力KPI評價體系、財務支撐、高層支持數據管理平臺群、人力KPI評價體系、數據共享平臺等2024年治理提升 完善并落地數據治理體系,提升數據管理保障
11、能力;啟動數字化專項關鍵數據治理;啟動系統工具建設;達成DCMM自評3級目標2025年夯實成果2026年全面提升 已成立數據治理組織,已落實不同層級的數據管理角色及職責;數據架構、數據標準、數據資產、數據安全等管理能力域處于建設初期;數據使用及共享上交互難、數不準;數據管理運營難,體系弱?,F狀 夯實數據治理體系建設成果,完善數據管控規范及流程。制定數據治理評價體系,監測數據治理成果;推廣數字化專項關鍵數據治理成果,擴大數字化專項數據治理范圍;加強系統工具體系落地能力,推廣系統工具的應用;通過DCMM3級評估要求。完善數據治理評價體系;企業內全面執行數據治理體系;行業內輸出數據治理成功案例;達成
12、DCMM自評4級目標。對標DCMM數據管理能力成熟度評估標準,以支撐數字化項目建設為抓手,逐步完善企業數據治理體系,全面提升企業數據管理水平2022 Datablau All right reservedDCMMDCMM評級評級數據資產運營數據資產運營中期規劃0.00.51.01.52.02.53.03.54.04.55.0數據戰略規劃數據戰略實施數據戰略評估數據治理組織數據制度建設數據治理溝通數據模型數據分布數據集成與共享元數據管理數據分析數據共享開放數據服務數據安全策略數據安全管理數據安全審計數據質量需求數據質量檢查數據質量分析數據質量提升業務術語參考數據和主數據數據元指標數據數據需求數據
13、設計和開發數據運維數據退役DCMMDCMM評估能力項等級分布評估能力項等級分布數據資源數據資產2022 Datablau All right reserved數據治理建設路徑數據標準/企業級數據模型業務術語-業務視角展開(自上而下)系統調研(自下而上)行業標準(參考)通過數據模型設計規范化落標數據質量檢核(管理看板)數據資產盤點(元數據-數據標準關聯映射)數據標準核標(管理看板)數據資產目錄&數據服務(數據運營)業務系統(OLTP)增量部分落標數據湖數據架構(OLAP)賦能業務部門數據安全(數據資產分類分級)數據安全合規制度體系企業架構、業務架構、業務流程圖企業長期數據應用的基石數據治理組織架
14、構&制度體系技術元數據業務系統數據模型主數據2022 Datablau All right reserved以終為始數據價值引導數據治理業務支撐面(直接和間接支撐)基本涵蓋到行里所有業務線(包括:零售、對公、機構、投行、資管等)和職能線(財務、人力)企業管理部運營管理部零售管理部財務部戰略客戶部風險管理部稽核部結算部投資銀行部合規部人力資源部分公司營業部XXXXXX經營駕駛艙XXX數據查詢服務數據標準規范服務數據管控服務零售綜合報表精準營銷模型用戶畫像體系信用業務模型對公綜合報表戰略綜合報表數據地圖服務稽核分析報表風險駕駛艙經營指標庫客戶主數據監管報送報表量化金融模型數據安全服務數據生命周期管
15、理服務數據資產盤點服務資訊數據服務通過多樣化的自助工具支撐所有分支機構的數據使用和查詢統計。通過平臺級數據服務,支撐上百個下游業務應用。1 1數據治理專項案例-數據模型管控2022 Datablau All right reserved建設模型驅動的數據中臺ODSADSDWDDWS物理模型SQLODSADSDWDDWS物理模型SQL模型主題層純代碼開發模式模型驅動代碼開發模式標準 規范 評審通過對數據中臺模型的管理,實現從孤井式的代碼開發,到模型驅動的代碼開發階段的轉變。實現了模型驅動的數據模型資產化,開發過程可審查,代碼質量可靠性等轉變,使中臺成為企業數據資產的沉淀和發布中心,進而形成行業模
16、型的影響力。2022 Datablau All right reserved銀行行業模型設計過程(以數倉為例)主題中文名英文全稱英文簡稱物理表前綴手工數據前綴外部數據參與方PARTICIPANTSPAST01M01E01產品MATERIELMALT02M02E02協議CONTRACTCOTT03M03E03渠道CANALSCALT04M04E04事件EVENTEVTT05M05E05資產ASSETASST06M06E06營銷MARKETMATT07M07E07財務FINANCIALFILT08M08E08地域LOCATIONLONT09M09E09參數PARAMETERPART10M10E10
17、代碼CODECDET99M99E99主題域模型主題域模型概念模型概念模型邏輯模型邏輯模型物理模型物理模型12342022 Datablau All right reserved構建企業級概念模型,是進行企業級數據定義最為徹底的一種方法,根據銀行現狀,分析企業級概念建模的可行性國際結算系統ECIF系統信貸系統資金交易系統核心系統CRM系統 數據各自為政 從當前各自業務的視角提需求,帶來的影響往往是邊界不清 系統建設完成,一段時間后,如同一個個煙囪,存在大量重復冗余,接口繁雜 新業務產生后難以判斷需求該落在哪里無企業數據模型無企業數據模型 數據統籌規劃 按照數據模型的規范,按數據分布的規劃提數據需
18、求 數據的流轉、邊界清晰 具備擴展性與前瞻性,當系統改造或新建時,很容易判斷數據該落在哪里企業數據模型(概念模型)企業數據模型(概念模型)國際結算系統ECIF系統企業數據模型信貸系統資金交易系統核心系統CRM系統2022 Datablau All right reserved在完成企業級概念模型后,可以進一步梳理企業級數據分布企業概念數據模型是揭示業務本質的模型,對于類似的業務是相關、可繼承的,因此基于概念模型的數據分布基于概念模型的數據分布不僅僅是當前業務在各系統的分布、流轉,更可用于規劃新業務在系統中的分布與流轉規劃新業務在系統中的分布與流轉數據分布數據分布是數據需求的各個實體在各個系統間
19、流轉、存儲的視圖如果說企業數據模型是靜態的需求,則數據分布是動態的需求動態的需求,透過數據分布,可以看到數據在各個系統的分布、流在各個系統的分布、流向向,也可以指導未來業務數據在系統如何落地指導未來業務數據在系統如何落地國際結算系統ECIF系統客戶數據(概客戶數據(概念模型)念模型)信貸系統資金交易系統核心系統CRM系統如何分布如何分布核心系統信貸系統CRM系統ECIF系統數據倉庫ACRM系統其它分析類系統如何流轉如何流轉新業務產生時,新業務產生時,該如何分布、該如何分布、流轉?流轉?2022 Datablau All right reserved模型管控與數據治理管控聯合機制模型評審標準定義
20、標準評審數據建模師數據開發數據運維DDL作業提交與發布標準發布模型發布元數據采集與管理數據標準、碼值詞根管理模型設計引用數據標準模型保存模型提交詞根DDL作業開發模型報告:設計描述及評價 數據標準合規率 數據規范評分 模型設計問題集符合發布要求的模型及其元數據DDL腳本;ETL腳本(可選)開發環境測試庫生產庫數語能力/服務數據中臺功能圖示說明:生產庫元數據與模型自動關聯、差異比對;數據標準自動同步至元數據 DDL腳本數語DAM服務1和2可采用數語的DAM頁面及服務,將數據標準、碼值、詞根提供給建模;數語DAM服務及DDM服務保留API對接能力,一方面讓已有的數據標準(發布后)及元數據數據推送至
21、DAM,另一方面數語DAM及DDM系統能夠對接已有的workflow實現符合實際管理要求的模型/數據標準審核、發布流程數語DAM服務數語DDM建模工具腳本發布并在生產庫執行后、通知數語DAM觸發元數據采集及數據標準自動同步2022 Datablau All right reserved全生命周期的模型管控體系數據開發項目模型設計階段模型開發階段投產上線階段1.模型導入通過導入工具,將PD、ERWin等工具的模型導入DDM中。2.反向工程 通過直聯數據庫的方式,反向生成模型。3.信息補全補充模型中缺失的字段信息,例如字段中文名稱將DDM納入開發投產流程中,使用平臺提供的典型能力進行進行模型設計、
22、開發測試和投產。2個關鍵階段:1.開發測試結束后的預投產階段進行模型的評審,保證信息補全率和落標率。見下圖的步驟9.2.投產后的后督管理,報告投產后的模型不一致情況。見下圖的步驟12.4.模型設計-使用客戶端設計器進行模塊設計與維護5.影響分析-設計階段能夠顯示模型的修改對下游系統的影響6.字段引標-設計工具中能夠引用數據標準7.模型評審-模型的變更必須經過線上評審,信息補全率,落標率8.數據開發 根據模型的映射和轉換規范,書寫代碼進行開發和調試9.任務編排 根據開發任務進行任務編排。10.發布項目 檢查和評審將投產DDL和DML代碼,合格后,發布到調度工具11.調度管理 對整體任務進行編排,
23、切換生產庫信息,進行上線投產。產后階段12.模型與元數據一致-將投產D模型與元數據比對,報告產生的不一致情況,進行后督改進。13.發布數據資產 將模型信息更新到元數據種。開發階段投產中和投產后階段2022 Datablau All right reserved將建模平臺融入行內投產流程PSET數據資產平臺數據資產平臺數據標準定義數據標準發布數據標準變更數據標準廢棄命名詞典管理生產數據庫生產數據庫需求管理需求評審系統管理系統版本數據建模平臺數據建模平臺Jira-項目管理與協作云測平臺云測平臺PSET測試報告檢查需求流程審批開發任務管理投產版本管理任務節點審批需求申請測試任務功能測試性能測試安全測
24、試測試報告DEV模型UAT模型VER模型版本任務版本任務落落標標標準落標多版本合多版本合版評審版評審測測試試任任務務合版評審合版評審模型合并模型合并模型合并模型合并數據庫ODS/DWD/DWB翻翻譯譯安全報告檢查代碼檢查DDL檢查模型報告檢查DDL腳腳本本任務跟蹤測試任務管理上線報告上線報告投投產產測試報告安全報告模型報告模型變化中文充足率數據模型規范模型變更歷史模型報告模型報告測試報告測試報告門禁檢查門禁檢查1.深度集成行內開發流程相關平臺,實現通過深度集成行內開發流程相關平臺,實現通過Jira項目管理與協作平臺統一開發流程的管理。項目管理與協作平臺統一開發流程的管理。2.綁定與開發流程,使
25、系統開發、測試與模型的設計、評審、測試同行。綁定與開發流程,使系統開發、測試與模型的設計、評審、測試同行。3.利用模型平臺能力,形成模型報告,作為系統發版上線的最后一道關卡,保障系統開發上線的完整性、規范性、統一性、安全性。利用模型平臺能力,形成模型報告,作為系統發版上線的最后一道關卡,保障系統開發上線的完整性、規范性、統一性、安全性。詞典翻譯協同建模簽入版本2022 Datablau All right reserved通過集成層與行內管控流程對接通過集成層與行內管控流程對接通過集成層與行內管控流程對接2022 Datablau All right reserved數據模型管理工具的效益大數
26、據運維開發完善數據治理體系 在數據模型設計中體現數據標準,逐步實現引標落標 完善元數據血緣關系,并與數據模型工具進行協同設計有據可依 形成全行數據模型資產,模型共建共享 模型字段設計可以參考使用數據標準 設計階段提示變更影響范圍,防控風險保障投產質量 將數據模型管理納入開發投產的統一管理中 避免出現模型腳本錯漏等情況2 2數據治理專項案例-數據安全2022 Datablau All right reserved1.2 越來越嚴格的數據安全監管要求252016年2017年2018年2019年2021年“十三五”國家信息化規劃促進大數據發展行動綱要網絡安全法大數據安全管理指南大數據安全服務能力要求
27、個人信息安全規范數據安全法(一審草案)個人信息保護法(一審草案)工業數據分類分級指南(試行)個人信息安全影響評估指南網絡安全等級保護基本要求(等保2.0)電信和互聯網用戶個人信息保護規定個人信息出境安全評估辦法App違法違規收集使用個人信息行為認定方法關鍵信息基礎設施網絡安全保護基本要求數據安全能力成熟度模型互聯網個人信息安全保護指引貴陽市大數據安全管理條例大數據安全標準化白皮書20182020年個人金融信息保護技術規范數據安全法個人信息保護法 關鍵信息基礎設施安全保護條例網絡數據安全管理條例(征求意見稿)重要數據識別指南(征求意見稿)金融數據安全 數據安全評估規范(征求意見稿)數據安全事件愈
28、演愈烈,數據安全相關法律規范也陸續出臺和完善。2022年2022 Datablau All right reserved0102AI AI 性能性能JRT0197JRT0197分類分類針對人行JRT0197 金融數據定級指南建議的數據分類,優化檢測關鍵詞檢測關鍵詞和部分識別關鍵詞部分識別關鍵詞的優化,對監管報送數據及當前銀行主要業務數據字段的有效識別。0304識別準確率提升識別準確率提升AIAI自我學習自我學習基于22G完整語料庫的秒級分類分秒級分類分級結果級結果呈現,性能無障礙。1220萬條行業語料庫,充分釋放識別能力,首次AI自動化識別率達76%,人工優化后分類準確率可達90%補充完善行業
29、詞庫,預置了優化后的人行人行01970197數據安全分類數據安全分類及監監管報送數據分類管報送數據分類,同時加入了經過業務專家手動判定的銀行業通銀行業通用分類用分類作為基準,在原來識別率的基礎上再次提高。在準確率提升方面,由于在人行框人行框架下的數據分類架下的數據分類加入了更多的描述內容和關鍵詞,并將人工優化定級人工優化定級的監管報送數據分類的監管報送數據分類和銀行業通用銀行業通用數據分類數據分類,作為數據字典的優先識別依據,結合22G22G完整語料庫完整語料庫的應用,準確率也大幅提升。人行分類庫+監管報送庫+銀行業通用庫+22G語料庫,首次分類準確率可達76%智能數據安全分類分級2022 D
30、atablau All right reservedClick to edit Master text stylesSecond levelThird levelFourth levelFifth level智能數據安全分類分級2022 Datablau All right reserved指|信貸融資|、|證券交易|、|債券發行|等|與|投資|和|融資|相關|的|業務|信息|。|如|融資余額|、|本幣金額|等|。投融資業務信息,指信貸融資、證券交易、債券發行等與投資和融資相關的業務信息。如融資余額、本幣金額等。分類描述:分詞處理信貸融資|證券交易|債券發行|投資融資|融資余額|本幣金額根據詞
31、性剔除其他詞,保留關鍵詞進行向量計算比較字段名:融資融券分類:業務/金融監管和服務/收付業務信息得分:0.81435037詞向量庫分詞庫智能數據安全分類分級2022 Datablau All right reservedRUAC(Real User Access Control),基于數據安全三維框架:人-數-安全框架,數據自動授權體系:建自動訪問體系和白名單相結合的授權機制,通過統一ABAC機制的驅動,控制BI等落地數據訪問。數據資產和安全管理OLTP敏感數據識別數據安全分級數據安全分類安全定密盤點分類數據資產數據資產目錄白名單訪問控制組織人員訪問等級數據治理數據申請組織機構資產盤點訪問策略
32、脫敏規則JDBC驅動數據安全訪問引擎OLAP血緣關系治理數據標準治理數據庫數據安全框架認責定級統一數據訪問網關BI(帆軟)數據安全數據服務APISQL查詢服務脫敏函數數據安全管理制度數據安全共享制度數據安全應用Real UserDB User數據分類分級驅動的數據資產安全管控MySQL數據安全網關數據資產分類分級FineBI安全訪問JDBCOracleHive姓名手機號地區張三159*0246北京李四163*3433北京李五163*3433上海UserAUserB姓名手機號地區張三1590119*46北京李四1632343*33北京李五16311234433上海Real UserDB User
33、Data分類分級訪問User統一數據查詢SQLReal User安全防控安全審計風險識別效能監控2022 Datablau All right reserved“數據崗權”數據崗權”的實現邏輯:基于職位與組織架構的定義,預定義自助式分析用戶的授權角色,明確角色的表級、字段級、行級權限及敏感字段的實現邏輯:基于職位與組織架構的定義,預定義自助式分析用戶的授權角色,明確角色的表級、字段級、行級權限及敏感字段的脫敏要求的脫敏要求數據崗權人員系統數據中臺人員P脫敏策略(基于安全等級+脫敏等級)職職位位C1C2Cn授權角色授權角色(標崗+組織)R1R2Rn行訪問策略(不只是組織,還有各種分析緯度)DS1
34、表表+列訪問范圍策略列訪問范圍策略DS2DSn指導映射組織 O角色 S指導一對N一對N2022 Datablau All right reserved“數據崗權”“數據崗權”的賦權流程:除了第一次登錄以外,針對兼崗、轉崗、離職等場景,均可以基于數據崗權機制進行快速的更換和刪除數據資產的賦權流程:除了第一次登錄以外,針對兼崗、轉崗、離職等場景,均可以基于數據崗權機制進行快速的更換和刪除數據資產消費權限消費權限小小明明入入職職離離職職物理場景物理場景數據展現數據展現分公司分公司1 1-人力資源部人力資源部績效考核主管身份證數據屬于核心數據(L4);按規則脫敏數據崗權數據崗權說明說明20222022
35、年員工信息表年員工信息表公司公司姓名姓名部門部門職級職級身份證身份證分公司1張三生產部初級321224*8843分公司2趙六財務部中級321564*6343集團集團-人力資源部人力資源部績效考核主管登錄使用轉轉崗崗分公司2分公司1原授權角色原授權角色關系關閉關系關閉新授權角色與新授權角色與職位自動匹配職位自動匹配登錄使用賬號棄用離離 職職授權角色授權角色綁定關系接觸綁定關系接觸兼兼崗崗分公司2分公司1原授權角色原授權角色新授權角色新授權角色登錄使用數據數據崗權崗權20222022年員工信息表年員工信息表公司公司姓名姓名部門部門職級職級身份證身份證分公司1張三生產部初級321224*8843分公
36、司1李四財務部中級324524*324320222022年員工信息表年員工信息表工廠工廠姓名姓名部門部門職級職級身份證身份證分公司2王五生產部初級321224*8843分公司2趙六財務部中級321564*6343登錄使用數據崗權2022 Datablau All right reserved“單個數據資產”授權流程:針對“職權”以外的數據消費需求,平臺也可以基于單個資產給業務用戶相應的使用權限“單個數據資產”授權流程:針對“職權”以外的數據消費需求,平臺也可以基于單個資產給業務用戶相應的使用權限小明是分公司1財務部的出納,根據他的職位,可以看到分公司1的財務的相關數據,某一天接到了一個新的工作
37、,需要小明統計一下 分公司1下的出庫信息,所以小明需要在數據崗權申請查看出庫的相關數據。選擇庫存表選擇庫存表數據崗權數據崗權OAOA系統系統查看新申請的數據,并查看新申請的數據,并制作報表制作報表數據資產申請數據資產申請權限權限OAOA審批審批單單數據管理團隊數據管理團隊安全專員安全專員小明主管小明主管信息安全部信息安全部主管主管挑選庫存表中要訪問的字段挑選庫存表中要訪問的字段選擇數據使用時間,選擇數據使用時間,挑選能看到的數據行級過濾條件挑選能看到的數據行級過濾條件查看新申請的數據,并制作報表查看新申請的數據,并制作報表到期后權限自動回收到期后權限自動回收小明小明會 簽會 簽數據管家數據管家
38、A A4 4數據管家數據管家B B會 簽會 簽數據數據owner Aowner A數據數據ownerownerB B部門經理部門經理總經理總經理安全等級安全等級=L3?L3?安全等級安全等級=L4?L4?安全等級安全等級=L1/L2L1/L2數據訪問權限申請2022 Datablau All right reserved基于安全網關的數據安全控制示例基于安全網關的數據安全控制示例公司中心部門年月目標KPI實際KPI數語產品中心產品開發部202202100105數語產品中心產品交付部202203200195數語售前中心商務部202202105100數語售前中心售前部202203115120公司中
39、心部門年月目標KPI實際KPI數語產品中心產品開發部202202100105數語產品中心產品交付部202203200195數語售前中心商務部202202105100數語售前中心售前部202203115120公司HR可以看到所有數據(公司=“數語”)公司HR、產品中心HR、售前中心HR三位員工擔任不同組織的職位,標崗均是員工關系專員,都可以訪問“組織績效考核匯總分析表”,如圖:組織績效考核匯總分析表公司中心部門年月目標KPI實際KPI數語產品中心產品開發部202202100105數語產品中心產品交付部202203200195數語售前中心商務部202202105100數語售前中心售前部202203
40、115120組織績效考核匯總分析表產品中心HR可以看到產品開發部、產品交付部的目標KPI(中心=“產品中心”)組織績效考核匯總分析表售前中心HR可以看到售前中心的實際KPI(中心=“售前中心”)數據訪問權限申請2022 Datablau All right reserved結合客戶信息安全部對于信息密級的要求,定義數據安全分級參考標準結合客戶信息安全部對于信息密級的要求,定義數據安全分級參考標準數據安全級別數據安全級別數據安全等級數據安全等級危害程度危害程度數據使用策略數據使用策略數據分級數據示例數據分級數據示例L1公開數據無/輕微無利益損害在企業內部完全公開企業外部公示數據(本企業名稱、企業
41、法人名稱、公示運營報表)各業務域可對企業外部完全開放的業務數據企業官方新聞。L2內部數據中等輕微利益損害可跨部門、跨業務域直接使用需數據管家審批一般的管理、運營類報表(報表結果可在企業內部公開)企業公開的研究報告L3重要數據嚴重企業合法權益,個人隱私一般損害跨部門、跨業務域使用必須脫敏(例如數據聚合等)后使用審批流程需數據Owner審批(比2級多一層審批)個人一般信息(非隱私)、供應商基本信息企業組織機構重要信息(職位、職位職責及能力要求、職位等級權限等)企業組織機構基本信息(從L2放到L3)企業合同基本信息(采購合同、外加工合同、外部服務合同、銷售合同等)企業業務運營、生產流程、銷售過程信息
42、企業財務基礎信息,不涉及財務交易賬務(銀行賬戶、銀行交易)。L4核心數據非常嚴重嚴重損害企業合法權益、個人隱私、公眾權益、國家安全一般不在企業內部進行跨部門、跨業務域使用如需使用需總經理審批數據使用過程必須脫敏并且不落外庫。企業戰略決策信息(企業戰略預測及規劃、企業管理報表、企業業務評估信息、企業投資信息)個人隱私信息(個人安全法規定)、供應商敏感信息(供貨、運營評估等)已明確為機密的信息(機密商務合同等)已簽訂數據保密合同的信息。數據安全分類分級3 3數據治理專項案例-數據血緣2022 Datablau All right reserved數據血緣360:從上到下的設計血緣,從左到右的加工鏈
43、路源端業務數據數據加工鏈路血緣業務數據設計血緣ODS湖倉BI指標業務流程與需求概念模型數據標準邏輯模型2022 Datablau All right reserved數據血緣支持列表數據庫類型Oracle,SQL Server,MySQL,OceanBase,Hologres,Greenplum,PostgreSQL,Polar-DB,Redshift,GaussDB,DB2,DB2 for iSeries,Gbase,Hana,Teradata,ClikHouse,Vertica,Informix,StarRocks,JDBC大 數 據/非 結 構 化Hbase,Impala,MongoDB
44、,ElasticSearch,MaxCompute,FusionInsight,Transwarp-Inceptor,HiveSQLSpark SQL,Flink SQL,Gbase,TSQL Script,ClikHouse,PL/SQL,Hive,MySQL,Redshift,GaussDB,PostgreSQL,RestCloudETL工具Informatica,DataStage,SSIS,Tableau,DataX,Kettle,自定義報表工具Cognos,Davinci,FineBI,SmartBI,Yonghong BI,Tableau,自定義數 據 模 型邏輯數據模型、物理數據
45、模型2022 Datablau All right reserved血緣分析:報表與指標的質量問題朔源和追蹤源端業務系統集市寬表指標1數據倉庫模型2022 Datablau All right reserved結合結合DatablauDatablau DAMDAM的數據的數據血緣分析血緣分析功能,應用功能,應用建模工具建模工具的自動差異發現能力,的自動差異發現能力,快速定位快速定位本次上線模型和基線模本次上線模型和基線模型的差異,并型的差異,并自動統計分析自動統計分析使用存在差異模型的接口、系統等應用端,通知相關方及時進行適應性調整,避免下游使用存在差異模型的接口、系統等應用端,通知相關方及時
46、進行適應性調整,避免下游系統的系統的“被動排雷”“被動排雷”式升級,提升數據協同效率。式升級,提升數據協同效率。影響分析:上游需求變更,下游數據和系統的適應性調整主動分析模型變更影響模型2.0差異比較分析引擎模型發布的變更和影響報告記錄當前系統上下游數據流轉關系和影響關系比較引擎模型比較引擎模型1.0新增新增變化變化缺失缺失表544字段3102視圖100Datablau DAM(數據血緣系統)發送通知查詢報告模型工具2022 Datablau All right reserved基于血緣識別的數據分類分級能力提升利息凈收入利息凈收入安全等級:L2分類:財務指標利息收入利息收入(安全:無)利息支
47、出利息支出(安全:無)對客業務對客業務利息收入利息收入安全等級:L3分類:財務指標市場業務市場業務利息收入利息收入(安全:無)信貸業務信貸業務利息收入利息收入(安全:無)其他業務其他業務利息收入利息收入(安全:無)指標血緣數據指標血緣數據(安全等級血緣識別前安全等級血緣識別前)安全等級:L2安全等級:L3已確定安全等級已確定安全等級已確定安全等級已確定安全等級利息凈收入利息凈收入安全等級:L2分類:財務指標利息收入利息收入安全等級:L2分類:財務指標利息支出利息支出安全等級:L2分類:財務指標對客業務對客業務利息收入利息收入安全等級:L3分類:財務指標市場業務市場業務利息收入利息收入安全等級:
48、L2分類:財務指標信貸業務信貸業務利息收入利息收入安全等級:L3分類:財務指標其他業務其他業務利息收入利息收入安全等級:L3分類:財務指標指標血緣數據指標血緣數據(安全等級血緣識別后安全等級血緣識別后)安全等級:L2安全等級:L3已確定安全等級已確定安全等級已確定安全等級已確定安全等級通過父級(上游)確定安全等級通過父級(上游)確定安全等級通過父級(上游)確定安全等級通過父級(上游)確定安全等級通過父級(上游)確定安全等級已分類分級已分類分級數據數據安全等級:L2分類:財務指標未分類分級未分類分級數據數據根據已分類分級的數據已分類分級的數據,沿血緣方向血緣方向對經過的數據進行分類分級。安全信息
49、(分類分級)將以血緣的方以血緣的方式進行傳播和繼承式進行傳播和繼承。已分類分級已分類分級數據數據安全等級:L2分類:財務指標根據血緣分根據血緣分類分級數據類分級數據安全等級:L2分類:財務指標2022 Datablau All right reserved評估數據價值:從數據受眾、更新量級、更新頻次等數據鏈路中作為數據發揮價值的實證,數據引用頻度是發掘數據資產的重要因素。2022 Datablau All right reservedDataOps:評估數據倉庫質量,發現環狀鏈路,跨層引用,重復加工問題DIM2022 Datablau All right reserved在線SQL解析工具試用
50、鏈接:http:/:28080Datablau SQLink是數語科技2023年3月發布的獨立的SQL血緣解析工具,具有自主知識產權,其依托于Datablau數據治理產品在大型企業大量復雜SQL的處理積累,具有廣受客戶認可的SQL解析準確率和覆蓋率4 4數據治理專項案例-數據資產運營2022 Datablau All right reserved數據資產目錄建設數據資產目錄分錄賬:數據資產目錄分錄賬:用于數據資產目錄總帳下各類數據資產2022 Datablau All right reserved數據資產運營經營經營融合數據融合數據明細數據明細數據風險風險融合數據融合數據明細數據明細數據財務財
51、務融合數據融合數據明細數據明細數據監管監管融合數據融合數據明細數據明細數據數據資產管理數據資產管理數據資產目錄數據資產應用數據資產應用安全分類發分級數據資產查詢樣例數據數據資產監控數據資產分布權限申請數據服務門戶數據資產共享數據資產價值數據資產管理是充分發揮數據價值的必經之路,數據資產管理的目的是讓數據的使用者能夠清楚地認識數據和數據關系,從而更好的回答業務部門數據有哪些?是什么?在哪里?能夠一目了然,進而能夠用好數據;建立全域數據資產統一管理,實現數據資產化,讓數據應用的管理者能夠洞察數據、應用、系統之間的復雜依賴關系,進而能夠管好數據。價值:輔助數據資產盤點,開展數據資產服務,實現數據資產
52、價值的提升2022 Datablau All right reserved數據資產梳理數據發現明確歸屬可信數據分類分級數據資產數據管理部財富管理部數據運維專員分類分級專員資產盤點專員數據技術責任人數據業務責任人定義盤點框架定義盤點數據清單定義資產目錄框架采集數據資源配合數據采集提供數據定義確認數據歸屬明確可信數據源(數據庫、模式)補充數據定義(表/字段定義)維護平臺賬號及數據盤點權限注冊可信數據源基于規則指定數據歸屬方基于規則輸出數據分類分級結果定義分類分級規范確認數據分類分級結果確認數據共享規則數據資產目錄管理角色部門指導協助指向技術支持提供指導提供財管IT團隊數據中心數據技術開發2022
53、Datablau All right reserved指標管理體系指標模型2022 Datablau All right reserved構建數據標準體系,結合數據模型管控,從源頭到指標的端到端治理,配合質量管控體系,實現資產自動盤點,最后通過數據倉庫和服務,達到數據資產變現目的。標準落標Data Modeler數據模型工具模型管控模型設計協作共享元數據管理Data Asset Mgr數據治理平臺基礎標準管理指標標準管理數據質量管理數據血緣與圖譜數據資產目錄Data Catalog數據資產目錄平臺數據資產門戶數據資產盤點目錄空間數據服務智能分類分級Data Security數據安全治理平臺數據
54、權限管理數據安全網關數據動態脫敏安全策略審計模型開發數據架構工具Tools數據開發工具指標管理應用血緣解析工具數據開發工具Datablau 產品體系2022 Datablau All right reserved數據湖治理數據資產運營數據安全治理架構,設計,開發一體化管理數據標準數據標準管理管理元數據元數據管理管理數據質量數據質量管理管理數據模型數據模型管理管理數據安全數據安全管理管理數據資產數據資產運營管理運營管理設計規范及評價體系管理流程及崗位職責數據模型管理工具元數據管理平臺數據標準管理平臺數據質量管理平臺數據安全管理平臺數據資產管理平臺數據服務指標平臺企業數字化轉型戰略目標4數據治理數據治理落地場景落地場景6數據治理數據治理核心管理體系核心管理體系1統一數據治理統一數據治理平臺平臺 標準化數據 高質量的數據 安全可控的數據 統一的數據服務 清晰的數據架構研發效能賦能業務洞察賦能TP&AP一體化數據模型基礎數據治理標準元數據質量發布,授權,應用的資產運營服務1數字化戰略數字化戰略業務專項治理業務專項治理研發設計采購物流營銷銷售產品質量服務生產制造財務Datablau的數據治理框架