《2020年終大會-數據治理:15-3.pdf》由會員分享,可在線閱讀,更多相關《2020年終大會-數據治理:15-3.pdf(33頁珍藏版)》請在三個皮匠報告上搜索。
1、網易嚴選數據任務治理實踐 分享嘉賓范中喜 目錄1:數據任務治理背景 目錄2:事前模型上線前第一道防線 目錄3:事中基于“基線”任務運維策略 目錄4:事后報警后干預措施及常態化機制 目錄5:后續規劃 分享大綱 數據任務治理背景 數據任務治理背景希望改善點 規范、制度 知識沉淀 模型 及時、準確、穩定 問題快速定位、影響評估 任務 提升鏈路感知(場景:減少 資損事件發生) 鏈路感知減少報警、有一定干預措施報警 QA卡點、系統輔助測試 重大事故快速恢復(如入倉數 據異常) 事故恢復 數據任務治理背景落地產品 模型設計(完善):主題域、維度、度量、指標、設計等知識沉淀 產品化 倉頡(原有):指標管理、
2、維度、指標定義、指標與模型綁定 數據地圖(完善):模型搜索、指標搜索 測試中心(新增):形態報告、數據比對 數據質量(完善):質量稽核、質量評估、質量大屏 任務運維中心(新增):基線、報警監控、影響分析、診斷、事故恢復、考核 數據資產中心(新增):模型評估、任務健康評估、生命周期管理等。 執行保障:杭研猛犸技術組+網易嚴選數據技術組 事前模型上線前第一道防線 事前模型上線前第一道防線 保障 鏈路感知保障 測試保障 數據質量保障 模型設計保障 流程保障 事前模型上線前第一道防線(流程保障) 需求 Jira工單 需求評審:明確指 標口徑 研發 模型設計:設計文檔 模型評審:口徑、粒度、 調度周期、
3、比率加工、注意 事項等。 任務開發:單任務單模型、 分區規范、命名規范、同步 拆分等。 數據測試:測試報告、流 程審批 發布驗收:產品/分析師 驗收。 生產 質量稽核:配置規 則 鏈路感知(資損防 控):提示、流程管控 任務運維:監控、 優化、分析 問題處理:問題記 錄、工單處理、周會復 盤、事故定級等。 事前模型上線前第一道防線(模型設計保障) 維度定義: 粒度、層 級、屬性 主題域 劃分 業務過程 劃分:業務流 程說明 架構層次: 定位、職責 度量定義: 來自單一 業務過程 命名規范: 模型、維 度、度量、 指標 先設計后開發 知識沉淀 ODS MID DWD DWS DM 增 加 建 表 審 批 流 程 事前模型上線前第一道防線(模型設計保障) 提煉維度:who、what、where、why、when 提煉度量:來源明確、主題域層明確(dwd) 定義指標:指標口徑,模型關聯(dws、