《2024datafun峰會_沐瞳指標管理與智能洞察.pdf》由會員分享,可在線閱讀,更多相關《2024datafun峰會_沐瞳指標管理與智能洞察.pdf(19頁珍藏版)》請在三個皮匠報告上搜索。
1、DataFunSummitDataFunSummit#20242024沐瞳指標管理與智能洞察HelenMa-沐瞳-數倉負責人指標管理智能洞察指標生產消費指標治理目錄 CONTENTDataFunSummitDataFunSummit#2024202401指標管理效率低ROI低找數難質量差指標現狀新起個項目,所有事情重新來一遍一句話需求多,理解成本高、需求變換頻繁受理周期長、開發效率跟不上各應用冗余建設,多業務重復管理獨立煙囪建設,生產加工流程不統一超過90%的數據無熱度未被使用頁面看到一個數,沒有看口徑的地方驗證一個數的準確性,找技術定義困難指標被重復、分散地定義、入口不統一能看到數據,但數據
2、不準同一指標不同平臺看到的數據不一致同義不同名、同名不同義策略與功能布局高效集中化梳理產品化管控資產化收口指標管理指標定義術語規范數據標準指標管理指標模型數據集指標血緣指標服務指標生產智能洞察自助分析指標地圖指標關系指標消費指標體系指標規范指標流程數據資產數據專輯知識庫問答資產健康度指標的命名規范盡可能做到事前規范指標命名、能清楚的看到每個指標的拆解清晰指標的定義與管理易查建立標準化管理機制,解決指標無管理與口徑不統一的問題、讓大家能清楚看到指標定義和計算邏輯事實表維表重復、分散定義指標口徑不統一指標管理統一管理技術定義業務定義統一口徑數據地圖技術定義數據集管理業務定義 英文名稱:order_
3、num 中文名稱:訂單數 業務描述:按創單時間統計,提交訂單的數量總和 .數據模型:order_model 聚合方式:sum 聚合字段:orderid.數倉表 信息自動出倉API發布指標的需求流程 業務需求調研業務需求調研:明確業務板塊、維度列表、指標列表。需求分析評審需求分析評審:明確指標拆解涉及的業務板塊、數據域、業務過程、度量、修飾詞、關聯數據源 等,錄入指標管理系統。技術評審開發技術評審開發:明確模型分層、模型粒度、設計指標模型、綁定指標與模型映射關系、綁定數據集建立常態化需求到指標的管理流程機制,指標責任到人常態化DataFunSummitDataFunSummit#20242024
4、02指標生產消費標準化領域模型快速模型加工數據集接入請求DSL數據應用查詢優化消費快速指標查詢五要素數據集指標維度過濾條件時間范圍模型匹配模型擇優語法解析日期國家訂單數訂單金額0525越南208800w0526菲律賓300900wSQL:select sum(order_amt)as 訂單金額 from order where logymd 20220501 and logymd-當期值當期值 90009000萬萬)根因維度定位:根因維度定位:共分析了共分析了5 5個維度、可能是根因所在的維度個維度、可能是根因所在的維度2 2個,波動貢獻最大的是個,波動貢獻最大的是 D1 D1(貢獻率(貢獻率
5、 12%12%)1.1.按國家大區:按國家大區:Z Z國國 反向貢獻反向貢獻 8%8%2.2.按機型網絡按機型網絡:C C機型機型 反向貢獻反向貢獻 6%6%根因指標定位:根因指標定位:共分析了共分析了3 3個原子個原子指標、波動貢獻最大的是指標、波動貢獻最大的是 M1 M1(貢獻率(貢獻率 30%30%)1.1.加法加法型:型:1.1.新增新增:C:C渠道渠道 減量影響減量影響 反向貢獻反向貢獻 8%8%2.2.留存:新版本更新留存:新版本更新 留存率留存率 反向貢獻反向貢獻 4%4%3.3.回流:未見明顯異?;亓鳎何匆娒黠@異常2.2.漏斗型:漏斗型:1.1.登錄登錄損耗率:反向貢獻損耗率:
6、反向貢獻 X X%根因大事件定位:根因大事件定位:共分析了共分析了5 5個大事件、可能個大事件、可能是根因所在的大事件是根因所在的大事件3 3個,個,波動貢獻最波動貢獻最大的是大的是 E2 E2(貢獻率(貢獻率 12%12%)1.1.與該波動正相關的與該波動正相關的事件:事件:allstar allstar 活動活動2.2.與該波動負相關的與該波動負相關的事件:暑假、停電等事件:暑假、停電等維度拆解維度拆解+指標拆解指標拆解 加法指標(DAU=新增+留存+回流)從眾多維度中定位根因,采用相對熵(JS散度)來評估維度的維度項的貢獻率,相對熵分布變化大,根因與維度相關性大。指標拆解加法加法拆解拆解
7、漏斗拆解漏斗拆解智能洞察決策好用智能洞察(DataWind)數據產品指標地圖 異動檢測數倉模型指標管理 ADS層DM層WwDWM層CUBE 指標模型多層維度下鉆聚合匯總模型(日/周/月)OLAP層戰斗性能DAU分析寬表投放歸因用戶異動檢測事件分析指標拆解維度拆解指標歸因維度歸因指標分析樹指標平臺大盤監控指標管理指標地圖新增活動性能戰斗對局分析寬表活動分析寬表CUBE 指標模型過程指標貢獻度統計匯總模型(日/周/月)維度表活動留存活躍多維分析DAU洞察報告總結DataFunSummitDataFunSummit#2024202404指標治理指標質量保障業務庫表業務需求跟蹤流量監控源變動監控 數據
8、異動橫向對比基本數據探查數倉模型任務SLA保障主鍵監控資源預警表/字段監控縱向對比運行時長監控標準化管理測試工具 完整性事后校驗指標規范 監控配置規范需求規范自測規范詞根管理監控工具事中 監控17準確事前 監控需求流程開發流程測試流程運維流程 及時性 唯一性 一致性 有效性 合理性指標/維度定義指標生產指標消費指標下線業務運營指標管理指標規范指標流程指標服務指標血緣指標地圖指標異動質量監控工具指標鏈路成本ROI省錢基線SLA 簽署表熱度分區熱度字段熱度數據分類數據分級數據保留周期表/任務血緣分區血緣字段血緣表ROI項目/指標基線&SLA鏈路ROI賬單(計算成本+存儲成本+機器服務成本)AWS 業務/項目 與 技術組件 機器打標根據應用層熱度、采用血緣向上追溯、各節點平均分攤成本20萬10萬感謝觀看