《貝殼-王嘯-多維分析數據庫Druid在貝殼OLAP平臺的應用之路.pdf》由會員分享,可在線閱讀,更多相關《貝殼-王嘯-多維分析數據庫Druid在貝殼OLAP平臺的應用之路.pdf(43頁珍藏版)》請在三個皮匠報告上搜索。
1、主辦方: 多維分析數據庫多維分析數據庫DruidDruid 在貝殼在貝殼OLAPOLAP平臺的應用之路平臺的應用之路 王嘯王嘯 貝殼貝殼 技術專家技術專家 主辦方主辦方: 王 嘯 “ 現貝殼基礎平臺中心-大數據平臺部 負責OLAP平臺查詢引擎技術研發 曾經供職于中國電信、百度,負責多項大數據產品架構設計與研發 ” 請插入 您的照片 講師簡介 主辦方主辦方: 摘要 貝殼作為全國領先的房產交易和租賃在線服務平臺,主要有四大業務:二手房交易、新房交易、租賃業務 以及裝修業務。四大業務運營將產生大量實時和離線數據,這對數據分析和查詢帶來了巨大的挑戰。原有 OLAP查詢平臺革新升級迫在眉睫。我們團隊結合
2、貝殼業務數據特點,選擇Apache Druid作為我們底層主 要查詢分析數據庫,這背后隱藏了哪些故事,今天將與大家一同分享。 主辦方主辦方: 多維分析數據庫Druid應用之路 案例大綱案例大綱 1.貝殼OLAP平臺經歷那些發展階段,我們面臨過哪些問題 2.OLAP多維分析數據庫產品眾多,OLAP選型策略是怎樣的 3.Druid怎樣才能服務好各個業務方,降低技術門檻,提升工作效率,數據指標建模的流程是怎樣的 4.結合公司自身的業務場景,對Druid做了哪些針對性改進和優化 5.未來規劃 主辦方主辦方: 引入案例來源引入案例來源 原有業務情況:原有業務情況: OLAP平臺支撐整個指標提建立,覆蓋公
3、司所有的業務線 6000+指標 日均調用量3000w+ 調用3s內返回99.5% 底層引擎以Kylin為主,600TB的Cube存儲量 主辦方主辦方: 痛點痛點 數據源構建時間長,不能完全滿足業務方及時查詢要求 數據源底層存儲占用巨大 查詢靈活性較差,可能需要構建多個cube適配 相較源數據膨脹率巨大,產生可怕的維度爆炸 調優門檻相對較高 使用使用KylinKylin存在的問題:存在的問題: 主辦方主辦方: 怎么做到的 我們需要的我們需要的OLAPOLAP數據庫是什么樣的數據庫是什么樣的 要求 亞秒級 響應 支持較高 的并發 靈活易用 查詢接口 快捷的數 據導入 PB級別的 數據量 主辦方主辦方: 怎么做到的 能滿足五項要求的開源能滿足五項要求的開源MOLAPMOLAP數據庫,做全面的對比數據庫,做全面的對比 種類種類大數量支持大數量支持 查詢性能查詢性能高并發高并發實時數實時數 據攝入據