您的當前位置: 首頁 > 新聞中心 > 行業知識 > 數據湖是什么?與數據倉庫的區別在哪?易華錄“數據湖+”應用場景介紹

數據湖是什么?與數據倉庫的區別在哪?易華錄“數據湖+”應用場景介紹

1 什么是數據湖

數據湖的概念最早是由“數據倉庫之父”的 Bill Inmon提出,在其著作《數據湖架構》一書中,他提出通過設計數據湖來避免垃圾存儲的概念。數據湖是存儲原始數據的大型倉庫,在數據湖中數據有很多不同階段,數據湖的成功建立需要提供大規模數據接入、數據治理、數據服務和數據安全管理框架。

按照維基百科的定義數據湖是一類存儲數據自然、原始格式的系統或存儲,通常是對象塊或者文件。數據湖通常是企業中全量數據的單一存儲。使用數據湖解決方案,從結構化和非結構化數據中生成有意義的信息,并在市場中保持競爭力。

數據湖

2 建立數據湖的意義

數據湖是政府與社會資本合作,同時解決發展數字經濟三個痛點的中國特色新基建方案

(1)存的起(藍光存儲):訪問速度在分鐘級、存儲能耗在千分之三、存儲成本只有6.5%、存儲時間是100年。

(2)得得到:政府收儲有序開放、社會數據留存共享、制定數據安全法律、建立地方要素市場

(3)用得好:企業依法獲得數據、開放數據智能算法、開發數據應用場景、為數字化轉型賦能

數據湖

3 易華錄“數據湖+”戰略的應用場景

(1)數據湖+大交通:公司作為智能交通龍頭企業,可以基于數據湖中的政府數據,以及交通軟件管理平臺及電子車牌業務打造交通數據湖。 2020 年,公司中標哈爾濱智慧城市“交通云”平臺服務項目,哈爾濱“交通云”城市交通大腦運用大數據、云計算、人 工智能等前沿技術,將“智慧治堵”作為先導性需求,建設城市數據大腦交通平臺,實現智能感知路況、智能判定堵情、 智能巡查事件、智能優化配時、智能輔助指揮等五大基本功能。

(2)數據湖+大安全:目前研發了藍鯨產品,基于人工智能分析,將攝像頭數據導入數據湖,通過人臉識別精準鎖定相關人員,良好輔助公安 部門偵破案件。公司在“智慧公安”項目建設中,面對技術難度大、工作時間緊、泛在感知數據接入復雜的狀況,緊緊 圍繞“智慧公安”體系化建設方案,積極解決技術難題、組織技術攻關,建起了智能化、實戰化、一體化的“升級版技 防城”實戰應用系統。

(3)數據湖+大健康:隨著老齡化的加速,基于政府對老年人生活的重視,整合養老大數據,為老年人提供增值服務。

數據湖

4 數據湖與數據倉庫的區別

(1)數據湖能能處理所有類型的數據,如結構化數據,非結構化數據,半結構化數據等,數據的類型依賴于數據源系統的原始數據格式;數據倉庫只能處理結構化數據進行處理,而且這些數據必須與數據倉庫事先定義 的模型吻合。 

(2)數據湖擁有足夠強的計算能力用于處理和分析所有類型的數據,分析后的數據會被存儲起來供用戶使用;數據倉庫處理結構化數據,將它們或者轉化為多維數據,或者轉換為報表,以滿 足后續的高級報表及數據分析需求。

(3)數據湖通常包含更多的相關的信息,這些信息有很高概率會被訪問,并且能夠為企業挖掘新的運營需求。 數據倉庫通常用于存儲和維護長期數據,因此數據可以按需訪問。

數據湖與數據倉庫

推薦閱讀:《【公司研究】易華錄-數據湖基建龍頭于波瀾之中把握新機遇-210604(32頁).pdf》

《【4】基于Flink+Iceberg構建企業級實時數據湖-胡爭-阿里巴巴.pdf》

《數據湖技術IceBerg如何解決騰訊看點業務痛點v5.pdf》

本文由作者C-C發布,版權歸原作者所有,禁止轉載。本文僅代表作者個人觀點,與本網無關。本文文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關內容。

相關報告

未來宇航研究院:2018中國商業航天產業投融資報告.pdf
未來宇航研究院:2018中國商業航天產業投融資報告.pdf

1 2 3,571,000,000 36 3 4 5 6 7 8 新 航 天 新 生 態

58交易營銷數據倉庫建設-3.pdf
58交易營銷數據倉庫建設-3.pdf

2020.08.18-19 5858同城大數據應用實踐同城大數據應用實踐 DataFunTalkDataFunTalk 數據架構師李瑞洋 5858交易營銷數據倉庫建設實踐交易營銷數據倉庫建設實踐 業務背景:交易中心,營銷中心 服務對象:銷售,客服,管理,運營,財務,內控等 應用背景:業績財務核算,面向銷售客

2020年終大會-數據倉庫:7-1.pdf
2020年終大會-數據倉庫:7-1.pdf

滴滴指標體系建設實踐分享 曹雷 2020.12.19 2 個人簡介 銀行 10年+ 美團外賣 滴滴出行 知行合一 保險 電力 項目經理 DBA 數倉架構師 教練 3 目錄 前導 指標體系概述 指標體系搭建方法 指標體系管理 指標體系產品化 4 前導-思考背景 指標體系的問題是背后數據體系的問題 點 指標體系

2020年終大會-數據倉庫:7-2.pdf
2020年終大會-數據倉庫:7-2.pdf

陌陌大數據治理與優化實踐 劉志祖 數據倉庫負責人 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 團隊使命 大數據治理介紹 陌陌大數據治理實踐 下一步規劃 分享大綱 01 大數據治理介紹 大數據治理 總體介紹 目標 -降低大數據膨脹引入的熵增成本 - 保障數據資產可信及合規等

2020年終大會-數據倉庫:7-4.pdf
2020年終大會-數據倉庫:7-4.pdf

金融資管數據中臺體系金融資管數據中臺體系 的探索和實踐的探索和實踐 金晨金晨 北京熵簡科技有限公司北京熵簡科技有限公司 關于熵簡科技關于熵簡科技 以技術+業務導向為核心的數據智能服務商 我們的客戶與合作伙伴 數據中臺架構 1 2 3 熵簡科技:以技術熵簡科技:以技術+ +業務導向為核心的數據智能服務商業務導

2020年終大會-數據倉庫:7-3.pdf
2020年終大會-數據倉庫:7-3.pdf

貝殼基于Apache Druid的 OLAP引擎應用實踐 王 嘯 現貝殼基礎平臺中心大數據平臺部工程組-資深研發工程師,負責OLAP平臺查詢引擎相關技術 曾經供職于中國電信、百度,負責大數據平臺的架構設計與研發,有著豐富的實踐經驗 個人介紹 1. 貝殼OLAP平臺介紹 2. OLAP技術選型策略 3. Dr

2020年終大會-數據倉庫:7-5.pdf
2020年終大會-數據倉庫:7-5.pdf

? ? ? ? Contents 目錄 01 ? 02 ? 03 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?

16-3搜狐智能媒體在數據倉庫體系建設中的技術實踐.pdf
16-3搜狐智能媒體在數據倉庫體系建設中的技術實踐.pdf

搜狐智能媒體在數據倉庫 體系建設中的技術實踐 搜狐智能媒體研發中心 翟東波 自我介紹 2018年5月加入搜狐智能媒體研發中心 曾先后供職于中興、百度、優酷、阿里大文娛、偶數等公司,從事 過網絡通訊協議、分布式OLAP/OLTP數據庫、大數據開發平臺等產 品的研發工作,專注于分布式系統和大數據等技術領域 主要

客服
商務合作
小程序
服務號
折疊
午夜网日韩中文字幕,日韩Av中文字幕久久,亚洲中文字幕在线一区二区,最新中文字幕在线视频网站