您的當前位置: 首頁 > 新聞中心 > 行業知識 > 數據倉庫是什么?特點是?與數據挖掘、數據湖的區別與聯系

數據倉庫是什么?特點是?與數據挖掘、數據湖的區別與聯系

1.數據倉庫

數據倉庫的概念是由William H Inmon在上個世紀九十年代提出,他將其定義為面向主題的、集成的、穩定的、不同時間的數據集合,用以更好地支持企業或組織的決策分析處理。具體來看,是一種從事務性應用程序中獲取數據與存儲數據的技術組合,它將一些信息系統中分散數據的重要信息提取到集中的存儲庫,以支持對歷史數據的訪問需求。

數據倉庫包含與操作數據庫分離的邏輯數據集合,是一個存儲信息的工具,可以集成來自各種應用程序或系統的各種類型數據,通過ETL(抽取、轉換和加載)過程從外部多種數據源提取數據,然后根據業務需要轉換數據,并將其存儲到數據倉庫中,可以保證管理人員通過專門訪問機制獲取信息并對其進行分析以進行決策。

數據倉庫有幾個特點:面向主題、集成數據、非易失性、時間變化和非標準化。

2.數據倉庫發展歷程

第一代數據倉庫:軟硬件一體化架構、有限的擴展性、昂貴的擴容成本;

第二代數據倉庫:開源軟件框架(Hadoop、Hive、Spark)、適配通用硬件(x86)、適應上百BP的海量數據計算、可靈活地進行性能拓展;

第三代數據倉庫:可按需取用的云化資源、近乎無限的擴容能力、更低的擴容成本、降低運維成本;

第四代數據倉庫:計算存儲分離,精細化的資源管理、全民化的數據分析需求、更高的訪問并發量與更低的延遲。

數據倉庫發展

3.數據倉庫與數據挖掘、數據湖的區別與聯系

(1)數據倉庫與數據挖掘

數據挖掘試圖從數據中發現潛在的、內部的關系和模式,希望能夠透過數據的表象發現其本質;數據倉庫是一個包含大量歷史數據的海量數據庫,側重于管理和存儲以主題進行組織的數據。

數據挖掘所處理的數據比較混沌,其數據源種類很多,可以是數據文件或數據庫,不一定必須是數據倉庫,但是由于數據倉庫已經將大量的歷史數據進行了清洗、加玉后存放起來,因此它可以為數據挖掘算法提供豐富的、規范的、完備的、干凈的樣本數據,數據挖掘算法可以直接使用這些數據,而不必再進行繁瑣的數據清洗和準備工作,從而大大節省數據挖掘在數據預處理上所花費的時間,因此,將數據挖掘技術和數據倉庫有機結合起來,不但能夠發掘化更多的、更好的有價值的模式,而且能夠明顯提高數據挖掘過程的效率。

(2)數據倉庫與數據湖

數據湖能處理所有類型的數據,如結構化數據,非結構化數據,半結構化數據等,數據的類型依賴于數據源系統的原始數據格式;數據倉庫只能處理結構化數據進行處理,而且這些數據必須與數據倉庫事先定義的模型吻合。

數據湖擁有足夠強的計算能力用于處理和分析所有類型的數據,分析后的數據會被存儲起來供用戶使用;數據倉庫處理結構化數據,將它們或者轉化為多維數據,或者轉換為報表,以滿足后續的高級報表及數據分析需求。

數據湖通常包含更多的相關的信息,這些信息有很高概率會被訪問,并且能夠為企業挖掘新的運營需求;而數據倉庫通常用于存儲和維護長期數據,因此數據可以按需訪問。

數據倉庫與數據湖

更多行業知識,敬請關注三個皮匠報告行業知識欄目。

推薦閱讀:《【公司研究】易華錄-數據湖基建龍頭于波瀾之中把握新機遇-210604(32頁).pdf

【研報】通信行業海外云相關行業簡析之Snowflake:全球領先云上數據倉庫-20200921(27頁).pdf

新能源汽車行業數據倉庫系列之汽車電動化:電動化有望繼續繁榮磷酸鐵鋰風頭正勁-20220221(14頁).pdf

艾瑞咨詢:中國云原生數據湖應用洞察白皮書(47頁).pdf

本文由作者2200發布,版權歸原作者所有,禁止轉載。本文僅代表作者個人觀點,與本網無關。本文文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關內容。

相關報告

【研報】航天軍工行業:下游需求浪潮已至新材料乘勢而起-210428(65頁).pdf
【研報】航天軍工行業:下游需求浪潮已至新材料乘勢而起-210428(65頁).pdf

航空鈦合金的主要需求還來自于航空發動機的定期維修換新。目前發動機中鈦合金主要用在中溫區(低溫區部分使用陶瓷基復合材料,高溫區使用鎳基或鈷基高溫合金),質量占比大約為 25%。此外根據華泰有色組 2018 年 2 月 26 日發表的深度報告否極“鈦”來,軍工材料元年開啟,我們假設發動機的裝配比 1:1.2,即

【研報】航天軍工行業:業績進入快車道行業高景氣延續-210509(27頁).pdf
【研報】航天軍工行業:業績進入快車道行業高景氣延續-210509(27頁).pdf

免責聲明和披露以及分析師聲明是報告的一部分,請務必一起閱讀。 1 證券研究報告 航天軍工航天軍工 業績進入快車道,業績進入快車道,行業高景氣延續行業高景氣延續 華泰研究華泰研究 航天軍工航天軍工 增持增持 ( (維持維持) ) 行業行業走勢圖走勢圖 資料來源:Wind,華泰研究 2021 年 5 月 09

【研報】航天軍工行業: 大國復蘇軍工崛起-210305(74頁).pdf
【研報】航天軍工行業: 大國復蘇軍工崛起-210305(74頁).pdf

聚焦軍工高景氣賽道,橫向關注六大產業鏈導彈:重要消耗型武器裝備,換代與實戰化訓練打開需求 導彈武器系統技術裝備水平反映了一個國家的綜合國防實力。一方面,導彈武器系統非常復雜,是推進劑學、電子學、金屬材料學、自動控制學、無線電學、光學、流體力學、空氣動力學和發動機學等多學科先進科學技術結合的結果;另

2021年航天軍工行業現狀及未來趨勢分析報告(23頁).pdf
2021年航天軍工行業現狀及未來趨勢分析報告(23頁).pdf

2021 年深度行業分析研究報告 2 正文目錄正文目錄 軍工行業整體分析:收入利潤整體增長,十四五景氣度有望提升軍工行業整體分析:收入利潤整體增長,十四五景氣度有望提升 . 4 收入保持增長,利潤增速市場領先 . 4 毛利率有所回升,凈利率呈現波動 . 7 存貨周轉加快,應收賬款周轉的行業特征明顯. 7 主

【研報】航天軍工行業深度研究:國防信息化浪潮起國產替代進行時-210324(87頁).pdf
【研報】航天軍工行業深度研究:國防信息化浪潮起國產替代進行時-210324(87頁).pdf

根據工信部2021 年1 月29 日最新發布的基礎電子元器件產業發展行動計劃(20212023年),行業總體目標到 2023 年,產業規模不斷壯大,電子元器件銷售總額達到 21000 億元,進一步鞏固我國作為全球電子元器件生產大國的地位,充分滿足信息技術市場規模需求;技術創新取得突破,突破一批電子元器件關鍵

【研報】航天軍工行業: 軍工、通信高景氣模塊電源需求廣-210406(21頁).pdf
【研報】航天軍工行業: 軍工、通信高景氣模塊電源需求廣-210406(21頁).pdf

海外巨頭主導電源市場,國內企業有望逐步突圍海外企業具備先發優勢,國內龍頭奮起直追國外率先開展研究,形成技術領先優勢。開關電源的研究最早起源于上世紀 50 年代初,為了搭載火箭上的電子系統,美國宇航局以小型化、輕量化為目標,開發了開關電源技術。國外開關電源技術逐漸向兩個方面發展:首先是實現了對開關電源控制的集

2021年航天軍工行業國防信息化與國產替代分析報告(82頁).pdf
2021年航天軍工行業國防信息化與國產替代分析報告(82頁).pdf

軍用電源市場擴容,裝備電氣化趨勢明顯中美機型差距大,正處于更新換代關鍵時期。當前我國軍用飛機正處于更新換代的關鍵時期,未來 10 年現有絕大部分老舊機型將退役。根據World Air Forces 2021,2020 年我國共有殲-7、殲-8 二代戰斗機 484 架,殲-10、殲-11 等三代戰機 550

2021年航天軍工行業供需趨勢與六大產業鏈分析報告(70頁).pdf
2021年航天軍工行業供需趨勢與六大產業鏈分析報告(70頁).pdf

新材料:需求提升疊加國產替代國防軍工裝備制造產業鏈上游產品質量、可靠性等方面要求較高,行業呈現高毛利特點。上游材料與電子元器件供應商分別為機體、發動機和機載系統提供材料和零配件,主要材料包括鈦合金、高溫合金、連接器、鉭電容等,呈現高行業壁壘的特點,在技術能力、渠道資源、人才與團隊、資質與認證等方面對企業要求

客服
商務合作
小程序
服務號
折疊
午夜网日韩中文字幕,日韩Av中文字幕久久,亚洲中文字幕在线一区二区,最新中文字幕在线视频网站