《第五章 大數據融合數倉場景化解決方案.pdf》由會員分享,可在線閱讀,更多相關《第五章 大數據融合數倉場景化解決方案.pdf(103頁珍藏版)》請在三個皮匠報告上搜索。
1、版權所有 2019 華為技術有限公司 大數據融合數倉場景化解決方案 第2頁版權所有 2019 華為技術有限公司 前言 隨著大數據和物聯網技術的迅猛發展,數據進入爆炸式增長期,原有數據倉庫處理 分析的低擴展性、高擴展成本、單一數據格式、高時延,成為了客戶挖掘數據金礦 的阻力。如何構建一個全新的數據倉庫分析平臺,集高擴展性、低擴展成本、處理 多種數據格式文件、低時延等特性,成為當下急需解決的問題。 第3頁版權所有 2019 華為技術有限公司 目標 學完本課程后,您將能夠: 區分數據庫、數據倉庫、融合數倉的概念 熟悉華為融合數倉在行業中的應用 描述GaussDB 200中的概念和架構 掌握Gauss
2、DB 200的基本用法 熟悉GaussDB 200的核心特性 第4頁版權所有 2019 華為技術有限公司 目錄 1.數據倉庫與融合數倉 2.GaussDB 200 概述 3.GaussDB 200 6.5 新特性介紹 4.GaussDB 200 操作 5.融合數倉實戰 第5頁版權所有 2019 華為技術有限公司 數據庫架構設計 Shared - Disk 各個處理單元使用自己的私有 CPU和Memory,共享磁盤系 統。 Shared - Nothing 各個處理單元都有自己私有的CPU/Memory/ 硬盤等,不存在共享資源,各處理單元之間通 過協議通信,并行處理和擴展能力更好。 Share
3、d - Everything 一般是針對單個主機,完全透明共享 CPU/Memory/IO,并行處理能力是最 差的。 數據庫 架構設 計 第6頁版權所有 2019 華為技術有限公司 數據庫架構設計(續) 三者的區別如下所示: Disk DB SAN/共享存儲 DBDBDBDB DBDBDBDB DiskDiskDiskDisk Shared - EverythingShared - DiskShared - Nothing 第7頁版權所有 2019 華為技術有限公司 數據處理機制 主要分為OLAP和OLTP。 OLAPOLTP 用戶決策人員、高級管理人員操作人員、低級管理人員 功能分析決策日常操作處理 DB設計面向主題面向應用 數據 歷史的、聚集的、多維的、 集成的、統一的 當前的、最新的、細節的、 二維的、分立的 存取讀上百萬條記錄讀/寫數十條記錄 工作單位復雜的查詢簡單的事務 用戶數上