数据仓库

编辑
本词条由“匿名用户” 建档。

数据仓库(简称DWH或DW;字面意思是“数据仓库”,在德语中以英语拼写为主,但也使用拼写数据仓库)是一个为分析目的而优化的中央数据库,它汇集了来自多个通常异构的数据,来源。该术语来自商业信息学中的信息管理。完整的数据,例如来自公司或大型项目的数据,通常作为原始数据提供,尚未根据特定规范进行处理或选择,保存在数据湖中。 信息仓库一词是IBM于20世纪80年代中期创建的。数据仓库一词最早由BarryD...

数据仓库

编辑

数据仓库(简称 DWH 或 DW;字面意思是“数据仓库”,在德语中以英语拼写为主,但也使用拼写数据仓库)是一个为分析目的而优化的中央数据库,它汇集了来自多个通常异构的数据, 来源。 该术语来自商业信息学中的信息管理。 完整的数据,例如来自公司或大型项目的数据,通常作为原始数据提供,尚未根据特定规范进行处理或选择,保存在数据湖中。

数据仓库任期

编辑

信息仓库一词是 IBM 于 20 世纪 80 年代中期创建的。 数据仓库一词最早由 Barry Devlin 在 1988 年使用。

“数据仓库”一词目前没有统一的定义。 但是,以下内容通常适用:

  • 数据仓库通过将来自与全局视图相关的数据源的数据合并到一个通用的一致数据库中,实现异构和分布式数据库的全局视图。 这样可以方便地访问数据。
  • 数据仓库的内容是通过复制和处理来自不同来源的数据创建的。
  • 大多数情况下,数据仓库是汇总运营关键数据并基于这些数据进行分析的基础,即所谓的联机分析处理 (OLAP)。
  • 数据仓库通常是数据挖掘的起点。
  • 应用程序通常与数据仓库(即所谓的数据集市)中的应用程序特定提取物一起工作

定义的差异首先可以在数据仓库的一般用途以及数据仓库中数据的范围和处理中找到。

  • 定义的范围从 Bill Inmon 的限制性观点开始:“数据仓库是一个面向主题的、集成的、按时间顺序排列的持久数据集合,以支持管理层的决策过程。”最初:“数据仓库是一个面向主题的、集成的、时变的、非易失的数据集合,以支持管理层的决策过程。
  • Bauer 和 Günzel 以及 Kimball 的以下定义限制较少,但针对特定目的,即分析功能:“数据仓库是一个物理数据库,代表(任意)数据的集成视图,以启用分析。” “数据仓库是专门为查询和报告而构建的交易数据的副本。”
  • 定义范围以 Zeh 的定义结尾,Zeh 对数据的范围和处理没有任何限制,也没有目的:“数据仓库是一个物理数据库,它支持底层数据源的集成视图。”

“物理”限制是区分数据仓库和“逻辑”联邦数据库系统所必需的。

操作(数据入库)

编辑

数据仓库的创建基于两个指导原则:

  • 集成来自分布式和不同结构数据库的数据,以实现源数据的全局视图,从而在数据仓库中进行综合评估。
  • 将用于运营业务的数据与数据仓库中用于报告、决策支持、业务分析、控制和公司管理等任务的数据分开。

数据仓库的数据采购、管理和评估的整个过程也称为数据仓库。 数据入库包括:

  • ETL 过程中的数据采购、数据集成(暂存)和进一步处理
  • 数据管理,即数据库中数据的长期存储(另见长期归档)
  • 数据评估与分析
  • 为分析、数据集市所需的独立数据库存提供和数据存储

在数据集市中,数据通常存储为所谓的星型模式或相关数据模式(如雪花和星系模式)中的多维矩阵。

数据仓库

近年来,数据仓库(实时数据仓库)从常规加载到实时加载的转变越来越多。 一些行业,如电信和零售,需要立即可用的数据,同时保持运营和分析系统的分离。 实时数据仓库还可以将结果直接反馈到操作系统中。 因此,数据仓库数据的分析结果反过来影响为数据仓库提供数据的操作系统(闭环)。

数据仓库应用

编辑
  • 整合来自不同结构和分布式数据库的数据,以实现源数据的全局视图,从而进行综合评估
  • 通过数据挖掘确定数据之间隐藏的关系
  • 快速灵活地提供报告、统计数据和关键数据,以便能够确定市场服务范围之间的联系
  • 有关业务对象和关系的全面信息
  • 业务流程、成本和资源使用的长期透明度
  • 提供信息,例如用于创建产品目录。

内容由匿名用户提供,本内容不代表vibaike.com立场,内容投诉举报请联系vibaike.com客服。如若转载,请注明出处:https://vibaike.com/361562/

(5)
词条目录
  1. 数据仓库
  2. 数据仓库任期
  3. 操作(数据入库)
  4. 数据仓库应用

轻触这里

关闭目录

目录