数据仓库是用于结构化和半结构化数据的商业智能分析和报告的企业系统。
随着我们周围的几乎所有事物都成为数据源,事实证明,传统数据仓库要支持如此快速变化的海量数据是一个相当大的挑战。那么,数据仓库是否已经成为过去式了呢?
来自各种来源的大量数据集合称为数据仓库。最初创建数据仓库是为了存储组织的信息。此信息指的是有关组织的销售、采购、客户、员工等的数据。随着存储和检索这些数据成为一项乏味的任务,对数据仓库的需求就出现了。
数据仓库的优点是什么?
数据仓库具有各种独有的功能。数据仓库最突出的四个特点是:
1、结构化信息存储
以结构化方式存储的信息。这意味着这里存储的数据是根据其来源划分的,并存储在各自的数据集市中。如果有数据必须添加到销售中,则该信息将进入已在数据仓库中创建的销售数据集市。数据仓库中没有杂乱的数据输入。
2、集成数据
数据集成是数据仓库的主要功能之一。数据的集成存储意味着来自多个来源的数据一起存储在数据仓库中。
3、非易失性
存储在数据仓库中的数据是非易失性的,因为存储在数据仓库中的信息无法编辑。一旦将信息插入到数据仓库中,就只能对其进行更新或完全删除。
4、时变性
存储在数据仓库中的信息无法编辑,因此可以在数据仓库中长期存储。如果一个组织想要评估为什么销售额在过去一年中下降,而在两年前的销售额却是不可计数的,这可以通过参考存储在数据库中的信息来参考其当时使用的策略。
数据仓库的缺点是什么?
随着时间的推移,组织已经意识到数据仓库的局限性。以下是其的三个缺点:
1、数据是刚性的
由于信息以指定的文件格式存储,因此要在数据仓库中使用数据,必须将其更改为该文件格式。这导致了数据仓库无法存储混合文件格式的数据的缺点。
2、维护成本高
每当小型组织获得大型IT项目时,就需要高维护系统。这些高维护系统需要财政资源。这会导致组织花费更多的资源而不是从中获利。
3、无法存储大量数据
无法存储大量数据被认为是数据仓库的主要缺点之一。这导致了大数据没有数据仓库的支持。
我们如何才能超越数据仓库的限制?
数据仓库无法存储不同文件格式和海量数据的信息,导致了统一信息架构的创新。使用这种架构,组织可以存储各种文件格式的信息,并且数据是易变的。这种数据库还可以存储以前存储在数据仓库中的信息。
有许多组织仍然在使用数据仓库,然而,那些正在处理大数据的组织已经转向了更好的版本。可以得出这样的结论:数据仓库永远不会成为过去,因为数据存储的新技术将成为数据仓库最初用途的基础。
此文内容来自千家网,如涉及作品内容、版权和其它问题,请于联系工作人员,我们将在第一时间和您对接删除处理!