天天看点

无mi6大数据库挖掘7种业务场景的存储更优解分享

作者:大道至简91
无mi6大数据库挖掘7种业务场景的存储更优解分享

建立数据仓库的意义就是利用这些数据,最典型的应用就是数据挖掘。

下zaike呈:www.666xit.com/3855/

一、数据仓库概述

数据仓库是一种面向主题的、集成的、相对稳定的反映历史变化的数据集合。其中,

1)数据源是数据仓库系统的基础,是整个系统的数据源。

2) OLAP(联机分析处理)服务器有效整合数据,并按照多维模型进行组织;

3)前端工具和数据挖掘的应用

二、数据仓库的分类

从结构的角度来看,数据仓库可以分为三种模型:

1.企业仓库

对于企业级应用,收集企业各种主题的所有信息,提供企业范围的数据集成。它的数据通常来自多个操作数据库(即OLTP,我们的应用程序通常使用的数据库)和外部信息提供商,并且跨越多个功能领域。

企业通常包含明细数据和汇总数据,数据量可以达到TB级别。

2.数据集市

数据集市(Datamart)是企业范围内数据的子集,其范围仅限于选定的主题,针对企业部门和特定用户的应用。为什么叫集市?也许只是得到他们想要的。根据数据来源的不同,可以分为

1)依赖数据集市

数据来自中央数据仓库。为某些部门单独复制和处理一份数据,建立一个数据集市,可以提高部门的访问速度,满足他们特殊的分析需求。下属数据集市的数据与中心数据仓库一致,并经过处理和测试。

无mi6大数据库挖掘7种业务场景的存储更优解分享

2)独立的数据集市

数据直接来自业务系统。

独立数据集市的优点是可以快速建立并且成本低。然而,由于它们的独立性,可能很难集成到一个统一的中央数据仓库中,需要重新设计和部门协调。

无mi6大数据库挖掘7种业务场景的存储更优解分享

3.虚拟仓库

虚拟仓库是视图的集合。只定义来自各种操作数据库的查询,除了一些概要视图可能被具体化之外,不存储任何数据。

虚拟仓库很容易建立,但它会消耗运营数据库服务器的资源,要求它们有多余的工作能力。

继续阅读