发布日期:2013-11-29 10:34 来源: 标签: 数据 仓库 主要 元素
数据仓库的多维数据集
       4. 多维数据集
       多维数据集是一种多维数据结构,可用于查询业务信息。多维数据集一般是基于事实数据和维度构建的。一个多维数据集可能会包含来自一个或多个事实表的事实数据,通常还会包含少量的维度。通常情况下,任何给定的多维数据集都有一个关联的主要分析主题。例如,可以构建一个Sales多维数据集,用于按地区分析销售情况,也可以构建一个Call Processing 多维数据集,用于按报告的问题类别分析通话时间长度。可以将这些多维数据集提供给你的用户,以供其进行分析。
        图1-5 显示的是基于前面给出的事实表数据创建的Beer Sales 多维数据集。我们可以注意到,该多维数据集的正面显示的是一些数字。该多维数据集具有3 个维度:Time、Product Line以及销售产品所在的State。多维数据集的每一块称为一个单元,通过每个维度中的一个成员唯一标识。例如,分析位于左下角的单元,该单元包含4 784 和$98 399 两个值。这两个值分别表示销售量和销售额。该单元表示的是Ale 类型的啤酒2011 年7 月份在华盛顿(WA)州的销售情况。该单元可表示为[WA, Ale, Jul '11]。请注意,其中一些单元不包含任何值,这是因为事实表中没有可用于这些单元的事实。
        构建这些多维数据集的主要目的是降低查询响应时间,以便信息工作者可以快速地从数据中提取出所需的知识信息。为了实现这一目的,通常情况下,多维数据集会包含预先计算好的汇总数据,称为聚合。与在没有预先计算好的汇总数据的情况下执行冷(无缓存)查询相比,查询现有的已聚合数据可以说是瞬时完成。实际上,这就是BI 的核心所在,即能够查询背后包含数GB 甚至数TB预先汇总好的数据的数据,而且能够在短时间内从服务器获得响应。当你认识到自己实现了这一目标时,那会是多么的令人兴奋啊!
        现在,你已经了解了多维数据集如何提供用于存储多维数据的基础架构。实际上,多维数据集并不仅仅存储来自事实表的多维数据,它还存储这些数据的聚合。典型的聚合应该是某个维度的某个层次结构上所有值的汇总。相关示例包括汇总从商店级别到行政区级别再到地区级别的所有销售数据;针对这些数字进行查询时,会在短时间内获得响应,因为在构成聚合时已经完成了计算。事实数据并不是一定要聚合为特定事实数据的汇总。可以使用其他数据聚合方式,例如计算售出的产品数量。再次强调一下,通常情况下,该计数会汇总某一维度的所有层次结构上的数据。
       5. 星型架构
       与OLAP(多维)数据库相比,关系数据库的实体关系图表示形式所显示的内容完全不同。不同之处在于,对于用于构建OLAP 数据库的架构类型,提供了一个名称:星型架构和雪花型架构。其中,后者是在前者基础上经过大量的变形得到的。主要区别在于架构的复杂程度,OLTP架构一般都会比OLAP 架构复杂得多。到目前为止,你已经了解了构成事实表、维度表和多维数据集的基础架构,理解星型架构的概念应该不存在什么难度。这是因为,在配置与维度表的一个或多个主键具有外键关系的事实表(如图1-6 所示)时,已经使用了星型架构。之所以将这种类型的架构称为“星型架构”,主要是因为会看到许多维度表(就像星型的各个角点)联接到一个中心事实表(即星型的主体)。


       星型架构通过一种清晰明了且易于理解的方式阐明了各个业务实体之间的关系。此外,它还使得可以以惊人的速度对事实表中的度量值进行数字处理。
       6. 雪花型架构
       你可能会认为星型架构已经相当出色了(事实上也确实如此),实际上还有一个在此概念基础上进行的扩展,称为雪花型架构。当你开始感觉到某个维度表看起来与其所连接到的事实表一样错综复杂时,雪花型架构便可以派上用场了。使用雪花型架构,一个或多个级别将从某个维度表中分离出来,这样它们通过一个或多个表与事实表分隔开来。在图1-7 中,Product 维度联接到某个ProductSub Category 级别。因此,Product Sub Category 级别是从Sales Fact 表删除的一个表。而Product SubCategory 级别又联接到一个称为Product Category 的最终级别(在该级别与Sales Fact 表之间有两个表将其分隔开来)。这些级别可以用于构成维度中的一个层次结构,它们不会提高处理速度,也不会缩短查询响应时间,但它们可以使一个复杂的架构让人更容易理解。

       到现在为止,你已经了解了数据仓库的各种基本元素。最大的挑战在于如何充分理解这些元素,设计并实现你自己的数据仓库以满足最终用户的需求。有两种主要的设计技术用于实现数据仓库:Inmon 方法和Kimball 方法。
 

相关评论

专题信息
    SQL Server 2012附带了强大的Analysis Services新功能,可使商业智能得到显著增强。本书由Microsoft产品团队的主要成员编写,介绍了如何应用这些新功能来创建复杂的BI解决方案。为了实现这一目的,你将在本书中了解到如何使用SQL Server Analysis Services设计、构建和处理多维和表格商业智能语义模型(BISM)。