Quantcast
Channel: CSDN博客推荐文章
Viewing all articles
Browse latest Browse all 35570

数据仓库(五):概念建模与概念设计

$
0
0

数据仓库设计包括3个主要阶段:概念设计、逻辑设计、物理设计。3中不同的设计场景:数据驱动的场景、需求驱动的场景、混合场景。

目前普遍认可数据集市基于数据的多维视图,但是对于如何根据用户的需求实现其概念设计仍然没有统一的看法。实体-关系模型(ERM)是面向遵循数据间的关联而非汇总数据的查询的,因而不适用于数据集市。ERM实际上具有足够的表达力来表示数据集市建模必需的大多数概念。然而,基本ERM不足以准确地突出多维模型的显著特征。

许多情况下,设计人员将逻辑层次(数据仓库设计分为概念层次、逻辑层次、物理层次)作为数据集市设计的基础——即,直接定义星型模式,这是关系型系统中的多维模型的标准实现。数据仓库设计若从设计星型模式开始(跳过概念设计阶段)相当于关系数据库设计跳过实体-关系模式的设计,在没有任何静态、动态或概念模式的前提下从编码阶段开始创建一个复杂的系统。

因此,产生了许多多维建模的方法。可分为概念层和逻辑层。其中概念层模型又可分为基于ERM的(如Franconi等人1999年提出的模型),基于UML的(如Luján Mora等人2006年提出的模型),即席的(如Hüsemann等人2000年提出的模型,维度事实模型)三种。

维度事实模型(Dimensional Fact Model,DFM)由Golfarelli、Maio和Rizzi在1998年提出,经过不断完善达到最适用于在实际项目中可能遇到的各种建模情况。DFM是专门支持数据集市设计的一种概念模型。它实际上是一种图形,基于多维模型。DFM的目标是:

  • 提供对概念设计的有效支持;
  • 创建一种环境,在其中可以直观地构造用户查询;
  • 使设计人员和终端用户直接交流成为可能,目标是构造需求规范;
  • 为逻辑设计构建一个稳定平台;
  • 提供清晰、富有表达力的设计文档。

DFM生成的概念表示由一组事实模式组成。事实模式主要对事实、度量、维度和层次结构进行建模。事实具有动态性,随时间变化。度量是事实的一个数值特征,描述事实与分析相关的一个量化方面,通常是数值。维度是范围有限的事实属性,描述事实的分析坐标。层次结构是一棵有向树。有向树中,只有一条有向路径将树根连接到其他每个子孙节点。


参考资料:

《数据仓库设计:现代原理与方法》

作者:kingzone_2008 发表于2013-5-10 23:06:46 原文链接
阅读:54 评论:0 查看评论

Viewing all articles
Browse latest Browse all 35570

Trending Articles



<script src="https://jsc.adskeeper.com/r/s/rssing.com.1596347.js" async> </script>