逻辑模型,是指数据的
逻辑结构。
逻辑建模是
数据仓库实施中的重要一环,因为它能
直接反映出
业务部门的需求,同时对系统的物理实施有着重要的指导作用,它的作用在于可以通过实体和关系勾勒出企业的数据蓝图。
逻辑模型中
层次模型和
网状模型是早的
数据模型,统称为非
关系模型。20世纪70年代至80年代初,非关系模型的
数据库系统非常流行,在数据库系统产品占据了
主导地位,已逐渐被关系模型的数据库系统取代,但在美国等地,由于早期开发的
应用系统都是基于层次或
网状数据库系统,因此
层次数据库或网状数据库的系统仍很多。
20世纪80年代以来,面向对象的方法和技术在计算机各个领域,包括
程序设计语言,
软件工程、计算机硬件等各方面都产生了深远的影响,出现了一种新的模型——面对对象的数据模型。
这3种逻辑模型的根本区别在于数据结构不同,即数据之间联系的
表达方式不同,层次模型用“
树结构”来表示数据之间的联系;网状模型是用“图结构”来表示数据之间的联系;关系模型是用“
二维表”来表示数据之间的联系。
数据操作是指对数据库中各种对象的实例或取值所允许执行操作的集合,其中包括操作方法及有关规则,它是对数据库
动态特性的描述。
完全性约束是指对数据的一组完整性规则(
约束条件)的集合。逻辑逻辑应该反映和和规定本数据模型必须遵守的基本的通用的完整性约束条件。例如,在关系模型中,任何关系都必须满足
实体完整性和
参照完整性两个条件。此外,逻辑模型还应该提供用户定义完整性约束条件的机制,以反映具体应用所涉及的数据必须遵守的特定的语义约束条件。
在概念模型设计中,我们确定了几个基本的主题域,但是,
数据仓库的设计方法是一个
逐步求精的过程,在进行设计时,一般是一次一个主题或一次若干个主题地逐步完成的。所以,我们必须对概念
模型设计步骤中确定的几个
基本主题域进行分析,一并选择首先要实施的主题域。选择第一个主题域所要考虑的是它要足够大,以便使得该主题域能建设成为一个可应用的系统;它还要足够小,以便于开发和较快地实施。
数据仓库
逻辑设计中要解决的一个重要问题是决定数据仓库的粒度划分层次,粒度层次划分适当与否直接影响到数据仓库中的数据量和所适合的查询类型。由于
主题数据库响应企业级业务
OLTP需求,所以必须保存最细类度数据,同时根据
业务部门的查询需求考虑确定多重粒度来提高复杂查询速度。
在这一步里,要选择适当的
数据分割的标准,一般要考虑以下几方面因素:数据量(而非记录行数)、
数据分析处理的实际情况、简单易行以及粒度划分策略等。其中,数据量的大小是决定是否进行数据分割和如何分割的主要因素;数据分析处理的要求是选择数据分割标准的一个主要依据,因为数据分割是跟数据分析处理的对象紧密联系的。
数据仓库的每个主题都是由多个表来实现的,这些表之间依靠主题的公共码键联系在一起,形成一个完整的主题。在概念模型设计时,我们就确定了数据仓库的基本主题,并对每个主题的公共码键、基本内容等做了描述。在这一步里,我们将要对选定的当前实施的主题进行模式划分,形成多个表,并确定各个表的
关系模式。