数据仓库与数据挖掘教程
2006年清华大学出版社出版的图书
《数据仓库与数据挖掘教程》是2006年清华大学出版社出版的图书,作者是陈文伟。本书是一部关于数据处理的高校教材,全书系统介绍数据仓库原理、联机分析处理、数据仓库设计与开发、数据仓库的决策支持应用,数据挖掘原理、信息论的决策树方法、集合论的粗糙集方法、关联规则、公式发现、神经网络、遗传算法、文本挖掘与web挖掘,以及数据仓库与数据挖掘的发展。
内容简介
数据仓库与数据挖掘都是从数据资源提取信息和知识进行辅助决策。由于数据资源丰富,数据仓库与数据挖掘辅助决策效果十分显著。本书对数据仓库的系统介绍,在于突出决策支持的本质。对数据挖掘的各类方法均介绍了它们的理论基础和实现方法,并通过例子进行了说明。
本书的特点是从数据仓库和数据挖掘的兴起与演变来说明它们的本质,通过实例来解释它们的原理,这样便于读者学习和掌握,适于本科生和研究生使用。
目录
第1章 数据仓库与数据挖掘概述
1.1 数据仓库的兴起
1.1.1 从数据库到数据仓库
1.1.2 从OLTP到OLAP
1.1.3 数据字典与元数据
1.1.4 数据仓库的定义与特点
1.2 数据挖掘的兴起
1.2.1 从机器学习到数据挖掘
1.2.2 数据挖掘的含义
1.2.3 数据挖掘与OLAP的比较
1.2.4 数据挖掘与统计学
1.3 数据仓库和数据挖掘的结合
1.3.1 数据仓库和数据挖掘的区别与联系
1.3.2 基于数据仓库的决策支持系统
1.3.3 数据仓库与商业智能
习题
第2章 数据仓库原理
2.1 数据仓库结构体系
2.1.1 数据仓库结构
2.1.2 数据集市及其结构
2.1.3 数据仓库系统结构
2.1.4 数据仓库的运行结构
2.2 数据仓库的数据模型
2.2.1 星型模型
2.2.2 雪花模型
2.2.3 星网模型
2.2.4 第三范式
2.3 数据抽取、转换和装载
2.3.1 数据抽取
2.3.2 数据转换
2.3.3 数据装载
2.3.4 ETL工具
2.4 元数据
2.4.1 元数据的重要性
2.4.2 关于数据源的元数据
2.4.3 关于数据模型的元数据
2.4.4 关于数据仓库映射的元数据
2.4.5 关于数据仓库使用的元数据
习题
3.1O LAP概念
3.1.1 OLAP的定义
3.1.2 OLAP准则
3.1.3 OLAP的基本概念
3.2 OLAP的数据模型
3.2.1 MOLAP数据模型
3.2.2 ROLAP数据模型
3.2.3 MOLAP与ROLAP的比较
3.2.4 HOLAP数据模型
3.3 多维数据的显示
3.3.1 多维数据的显示方法
3.3.2 多维类型结构
3.3.3 多维数据的分析视图
3.4 OLAP的多维数据分析
3.4.1 多维数据分析的基本操作
3.4.2 广义OLAP功能
3.4.3 多维数据分析实例
3.5 OLAP结构与分析工具
3.5.1 OLAP结构
3.5.2 OLAP的Web结构
3.5.3 OLAP工具及评价
习题
第4章 数据仓库设计与开发
第5章 数据仓库管理和应用
第6章 数据挖掘原理
第7章 信息论方法
第8章 集合论方法
第9章 公式发现
第10章 神经网络与遗传算法
第11章 文本挖掘与Web挖掘
第12章 数据仓库与数据挖掘的发展
参考文献
前言
数据仓库(data warehouse,DW)是利用数据资源提供决策支持。它比利用模型资源辅助决策更有效,而且辅助决策的范围更宽。由于在现实中,数据大量存在,而且在迅速地增长,只要将面向应用(事务驱动)的数据库重新组织转变为面向决策分析的数据仓库,就可以帮助决策者从不同的视角,通过综合数据分析掌握现状;通过多维数据分析发现各种存在的问题;通过对数据层次的钻取找出问题产生的原因;通过历史数据预测未来。由于数据仓库辅助决策效果明显,数据仓库已经从20世纪90年代中期兴起,经过几年的发展,迅速形成了潮流。. 数据挖掘(data mining,DM)是从数据中挖掘出信息和知识,是从人工智能的机器学习(machine..)
最新修订时间:2023-12-23 22:25
目录
概述
内容简介
目录
参考资料