《数据仓库与数据挖掘教程》是2006年
清华大学出版社出版的图书,作者是陈文伟。本书是一部关于数据处理的高校教材,全书系统介绍数据仓库原理、
联机分析处理、数据仓库设计与开发、数据仓库的决策支持应用,数据挖掘原理、信息论的决策树方法、集合论的粗糙集方法、关联规则、公式发现、神经网络、遗传算法、文本挖掘与web挖掘,以及数据仓库与数据挖掘的发展。
数据仓库与数据挖掘都是从数据资源提取信息和知识进行辅助决策。由于数据资源丰富,数据仓库与数据挖掘辅助决策效果十分显著。本书对数据仓库的系统介绍,在于突出决策支持的本质。对数据挖掘的各类方法均介绍了它们的理论基础和实现方法,并通过例子进行了说明。
数据仓库(data warehouse,DW)是利用数据资源提供决策支持。它比利用模型资源辅助决策更有效,而且辅助决策的范围更宽。由于在现实中,数据大量存在,而且在迅速地增长,只要将面向应用(事务驱动)的数据库重新组织转变为面向决策分析的数据仓库,就可以帮助决策者从不同的视角,通过综合数据分析掌握现状;通过多维数据分析发现各种存在的问题;通过对数据层次的钻取找出问题产生的原因;通过历史数据预测未来。由于数据仓库辅助决策效果明显,数据仓库已经从20世纪90年代中期兴起,经过几年的发展,迅速形成了潮流。. 数据挖掘(data mining,DM)是从数据中挖掘出信息和知识,是从人工智能的机器学习(machine..)