结构学习
结构学习
结构学习是指贝叶斯网络结构学习
定义
结构学习是指贝叶斯网络结构学习。贝叶斯网络中涉及到两种学习问题:结构学习和参数学习。
贝叶斯网络(Bayesiannetworks,BN)是概率论与图论结合的产物,已经成为处理不确定性问题的有效工具。
贝叶斯网络结构学习一般贝叶斯网络的构建是首先由相关领域的专家根据事物间的关系来确定出结构模型,即有向无环图,然后再利用其它方法确定每个节点的条件概率,但这样构建的网络模型无法保证其客观性和可靠性。因此,研究人员尝试引入客观的观测数据,希望通过将观测数据与专家知识相结合来共同构建贝叶斯网络,并进一步在没有专家先验知识的情况下,尝试完全从观测数据中学习得到网络结构和参数。其中网络结构的学习不但是整个学习过程的基础,并且是一个NP难题,因此更吸引了大量研究人员的注意。研究人员借鉴统计学领域对多变量联合概率分布近似分解的方法,从多个角度对该问题进行研究,形成了基于独立性检验和基于评价与搜索的两大类算法。在一系列假设下,研究人员通过将先验信息与观测数据相结合,实现了多种网络结构模型的学习算法,进而提出了在没有任何先验信息情况下的相应算法。最近的研究开始减弱甚至放弃某些假设,从更一般意义下研究网络结构的学习。因果贝叶斯网络结构模型的学习有时也称为因果发现或因果挖掘。这是因为数据的处理所获得的结构模型反映了事物间因果关系的知识。从广义的角度讲,因果数据挖掘可以认为是从数据中发现有关因果性知识的过程。
分类
贝叶斯网络结构学习分为完备数据和不完备数据两种情况。完备数据下贝叶斯网络结构学习的方法通常分为三类:基于依赖统计分析的方法;基于评分搜索的方法;结合上述两种方法的混合搜索算法。不完备数据下的贝叶斯网络结构学习算法需要对数据进行修补,然后再对贝叶斯网络进行结构学习。
一般地,贝叶斯网络结构学习的方法可以分为两大类:基于独立性测试的方法;基于评分搜索的方法。基于评分搜索的方法包括2个要素,即评分标准和搜索策略。由于贝叶斯网络结构学习是一个NP难问题,因此基于评分搜索的贝叶斯网络结构学习方法中的搜索算法一般采用启发式搜索算法。国内外的学者提出了许多基于评分搜索的方法,例如Cooper等1992年提出了K2算法。Chickering在2002年提出贪婪算法(greedysearch,GS)。李显杰等在2008年将量子遗传算法用于贝叶斯网络结构学习,取得较好的效果,但该方法编码方式较复杂。高晓利在2011年提出了一种改进的学习贝叶斯结构的贪婪算法,该算法结合了条件独立性测试方法,当节点个数增大时,条件独立性测试呈指数增长,这种方法适合节点较少的网络结构。人工蜂群(artificialbeecolony,ABC)算法是Dkaraboga 2005年提出的一种群体智能优化算法。该算法结构简单、参数较少、易于实现,受到了众多学者的关注和研究,并成功应用于函数优化、神经网络训练、控制工程等问题。
应用
空间决策支持系统中贝叶斯网的应用
GIS的应用越来越广泛,应用GIS的主要目的是为了支持高层管理和决策的需要,空间数据质量的可靠性是GIS中一个关键的特性,因为质量差的数据导致效果差的决策。错误的决策会带来严重的后果。因此空间数据的不确定性和质量控制是GIS系统中一个重要的研究课题。空间数据的不确定性来自多种原因,如对现实问题的理解和建模,数据的编码、编辑、变化、处理、分析和输出过程都可能导致空间数据具有不确定性的特征。空间数据的不确定性包括空间位置不确定性、拓扑关系的不确定性、属性的不确定性和时间不确定性。同样,贝叶斯网的概率推理可用在GIS中评估决策制订的风险情况,以保障空间决策的正确性和可靠性。
贝叶斯网在数据挖掘中的应用
用贝叶斯网找出数据之间潜在的关系,正是数据挖掘所需要完成的功能。但是利用贝叶斯网进行数据挖掘,主要问题是先验知识的重要性。由于不可能对所有的网络结构进行计算,特别是当变量增多时,可能的网络结构成倍增加,因此必须在现有的知识下进行网络选择,这在很大程度上依赖于专家知识。用于数据挖掘的贝叶斯网方法主要有以下几个特点:(1)贝叶斯网可以处理不完整和带有噪声的数据集。它用概率测度的权重来描述数据间的相关性,从而解决了数据间的不一致,甚至是相互对立的问题。(2)贝叶斯网用图形的方法描述数据间的相互关系,语义清晰,可理解性强,这将有助于利用数据间的因果关系来进行预测分析。(3)由于贝叶斯网具有因果和概率性语义,它有助于先验知识和概率的结合,容易与优化决策方法相结合。
其他应用
微软公司研制的MSBN是一个偏爱预测(preferenceprediction)系统。它可以通过调查众多观众对不同电视节目的收视情况,更合理地安排电视节目以提高收视率,及插播广告以加强广告的宣传效果。系统用多种搜索方法同时学习网络结构和参数,但是对概率分布有分布家族限制。贝叶斯网在工业诊断中的应用要相对简单得多,尤其用在故障诊断问题中。如常见的由微软和惠普公司开发的用于打印机故障处理的问题解答系统,即采用贝叶斯网技术作为技术支持,一些惠普系统甚至提供在线打印支持。
最新修订时间:2022-08-25 16:05
目录
概述
定义
参考资料