贝叶斯推断(英语:Bayesian inference)是
推论统计的一种方法。这种方法使用
贝叶斯定理,在有更多
证据及
信息时,更新特定
假设的
概率。贝叶斯推断是
统计学(特别是
数理统计学)中很重要的技巧之一。贝叶斯更新(Bayesian updating)在
序列分析中格外的重要。贝叶斯推断应用在许多的领域中,包括
科学、
工程学、
哲学、
医学、
体育运动、
法律等。在
决策论的哲学中,贝叶斯推断和
主观概率有密切关系,常常称为
贝叶斯概率。
贝叶斯定理的简介
正式的介绍贝叶斯推断
贝叶斯推断将
后验概率(考虑相关证据或数据后,某一事件的条件机率)推导为二个
前件、
先验概率(考虑相关证据或数据前,某一事件不确定性的机率)及
似然函数(由
概率模型推导而得)的
结果。贝叶斯推断根据
贝叶斯定理计算后验概率:
其中
表示将某
事件成立作为条件(因此 表示“假定B成立的A”)
H表示假说,其机率可能会受
实验数据(以下会称为证据)影响。一般来说会有许多互相矛盾的假说,任务是要确认哪一个假说可能性最高。
E表示证据。证据对应新的数据,也就是还没用来计算先验概率的数据。
P(H),
先验概率,是观察到数据E(目前证据)之前,假说H的机率。
,
后验概率,是在给定证据 E之后,假说 H的机率,是希望求得的资讯,也就是在有目前证据时,假说H的机率。
是假定H成立时,观察到 E的机率。在H不变时,这是E的函数,也是
似然函数,指出在给定假设下假说和证据的相容程度。似然函数是证据E的函数,而后验概率是假说H的函数。
P(E)有时会称为边缘似然率。此系数对所有可能的假说都是定值,因此在判断不同假说的相对机率时,不会用到这个系数中。
非正式的介绍贝叶斯推断
贝叶斯推断最关键的点是可以利用贝叶斯定理结合新的证据及以前的先验机率,来得到新的机率(这和频率论推论相反,频率论推论只考虑证据,不考虑先验机率)。
而且贝叶斯推断可以迭代使用:在观察一些证据后得到的后设机率可以当作新的先验机率,再根据新的证据得到新的后设机率。因此贝叶斯定理可以应用在许多不同的证据上,不论这些证据是一起出现或是不同时出现都可以,这个程序称为贝叶斯更新(Bayesian updating)。
贝叶斯推断的描述
定义
是数据点分布的
参数,也就是说。这也有可能是参数形成的向量。
是参数的
超参数,也就是说。这也有可能是超参数形成的向量。
,由观测到的n个数据点组成的一组数据,
,需预测分布的新数据点。
贝叶斯推断
先验分布可能不容易确认,此时可以用杰佛里斯事前分配在更新较新的观测值时,先获得后验分布。
取样分布是以观测资料的条件,其参数的分布。这也称为
似然函数,尤其是视为是参数的函数时,有时会写成。
边缘似然率(有时也称为证据)是观测资料在参数上的
边缘分布。
后验分布是考虑观测资料后的参数分布。可以由贝斯法则确认,也是贝叶斯推断的核心:
若用文字表示,即为“后验和先验及似然率的乘积成正比”,有时也会写成“后验 = 先验 × 似然率,在有证据的情形下”。
应用
电脑应用
贝叶斯推断有在
人工智能及
专家系统上应用。自1950年代后期开始,贝叶斯推断技巧就是电脑模式识别技术中的基础。现在也越来越多将贝叶斯推断和以模拟为基础的
蒙地卡罗方法合并使用的应用,因为一些模杂的模型无法用贝叶斯分析得到解析解,因
图模式结构可以配合一些快速的模拟方式(例如
吉布斯抽样或是其他Metropolis–Hastings算法)。因为上述理由,贝叶斯推断在
系统发生学研究社群中来越受到重视,许多的应用可以用同时估测许多人口和进化参数。
历史
“贝叶斯”是指
托马斯·贝叶斯(1702–1761),他证明了一个特例(现在知道是
贝叶斯定理的特例),不过
皮埃尔-西蒙·拉普拉斯(1749–1827)推导了此定理的一般版本,应用在
天体力学、医疗统计学、
可靠度及
法学上。早期的贝叶斯推断是用拉普拉斯不充分理由原则所得的均匀先验,称为逆向机率(因为是由观测值倒推参数的
归纳推理,或是从结果倒推到原因)。在1920年代以后,逆向机率很大程度的被另一群称为频率论统计的方式取代。
二十世纪时,拉普拉斯的概念往下分支为二派,开始出现主观贝叶斯方法及客观贝叶斯方法。客观贝叶斯方法(或是不提供信息的贝叶斯方法)中,统计分析只依照假设的模型、分析的资料以及给定先验分布的方式(不同的客观贝叶斯方法会有不同给定先验分布的方式)。主观贝叶斯方法(或是提供信息的贝叶斯方法)中,先验的规格依信念(也是分析希望要呈现的主张)而定,信念可以由专家整理资讯后总结产生,也可以根据以往的研究等。
1980年代发现了
马尔科夫蒙特卡洛方法,让贝叶斯方法的研究及应用有大幅的发展,除去了许多运算上的问题,也有越来越多人愿意参与非标准的复杂问题。不过虽然贝叶斯方法的研究仍在成长,大部分大学本科的教学仍是以频率论统计为基础。不过贝叶斯方法也广为许多领域接受及应用,例如在
机器学习的领域中。