随机逼近
一种参数的估计方法
随机逼近是一种参数的估计方法。它是在有随机误差干扰的情况时,用逐步逼近的方式估计参数的方法。
简介
随机逼近是一种参数的估计方法。它是在有随机误差干扰的情况时,用逐步逼近的方式估计参数的方法。
1951年,H.罗宾斯和S.门罗首先研究了此问题的一种形式:设因素x的值可由试验者控制,x的“响应”的指标值为Y ,当取x之值x进行试验时,响应Y可表为Y=h(x)+ε ,式中h(x) 为一未知函数, ε 为随机误差。
设目标值为A ,要找这样的x ,使h(x)=A。分别以Y-A和h(x)-A代替Y和h(x) 。不妨设A=0 ,问题就在于找方程h(x)=0 的根x。例如若x为施药量,Y为衡量药物反应的某种生理指标,则问题在于找出施药量x ,以使该生理指标控制于适当的值A。
典型问题
典型的随机逼近问题可描述为:
令 是同分布的随机序列,已知εt 和 x 的某一函数,欲求
的解,式中 E 表示对εt求数学期望,但并不知道的分布,函数的确切形式也可能是未知的,然而,对任何选定的 x 值,都能得到(或观测到)的值。例如,观测值为,要求从观测值估计出参数 x,则取随机逼近算法
式中数列
1951年,罗宾斯(Robbins,H.) 和门罗(Monro,S.) 对加了一定条件后证明
这时随机逼近的奠基工作。
在有的问题中,要找到的不是 h(x) 的零点,而是 的极值点,它满足这时观测到的仍是,而不是,故上述算法已不能用于逼近。基弗 (Kiefer,J.C.) 和维尔弗维茨 (Wolfowitz,J.) 给出求极值的逼近算法
数列 at 满足上述同样条件则可逼近极值点。
深入的研究
1951年以来,随机逼近的研究已取得了很大的进展。在理论上,讨论了量测误差不独立的情形和带约束条件的情形,以及h(x) 具有更一般性质的情形。也考虑了时间连续时的算法和修正系数bj 的选择,并对算法的渐近性质作了深入的研究。在方法上,也从纯概率发展到结合使用微分方程等工具。
从罗宾斯、门罗以来,随机逼近的研究进一步取得了很大进展。讨论了观测误差不独立的情况和带约束条件的情况,以及 h(x) 具有更一般性质的情形,并且把概率的方法结合使用了微分方程等工具。随机逼近在最优化问题、系统辨识、适应控制器等方面都有应用。
参考资料
最新修订时间:2023-01-05 07:34
目录
概述
简介
典型问题
参考资料