1951年,H.罗宾斯和S.门罗首先研究了此问题的一种形式:设因素x的值可由试验者控制,x的“响应”的指标值为Y ,当取x之值x进行试验时,响应Y可表为Y=h(x)+ε ,式中h(x) 为一未知函数, ε 为随机误差。
设目标值为A ,要找这样的x ,使h(x)=A。分别以Y-A和h(x)-A代替Y和h(x) 。不妨设A=0 ,问题就在于找方程h(x)=0 的根x。例如若x为施药量,Y为衡量
药物反应的某种生理指标,则问题在于找出施药量x ,以使该生理指标控制于适当的值A。
的解,式中 E 表示对εt求数学期望,但并不知道的分布,函数的确切形式也可能是未知的,然而,对任何选定的 x 值,都能得到(或观测到)的值。例如,观测值为,要求从观测值估计出参数 x,则取随机逼近算法
在有的问题中,要找到的不是 h(x) 的零点,而是 的极值点,它满足这时观测到的仍是,而不是,故上述算法已不能用于逼近。基弗 (Kiefer,J.C.) 和维尔弗维茨 (Wolfowitz,J.) 给出求极值的逼近算法
1951年以来,随机逼近的研究已取得了很大的进展。在
理论上,讨论了量测误差不独立的情形和带约束条件的情形,以及h(x) 具有更一般性质的情形。也考虑了时间连续时的算法和修正系数bj 的选择,并对算法的渐近性质作了深入的研究。在方法上,也从纯概率发展到结合使用微分方程等工具。
从罗宾斯、门罗以来,随机逼近的研究进一步取得了很大进展。讨论了观测误差不独立的情况和带约束条件的情况,以及 h(x) 具有更一般性质的情形,并且把概率的方法结合使用了微分方程等工具。随机逼近在
最优化问题、系统辨识、适应控制器等方面都有应用。