均方根差(root mean square error,缩写
RMSE),也称为方均根偏移(root-mean-square deviation,缩写
RMSD),是一种常用的测量数值之间差异的
量度。
定义
作为一种常用的测量数值之间差异的
量度,均方根差的数值常为模型预测的量或是被观察到的
估计量。方均根偏移代表预测的值和观察到的值之差的
样本标准差,当这些差值是以资料样本来估计时,他们通常被称为
残差;当这些差值不以样本来计算时,通常被称为
预测误差。方均根偏移主要用来聚集预测里头
误差的大小,通常是在不同的时间下,以一个量值来表现其预测的能力。方均根偏移是一个好的准度的量度,但因其与数值范围有关,因此被限制只能用来比较不同模型间某个特定变数的预知误差。
方程式
方均根差的估计子 对应到被估计的参数 被定义为其均平方差的平方根
对一个
无偏估计量(unbiased estimator)来说,均方根差是变异数的平方根,也就是我们所称的
标准差(standard deviation)。
均方根差的预测值 对时间t的回归应变项 是以n个不同的预测来做为其均方差的
平方根:
和 时,方均根的式子会变成
正规化的均方根差
正规化的均方根差(NRMSD)可以使得不同数值范围的资料集更易于比较。虽然并没有一个一致性的方法来正规化方均根差,但较常用平均值或是资料的范围来正规化被量测的资料。
这个值常被用来指正规化的方均根偏移或误差,同时也常常被表示成比例。当比例的值较低时,代表较少的残差变异。在很多情况下,特别是取较小的样本的时候,样本的范围容易被样本的大小影响,其准确度可能就受到影响。
当以平均值来正规化量测值时,方均根差的变异系数(coefficient of variation,缩写CV)可能被用来避免混淆。这和方均根差在标准差上的变异系数是相同的。
应用
1.在天气学上,可用来评估一个数值模型可以多好的预测大气层的行为。
2.在
生物资讯学中,方均根差被用来量测重叠蛋白质分子间的距离。
3.在结构药物设计中,方均根差被用来测量配体的晶格构造以及对接预测(docking prediction)。
4.在经济学中,方均根差被用来觉得一个模型是否符合经济指标(economic indicators)。部分专家曾提出方均根差比相对
绝对误差(relative absolute error)来的不可靠。
5.在实验心理学中,分均根差被用来指示一个数学或计算行为模型(mathematical or computational models)能解释实际观察行为的良好程度。
6.在地理资讯系统中(GIS),方均根差是一种用来量测空间分析和远距侦测的量度。
7.在水文地质学中,方均根差和正规化方均根差被用来评估地下水模型的刻度。
8.在影像科学中,方均根差是一种峰值讯噪比,是一种用来检视一个方法能多好的去重建原来的影像。
9.在计算神经科学中,方均根差被用来检视一个系统能学习一个给定模型的能力。
10.在蛋白质核磁共振光谱学中,方均根差被用来当作一个评估结构品质的量度。