地统计学的主要理论是统计学家马特龙创立的,经过不断完善和改进,目前已成为具有坚实理论基础和实用价值的数学工具。地统计学的应用范围十分广泛,不仅可以研究空间分布数据的结构性和随机性、空间相关性和依赖性、
空间格局与变异,还可以对空间数据进行最优无偏内插,以及模拟空间数据的离散性及波动性。地统计学由分析空间变异与结构的变异函数及其参数和空间局部估计的克里金插值法两个主要部分组成,目前已在
地球物理、
地质、
生态、
土壤等领域应用。它针对像矿产、资源、生物群落、地貌等有着特定的地域分布特征而发展的统计学。由于最先在地学领域应用,故称为地统计学。地统计学的主要理论是
法国统计学家G.Matheron 创立的,经过不断完善和改进,目前已成为具有坚实理论基础和实用价值的数学工具。
地统计学的应用范围十分广泛,不仅可以研究空间分布数据的结构性和
随机性、空间相关性和
依赖性、空间格局与变异,还可以对空间数据进行最优无偏内插,以及模拟空间数据的离散性及波动性。地统计学由分析空间变异与结构的
变异函数及其参数和空间局部估计的Kriging(克里格)
插值法两个主要部分组成,目前已在地球物理、地质、生态、土壤等领域应用。气象领域的应用目前还不多见,主要使用Kriging法进行降水、温度等要素的最优内插的研究及气候对农业影响方面的研究。
模拟在广义上是指使用模型复制现实的过程。在地统计中,模拟是
随机函数(表面)的实现,其与生成该模拟的样本数据拥有相同的地统计要素(使用均值、方差和
半变异函数来度量)。更具体地说,高斯地统计模拟 (
GGS) 适用于
连续数据,并假设数据或数据的变换具有正态(高斯)分布。GGS 所依托的主要假设是数据是静态的 - 均值、方差和空间结构(半变异函数)在数据空间域上不发生改变。GGS 的另一个主要假设是建模的随机函数为多元高斯随机函数。
同
克里金法相比,GGS具有优势。由于克里金法是基于数据的局部平均值的,因此,其可生成平滑的输出。另一方面,GGS生成的局部变异性的制图表达比较好,因为 GGS 将克里金法中丢失的局部变异性重新添加到了其生成的表面中。对于由GGS实现添加到特定位置的预测值中的变异性,其平均值为零。这样,很多GGS实现的平均值会趋向于克里金预测。各种实现以一组堆叠输出图层的形式表示出来,并且特定坐标位置的值服从
高斯分布,其平均值等于该位置的克里金估计值,而扩散程度则由该位置上的克里金法方差给出。
对 GGS 的使用在地统计实际操作中日益呈现出一种趋势,它不是追求获得每个未采样位置的最佳无偏预测结果(正如克里金法所体现的),而是强调对决策分析和风险分析的不确定性的特证描述,这样更适合于呈现数据中的全局趋势 (Deutsch and Journel 1998, Goovaerts 1997)。模拟还会克服克里金估计值中的条件偏差带来的问题(高值区域预测值通常偏低,而低值区域预测值通常偏高)。
对于所研究属性的空间分布,地统计模拟可为其生成多个具有同等可能性的制图表达。可基于这些制图表达来测量未采样位置的不确定性,这些未采样位置在空间上被一起选取,而不是逐个被选取(如同通过克里金法方差进行测量一样)。此外,克里金法方差通常独立于数据值,且通常不能用作估计精度的测量值。另一方面,可以通过使用多个模拟实现(该实现用呈正态分布的输入数据通过简单克里金模型进行构建,即,数据呈正态分布或已使用常态得分变换或其他类型的变换对数据进行了变换)为未采样位置的估计值构建分布来测量估计精度。对于使用估计数据值的风险评估和决策分析而言,这些不确定性的分布很关键。
GGS假设数据呈正态分布,但在实际中,很少会出现这种情况。对数据执行常态得分变换,使得数据符合
标准正态分布(均值=0,方差=1)。然后对此正态分布数据进行模拟,并对结果做反向变换,以便以原始单位获得模拟输出。对正态分布数据使用简单克里金法时,该克里金法所提供的克里金估计值和方差可完全定义研究区域中每个位置的条件分布。这样,您可以在只知道每个位置的这两个参数的情况下绘制随机函数(未知采样表面)的模拟实现,这也是GGS 基于简单克里金模型和正态分布数据的原因。
1、条件模拟遵循数据值(除非克里金模型中包含
测量误差)。由于模拟会在格网像元中心生成值,因此,如果此值与采样点的位置不完全对应,则采样位置的测量值与模拟值可能会不同。条件模拟也将以平均方式(即,在很多实现上平均)复制数据的均值、方差和半变异函数。模拟表面看起来很像克里金
预测地图,但其将显示更多的空间变异性。
2、非条件模拟不遵循数据值,但会以平均方式复制数据的均值、方差和半变异函数。模拟表面所显示的空间结构类似于克里金地图,但输入数据中存在高值或低值的地方不一定会出现高值和低值。