MARS 模型是由 Jerome H. Friedman 于 1991 年提出的。是一种泛化能力很强的专门针对高维数据的回归方法,该回归方法以
样条函数的张量积作为基函数,而基函数的确定和基函数的个数都由数据自动完成,不需要人工选定。
MARS 方法是由 Jerome H. Friedman 于 1991 年提出的。该方法以样条函数的张量积作为基函数,而且基函数生成过程完全不需要人工操作,所以相比于其他方法,MARS 不仅具有很强的自适应性,而且对模型预测的精度也比较高。在多维情况下,由于样本空间的扩张,怎样划分空间就成为至关重要的问题。MARS 就是一种泛化能力很强的专门针对高维数据的回归方法。该回归方法以样条函数的张量积作为基函数,而基函数的确定(张积变量的个数以及变量的分割点)和基函数的个数都由数据自动完成,不需要人工选定。MARS模型很好的解决了这个问题,具备了很多响应面模型所不具备的多维大样本数据处理优势。
MARS 综合了投影追踪法和递归分区法的优点,并引入了样条作为基函数。该方法并不要求空间划分是不相交的,只要它们的并集能覆盖整个取值空间即可,每个小的划分区域对应一个系数,输入变量 x*落入区域对应系数与其基函数乘积的线性和就是它的预测值,这样可得到连续的函数估值,而且对于只有少数几个变量具有交互作用的情形,该方法具有更大的弹性。重要的是,该方法容易确定各个变量的累加贡献和多个不同变量的交互作用。