多维标度法是一类
多元统计分析方法的总称,它包含各种各样的模型和手段,其目的是通过多种途径把多维的研究对象转化成低维情形进行研究。具体地说多维标度法它是以多维研究对象之间某种亲近关系为依据(如距离、相似系数、亲疏程度等),从它们所给出的信息出发合理地将几个多维研究对象在近似的定义下,从多维约简到一个较低维的空间内,并寻求一个最佳的空间维数和空间位置(如二维和三维),从而尽可能的揭示原始研究对象的真实结构关系。
发展沿革
多维标度法(MDS)是著名计量心理学家谢泼德(Shephard)和克鲁斯克(Kruskal)分别于1962年和1964年发展起来的一种计量心理学技术。多维标度法是基于研究对象之间的相似性将研究对象在一个低维的(一般小于等于二维)的空间形象地表示出来,进行聚类或维度内含分析的一种图示法。说得详细一点,MDS是这样一种方法:在Ⅳ个物品中已知它们的相似度(或距离),要寻找一个低维空间表示,使物品间的亲近(Droximitv)关系能和原来的相似度有一个近似的匹配。这个匹配的数量近似,可以用一个称为克鲁斯克系数“Stress”的指标来表达。多年来多维标度法所涉及的研究对象甚广。
1970---1972年格林(Green)及其同僚将多维标度法应用于市场研究方面,主要研究消费者的态度,衡量消费者的感觉和偏好。运用多维标度法将消费者对各种品牌产品的偏好和感觉资料,变换成空间坐标图。用坐标图中的点代表各种品牌;各点之间的距离则表示各种品牌在消费者心目中的相似或差异程度;各点到坐标的距离则表示消费者对某一品牌、某种特性的评价。这种方法将消费者对各种品牌之间的相似或差异程度的评价,用距离及图形表示出来,因此具有形象直观的特点。这里的输入资料是消费者对各种品牌产品之间的相似或差异程度的评价,其输出则是与品牌有关的特性以及各种品牌在各特性中的位置。因此,多维标度法是用间接方法推断出品牌有关的特性。在许多情形中,我们可能不知道那些特性与品牌有关,或者应答者不能够或不愿意准确地回答,这时必须采用间接推断的方法。
广义的MDS可以将
聚类分析和
对应分析(Correspondence Analvsis)也包括进来。根据它所利用的信息来看,多维标度法可以分为两大类:一类称为非度量的MDS(nonmetric MDS);另一类为量度的MDS(metric MDS)。前者使用了研究对象间距离(或相似度)的排序信息,而后者用的是实际上的数量指标。
特点
这种研究方法不需要事先知道反映研究对象具有多少个指标以及对指标的观察或测量数据等,而仅仅需要知道的是研究对象的某种距离(不一定是
欧氏距离)或相似性等即可。如下面将要介绍的英国12个城市之间的公路距离,画出在二维空间上的一个平面图,从而可以更直观的观察各个城市之间的远近距离也可对各个城市进行分类等。
多维标度法按数据的尺度水平不同,可分为计量和非计量两种:所谓计量数据,就是按间隔尺度或比例尺度测定的数据,也称为定量数据;所谓非计量数据,就是按名义尺度或顺序尺度确定的数据,也称为定性数据;因此多维标度法也可分为计量的多维标度法和非计量的多维标度法。
多维标度法的产生与发展,和它在心理学各个分支中的应用是分不开的,20世纪40年代是它的萌芽和准备时期,50年代是计量多维标度法的发展时期,1952年Torgerson首先给出了计量的多维标度法的数学模型,为以后的发展奠定了基础,60年代是非计量的多维标度法的发展时期,70年代以后上面提出的各种方法趋于成熟,出现了许多近似计算法,并且提出了许多新的方法和模型,从应用角度来说,在50年代多维标度法仅应用于心理学,60年代又应用于销售和消费领域中,从70年代以来,多维标度法的应用范围迅速扩大,已应用于交通、社会学、生态学及地质学等领域。
适用情况
多维标度法解决的问题是:当N个对象(Object)中各对对象之间的相似性(或距离)给定时,确定这些对象在低维空间中的表示(感知图,Perceptual Mapping),并使其尽可能与原先的相似性(或距离)“大体匹配”,使得由降维
引起的任何变形达到最小。多维空间中排列的每一个点代表一个对象,因此点间的距离与对象间的相似性高度相关。也就是说,两个相似的对象由多维空间中两个距离相近的点表示,而两个不相似的对象则由多维空间中两个距离较远的点表示。多维空间通常为二维或三维的
欧几里得空间,但也可以是非欧几里得三维以上空间。
多维标度法内容丰富、方法较多。按相似性(距离)数据测量尺度的不同,MDS可分为:度量MDS和非度量MDS。当原始相似性(距离)的实际数值为间隔尺度和比率尺度时称为度量MDS(Metric MDS);当原始相似性(距离)
为等级顺序(即有序尺度)而非实际数值时称为非度量MDS(Nonmetric,MDS)。按相似性(距离)矩阵的个数和MDS模型的性质,MDS可分为:古典多维标度(CMDS)(一个矩阵,无权重模型)、重复多维标度(Replicated MDS)
(几个矩阵,无权重模型)、权重多维标度(WMDS)(几个矩阵,权重模型)。