CLARANS是分割方法中基于
随机搜索的大型应用
聚类算法。在分割方法中最早提出的一些算法大多对小数据集合非常有效,但对大的数据集合没有良好的可伸缩性。
如PAM。CLARA能处理比PAM大的数据集合,其有效性取决于样本的大小,但当某个采样得到的中心点不属于最佳的中心点时.CLARA不能得到最佳聚类结果。CLARA NS是在CLA RA 算法的基础上提出来的.与CLA RA 不同.CLARA NS没有在任一给定的时间局限于任一样本.而是在搜索的每一步都带一定随机性的选取一个样本。CLARA NS的时间复杂度大约是O(n2).n是对象的数目。此方法的优点是一方面改进了CLA RA 的聚类质量.另一方面拓展了数据处理量的伸缩范围,具有较好的聚类效果。但它的计算效率较低,且对数据输入顺序敏感,只能聚类凸状或球型边界。
第 4 步从第 2 步中剩下的n–k 个目标集中随机选取一个目标,并用之替换质心集合中随机的某一个质心可得到一个新的质心集合,计算两个质心集合的代价差(这一点和PAM相似,只是变成了随机选取替换对象和被替换对象)。