相似性所属现代词,是对两个个体或部分之间的精细结构或性质等元素的一致性的评价。广泛应用于数学、结构、模型、化学、语言等领域。
数学中的相似性
几何相似性
在欧几里德几何学中,两个物体如果形状相同,或者一个物体的形状与另一个的镜像相同,则这两个图形相似。实际上如果任意一个图形可以通过平移、缩放、旋转和翻转之后与另一个图形完全重合,那么这两个图形相似。
(1)多边形的相似
三角分别相等,三边成比例的两个三角形叫做相似三角形(similar triangles)
相似三角形是几何中重要的证明模型之一,是全等三角形的推广。全等三角形可以被理解为相似比为1的相似三角形。相似三角形其实是一套定理的集合,它主要描述了在相似三角形是几何中两个三角形中,边、角的关系。
相似三角形的性质:
定义 相似三角形的对应角相等,对应边成比例。
定理 相似三角形任意对应线段的比等于相似比。
定理 相似三角形的面积比等于相似比的平方。
相似三角形的判定:
类比全等三角形的判定定理,可以得出下列结论:
定理 两角分别对应相等的两个三角形相似。
定理 两边成比例且夹角相等的两个三角形相似。
定理 三边成比例的两个三角形相似。
定理 一条直角边与斜边成比例的两个直角三角形相似。
相似三角形的特殊情况:
1.凡是全等的三角形都相似
全等三角形是特殊的相似三角形,相似比为1。反之,当相似比为1时,相似三角形为全等三角形。
2. 有一个顶角或底角相等的两个等腰三角形都相似。由此,所有的等边三角形都相似。
相似的两个多边形称为相似多边形。两个多边形的对应边成比例、对应角相等时,它们相似。两个边数相等的正凸多边形一定相似。两个相似多边形的周长的比等于它们的相似比,面积的比等于相似比的平方。
(2)曲线的相似
几种类型的曲线具有该类型的所有示例彼此相似的属性。其中包括:圈、
抛物线、特定偏心的
双曲线、特定偏心的
椭圆、不同真数的
对数函数图表、不同底数的
指数函数图、
对数螺线(3)拓扑
在拓扑学中,度量空间可以通过定义相似性而不是距离来构造。相似性是一个函数,当两点更近时,其值更大。
(4)自相似
•
自相似性意味着模式与自身非常相似,例如,{2i,3•2i}形式的数字集合{…,0.5,0.75,1,1.5,2,3,4,6,8,12,…},其中i覆盖所有整数。当这个集合以对数标度绘制时,它具有一维平移对称性:将两个数的对数与其中一个数的对数相加或相减,就会产生另一个数的对数。在给定的一组数字本身中,这对应于一种相似性变换,在这种变换中,数字被乘以或除以2。
•
分形,具有以非整数维形式充填空间的形态特征。通常被定义为“一个粗糙或零碎的几何形状,可以分成数个部分,且每一部分都(至少近似地)是整体缩小后的形状”,即具有自相似的性质。分形(Fractal)一词,是芒德勃罗创造出来的,其原意具有不规则、支离破碎等意义。1973年,芒德勃罗(B.B.Mandelbrot)在法兰西学院讲课时,首次提出了分维和分形的设想。
矩阵的相似性
在线性代数中,如果存在不可逆的n-by-n矩阵P,则称为类似
矩阵A和B
B=P-1AP
转变A↦P−1AP称为矩阵A的相似变换或共轭。因此,在一般线性群中,相似性等同于共轭性,相似矩阵也称为共轭矩阵;然而,在一般线性群的给定子群H中,共轭的概念可能比相似的概念更具限制性,因为它要求P位于H中。
语言中的相似性
词汇的相似性
在语言学中,词汇相似性是衡量两种给定语言的单词集相似程度的 度量。1(或100%)的词汇相似性意味着词汇之间完全重叠,而0表示没有相似的单词。用不同的方法来定义词汇的相似性,结果也相应地不同。
词汇相似性可用于评估两种语言之间的遗传关系程度。高于85%的百分比通常表明,被比较的两种语言很可能是相关的方言。词汇相似性只是两种语言相互理解的一个表示,因为后者还取决于语音、形态和语法相似性的程度。由于词列表不同而导致的变化对此有影响。例如,法语和英语在与文化有关的词汇领域具有相当大的相似性,而就基本(函数)单词而言,它们的相似性较小。与相互理解不同,词汇相似性只能是对称的。
语义的相似性
语义相似性是定义在一组文档或术语上的一种度量,其中项目之间的差异是基于它们的意义或语义内容的相似性,而不是词典的相似性。这些是用来估计语言单位、概念或实例之间语义关系强度的数学工具,通过对支持其意义或描述其性质的信息进行比较而得到的数字描述。语义相似性一词常常与语义关联性混淆。语义关联性包括两个词之间的任何关系,而语义相似性仅包括“是a”关系。例如,“汽车”类似于“公共汽车”,但也与“道路”和“驾驶”有关。
在计算上,语义相似度可以通过定义拓扑相似度来估计,通过使用本体来定义术语/概念之间的距离。例如,用于比较在偏序集中排序并表示为有向无环图(例如,分类法)节点的概念的朴素度量将是连接两个概念节点的最短路径。在文本分析的基础上,还可以使用向量空间模型等统计方法来估计语言单位(如单词、句子)之间的语义关联性,从而从合适的文本语料库中关联单词和文本上下文。对提出的语义相似度/关联度度量的评估主要通过两种方式进行。前者基于专家设计的数据集,由具有语义相似度/关联度估计的词对组成。第二种方法是基于信息检索、推荐系统、自然语言处理等具体应用中的措施的集成。
化学中的相似性
化学相似性(或称为分子相似性)是指二个元素、分子或化合物在结构上的相似程度,或是在参与化学反应时效果的相似程度。若是探讨在生物上的效应及其相似程度,一般会使用化合物的生物活性(biological activity),否则会使用化合物的活性度来衡量参与化学反应时的效果。
化学相似性(或分子相似性)的概念是化学信息学中(chemoinformatics)最重要的主题之一。在化合物性质预测或设计特定性质化合物的现代研究中,化学相似性都有重要的作用。而有些药物设计研究会利用大型化学品数据库进行筛选,也和化学相似性有关。上述研究的基础是Johnson和Maggiora的相似性质定律:“相似的化合物会有相似的性质”。
其他相似性
结构相似性
结构相似性指标(英文:structural similarityindex,SSIMindex)是一种用以衡量两张数位影像相似程度的指标当两张影像其中一张为无失真影像,另一张为失真后的影像,二者的结构相似性可以看成是失真影像的影像品质衡量指标。
遗传相似性
学界常用某特定物种的DNA序列共享人类序列的百分比来表示相似性。该数字显示了两物种之间碱基对相同的百分比。这里所列的是相对于人类的遗传相似性,并列出了数据来源。
这些数据来源于不同的二级数据源,并用不同的方法获得(例如DNA-DNA杂交或序列比对),这可能导致相同物种间的比较得到不同的结果。因此,这些数据应该仅仅用作大致相似性。