查准率
衡量某一检索系统的信号噪声比
查准率(Precision)(精度)是衡量某一检索系统信号噪声比的一种指标,即检出的相关文献与检出的全部文献的百分比。普遍表示为:查准率=(检索出的相关信息量/检索出的信息总量)x100%。
定义
查准率的数学表达:Precision=#(Retrieved∩Relevant)╱#Retrieved.
Retrieved:待评测检索系统处理查询样例返回结果集合。
Relevant:正确答案集合。
查全率
查全率(召回率),是衡量某一检索系统从文献集合中检出相关文献成功度的一项指标,即检出的相关文献与全部相关文献的百分比。普遍表示为:查全率=(检索出的相关信息量/系统中的相关信息总量)x100%
两者关系
关系:查全率与查准率互逆相关性,查全率一般为60%~70%,查准率约为40%~50%,当查全率超过70%时,若想再提高查全率就必然降低查准率。
衡量某一类文献检索系统的信号噪声比的一种指标。它的数值等于w/m,式中w是用户鉴别检出的m篇文献时,认为实际对口径的文献篇数。这一指标最初是1956年由J.W.佩里、A.肯特等人提出的。F.W.兰开斯特1979年在《情报检索系统──特性、试验与评价》(第二版)一书中将某一系统所拥有的文献总篇数表述为a+b+c+d之和,并列出2×2表格。   上述的w篇文献即为a ,m篇文献即为a+b,这样查准率即为a/(a+b),a值是经过一次检索后,即可由用户判定的,a+b即经过一次检索所检出的全部文献。例如在某一次检索过程中共检出了50篇文献,用户判定其中有 10 篇文献是相关的,则查准率即为10/50=20%。查准率主要取决于检索语言的专指性和所拟定的检索策略能否准确表达用户真正的情报需求。若检索策略拟订得较宽泛,参与组配的检索词较少,主题词的概念比用户的情报需求宽泛,则查准率将降低,而查全率将增加,因为二者一般呈互逆相关关系。查准率标志某一检索系统运行过程中拒绝无关文献、选出有关文献的能力,同时也是用户从检出文献中进一步筛选出相关文献所需时间的一种间接测度。为达到相同查全率,高的查准率意味着用户鉴别检索结果时只需用较少时间,不过这种测度主要适用于评价情报工作人员代替用户检索的情况。
参考资料
最新修订时间:2023-02-10 11:07
目录
概述
定义
查全率
两者关系
参考资料