自动摘要,用计算机析取文献信息内容,生成摘要。
背景介绍
随着文献信息数量的激增,人们对文献摘要、文摘或提要等信息浓缩品的需求已越来越多。而人工编写摘要是一种高智力的劳动,成本高,速度比较慢,效益低,其生产速度和数量远远不能适应文献信息数量和社会需求量的快速增长。于是,用计算机自动编制摘要的研究和开发越来越受到重视。20世纪50年代后期起,一些国家即开始研究自动摘要的方法,现在这项技术已趋于成熟。
类型
一般来说,摘要工作主要包含理解信息内容与生成摘要这两大部分,其核心乃是对信息的理解。摘要的类型可分为:
①摘录性摘要,即摘要中的句子大部分摘自原文,能基本反映文献主题。
②报道性摘要,用摘录者自己的、能反映文献主题的句子构成文摘。
③评论性或综述性摘要,要对不同的信息进行分析、比较与评述。
目前的自动摘要技术一般从文献信息中抽取出某些关键信息,填入预定报告的预定部位,生成文献信息的摘要。中国上海交通大学等单位开发的自动摘要系统已进入商业化应用阶段。