命名实体
人名、机构名、地名以及其他所有以名称为标识的实体
命名实体(named entity)所谓的命名实体就是人名、机构名、地名以及其他所有以名称为标识的实体。更广泛的实体还包括数字、日期、货币、地址等等。
含义
NE类别一般都是根据问题定义的,常见有机构名、人名、地名等,也可以有时间、日期、数量短语等。
根据MUC会议的规定,命名实体的任务包括三个子任务:
1、实体名(Entity Name),包括人名、地名、机构名
2、时间表达式(Temporal Expressions),包括日期、时间和持续时间
3、数字表达式(Number Expressions),包括钱、度量衡、百分比以及基数
2004年863NE评测中,命名实体的识别任务包括:
1、命名实体(ENAMEX),包括人名、地名、机构名
2、时间表达式(TIMEX),包括日期、时间
3、数值表达式(NUMEX)
生物医学
在生物医学领域内,重要的命名实体包括:基因名称、蛋白质名称、蛋白质结构属性名称、化合物名称、药物名称和疾病名称等,其中最重要的是基因名称和蛋白质名称。
命名实体识别
命名实体识别是指在文档集合中识别出特定类型的事物名称或符号的过程。
命名实体识别由3个问题组成:1.识别出文本中的命名实体;2.确定该实体的类型;3.对于多个实体表示同一事物时,选择其中的一个实体作为该组实体的代表。
参考资料
最新修订时间:2024-05-17 20:54
目录
概述
含义
参考资料