命名实体
人名、机构名、地名以及其他所有以名称为标识的实体
命名实体(named entity)所谓的命名实体就是人名、机构名、地名以及其他所有以名称为标识的实体。更广泛的实体还包括
数字
、日期、货币、地址等等。
含义
NE类别一般都是根据问题定义的,常见有机构名、人名、地名等,也可以有时间、日期、数量短语等。
根据MUC会议的规定,命名实体的任务包括三个子任务:
1、实体名(Entity Name),包括人名、地名、机构名
2、时间表达式(Temporal Expressions),包括日期、时间和持续时间
3、数字表达式(Number Expressions),包括钱、度量衡、百分比以及基数
2004年863NE评测中,命名实体的识别任务包括:
1、命名实体(ENAMEX),包括人名、地名、机构名
2、时间表达式(TIMEX),包括日期、时间
3、数值表达式(NUMEX)
生物医学
在生物医学领域内,重要的命名实体包括:基因名称、蛋白质名称、蛋白质结构属性名称、化合物名称、药物名称和疾病名称等,其中最重要的是基因名称和蛋白质名称。
命名实体识别
命名实体识别
是指在文档集合中识别出特定类型的事物名称或符号的过程。
命名实体识别由3个问题组成:1.识别出文本中的命名实体;2.确定该实体的类型;3.对于多个实体表示同一事物时,选择其中的一个实体作为该组实体的代表。
参考资料
最新修订时间:2024-05-17 20:54
条目作者
小编
资深百科编辑
目录
概述
含义
参考资料
Copyright©2024
闽ICP备2024072939号-1