实体属性关系抽取
- 针对语料:通用语料
- 抽取关系:通用实体关系
- 抽取级别:句子级别
关系类型(通用文本)
关系 | 例子 | 类型 | |
---|---|---|---|
隶属关系 | |||
个人 | 和谁结婚/是谁的妈妈 | per->per | |
组织 | 什么的发言人/**的总统/什么公司的CEO | per->org | |
人为 | 拥有/发明/生产() | per|org ->art | |
空间位置关系 | |||
临近 | 靠近/ | loc->loc | |
指向/方向 | 位于某处南部/ | loc->loc | |
整体与部分关系 | |||
组织 | 某个部门(a unit of/ a parent of) | org->org | |
政治 | 签署/附加/吞并 获取 | gpe->gpe(地理政治实体) |
关系类型(ACE2003)
角色关系:将一个人与组织或地缘政治实体联系起来
子类型:成员、拥有者、子公司、客户、公民
整体与部分关系:
抽取类型
- 任何名词都可以当作候选实体
- 任何动词都可以当作候选关系
人的属性
- 性别
- 出生日期
- 出生地
- 工作
产品的属性
- 描述信息
- 价格
概念的属性
企业的属性
实体属性抽取方法
- 基于模式和规则
- 人工构造规则和模式进行匹配
- 优点:准确率比较高
- 缺点:需要人工构造,依赖于特定领域,较难扩展和维护
- Bootstrapping方法
- 有监督方法
- 无监督方法
- 远程监督方法