专利名称:一种实体关系联合抽取方法专利类型:发明专利
发明人:冯钧,杭婷婷,李晓东,陆佳民,严乐,朱跃龙申请号:CN201911063750.2申请日:20191104公开号:CN110781683A公开日:20200211
摘要:本发明公开了一种基于多标签标注和复合注意力机制的实体关系联合抽取方法,包括以下步骤:收集用于研究的语料数据,然后去除关系标签为\"None\"的句子,对剩余的句子进行多标签标注,形成训练集;将经过多标签标注的句子输入到联合抽取模型中,通过所述联合抽取模型来识别句子中所包含的实体以及实体之间的关系,构建三元组;利用关系对齐模型对抽取出来的三元组进行校正,以适应(头实体E1,尾实体E2)实体对的多标签标注。本发明的效果为:能够有效的提高三元组抽取的准确率,是针对非结构化数据进行信息抽取的有效工具。
申请人:河海大学
地址:210098 江苏省南京市鼓楼区西康路1号
国籍:CN
代理机构:南京纵横知识产权代理有限公司
代理人:杨静
更多信息请下载全文后查看
因篇幅问题不能全部显示,请点此查看更多更全内容