您的当前位置:首页正文

一种信息抽取方法及装置[发明专利]

来源:一二三四网
专利内容由知识产权出版社提供

专利名称:一种信息抽取方法及装置专利类型:发明专利

发明人:李重勋,王利叶,胡可云,陈联忠申请号:CN201711476786.4申请日:20171229公开号:CN108052508A公开日:20180518

摘要:本申请实施例公开了一种信息提取方法,根据预设词库对预设文本进行分词,得到第一分词结果,从第一分词结果中提取所包括的多个待定词,从多个待定词中确定出没有包含关系的待定词作为对第一分词结果的信息提取结果。由于采用了两次分词,不仅可以将较长的第一分词结果提取出来,还可以从较长的第一分词结果中进一步提取出较短的、不具有包含关系的对第一分词结果的信息抽取结果,例如从完整的表示手术名称的词中提取出表示部位、疾病等信息的词,一方面增加了提取到的信息量,另一方面,通过第一分词结果与第一分词结果的信息抽取结果的结构层次设置,增强了数据结构化效果,有利于数据查询和定位。本申请实施例还公开了一种信息提取装置。

申请人:北京嘉和美康信息技术有限公司

地址:100085 北京市海淀区上地信息产业基地开拓路7号先锋大厦Ⅰ段三层

国籍:CN

代理机构:北京集佳知识产权代理有限公司

代理人:王宝筠

更多信息请下载全文后查看

因篇幅问题不能全部显示,请点此查看更多更全内容

Top