一种基于词共现的汉语实体关系提取的控制方法及装置专利登记公告
专利名称:一种基于词共现的汉语实体关系提取的控制方法及装置
摘要:本发明提供基于词共现的实体关系提取的控制方法,包括步骤:a.通过统计语料库中词语的共现频率计算词语相关度;b.根据所述词语相关度计算词语相似度;c.根据所述词语相似度确定实体关系。还提供相应的控制装置。本方法应用的语料库是新闻语料库,可以直接通过现有成熟的网页分析技术提取新闻正文和标题来构建语料库,不用太多人工参与去构建语料库,本方法应用自然语言处理中的浅语言规则如分词、词性标注和简单的统计技术便可以得到计算词语相关度时应用的词语频率,以及计算匹配相似度时考虑的词语位置、词语的词性和词语是不是动词等信息,
专利类型:发明专利
专利号:CN201110001355.9
专利申请(专利权)人:华东师范大学
专利发明(设计)人:杨静;王晶;周凌琛;刘金盼;陈超;贺樑
主权项:一种基于词共现和模式匹配的汉语实体关系提取的控制方法,其特征在于,包括如下步骤:b.基于语料库中词语的共现指标计算词语相关度;c.根据所述词语相关度计算词语间的相似度;g.根据所述词语相似度和模式匹配确定实体关系。
专利地区:上海
关于上述专利公告申明 : 上述专利公告转载自国家知识产权局网站专利公告栏目,不代表该专利由我公司代理取得,上述专利权利属于专利权人,未经(专利权人)许可,擅自商用是侵权行为。如您希望使用该专利,请搜索专利权人联系方式,获得专利权人的授权许可。