超过800万条软件/作品著作权公告信息!

提供基于中国版权保护中心以及各省市版权局著作权登记公告信息查询

一种基于聚合词树的敏感词匹配处理系统及方法专利登记公告


专利名称:一种基于聚合词树的敏感词匹配处理系统及方法

摘要:本发明提供了一种基于聚合词树的敏感词匹配处理系统及方法,该系统包括敏感词库单元、聚合词树算法处理器、语义分析单元、行业领域分析单元。通过聚合词树的方式对敏感词库中的敏感词进行聚合,形成词树结构,使敏感词库的数据结构有序,节省了内存空间,提高了匹配效率。本发明结合了行业规则的运用,并结合语义分析和行业环境进行过滤的方式,排除了那些在相应行业领域不属于敏感词范畴的关键词,减少了敏感词匹配的错误,提高了匹配准确率。

专利类型:发明专利

专利号:CN201210123747.7

专利申请(专利权)人:焦点科技股份有限公司

专利发明(设计)人:陶富成;邹铁鹏

主权项:一种基于聚合词树的敏感词匹配处理的系统,其特征在于,包括:敏感词库单元,用于保存长期积累的各类行业敏感词,以及具有敏感政治倾向、暴力倾向、不健康内容的词语;聚合词树算法处理器,用于根据敏感词库中的敏感词,进行生成词树的处理,以及对目标信息进行敏感词匹配的处理;语义分析单元,用于处理初步匹配成功的关键词,结合这些关键词在目标信息中上下文的内容进行语义分析,根据业务规则,判断这些关键词在文中是否是敏感词;行业领域分析单元,用于根据目标信息的属性确定其行业领域,通过事先设置的行业规则,判断初步匹配成功的关键词,

专利地区:江苏