一种基于指导的文本特征加权方法专利登记公告
专利名称:一种基于指导的文本特征加权方法
摘要:一种基于指导的文本特征加权方法,进行文本特征提取后得到a,b,c,d四类文档数,分别代表如下:a表示含词项t且属于正例的文档数;b表示不含词项t但属于正例的文档数;c表示含词项t但不属于正例的文档数;d表示不含词项t且不属于正例的文档数;a,b,c,d的总和为N,即总文档数;所述文本特征加权公式(1)。本发明提出的一种基于指导的文本特征加权方法tf.ridf,实现了词在总体文档及各类别文档之间的综合考虑,该方法有效地提高了分类性能。
专利类型:发明专利
专利号:CN201210063879.5
专利申请(专利权)人:浙江工业大学
专利发明(设计)人:刘端阳;陆洋
主权项:一种基于指导的文本特征加权方法,其特征在于:进行文本特征提取后得到a,b,c,d四类文档数,分别代表如下:a表示含词项t且属于正例的文档数;b表示不含词项t但属于正例的文档数;c表示含词项t但不属于正例的文档数;d表示不含词项t且不属于正例的文档数;a,b,c,d的总和为N,即总文档数;所述文本特征加权公式如下:
专利地区:浙江
关于上述专利公告申明 : 上述专利公告转载自国家知识产权局网站专利公告栏目,不代表该专利由我公司代理取得,上述专利权利属于专利权人,未经(专利权人)许可,擅自商用是侵权行为。如您希望使用该专利,请搜索专利权人联系方式,获得专利权人的授权许可。