学术文献自动分类的方法专利登记公告
专利名称:学术文献自动分类的方法
摘要:本发明公开了一种学术文献自动分类的方法,包括输入训练文献于数据库中,所述训练文献包含文献分类号;对训练文献进行一元特征词、二元特征词的选择及二元词对的生成;读取数据库中的训练文献,并分别计算一元特征词、二元特征词与文献分类号的概率关系,形成一元分类词典与二元分类词典;读取待标注文献,根据一元二元分类词典及一元特征词与二元特征词在待标注文献中的权重,计算文献对应的中图分类号,并自动标注;将一元二元分类结果根据置信度大小分为高准确率结果集和低准确率结果集,并输出分类结果。
专利类型:发明专利
专利号:CN201010168290.2
专利申请(专利权)人:同方知网(北京)技术有限公司
专利发明(设计)人:张振海;罗霄
主权项:学术文献自动分类的方法,包括:输入文献;对文献的自动分类;判断自动分类结果是否为高准确率;如果不是高准确率结果,则进行人工分类;否则,直接进入网络检查,如果检查分类号正确,则提交为日更新数据,加入到数据库中;否则将检查后修改的数据和一定比例的未修改数据提出,进行复查;编辑抽样审错;达到合格比例后,按月更新到数据库;其特征在于,文献的自动分类包括:A、输入训练文献于数据库中,所述训练文献包含文献分类号;B、对训练文献进行一元特征词、二元特征词的选择及二元词对的生成;C、读取数据库中的训练文献,并分别计算一元
专利地区:北京
关于上述专利公告申明 : 上述专利公告转载自国家知识产权局网站专利公告栏目,不代表该专利由我公司代理取得,上述专利权利属于专利权人,未经(专利权人)许可,擅自商用是侵权行为。如您希望使用该专利,请搜索专利权人联系方式,获得专利权人的授权许可。