基于半监督的垃圾图片过滤方法专利登记公告
专利名称:基于半监督的垃圾图片过滤方法
摘要:基于半监督的垃圾图片过滤技术研究对图像型垃圾邮件进行检测判定工作时,先提取文本和图片特征进行特征处理,利用已经得到的分类模型进行检测分类,并不断加入新的标签样本,训练分类器,提高分类精度同时误判率将大大降低。经大量实验数据检验证明,该方法构建了一种高效率垃圾邮件网页过滤系统,在保证高准确率的同时,处理效率有很大的提高,并显著减小网页检测时间。
专利类型:发明专利
专利号:CN201210129234.7
专利申请(专利权)人:南京邮电大学
专利发明(设计)人:张卫丰;胡文婷;张迎周;周国强;王慕妮;钱小燕;许碧欢;陆柳敏
主权项:一种基于半监督的垃圾图片过滤方法,其特征在于该方法主要包括以下几个部分:图片中的文本、图片特征提取及处理,预测样本点的选择,支持向量机分类器的训练;?步骤1)提取未标签和已标签图片样本中的文本特征向量:??步骤1.1)利用光学识别技术对样本集合中的图片进行批量处理,得到图片中的文字,步骤1.2)用怀卡智能分析环境对步骤1.1)中的结果进行处理,得到.arff格式的文件,文件中每一行的第一列代表一个图像中的文字,第二列代表一个图像的标签,作为图像的文本特征向量,步骤1.3)计算文本特征向量的R值,得到经过处
专利地区:江苏
关于上述专利公告申明 : 上述专利公告转载自国家知识产权局网站专利公告栏目,不代表该专利由我公司代理取得,上述专利权利属于专利权人,未经(专利权人)许可,擅自商用是侵权行为。如您希望使用该专利,请搜索专利权人联系方式,获得专利权人的授权许可。