超过800万条软件/作品著作权公告信息!

提供基于中国版权保护中心以及各省市版权局著作权登记公告信息查询

基于支持向量机的博客作者兴趣与性格自动识别方法专利登记公告


专利名称:基于支持向量机的博客作者兴趣与性格自动识别方法

摘要:本发明提供基于支持向量机的博客作者兴趣与性格自动识别方法,首先构建兴趣分类训练样本集和性格分类训练样本集,然后使用中文词法分析器分别处理这两组训练样本集,得到候选兴趣特征项集合和候选性格特征项集合,接着使用统计方法分析这两组候选特征项集合,构建兴趣分类特征项集合和性格分类特征项集合,然后分别使用这两组特征项集合将兴趣分类训练样本集和性格分类训练样本集表示成向量形式,最后分别使用这两组向量训练兴趣分类器和性格分类器,该分类器被用于识别其他作者的兴趣和性格。本发明能够准确地识别作者的兴趣和性格,适用于各种基于

专利类型:发明专利

专利号:CN201210070174.6

专利申请(专利权)人:华南理工大学

专利发明(设计)人:黄翰;鲁梦平;郝志峰;刘伟庆;张远峰;蔡昭权

主权项:基于支持向量机的博客作者兴趣与性格自动识别方法,其特征在于,包括以下步骤:(a)搜集一组表示作者兴趣主题的博客文章以及内向、外向作者写作的博客文章,分别将这两组博客文章作为兴趣分类和性格分类训练样本集;(b)用中文词法分析器对步骤(a)得到的两组训练样本集进行词法分析,得到这两组样本集中文章分词结果和词语的词性,分别定义为候选兴趣特征项集合和候选性格特征项集合;(c)用统计方法分别分析候选兴趣特征项集合和候选性格特征项集合中的特征项对兴趣训练样本集和性格训练样本集的重要性,并分别按重要性大小筛选一组兴趣特

专利地区:广东