超过800万条软件/作品著作权公告信息!

提供基于中国版权保护中心以及各省市版权局著作权登记公告信息查询

识别特征库获取方法、装置及短消息识别方法、装置专利登记公告


专利名称:识别特征库获取方法、装置及短消息识别方法、装置

摘要:本发明提供一种识别特征库获取方法、装置及短消息识别方法、装置,该识别特征库获取方法,包括:利用多个来自用户且消息类型预先确定的短消息形成样本集合;对样本集合中的每个短消息进行字符串抽取,得到第一字符串集合;所述第一字符串集合中的每个字符串均不同;针对所述第一字符串集合中的每一个字符串,统计所述样本集合的短消息中包括该字符串的短消息数量;根据统计结果计算字符串对应于短消息类别的互信息;按照互信息从大到小的顺序,从所述第一字符串集合中选择部分或全部字符串形成识别特征库。本发明提高了短消息识别的效率。

专利类型:发明专利

专利号:CN201010602263.1

专利申请(专利权)人:中国移动通信集团设计院有限公司

专利发明(设计)人:万狄飞

主权项:一种识别特征库获取方法,其特征在于,包括:利用多个来自用户且消息类型预先确定的短消息形成样本集合;对样本集合中的每个短消息进行字符串抽取,得到第一字符串集合;所述第一字符串集合中的每个字符串均不同;针对所述第一字符串集合中的每一个字符串,统计所述样本集合的短消息中包括该字符串的短消息数量;根据统计结果计算字符串对应于短消息类别的互信息;按照互信息从大到小的顺序,从所述第一字符串集合中选择部分或全部字符串形成识别特征库。

专利地区:北京