识别特征库获取方法、装置及短消息识别方法、装置专利登记公告
专利名称:识别特征库获取方法、装置及短消息识别方法、装置
摘要:本发明提供一种识别特征库获取方法、装置及短消息识别方法、装置,该识别特征库获取方法,包括:利用多个来自用户且消息类型预先确定的短消息形成样本集合;对样本集合中的每个短消息进行字符串抽取,得到第一字符串集合;所述第一字符串集合中的每个字符串均不同;针对所述第一字符串集合中的每一个字符串,统计所述样本集合的短消息中包括该字符串的短消息数量;根据统计结果计算字符串对应于短消息类别的互信息;按照互信息从大到小的顺序,从所述第一字符串集合中选择部分或全部字符串形成识别特征库。本发明提高了短消息识别的效率。
专利类型:发明专利
专利号:CN201010602263.1
专利申请(专利权)人:中国移动通信集团设计院有限公司
专利发明(设计)人:万狄飞
主权项:一种识别特征库获取方法,其特征在于,包括:利用多个来自用户且消息类型预先确定的短消息形成样本集合;对样本集合中的每个短消息进行字符串抽取,得到第一字符串集合;所述第一字符串集合中的每个字符串均不同;针对所述第一字符串集合中的每一个字符串,统计所述样本集合的短消息中包括该字符串的短消息数量;根据统计结果计算字符串对应于短消息类别的互信息;按照互信息从大到小的顺序,从所述第一字符串集合中选择部分或全部字符串形成识别特征库。
专利地区:北京
关于上述专利公告申明 : 上述专利公告转载自国家知识产权局网站专利公告栏目,不代表该专利由我公司代理取得,上述专利权利属于专利权人,未经(专利权人)许可,擅自商用是侵权行为。如您希望使用该专利,请搜索专利权人联系方式,获得专利权人的授权许可。