一种基于多因素频率位移不变特征的鲁棒说话人辨别方法专利登记公告
专利名称:一种基于多因素频率位移不变特征的鲁棒说话人辨别方法
摘要:本发明公开了一种考虑语音中多因素的频率位移不变特征提取方法,用于复杂环境下的文本无关说话人辨别,该方法考虑了语音的时间、频率、尺度和相位信息,通过不同尺度和相位的二维复数小波变换对语音信号能量谱进行多因素表征,考虑频率的位移不变特性,利用卷积型非负张量分解方法,计算频率阶上的位移不变特征投影矩阵,得到多因素的稀疏特征,通过离散余弦变换对特征去相关,计算特征的一阶和二阶差分系数,最终获得具有较好鲁棒性的说话人特征。本发明考虑语音信号多因素频率位移不变特征提取方法,利用卷积型非负张量分解方法计算具有鲁棒性的多
专利类型:发明专利
专利号:CN201210137353.7
专利申请(专利权)人:山东大学
专利发明(设计)人:吴强;刘琚;孙建德
主权项:一种考虑语音中多因素的频率位移不变特征提取方法,其特征是:考虑语音信号中包括时间、频率、尺度和相位信息的多重因素,利用卷积型非负张量分解方法计算频率阶上的特征投影,提取频率的位移不变稀疏特征,降低噪声成分的干扰,经过离散余弦变换对特征去相关,计算特征的一阶和二阶差分系数,用于复杂环境下文本无关的说话人辨别,具体包括以下步骤:(1)通过采集设备得到语音信号x(t),并进行加窗和预加重,利用短时傅里叶变换计算x(t)的能量谱S(f,t);(2)利用不同尺度和相位的二维复数小波变换对能量谱S(f,t)进行滤波,
专利地区:山东
关于上述专利公告申明 : 上述专利公告转载自国家知识产权局网站专利公告栏目,不代表该专利由我公司代理取得,上述专利权利属于专利权人,未经(专利权人)许可,擅自商用是侵权行为。如您希望使用该专利,请搜索专利权人联系方式,获得专利权人的授权许可。