基于小波变换的说话人识别方法.研究

基于小波变换的说话人识别方法.研究

ID:31982490

大小:2.11 MB

页数:49页

时间:2019-01-30

基于小波变换的说话人识别方法.研究_第1页
基于小波变换的说话人识别方法.研究_第2页
基于小波变换的说话人识别方法.研究_第3页
基于小波变换的说话人识别方法.研究_第4页
基于小波变换的说话人识别方法.研究_第5页
资源描述:

《基于小波变换的说话人识别方法.研究》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第一章绪论弟一早珀T匕§1.1研究目的和意义在生物学和信息科学高度发展的今天,生物认证技术作为一种便捷、先进的信息安全技术开始在全球电子商务时代崭露头角【11。这是一种根据人体自身的生理特征(指纹、手形、脸部、虹膜、视网膜、气味等)和行为特征(声音、签名、击键方式等)来识别身份的技术。它是集光学、传感技术、红外扫描和计算机技术于一身的第三代身份验证技术,能满足现代社会对于身份鉴别的准确性、安全性与实用性的更高要求。在信号检测与处理、模式识别、人工智能、机器学习等理论与技术迅速发展的推动下,不久的将来

2、,生物认证技术必将进入一个光辉的时代。通过语音传递信息是人类最重要、最有效、最常用和最方便的信息交换形式。因此,语音信号处理的研究也日益显示出它的重要性。在语音识别技术领域中,说话人识别技术(或称声纹识别技术),以其独特的方便性、经济性和准确性等优势受到世人瞩目,并日益成为人们日常生活和工作中重要且普及的安全验证方式。说话人识别12J属于生物识别技术的一种,是一项根据语音波形中反映说话人生理和行为特征的语音参数,通过对这些个性特征的分析和识别,从而达到对说话人进行辨认或者确认的目的。与语音识别不同的

3、是,说话人识别利用的是语音信号中的说话人信息,而不考虑语音中的字词意思,它强调说话人的个性化特征;而语音识别的目的是识别出语音信号中的言语内容,并不考虑说话人是谁,它强调说话人的共性特征。与其他生物识别技术相比,说话人识别(或声纹识别)具有更为简便、准确、经济及可扩展性良好等众多优势,可广泛应用于安全验证、控制等各方面。另一方而,随着移动通信技术的飞速发展,尤其是网络和电子商务的繁荣,电话的使用率空前增长,远程身份认证越来越频繁。如果仅需要张口打一个电话就可以获得服务、进行交易,将是何等的方便和快捷

4、。现有的说话人识别系统在实验室环境下能达到很高的识别率,但实际环境中无处不在的噪声带来了训练模型和测试语音之间的失配,使得噪声环境中说话人识别系统的识别率急剧下降l引。目前,对于利用HMM的说话人识别系统,在用高品质的话筒,从安静环境下的语音信号中提取的倒谱参数,利用事后设定的阈值进行判定时,对于几十名话者的识别率可以达到99%以上。然而,对于通过实际网络(例如市话网)传输的电话语音、存在噪音的实际环境下的语音进行判定的说话人识别系统性能还有待研究提高。含噪语音的说话入识别是目前研究的热点和难点。抗

5、噪声说话人识别的目的是尽量减小或者消除噪声所带来的训练模型和测试语音之间的失配,使得识别性能尽可能接近训练环境下的性能。因而抗噪声的研究是说话人识别系统实用的关键。环境噪声会影响语音质量,语音增强就是从带噪语音信号中提取尽可能纯净的原始语音。在实际应用时,要根据具体的噪声情况和特定环境,选用不同的语音增强方法或语音增强方法的组合,来达到最好的语音增强的效果。为了让说话人识别系统在强噪声环境中,有较好的识别效果,研究一个将语音增强器和说话人识别连起来,将语音增强作为前端处理来提高输入的信噪比,进而提高

6、说话人识别的抗噪声性能是十分必要的。此外,目前的说话人识别系统使用的普遍性比较强,而针对性不够即是说市场性不够,因此在研究中应该多针对实用中的某一方面进行深入探讨,以保证系统的实用性和效益性【41。总之,未来说话人识别技术将对语音信号增强处理、说话人个性特征的提取方法和识别算法做进一步研究进而推动说话人识别的发展。§1.2国内外研究现状1.国外研究现状说话人识别的历史可追溯到1660年,据史料记载,英国国王查尔斯一世之死的侦破过程中,就利用了声音作为找出犯人的线索,这也许就是根据说话人声音审理案件的

7、记录。对说话人识别的研究始于20世纪30年代【51。早期的工作主要集中在人耳听辨实验和探讨听音识别的可能性方面。随着研究手段和工具的改进,研究工作逐渐脱离了单纯的人耳听辨。Bell实验室的LGKesta目视观察语谱图进行识别,提出了“声纹(voiceprint)”的概念。随后,电子技术和计算机技术的发展,使通过机器自动识别人的声音成为可能。Bell实验室提出了基于模式匹配和概率统计方差分析的说话人识别方法,而引起信号处理领域许多学者的注意,掀起了说话人识别的一个研究高潮,其间的工作主要集中在各种识别

8、参数的提取、选择和实验上,并将倒谱和线性预测分析等方法应用于说话人识别。1964年,Pruzansky和Mathews利用方差分析的方法进行说话人研究,提出了有名的衡量说话人特征参数有效性的F比值公式。同时,Becker等人采用自适应系统对说话人进行了实验研究,至此,说话人识别已明确划分为说话人确认和说话人辨认两大研究任务。在这之后,Glenn等研究了基于鼻辅音的说话辨认研究,发现从鼻辅音中可以提取出说话人的有效特征。Luck首先将基频、倒谱技术对基频参数进行主分量分

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。