基于dsp的话者识别系统svm算法的研究

基于dsp的话者识别系统svm算法的研究

ID:34133090

大小:648.35 KB

页数:10页

时间:2019-03-03

基于dsp的话者识别系统svm算法的研究_第1页
基于dsp的话者识别系统svm算法的研究_第2页
基于dsp的话者识别系统svm算法的研究_第3页
基于dsp的话者识别系统svm算法的研究_第4页
基于dsp的话者识别系统svm算法的研究_第5页
资源描述:

《基于dsp的话者识别系统svm算法的研究》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、http://www.paper.edu.cn基于DSP的话者识别系统SVM算法的研究12郭峻岭沈维聪1武汉理工大学信息工程学院,湖北武汉(430070)2武汉理工大学信息工程学院,湖北武汉(430070)E-mail:candykiven@163.com摘要:本文给出了一种基于DSP的话者识别系统的硬件设计与算法研究。硬件核心是TMS320C5402数字信号处理器,接口芯片为数模/模数转换器TLV320AIC23。软件算法采用支持向量机SVM(SupportVectorMachine)方法来对语音信号进行训练与识别。关键词:话者识别DSP倒谱系数(MFCC)支持向量机(SVM)1.引言话者识

2、别即说话人识别,它是语音识别的一个重要发展方向。与语音识别不同的是,说话人识别利用的是语音信号中的说话人信息,而不考虑语音中的字词意思,它强调说话人的个性特点;而语音识别的目的是识别出语音信号中的言语内容,并不考虑说话人是谁,它强调共性。随着现代数字通讯、多媒体系统、信息高速公路等技术的应用和发展,话者识别己经越来越深入地影响并改变着我们每个人的生活和工作方式,这同时也对语音信号处理的研究工作提出了更高的要求,它在各方面的进展也令人瞩目。如今,说话人识别技术己逐渐走入实际应用,AT&T应用说话人识别技术研制出了智慧卡(smartcard),己应用于自动提款[4]机。欧洲电信联盟在电信与金融结合

3、领域应用说话人识别技术,于1998年完成了CAVE(CallerVerificationinBankingandTelecommunication)计划,并于同年又启动了PICASSO(PioneeringCallAuthenticationforSecureServiceOperation)计划,在电信网上完成了说话人识别。2.话者识别基本原理话者识别技术是一门交叉学科,它所涉及的学科基础包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。每个说话人的语音信号既含有文本信息又含有说话人信息,说话人识别就其本质来讲,就是要把语音信号中的文本信息与说话人信息分离开,提取其

4、中表征说话人身份的信息;另一方面,我们希望在提取说话人的特征时要尽可能地做到与文本无关,不易受外界环境、身体状况等因素的影响。因此从语音信号中[3.4]提取的说话人特征参数应满足以下准则:ò对局部变量(例如:身体状况、情绪、系统的传输特性)不敏感;ò能长期地保持稳定;-1-http://www.paper.edu.cnò容易对其进行测量和存储;[1]话者识别分为训练和识别两个部分。在训练阶段,话者识别系统将为每一个话者建立一个能够描述这一说话人个性特征的模型,即说话人的语音特征模型。话者识别系统对语音样本进行学习,学习结束把学习的内容存储到模型库中。在识别阶段,对说话人进行辨认时,取与测试音匹

5、配距离最小的说话人模型所对应的说话人作为说话人识别的结果;对说话人进行确认时,用测试音的模型与所声称的说话人的模型进行比较,若匹配距离小于一个规定的阀值,则该说话人得到确认。说话人识别的基本原理如图一所示。语音输入识别结果预处理特征提取模式匹配模板训练参考模式图1话者识别基本原理3.系统硬件结构本系统以TMS320C5402为核心。TMS320C5402DSP是TI公司TMS320C54X系列的产品,它是一种典型的高性能、低功耗、16位定点DSP,广泛应用于语音处理、图形图像处理以及实时信号处理等多种领域。由于采用先进的修正哈佛(Harvard)结构、多总线结构和流水线技术,使处理指令和数据可

6、以同时进行,从而大大提高了处理速度,TMS320C5402DSP的处理速度最高可达100MIPS。在数字信号处理算法中,乘法和累加是基本的大量的运算,如卷积、FFT、FIR和IIR、矩阵运算、矢量搜索等,都大量类似于∑A(k)B(n−k)一类的运算。而DSP中设置了硬件乘法器和MAC(乘法并累加)一类指令,这些操作往往可在单个指令周期内完成,从而提高了速度,即使在声频范围内也能达到实时分析处理。片内存储器DRAM有16K字,ROM有4K字;片内具有丰富的外设,如PLL、McBSP、DMA、HIP等,其中多通道缓冲串口(McBSP)是一个双向的同步串口,用来和AD/DA连接,接收采集到的语音数据

7、。TMS320C5402有两个McBSP多通道缓存串行口。McBSP提供了全双工的通信机制,以及双缓存的发送寄存器和三缓存的接收寄存器,允许连续的数据流传输,数据长度可以为8、12、16、20、24、32;同时还提供了A-律和μ-律压扩,多达128个通道的发送和接收。AD/DA芯片采用TI公司的高速模拟接口芯片TLV320AIC23,它集成了16位A/D和D/A转换器,采样速率最高可达22.05k

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。