欢迎来到天天文库
浏览记录
ID:11674327
大小:27.50 KB
页数:11页
时间:2018-07-13
《基于i―vector声纹识别上课点名系统的设计与实现[word文档]》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、基于i―vector声纹识别上课点名系统的设计与实现关键字:基于,vector,声纹识别,上课,点名,系统,设计,实现基于i―vector声纹识别上课点名系统的设计与实现本文为Word文档,感谢你的关注! 摘要:当今课堂教学过程中存在着学生旷课、老师需要经常检查课堂出勤情况等问题。本系统着眼于课堂教学的实际需要,旨在方便任课老师了解学生上课出席情况,以及防止冒名顶替等不公正现象的发生,开发了基于i-vector�纹识别技术的上课点名系统,不仅在说话人识别的研究领域有探索意义,而且在方便老师课堂管理方面有着重要的实践意义。 关键词:上课点名系统;声纹识别;跨平台交互 TP391
2、 文献标志码:A 2095-2163(2016)06-0108-03 0引言 声纹识别(voiceprintrecognition)也称为说话人识别[1](speakerrecognition),是通过对说话人语音信号特征的分析处理,识别说话人身份的过程。与语音识别不同,说话人识别侧重于说话人的身份而非说话的内容。按照说话内容的类型,可分为文本有关和文本无关。前者要求说话人在训练与识别阶段说相同的内容,而后者无此要求。所以,文本无关说话人识别应用将更为广泛,但识别难度也必然更大。 对说话人识别的研究始于20世纪30年代,早期主要进行有关人耳听辨方面的研究。而对说话人自动识别的
3、研究则需上溯自60年代。在语音特征提取方面,1962年Kesta提出使用语谱图进行说话人识别的方法[2],1969年Luck等人将倒谱技术首度应用于说话人识别[3],1976年Atal等人进一步提出线性预测倒谱系数[4]。而在说话人识别模型方面,60及70年代初期,主要采用的是模板匹配方法。70年代后期,动态时间规整和矢量量化技术相应地已然成为研究和发展重点[5-7]。 80年代后,Davis等人提出了Mel频率倒谱系数(MelFrequencyCepstrumCoefficient,简称MFCC)[8]。由于MFCC考虑了人耳的听觉感知机理,表现出良好的识别效果和噪声鲁棒性,从而
4、成为说话人识别中使用的基础评判参数。与此同时,人工神经网络和隐马尔可夫模型[9]也在语音识别领域获得了成功与广泛的应用,由此晋升为说话人识别中的核心技术。90年代后,高斯混合模型凭借其简单、灵活、有效以及出众的鲁棒性,迅速演进成为目前与文本无关的说话人识别中的主流技术[10]。进入21世纪以后,Reynolds等人提出GMM-UBM(GaussianMixtureModelwithUniversalBackgroundModel)模型用于文本无关说话人识别,使得训练GMM的样本数量要求减少,文本无关的说话人识别开始从实验室走向了广阔现实应用[11]。 2006年,Campbell等
5、人在GMM-UBM基础上提出高斯超向量概念,并与支持向量机融合为高斯混合超向量-支持向量机模型用于文本无关说话人识别,由此突破性地发展成为目前国内外文本无关说话人识别的热点关键实用技术[12]。近年来,学者们又在高斯超向量基础上,提出了联合因子分析[13]、鉴别性向量(i-vector)[14]等模型,使得文本无关说话人识别系统的性能取得了显著的改进与提升。本系统是基于i-vector构建的声纹识别系统。i-vector说话人建模技术[15]的基本思想可大致描述为:信道和会话的影响均包含在总体变化子空间中,通过对包含说话人信息和信道信息的GMM均值超矢量在低秩的总体变化子空间上进行投
6、影,得到只包含说话人信息的低维矢量。基于声纹识别的上课点名系统为教师课堂出勤管理提供了一整套行之有效的解决方案,从而大大提高了上课点名系统的性能。 [BT4]1系统的整体架构 上课点名系统总体架构分为PC端和移动端,两者通过无线网络相连。系统呈现C/S结构,在整体架构上可分为4层:最底层由无线网络、PC和手机来提供支撑;第二层包含网络TCP/IP协议和Socket;第三层由声纹识别算法、数据库和Android系统的API构成;最顶层即由系统各功能模块组成。综上可知,以上4层构成了完整的上课点名系统。 上课点名系统分为5大模块,具体可表述为:PC端的训练模块、点名模块、统计模块、
7、移动端的点名模块和本地录音模块。PC端承载了大运算量的识别任务,而移动端只负责语声的录音、简单转换和发送工作。PC端点名模块设计为主控整体的点名过程,移动端的点名模块则实施完成每个学生的点名工作。 [BT5]1.1训练模块 训练模块是上课点名系统的核心模块之一。训练过程一般由管理员控制并完成,模型训练后即可分发给教师使用。训练模块有如下的功能: 1)训练参数设置。训练参数设置包括MFCC参数设置、UBM和TV参数设置和默认路径设置。其中,MFCC参数
此文档下载收益归作者所有