防录音回放功能的语音识别软件的设计与实现

防录音回放功能的语音识别软件的设计与实现

ID:26011682

大小:56.50 KB

页数:7页

时间:2018-11-24

防录音回放功能的语音识别软件的设计与实现_第1页
防录音回放功能的语音识别软件的设计与实现_第2页
防录音回放功能的语音识别软件的设计与实现_第3页
防录音回放功能的语音识别软件的设计与实现_第4页
防录音回放功能的语音识别软件的设计与实现_第5页
资源描述:

《防录音回放功能的语音识别软件的设计与实现》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、防录音回放功能的语音识别软件的设计与实现----录音艺术论文-->第一章绪论1.1研究背景及意义说话人识别任务根据识别方式的不同,可分为三类[3]:(1)说话人辨认(SpeakerIdentification),是指从给定用户集中把测试语音所属的说话人区分出来;(2)说话人确认(SpeakerVerification),是针对单个用户,即通过用户测试语音来判断其是否是所声称的用户身份;(3)说话人探测跟踪(SpeakerSegmentationandClustering),是指对一段包含多个说话人的语音,正确标注在这段语音中说话人切换的时刻。前两个问题在某种程度上

2、是相通的,即如果把说话人确认问题看做是一个两类的说话人识别问题,则基本算法是一致的。在进行说话人识别时,按被输入的识别测试语音的内容来分,说话人识别一般分为[4~5]:(1)文本无关(Text-Independent),不规定说话内容的说话人识别(识别时不限定所用的语音的语句内容);(2)与文本有关(Text-Dependent),规定内容的说话人识别(只能用规定内容的语句进行识别)。在现代社会中,结合计算机(puter)、自动控制(Control)、通信(munication)、图像显示(CRT)等“4C”技术的门禁考勤、司法侦查、远程身份认证等领域的应用越来越

3、普遍,如:金融机构出入安全认真、企业出入检测考勤、司法调查监控语音分析、远程身份确认等。将说话人识别技术运用到这些领域具有以下的优势[3]:(1)说话人识别有着天然的优点:以声音作为识别特征,因其非接触性和自然性,用户容易接受。(2)说话人识别所用设备的成本低。对语音输入设备麦克风等没有特殊要求;声音的采样和量化对芯片的要求也不高;特征提取、模型训练和匹配等算法也便于实现。(3)其他生物识别技术较之说话人识别各有劣势。指纹、掌纹、手掌静脉等的识别需要手指接触传感器,存在卫生问题;虹膜、视网膜识别技术精确度高,但设备昂贵,同时需要把眼睛凑到传感器上;DNA验证技术准

4、确率极高却最昂贵最花时间;笔迹、步法等识别则可靠性低,用户使用感觉差。因此,说话人识别的优势更加明显。然而,说话人识别也面临着伪造语音攻击的问题。伪造语音主要来自以下几方面。(1)来自于其他说话人的刻意模仿(如口技等技艺)。(2)来自于录音设备(录音笔、MP3播放器、PDA等)的录音回放,即在某种场合时录下说话人的声音,并通过回放录音文件来攻击说话人识别系统。(3)现代的语音合成技术合成的逼真的语音。可以说,这些伪装、伪造语音是说话人识别的一大克星,如果系统不具有防伪性,那么说话人识别在实际应用中将变得毫无意义。而这么多种伪造语音中,录音设备获取的伪造语音最为简单

5、直接最为普遍,因此,开发具有防录音回放的说话人识别系统具有重大的实用意义。1.2说话人识别以及针对防假冒攻击的研究现状1.2.1说话人识别研究的现状1.研究历史1966年,美国法院第一次采用人耳听辨的方法进行了取证。Bell实验室的S.Pruzansky提出的基于模板匹配和统计方差分析的说话人识别方法,引起信号处理领域许多学者的注意,掀起了说话人识别研究的一个高潮。其间的工作主要集中在各种识别参数的提取、选择和实验上,包括从声学角度,对反映语音特征的物理参数的提取方法进行研究,最早使用的特征有谱包络系数、基音轮廓、线性预测系数等。1969年LuckJE首先将倒谱技

6、术用于说话人的识别,得到了较好的结果,BSAtal将线性预测倒谱系数LPCC用于说话识别,提高了识别系统的精度。Doddington提出利用共振峰进行说话人确认,1972年Atal用基频轮廓进行识别。将数字信号处理技术应用到语音信号处理上,人们提取了间接反映语音特征的参数,如LPC谱系数、LSP谱系数、部分相关系数。从20世纪70年代末至80年代末,声纹识别的研究重点转向对各种声学参数的线性或非线性处理上,StevenB.Davis最早提出了美尔倒谱系数(MFCC)的概念。MFCC由于考虑到了人耳的听觉感知机理,具有较好的识别效果和噪声鲁棒性,因此成了语音识别中使

7、用的主流参数[3]。第一章绪论...........11.1研究背景及意义...........11.2说话人识别以及针对防假冒攻击的研究现状.........31.3论文的主要工作以及章节安排.................5第三章说话人原始语音以及回放语音数据库的建设.................193.1说话人识别语音库以及回放语音库的简介...............193.2说话人原始语音以及回放语音库建设方案.................213.3本章小结.................27第四章具有防录音回放攻击功能说话人识别系统设计与实

8、现....

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。