资源描述:
《语音门禁系统设计》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、嵌入式智能语音门禁系统的设计与实现摘要:为实现对楼宇单元门的语音控制,以语音识别原理为基础,通过对语音识别原理的系统分析,结合特定人语音识别的具体情况,研究了基于线性预测编码(LPC)的递推来推求倒谱编码(CC)基于滤波理论的基音周期确定算法,并将其结合起来,应用高性能数字信号处理器作为核心,设计了一个基于ARM9微控制器的智能语音识别门禁系统。系统采用了S3C2440微处理器,结合UDA1341专用音频语音录放芯片和触摸屏等进行控制和接口设计硬件设计,并基于Linux操作系统和QT/Embedded图形用
2、户界面(GUI)编程,实现对特定说话人的语音识别。详细介绍了语音门禁系统的硬件组成和工作原理,实现音频信号的采集、读取及控制的并行性,提高了电路的可靠性,从硬件、软件、算法优化等方面实现了基于语音识别门禁系统的总体设计,从应用的角度阐明了本系统理论上的合理性。结果表明,该门禁系统界面友好,操作简单,且具有良好的识别效果,本系统能够成功实现声音的准确采集及对电磁锁的语音控制。可进行产品推广。关键词:嵌入式;语音识别特征提取模式匹配LPCDTW;门禁系统;特定说话人;信号采集;语音录放。0绪论综合集成计算机、通
3、讯、自动识别、机械工程和安全管理系统等相关技术的门禁系统有效地解决了重要部门和场所的安全访问控制问题,已得到广泛的应用,成为日常工作和生活中的电子门卫。目前,门禁系统采用较多的是非接触式RF卡、生物识别技术、IC卡、密码输入等方式。然而随着科学技术的发展,综合应用语音识别、指纹识别、虹膜识别、红外(热)感应等最新生物识别技术,结合电磁锁等技术的门禁系统已广泛吸引了人们的注意,并将逐步成为门禁系统发展的主流与最终目标之一。利用语音识别技术来实现门禁系统不用像其他方式一样需要触摸,具有方便、安全、准确、信息完整
4、、独立性强、反应速度快等优点。因此,基于语音识别技术的门禁系统有着非常独特的优势和发展前景。。1语音识别技术及其原理语音识别技术的关键在于准确地分辨出不同人的语音特征及其信息内容,并以此控制其他设备来满足人们的各种需要。语音识别根据应用场合、使用对象、语音词汇量、算法模型等不同的分类依据,可分为不同的类型,如表1[1]所示,针对办公室、家庭等私人小型场所,门禁系统涉及到的主要是特定人语音识别的特殊要求。本文拟采用对用户的依赖性分类的形式,将相关语音识别分为两类:对用户声音特征的辨识和对用户发出的命令的确认。
5、基于对声音特征辨识的特定人语音识别在对安全要求很高的部门门禁系统中得到了较为广泛的应用。其基本原理:当系统接收到外界语音信息后,从事先训练好的语音库中找出惟一匹配的声音特征模型进行辨识,如果匹配成功则执行下一步操作;反之,如果无法匹配,将会拒绝执行任何操作。特定人语音识别应用较简单,不需要预先采集过多的样本,对硬件资源要求也较低,因此降低了系统运行中的前期成本;此外,其训练过程可以根据用户习惯,由用户任意定义控制项目的具体命令语句,因而适合大多数中小型以下企业或部门的各类应用。然而,特定人语音识别存在稳健性
6、不理想,对有些人的语音识别率高,有些人的识别率却不高;系统刚训练完时识别率较高,但随着时间的延长会导致识别率慢慢降低等缺点。为克服这些缺陷,本系统结合门禁系统语音识别的实际情况,通过从改进语音特征提取算法和模式匹配算法两方面对传统方法作了相应的改进,以提高门禁系统的语音识别性能和稳健性。特定人语音识别分为语音训练和语音识别两个阶段。在训练阶段,通过MIC输入语音命令,然后对模拟语音信号进行预处理,对处理后得到的数字语音信号进行语音特征提取,为不同用户的不同语音特征参数建立一个相应的语音特征模型库。训练完成后
7、,进入语音识别阶段,对MIC输入事先训练好的语音命令,然后对模拟语音信号进行预处理,对处理后得到的数字语音信号提取语音特征参数,紧接着调出语音特征模型库进行匹配检测。如果在模型库中找到先前已经训练好的与之匹配的语音特征模型,就会产生识别结果;反之,则无法识别。特定人语音识别原理框图如图1所示。1.1预处理预处理包括噪音去除以及端点检测。1.1.1噪音去除将通过麦克风输入的一段模拟语音信号进行量化和采样,转换成数字语音信号;将这段含噪的数字语音信号去噪,得到干净的数字语音信号,再通过预加重技术滤除低频干扰(尤
8、其是50Hz或60Hz的工频干扰)提升语音信号的高频部分,这样可以起到提升清音部分能量、抑制随机噪声和消除直流漂移的作用。1.1.2端点检测端点检测也即是从一段语音信号中确定出语音的起点及结束点的过程。有效的端点检测不仅减少了系统的处理时间(帧数最少),而且能排除无声段的噪声干扰,从而使处理质量得到保证。端点检测的困难在于无声段或者发音前后人为呼吸等产生的杂音,使得语音的端点比较模糊。目前对端点检测采用较多的方法