基于网络监听的关键词识别系统的研究与实现

基于网络监听的关键词识别系统的研究与实现

ID:25187531

大小:2.26 MB

页数:76页

时间:2018-11-18

基于网络监听的关键词识别系统的研究与实现_第1页
基于网络监听的关键词识别系统的研究与实现_第2页
基于网络监听的关键词识别系统的研究与实现_第3页
基于网络监听的关键词识别系统的研究与实现_第4页
基于网络监听的关键词识别系统的研究与实现_第5页
资源描述:

《基于网络监听的关键词识别系统的研究与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、第一章绪论§1.3关键词识别技术语音识别技术的研究工作开始于20世纪50年代。语音识别技术简单的说,就是让电脑听懂人的话,并做出正确的反应。语音识别按系统的识别对象可分为孤立词、连接词和连续语音三种方式。①孤立词识别是指对说话人每次只说一个字、一个词组或一条命令这样的孤立词进行识别,其中的词组或命令在词汇表中都作一个独立的词条;②连接词识别一般特指对十个数字连接而成的多位数字的识别,有时还可加上少量的操作指令,这时词汇表只由这十个数字及少数指令构成;③连续语音识别是对以日常自然的方式讲述的内容进行识别。关键词识别就属于第一种方式,所以它是一种特殊的语音识别技术[5][6]。关键词识别技术的

2、实质性研究开始于20世纪80年代,Myers等人利用基于动态时间规整算法(DTW)的方法进行相关的研究[7]。美国国际电话电报公司用模型连接的方法实现了关键词识别系统,并提出了填充废料模型的概念[8]。AT&TBell实验室实现了以5个常用电话用语作为关键词的基于HMM的关键词识别系统[9];美国BBN系统和技术公司,实现了对非特定人关键词识别系统的连续HMM建模,并给出关键词识别系统的性能评估[10]。关键词识别的目的是从连续语音中识别出预先给定词表中所包含的关键词。它包括两个方面的基本内容,一个是关键词检出,一个是关键词确认。关键词检出是鉴别语音包含哪几个预先输入的关键词,是一个多元判

3、决问题。而关键词确认则回答是还是不是包含这个关键词,是一个两元判决问题。关键词检出一直是语音识别领域的最具竞争力的应用热点之一,其在声音信息检索与监察,网络信息安全,人机智能交互等领域的关键环节都有非常广泛的应用。关键词识别系统本质上是一种模式识别系统,其基本原理如图1.1所示。该系统具图1.1关键词识别系统体实现过程包括两个大的组成部分:关键词离线训练模块和关键词在线识别模块。训练模块的处理包括语音预处理、特征参数的提取、模型训练等步骤;识别模块的处理包括语音预处理、特征参数提取、模式匹配、关键词检出和关键词确认等步骤。其中最为关键的问题就是特征参数的提取和模式匹配。特征参数的提取是关键

4、词识别技术的首要问题,特征参数提取的好坏直接影响到识别器的性能。目前,关键词识别技术中广泛使用的特征参数有线性预测倒谱系数LPCC、Mel倒谱系数MFCC和感知线性预测PLP。模式匹配是关键词识别中的第二个基本问题,其任务是把不同的识别基元在特征矢量空间中划分开来。其中最重要的是关于声学模型的选取,声学模型决定着语音识别系统的识别性能。主要的模型和算法包括基于模板匹配的动态时间规整算法(DTW)、–3–万方数据第一章绪论人工神经网络(ANN)、基于概率统计模型的隐马尔可夫模型(HMM)。其中HMM是当前关键词识别系统中应用最广泛、最成功的声学模型。§1.4本文主要工作和结构安排本文对VoI

5、P网络的基本原理、实现方式、相关协议及其协议内容进行了介绍,对合法监听理论、合法监听系统等进行了讨论。利用开源的Winpcap来实现网络监听,并对数据包捕获、数据包解析等内容进行了详细讨论。对关键词识别系统的整体框架及其框架内各个组成部分,如语音预处理、特征参数提取、关键词训练、关键词检出、关键词确认等进行了研究。另外,为了提高关键词识别系统的正确识别率,采用了MFCC与线性预测残差相位的联合参数作为系统的特征参数矢量。本文各章内容安排如下:第一章,绪论。本章首先介绍了课题的背景,然后对涉及的技术进行概述,最后给出了本文的主要工作和内容安排。第二章,网络监听系统的研究。讲述了VoIP的基本

6、原理和实现方法,介绍了SIP协议和基于SIP的VoIP网络。阐述了合法监听相关概念、合法监听的要求和工作流程,并讨论了基于SIP的VoIP网络的合法监听系统。第三章,关键词识别系统。介绍了关键词识别系统的总体框架,并对其各个组成模块进行了研究。具体包括语音预处理、特征参数选择和提取、基本识别单元选择、声学模型的选择和建模、关键词识别等。第四章,基于网络监听的关键词识别系统的实现。首先是通过开源的Winpcap从网络上捕获数据包,并对捕获过程进行了详细的分析。然后对数据包进行解析、语音还原等处理,从而得到网络语音数据。最后对得到的语音数据进行关键词识别。第五章,结论与展望。–4–万方数据第二

7、章网络监听系统研究第二章网络监听系统研究§2.1VoIP系统简介§2.1.1VoIP的基本原理VoIP也称为IP电话,网络电话等。它将模拟的声音信号经过压缩与封包之后,以数据封包的形式在IP网络进行语音信号的传输。中文就是“通过IP数据包发送实现的语音业务”。它使你可以通过互联网免费或是资费很低地传送语音、传真、视频和数据等业务。它的应用包括PC对PC的连接、PC对电话的连接、电话对电话的连接。VoIP技术基本原理就是通

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。