声音、音频技术在视频安防监控中的应用.ppt

声音、音频技术在视频安防监控中的应用.ppt

ID:49327966

大小:280.50 KB

页数:22页

时间:2020-02-04

声音、音频技术在视频安防监控中的应用.ppt_第1页
声音、音频技术在视频安防监控中的应用.ppt_第2页
声音、音频技术在视频安防监控中的应用.ppt_第3页
声音、音频技术在视频安防监控中的应用.ppt_第4页
声音、音频技术在视频安防监控中的应用.ppt_第5页
资源描述:

《声音、音频技术在视频安防监控中的应用.ppt》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、声音在视频监控中的应用7/25/2021声音在视频监控中的应用概述声音是携带信息的重要媒体。研究表明,人类从外部世界获取的信息中,10%是通过听觉获得的,因此声音是多媒体技术研究中的一个重要内容。声音是由物体振动产生的,这种振动引起周围空气压强的振荡,从而使耳朵产生听觉的印象。声音的种类繁多,人的语音是最重要的声音。此外,还有动物、乐器等发出的声音,风声、雨声、雷声等自然声音,以及机器合成产生的声音等。7/25/2021声音在视频监控中的应用幅值t一个周期-+空气压强0人耳能识别的声音频率范围大约在20~20kHz,通常称为音频(audio)信号。人耳能识别的声音频率范围大约在20~20

2、kHz,通常称为音频(audio)信号。其中300HZ~3kHZ为语音信号(speech)图2.1空气压强振荡的波形示意图7/25/2021声音在视频监控中的应用音频滤波滤波器是一种选频装置,可以使信号中特定的频率成分通过,而极大地衰减其它频率成分。在测试装置中,利用滤波器的这种选频作用,可以滤除干扰噪声或进行频谱分析。音频滤波就是要滤除音频范围外的声音信号,相对突出音频信号,或者检出或去除某段频率的信号。常见的滤波器有高通,低通,带通,带阻。7/25/2021声音在视频监控中的应用7/25/2021声音在视频监控中的应用特定声音的检测和识别特定的声音常见的有玻璃破碎声,枪声,尖叫声等,

3、下面以玻璃破碎声为例介绍特定声音的检测和识别。7/25/2021声音在视频监控中的应用检测原理利用玻璃破碎的频率特征(10k~15kHZ),对高频的玻璃破碎声音进行有效检测,而对10kHZ以下的声音信号(如说话、走路声)进行有效过滤,这样当检测到特定频率的声音强度超过阈值时,就可认为发生了玻璃破碎。7/25/2021声音在视频监控中的应用检测原理示意图生态环境声音信号预处理训练样本测试样本特征提取特征提取高斯混合模型判决规则投票识别结果训练识别前端处理7/25/2021声音在视频监控中的应用玻璃破碎的应用玻璃破碎可应用到银行,博物馆,商业等一系列场合,如果同时进行低频的敲击声的检测,针对

4、性将更强,但玻璃破碎探测器要尽量靠近所要保护的玻璃,尽量远离噪声干扰源,如尖锐的金属撞击声、铃声、汽笛的啸叫声等,减少误报警。7/25/2021声音在视频监控中的应用声纹识别声纹识别属于生物识别技术的一种,是一项根据语音波形中反映说话人生理和行为特征的语音参数,自动识别说话人身份的技术。与语音识别不同的是,声纹识别利用的是语音信号中的说话人信息,而不考虑语音中的字词意思,它强调说话人的个性;而语音识别的目的是识别出语音信号中的言语内容,并不考虑说话人是谁,它强调共性。声纹识别系统主要包括两部分,即特征检测和模式匹配。特征检测的任务是选取唯一表现说话人身份的有效且稳定可靠的特征,模式匹配的

5、任务是对训练和识别时的特征模式做相似性匹配。7/25/2021声音在视频监控中的应用声纹识别应用前景与其他生物识别技术,诸如指纹识别、掌形识别、虹膜识别等相比较,声纹识别除具有不会遗失和忘记、不需记忆、使用方便等优点外,还具有以下特性:用户接受程度高,由于不涉及隐私问题,用户无任何心理障碍。与其他生物识别技术,诸如指纹识别、掌形识别、虹膜识别等相比较,声纹识别除具有不会遗失和忘记、不需记忆、使用方便等优点外,还具有以下特性:用户接受程度高,由于不涉及隐私问题,用户无任何心理障碍。与其他生物识别技术,诸如指纹识别、掌形识别、虹膜识别等相比较,声纹识别除具有不会遗失和忘记、不需记忆、使用方便

6、等优点外,还具有以下特性:用户接受程度高,由于不涉及隐私问题,用户无任何心理障碍。7/25/2021声音在视频监控中的应用声音定位人们经常借助听觉来判定发音物体的位置。声音定位在人和动物的日常生活中着重要意义。例如,当你独自行走时,突然听到一个响声.你会想到这个声音什么意思,对你有无威胁,它来自何方等等。确定声音的方向和距离需要比较来自两耳信息,虽然你会很快作比判断和反应,但声音定位过程是听觉系统复杂综合的功能。7/25/2021声音在视频监控中的应用声音定位机理强度差高频的声音刺激,由于它的波长较短,如果一个高频声波来自一侧,头部本身就构成声音传播的障碍物,使其到达对侧耳中的音强受到耗

7、损,这样在两耳之间形成了强度差,导致神经元单位发放频率的不对称。一般成年人能准确定位2000-3000Hz的声音。7/25/2021声音在视频监控中的应用声音定位机理时间差来自正前方的声音同时到达双耳,来自正侧方的声音到达近侧耳朵的时间比远侧耳朵约600ms,介于两者之间的声音到达双耳的时间差为0-600ms之间。到达的时间对有特征的、突然发生的声源定位是很有用的。此外还有音色差,相位差等。7/25/2021声音在视频监控中的应用声

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。