欢迎来到天天文库
浏览记录
ID:39855150
大小:2.91 MB
页数:78页
时间:2019-07-13
《声纹识别原理、技术及应用》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、声纹识别原理、技术及应用洪青阳副教授厦门大学信息科学与技术学院E-mail:qyhong@xmu.edu.cn主要内容1生物识别技术2声纹识别基本原理3文本相关声纹识别及应用4文本无关声纹识别及应用5文本提示声纹识别及应用6总结及展望生物识别技术当今信息社会中,在国家安全、金融、司法等社会各个领域均需要个人身份验证。生物特征识别(BiometricsAuthentification)技术是通过计算机与光学、声学、生物传感器和生物统计学原理等高科技手段密切结合,利用人体固有的生理特性(如指纹、人脸、虹膜、声音等)来进行个人身份的鉴定。生物特征识别技术比传统的
2、身份鉴定方法更具安全、保密和方便性,且具有不易遗忘、防伪性能好、不易伪造或被盗、随身“携带”和随时随地可用等优点。生物识别技术图1各类认证技术比较生物识别技术生物识别技术你是谁你有什么U盾/密保卡等你知道什么文本密码生物识别技术市场机密6生物识别技术比较错误接受率错误拒绝率容易实用性处理速度/人指纹识别很低较低好2s-5s掌纹识别低5%使用困难5s-10s人脸识别低<0.2%非常好≤5s需要培训才能仪器自动对准使用,手工操虹膜需要3s-虹膜识别很低约10%作对虹膜有困5s,手工操作难需要5s-25s视网膜识别未知未知不好15s-30s声纹识别较低较低好≤5s声纹
3、唯一性鼻鼻腔硬腭鼻咽齿龈软腭上唇口腔牙齿下唇小舌舌根下颚骨舌骨会咽喉管声带甲状软骨环状软骨气管食道由于每个人的声音器官,诸如声带、口腔、鼻腔、舌、齿、唇、肺等,在发音时呈现千姿百态,抑或有着哪怕是微小的差异,以及年龄、性格、语言习惯等多种原因,再加上发音容量的大小不一,发音频率的不尽相同,因而导致这些器官发出的声音必然有着各自的特点,形成每个人独具一格的声纹(Voiceprint),可用语谱图观察出来。机密8语谱图分析语音信号的语谱(Sonogram)图分析:把和时序相关的傅里叶分析结果显示的图形称为语谱图(Sonogram,或者Spectrogram),它表
4、示语音频谱随时间变化的三维图形。Sonogram(Spectrogram:time,frequency,amplitude)0~9语谱图400040003000300020002000100010000000.511.522.530500010000150004x10f001_1(0-9口令)f002_1(0-9口令)400040003000300020002000100010000000.511.522.530500010000150004x10f001_2(0-9口令)f002_2(0-9口令)声纹识别(VPR)什么是“声纹识别”声纹识别(说话人识别),
5、就是从某段语音中识别出说话人的身份的过程。与指纹类似,每个人说话过程中蕴涵的语音特征和发音习惯等也几乎是唯一的。与“语音识别”的不同“语音识别”是共性识别,判定所说的内容(说的什么)。“声纹识别”是个性识别,判定说话人身份(是谁说的)。声纹识别独特优势语音采集装置造价低廉,只需电话/手机或麦克风即可,无需特殊的设备。与指纹、人脸相比,声纹更适合于远程身份认证。声纹口令可动态变化。声纹应用领域声纹辨认刑侦破案、嫌疑人追踪情报过滤、反恐侦查、国防军事监听呼叫中心、个性化应用,等等声纹确认金融证券交易、银行交易司法鉴定、法庭证据社区矫正
6、声纹门禁智能手机、民用安全/娱乐/数码设备,等等国内产业化进展中科院声学所、清华大学、中国科技大学、厦门大学等科研机构和高等院校已研制成功各具特色的声纹识别系统。涌现出北京得意音通、厦门天聪公司等专业的声纹识别技术开发商。其中厦门天聪公司已开发出手机声纹锁、社区矫正声纹识别系统以及声纹动态口令。分类方式一按识别任务分类闭集是哪个人的声音?开集声纹辨认说话人1(Identification)M说话人编号前端处理说话人2A…X匹配分数/概率说话人N是XX的声纹确认声音吗?(Verification)宣称说话人模型+>接受前端处理对比<拒识-冒名
7、顶替者模型分类方式二按说话内容分类文本无关(Text-Independent)不限定说什么文本语种无关(Language-Independent)语种相关(Language-Dependent)文本相关(Text-Dependent)要求说特定的文本(与训练阶段一致,或现场提示)必定是语种相关的性能评价标准对于说话人辨认系统,其性能的评价标准主要是正确识别率。对于说话人确认(SV)系统,其最重要的两个指标是错误拒绝率(FRR)与错误接受率(FAR),前者是拒绝真实的说话人,又称“拒真率”,后者是接受冒认者而造成的错误,又称“认假率”,两者均与阈
8、值的设定相关。等错率(
此文档下载收益归作者所有