欢迎来到天天文库
浏览记录
ID:50148453
大小:263.04 KB
页数:3页
时间:2020-03-07
《不同频段共振峰在声纹鉴定中应用价值研究.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、2011年第2期中国刑警学院学报2011牟6月No.22011journalofChinaCriminalPoliceUniversityJun.2011不同频段共振峰在声纹鉴定中应用价值研究庄琳章东(1南京森林警察学院江苏南京210000;2南京大学声学研究所江苏南京210000)摘要本实验通过对元音的线性预测谱长N-?-~LPC(hnearpredictivecoeffients)分析,在0到3kHz、3kHz到7kHz、7kHz以上三个频率段内共振峰频率、频带宽度、振幅求方差之比来分析各频率段特征的价值。关键词共振峰LPC图谱声纹鉴定
2、话者识别声纹鉴定中分析的是语音信号中说话人的个性特本研究的目的是进一步阐明各次共振峰在话者识征,一般不考虑包含征语音中的字词的含义,合适的别中的鉴定能力。通过对男女各5人一组发音人的元语音特征选择对于声纹鉴定极为重要.~该特征一方衙音进行一段时间的跟踪和多次采样,研究元音共振峰应具备个体差异高f自身差异,二者差异越.,在的频率、带宽、振幅三个参数在不同频率段的变异情声纹鉴定中的利用价值越高,另~方面应易于从说话况,对不同人的数据与同一人的数据方差之比进行统人的语音信号中提取和溯量。计分析,讨论不同频率共振峰在声纹鉴定中的应用价汉语元音类的浊
3、音是由声带的准明期振动,绎值。道共鸣调制,由口鼻辐射出来。不同元音的音色反l唼1实验的频谱结构不同。当元音激励进入声道时会引起共振1.1仪器特性,产生一组共振频率,称为共振峰。共振峰的参】.1.1硬件数主要包括共振峰中心频率的位置、频带宽度和幅华索VM一423+数字录音笔,麦克风,计算机。度。共振峰反映了声道的谐振特性代表了发音信息的1.1.2软件最直接的来源。人在语音感知中利用了共振峰信息,vs一99语音工作站(北京阳宸电子技术公司),它的频率分布和走向具有良好的特定性和稳定性,是SPSS统计分析软件。声纹鉴定中最重要的参考依据。一般认为
4、语音频潜包1.2样本络中的最大值就是共振峰,利用线性预测谱长时I.Pc共10人,男性5人,女l生5人,年龄均21—24可以提取频谱包络图及共振峰参数饧俊杰实验表岁左右,来自全国不同方言区,普通话发音较标准,明,语音的长时平均LPC图谱具有较强的个体稳基无特殊发音习惯,以自然语声在普通房闯朗读包性,通过检验语音的长时平均LPC潜不失为进声含普通话6单元音([aJ[01[]fi][uJ[y])的词纹鉴定的途径之一。组每次2遍,每隔一至二周采样一次,时间跨度半但研究人员对元音各次共振峰在话者识别中的鉴年。共采样20遍。录音采样率22kHz,每个采
5、样点别能力存在争议。杨俊杰等认为不同频率共振峰在话量化精度为.16bit。者识别中区别能力无显著差异.吴新源发现发音人的1.3实验内容第四共振峰(频率在3KHz以上的共振峰)数据存在较大利用vs一99语音工作站分析线性预测谱LPC时差异,反映了语音的特殊性,对于语音同一认定有一的参数设置为:帧长20毫秒,运算点数512个采样定的价值,但未能对第四及以上共振峰的具体作用作点,阶数28,哈明窗。其中滤波器阶数与共振峰的更深入的研究。有的话者识别理论认为低频、中高频、个数相关。通常一对极点对应一个共振峰,因此当共高频范围内共振峰的区别能力随着频率
6、的升高而增强。振峰数为5时,滤波器阶数应为10。此外当语音为:s§t。簪一l2011丘中国刑警学院学报6月鼻音和摩擦音时,声道传递函数并不符合全极点模型的假定,而是一个既有极点,又有零点的模型。考虑到这些情况,滤波器阶数设置为2D+l,其中D为共振峰的个数。实验分别提取语音中相同单元音中间段的长时(时间长度50—200ms左右,视元音稳定程度确定)图3二女生元音【a】LPC图谱重叠比对图LPC图谱及共振峰频率(Hz)、共振峰带宽(Hz)、共振峰幅值(db)等数据。2各频率段共振峰人间差异大小分析2.1样本示意图图4二女生元音[i]LPC图谱
7、重叠比对图2.3数据统计分析为了研究元音各频率段个体差异性,并选择合适的参数用于声纹鉴定。我们结合图谱比对共振峰差异,将共振峰分为:低频段(<3kHz)、中频段(3kHz至7kHz)及高频段(>7kHz),并对这三个频段进行方差分析、方差之比F分析,以统计分析各频段共振峰区别能力。对于某一特征,若同一人说话的不同次发音的均值变化较少,但不同说话人发音的变化较图1二女生元音【_】时域波形图大,则可用方差之比F来衡量这一特征参数的有效性。方差之比F定义为:图1为女生1和女生2元音[i]的时域波形图,横F一不同说话人的特征各自的均值的方差轴为时间
8、轴,纵轴为振幅。图2为女生1元音『i1的光一同一说话人各次特征的方差的均值标间长时LPC图谱,横轴为共振峰频率,纵轴为各均值的方差(全部说话人之间一<[i—>i共振峰振幅。由图可
此文档下载收益归作者所有