声音识别-声音分类-算法实现.ppt

声音识别-声音分类-算法实现.ppt

ID:57651368

大小:863.50 KB

页数:9页

时间:2020-08-30

声音识别-声音分类-算法实现.ppt_第1页
声音识别-声音分类-算法实现.ppt_第2页
声音识别-声音分类-算法实现.ppt_第3页
声音识别-声音分类-算法实现.ppt_第4页
声音识别-声音分类-算法实现.ppt_第5页
资源描述:

《声音识别-声音分类-算法实现.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、模型框架生态环境声音信号预处理训练样本测试样本特征提取特征提取高斯混合模型判决规则投票识别结果训练识别前端处理图1基于GMM的生态环境声音识别系统设计模块预处理使用cooledit转换格式/声道,或用Matlab处理特征提取训练数据的特征提取测试数据的特征提取不同的特征提取可以分开或合在一起设计分类算法设计GMM,HMM,SVM,KNN,ANN...测试和决策特征提取%读取声音文件wav=wavread(data.filenames{i_files},[1307712]);eg.200个文件i_

2、files=1:200307712是提取的样本数(限制读取的长度,约28s)%要提取的MFCC系数个数num_ceps_coeffs=20;c.fs=11025;%采样频率%设置每帧大小(包含样本数)c.seg_size=1024;c.hop_size=512;%%c.seg_size-交叠部分=c.hop_size特征提取(MFCC)%帧数计算num_segments=floor((length(wav)-c.seg_size)/c.hop_size)+1;%初始化功率谱矩阵P=zeros(c

3、.seg_size/2+1,num_segments);%设置窗函数c.w=0.5*(1-cos(2*pi*(0:c.seg_size-1)/(c.seg_size-1)))';%汉宁窗函数%逐帧做FFTfori_p=1:num_segments,idx=(1:c.seg_size)+(i_p-1)*c.hop_size;x=abs(fft(wav(idx).*c.w)/sum(c.w)*2).^2;P(:,i_p)=x(1:end/2+1);%工程实际中经常只用单边功率谱endc.num_fi

4、lt=36;%%Mel频带数f=linspace(0,c.fs/2,c.seg_size/2+1);%初始平均划分fmel=log(1+f/700)*1127.01048;%1127.01048=2595/log10,Matlab中log=lnmel_idx=linspace(0,mel(end),c.num_filt+2);%初始平均划分mel(38个点)f_idx=zeros(c.num_filt+2,1);fori=1:c.num_filt+2,%%f_idx(i)存的是mel中与mel_

5、idx(i)最近的元素的地址[tmpf_idx(i)]=min(abs(mel-mel_idx(i)));%近似的平均划分endfreqs=f(f_idx);h=2./(freqs(3:c.num_filt+2)-freqs(1:c.num_filt));%%三角的高度c.mel_filter=zeros(c.num_filt,c.seg_size/2+1);fori=1:c.num_filt,c.mel_filter(i,:)=(f>freqs(i)&f<=freqs(i+1)).*...h(

6、i).*(f-freqs(i))/(freqs(i+1)-freqs(i))+...(f>freqs(i+1)&f

7、10(M);%DCT函数c.DCT=1/sqrt(c.num_filt/2)*...cos((0:num_ceps_coeffs-1)'*(0.5:c.num_filt)*pi/c.num_filt);c.DCT(1,:)=c.DCT(1,:)*sqrt(2)/2;%%离散余弦变换mfcc=c.DCT*M;分类算法设计(GMM示例)ncentres=16;%高斯分量个数input_dim=16;%特征维数%设置混合模型mix=gmm(input_dim,ncentres,'diag');%特征数

8、据输入siz=600;features=zeros(siz,input_dim);fork=1:sizforj=1:input_dimfeatures(k,j)=data.feat.mfcc(i_files,j,k);endend%初始化模型参数mix=gmminit(mix,features,options);options(14)=20;%迭代次数.[mix,options,errlog]=gmmem(mix,features,options);Gmmdata(i_files)=mix;分类

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。