卷积神经网络课件.ppt

卷积神经网络课件.ppt

ID:57411214

大小:7.16 MB

页数:42页

时间:2020-08-18

卷积神经网络课件.ppt_第1页
卷积神经网络课件.ppt_第2页
卷积神经网络课件.ppt_第3页
卷积神经网络课件.ppt_第4页
卷积神经网络课件.ppt_第5页
资源描述:

《卷积神经网络课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、卷积神经网络研究及其 在基音检测中的应用答辩人:黄志强指导老师:何立强教授张学良副教授1目录一、选题意义及研究现状二、神经网络与卷积神经网络三、CNN-ACF-DP基音检测方法四、对比实验五、总结与展望2基音检测的意义及研究现状一、选题的意义及研究现状语音是人类生产生活中使用最多的一种交流媒介,被广泛用于智能人机交互领域。语音信号处理技术中,有一个非常重要的语音参数,基音频率(基频),代表声带振动的频率。从语音中提取基频就叫基音检测3基音检测的意义及研究现状常用的基音检测方法有ACF、AMDF、倒谱法及其变形,2011年Jin方法和2014年PEFAC方法。常用的基音检测方法在低信噪比环境

2、下性能急剧下降。一、选题的意义及研究现状4CNN的发展及研究现状神经网络是神经科学与计算机科学结合的产物。神经网络的研究几经起落,直到2006年,深度学习提出,深度神经网研究兴起。Hubel和wiesel通过对猫的视觉系统的实验,提出了感受野的概念。基于视觉神经感受野的理论,有学者提出CNN。一、选题的意义及研究现状5CNN的发展及研究现状深度学习在语音识别、图像识别等领域摧枯拉朽。一、选题的意义及研究现状国际会议、期刊等涌现大量深度学习的文章,CNN被引入很多领域。知名高科技公司都在深度学习领域加大投入。6神经网络起源二、神经网络与卷积神经网络7神经网络-训练过程二、神经网络与卷积神经网

3、络8神经网络-训练理念(梯度下降)各变量满足如下公式:求vjk的梯度:求wij的梯度:二、神经网络与卷积神经网络9BP-梯度下降的规律一条连接权重的更新量为连接中前层神经元的输出乘以后层神经元的输入和的Err。对于末层神经元,输出错误定义为:对于非末层神经元,输出误差如Err(y)由与其相连的后层神经元的输入误差Err(Z)加权求和得到:一个神经元的输入误差Err(Y)与输出误差Err(y)满足公式二、神经网络与卷积神经网络10BP算法的规律二、神经网络与卷积神经网络11卷积神经网络卷积神经网络是神经网络的一种变形卷积神经网络与神经网络的主要区别就是CNN采用了卷积和子采样过程。神经生物学

4、中局部感受野的提出(1962)催生了卷积的思想。卷积减少了CNN网络参数,子采样减少了网络参数,权值共享大大减少的CNN网络参数。但是CNN具备深层结构。二、神经网络与卷积神经网络12局部感受野二、神经网络与卷积神经网络13卷积神经网络的一般结构二、神经网络与卷积神经网络14卷积卷积核kernal在inputX图中从左向右,从上至下每次移动一个位置,对应位置相乘求和并赋值到OutputY中的一个位置。二、神经网络与卷积神经网络15子采样(pooling)子采样通常有两种形式。均值子采样和最大值子采样,子采样可以看做一种特殊的卷积过程。二、神经网络与卷积神经网络16CNN训练中的三次卷积过程

5、尾部NN训练的三个过程特征抽取器完成三次卷积二、神经网络与卷积神经网络17前向卷积过程二、神经网络与卷积神经网络18错误信号传播二、神经网络与卷积神经网络19权重更新二、神经网络与卷积神经网络20编码实现CNN我们采用了6w张手写数字图片作为训练集,用1w手写数字图片作为测试集。经过100次迭代,在训练集上得到99.51%的准确率,在测试集上得到98.8%的准确率。二、神经网络与卷积神经网络21本文的基音检测模型CNN-ACF-DP三、CNN-ACF-DP基音检测方法22CNN特征选取本文的CNN模型的输入是语音的频谱特征三、CNN-ACF-DP基音检测方法23特征选择三、CNN-ACF-

6、DP基音检测方法24CNN输出定义人的发声基频约为80Hz到460Hz,使用如下公式将该范围内连续的pitch合理地离散化到71个区间。三、CNN-ACF-DP基音检测方法添加一个无基音状态对应CNN的72个输出。25本文CNN网络结构描述三、CNN-ACF-DP基音检测方法26CNN的基音预测结果一段带噪语音的真实基频CNN预测出来的基频分布三、CNN-ACF-DP基音检测方法27ACF过程三、CNN-ACF-DP基音检测方法K=32,33….20028CNN与ACF融合我们将CNN的预测结果以乘积的形式附加到ACF特征中。将CNN末层神经元的输出乘以ACF特征中对应的维度并作为对应维度

7、的新值。得到CNN-ACF的167+1=168维特征。三、CNN-ACF-DP基音检测方法29动态规划在每一帧的167个状态中,我们挑选出3个概率最高的峰值作为该帧基频的候选项。最后我们利用动态规划对连续语音计算出收益最大路径作为最终的基音序列。动态规划的收益定义为:三、CNN-ACF-DP基音检测方法最大受益的路径:30模型效果ACF三、CNN-ACF-DP基音检测方法ACF+CNNACF+CNN+DP31对比实验实验

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。