欢迎来到天天文库
浏览记录
ID:42253078
大小:791.16 KB
页数:22页
时间:2019-09-11
《人工神经网络学习》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、人工神经网络学习人工神经网络是一种应用类似于大脑神经突触联接的结构进行信息处理的数学模型,由大量的神经元之间相互联接构成,每两个神经元间的连接都代表一个对于通过该连接信号的加权值反向传播算法,使用梯度下降来调节网络参数以最佳拟合由输入-输出对组成的训练集合先用样本数据训练神经网络时,它自动地将输出值与期望值进行比较,得到误差信号,再根据误差信号,从后向前调节各神经网络层神经元之间的连接强度,然后再进行运算,使误差减小,再将新的输出值与期望值进行比较,得到新的比先前小的误差信号,再根据较小的误差信号,从后向前重新调节各神经网络层神经元之间的连接强度,依此不断地多次进行,直到误差
2、满足要求为止感知器感知器以一个实数值向量作为输入,计算这些输入的线性组合,如果结果大于某个阈值,就输出1,否则输出-1。其中每个wi是一个实数常量,或叫做权值,用来决定输入xi对感知器输出的贡献率。特别地,-w0是阈值。f(v)x1x2xnX0=1w0w1w2wn附加一个常量输入x0=1,前面的不等式写成或感知器的表征能力可以把感知器看作是n维实例空间(即点空间)中的超平面决策面对于超平面一侧的实例,感知器输出1,对于另一侧的实例,输出-1这个决策超平面方程是可以被某个超平面分割的样例集合,称为线性可分样例集合delta法则delta法则克服感应器法则的不足,在线性不可分的训
3、练样本上,收敛到目标概念的最佳近似delta法则的关键思想是,使用梯度下降来搜索可能的权向量的假设空间,以找到最佳拟合训练样例的权向量把delta训练法则理解为训练一个无阈值的感知器(一个线性单元)指定一个度量标准来衡量假设相对于训练样例的训练误差其中,D是训练样例集合,是训练样例d的目标输出,是线性单元对训练样例d的输出经贝叶斯论证,对于给定的训练数据使E最小化的假设也就是H中最可能的假设梯度下降搜索从一个任意的初始权向量开始,然后沿误差曲面最陡峭下降的方向,以很小的步伐反复修改这个向量,直到得到全局的最小误差点梯度下降法则的推导如何发现沿误差曲面最陡峭下降的方向?通过计算
4、E相对向量的每个分量的导数,这个向量导数被称为E对于的梯度,记作当梯度被解释为权空间的一个向量时,它确定了使E最陡峭上升的方向,所以这个向量的反方向给出了最陡峭下降的方向梯度训练法则其中训练法则的分量形式:其中最陡峭的下降可以按照比例改变中的每一分量wi来实现需要一个高效的方法在每一步都计算这个梯度梯度下降权值更新法则多层网络和反向传播算法单个的感知器仅能表示线性决策面,而反向传播算法所学习的多层网络能够表示种类繁多的非线性曲面。可微阈值单元使用什么类型的单元来构建多层网络?我们需要的单元满足的条件输出是输入的非线性函数输出是输入的可微函数Sigmoid单元,类似于感知器单元
5、,但基于一个平滑的可微阈值函数sigmoid单元先计算它的输入的线性组合,然后应用到一个阈值上,阈值输出是输入的连续函数f(v)x1x2xnX0=1w0w1w2wn其中sigmoid函数也称logistic函数挤压函数输出范围是0到1单调递增导数很容易用函数本身表示反向传播算法用来学习多层网络的权值采用梯度下降方法试图最小化网络输出值和目标值之间的误差平方网络的误差定义公式,对所有网络输出的误差求和对于每一个训练样例d,每个权被增加:其中,Ed是训练样例的误差隐藏单元的权值训练法则对于网络中的隐藏单元的情况,推导必须考虑间接地影响网络输出,从而影响,重新组织各项并使用表示我们
6、得到:其中Downstream(j)表示单元j的直接下游单元的集合反向传播算法面临的学习任务搜索一个巨大的假设空间,这个空间由网络中所有的单元的所有可能的权值定义,得到误差曲面在多层网络中,误差曲面可能有多个局部极小值,梯度下降仅能保证收敛到局部极小值举例假设对于期望的输入网络权系数的初始值见图。试用反向传播算法训练此网络这里,取神经元激励函数:学习步长为当前输出计算误差连接权系数更新
此文档下载收益归作者所有