浅谈深度学习的技术原理和其在计算机视觉的应用

浅谈深度学习的技术原理和其在计算机视觉的应用

ID:36614813

大小:1.33 MB

页数:11页

时间:2019-05-13

浅谈深度学习的技术原理和其在计算机视觉的应用_第1页
浅谈深度学习的技术原理和其在计算机视觉的应用_第2页
浅谈深度学习的技术原理和其在计算机视觉的应用_第3页
浅谈深度学习的技术原理和其在计算机视觉的应用_第4页
浅谈深度学习的技术原理和其在计算机视觉的应用_第5页
资源描述:

《浅谈深度学习的技术原理和其在计算机视觉的应用》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、UCLoud中国云三强:www.ucloud.cn浅谈深度学习的技术原理及其在计算机视觉的应用目前,深度学习几乎成了计算机视觉领域的标配,也是当下人工智能领域非常热门的研究方向。计算机视觉的应用场景和深度学习背后的技术原理是什么呢?下面让我们来一探究竟。计算机视觉的应用什么是计算机视觉呢?形象地说,计算机视觉就是给计算机装上眼睛(照相机)和大脑(算法),让计算机可以感知周围的环境。目前计算机视觉研究主要集中在基础应用场景,像图片分类、物体识别、人脸的3D建模等。识别物体是图片分类的一个比较常见的应用,例

2、如一个简单的猫咪识别模型,我们首先要给计算机定义模型,然后准备大量猫咪的照片去训练这个模型,让计算机能识别出来,输一张图片的时候能识别出图片是不是猫咪。正常情况下计算机模型能识别得比较准确,但是当我们输入了一些有遮挡、形态多变或者角度、光照不一的图片时,之前我们建立的模型就识别不出来。这就是计算机视觉在应用中存在的难点问题。UCLoud中国云三强:www.ucloud.cn深度学习背后的技术原理机器学习在计算机视觉领域中是怎么运用深度学习来解决问题的呢?深度学习作为机器学习的一种,这里先简单介绍下机器学

3、习。机器学习的本质其实是为了找到一个函数,让这个函数在不同的领域会发挥不同的作用。像语音识别领域,这个函数会把一段语音识别成一段文字;图像识别的领域,这个函数会把一个图像映射到一个分类;下围棋的时候根据棋局和规则进行博弈;对话,是根据当前的对话生成下一段对话。机器学习离不开学习两个字,根据不同的学习方式,可以分为监督学习和非监督学习两种方式。监督学习中,算法和数据是模型的核心所在。在监督学习中非常关键的一点是,我们对训练的每个数据都要打上标签,然后通过把这些训练数据输入到算法模型经过反复训练以后,每经过

4、一次训练都会减少算法模型的预计输出和标签数据的差距。通过大量的训练,算法模型基本上稳定下来以后,我们就可以把这个模型在测试数据集上验证模型的准确性。这就是整个监督学习的过程,监督学习目前在图片分类上应用得比较多。UCLoud中国云三强:www.ucloud.cn再来看非监督学习。跟监督学习不同的地方是,非监督学习不需要为所有的训练数据都打上标签。非监督学习主要应用在两个大类,一类是做聚类分析,聚类分析是把一组看似无序的数据进行分类分组,以达到能够更加更好理解的目的;另外是做自动编码器,在数据分析的时候,

5、原始数据量往往比较大,除了包含一些冗余的数据,还会包含一些对分析结果不重要的数据。自动编码器主要是对原始数据做降维操作,把冗余的数据去掉,提高后面数据分析的效率。通过不同的学习方式获取到数据后,算法是接下来非常重要的一环。算法之于计算机就像大脑对于我们人类,选择一个好的算法也是特别重要的。上面是ImaegNet竞赛的结果,2012年以前图片分类采用的机器学习的模型是特征+支持向量机的模型,2012年以后是卷积神经网络的模型,卷积神经网络在计算机视觉领域发挥着至关重要的作用。为什么2014年以后卷积神经网

6、络才发挥它的作用呢?我们先来看看神经网络。UCLoud中国云三强:www.ucloud.cn神经网络神经网络是受人脑神经元结构的启发,研究者认为人脑所有的神经元都是分层的,可以通过不同的层次学习不一样的特征,由简单到复杂地模拟出各种特征。上图是计算机应用数学的方式来模拟人脑中神经元的示意图。a1到ak是信号的输入,神经元会对输入信号进行两次变换。首要部分是线性变换,因为神经元会对自己感兴趣的信号加一个权重;其次部分是非线性变换。神经网络就是由许多的神经元级联而形成的,每一个神经元都经过线性变换和非线性变

7、换,为什么会有非线性变换?从数学上看,没有非线性变换,不管你神经网络层次有多深都等价于一个神经元。如果没有非线性变换,神经网络深度的概念就没有什么意义了。这是大家知道的神经元网络整体的模型,我们具体怎么来训练神经网络呢?UCLoud中国云三强:www.ucloud.cn步骤一,定义一个网络模型,初始化所有神经网络的权重和偏置。定义好网络模型以后再定义好这个模型的代价函数,代价函数就是我们的预测数据和标签数据的差距,这个差距越小,说明模型训练得越成功。开始训练的时候会初始化所有神经元的参数。输入所有训练数

8、据以后,通过当前的模型计算出所有的预测值,计算预测值以后和标签数据比较,看一下预测值和实际值有多大的差距。步骤二,不断优化差距,使差距越来越小。神经网络根据导数的原理发明了反向传播和梯度下降算法,通过N次训练后,标签数据与预测值之间的差距就会越来越小,直到趋于一个极致。这样的话,所有神经元的权重、偏置这些参数都训练完成了,我们的模型就确定下来了。接下来就可以在测试集上用测试数据来验证模型的准确率。卷积神经网络以上所讲的都是一般的全连接神经网

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。