人工智能诞生60周年 展望机器学习的未来发展.doc

人工智能诞生60周年 展望机器学习的未来发展.doc

ID:27839909

大小:33.50 KB

页数:11页

时间:2018-12-06

人工智能诞生60周年 展望机器学习的未来发展.doc_第1页
人工智能诞生60周年 展望机器学习的未来发展.doc_第2页
人工智能诞生60周年 展望机器学习的未来发展.doc_第3页
人工智能诞生60周年 展望机器学习的未来发展.doc_第4页
人工智能诞生60周年 展望机器学习的未来发展.doc_第5页
资源描述:

《人工智能诞生60周年 展望机器学习的未来发展.doc》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、人工智能诞生60周年展望机器学习的未来发展  1952年,ArthurSamuel在IBM公司研发了一款西游跳棋程序,这个程序具有自学习能力,可以通过对大量棋局的分析逐渐辨识出每一棋局中的“好棋”与“坏棋”,从而不断提高机器的跳棋水平并很快下赢了Samuel自己。1956,也就是在60年前的达特茅斯人工智能会议上,Samuel介绍了自己的这项工作,并发明了“机器学习”一词。  在计算科学历史上,“机器学习”有着多种定义,普遍的观点认为“机器学习”就是计算机利用数据和“经验”来改善算法系统自身的性能。斯坦

2、福大学对机器学习的定义是在没有明确编程指令的情况下,让计算机自行采取行动的科学。通过已有数据产生“学习算法”模型后,再应用到新的数据集上,从而对新的情况做出策略性判断,这就是所谓“预测”。可以说,机器学习是关于“学习算法”的科学,而人工智能则是研究开发具有智能的机器。  2016年是人工智能诞生60周年。在最近十年,随着大数据和云计算(大规模计算)的发展,机器学习进入了发展的黄金期。2016年12月17日,在2016机器智能前沿论坛上,中外专家探讨了机器学习的未来发展与展望。  机器学习进入发展黄金期 

3、 传统意义来说来,人工智能分两步:一是对数据的表示和表达,二是通过算法达到预测和决策的过程。传统人工智能是基于语义的方式实现数据的表示或表达,而从数据表示到预测往往是通过基于规则的逻辑推理,一个典型代表就是专家系统,这也是第一代机器学习。  对于第一代机器学习来说,规则的定义十分重要,一旦规则定义不准确或有问题,将导致不正确的逻辑推理。此外,基于规则的模型对于浅层推理有效,但没法用来进行深层次的推理。因此,也就发展出了第二代机器学习,即基于统计模型的机器学习。  在南京大学周志华教授的《机器学习》一书中

4、,对于机器学习的发展阶段和历史有更为细分的划分与相应的算法介绍。实际上,在二十世纪90年代中期,“统计学习”开始登上历史的舞台并迅速成为主流,代表技术即为SupportVectorMachine(SVM,支持向量机)以及KernelMethods等。而统计学习成为主流,则是因为前期的神经元网络研究出现瓶颈后(主要是因为当时的参数设置以手工为主),学者们才把注意力转向了统计学习。  随着统计学习的兴起,出现了机器学习的黄金十年。统计学习不仅被用于算法建模,还被用于数据的表示与表达,这样就弱化了对于相关背景

5、知识的要求。比如计算机视觉和图像研究属于计算机科学领域,其背景知识比较容易获取,而自然语言处理则需要英文或中文的语言学知识,这对于计算机专家来说就有难度了。  在更为广泛的应用领域,统计模式识别正在取代用于数据表达的专家规则,从而降低了人工智能和机器学习的入门门槛。这样,从数据表示到学习算法再到推理预测,就都可以全部用机器学习算法实现,这就进入了第三代机器学习阶段,即从数据直接到智能的端到端的机器学习。当然,随着大数据和云计算的出现,以复杂神经元网络为代表的深度学习也可以用于数据表示与表达。  可以看到

6、,面向数值计算的统计学习和以神经元网络为代表的深度学习是现代人工智能的两个主要分支。而在大数据+云计算的时代,这两大分支都进入了新的发展黄金期。  对抗网络和对偶学习  由前述可知,机器学习分为三个阶段,即第一阶段的数据获取与生成、第二阶段的学习算法和第三阶段的推理预测。在大数据与云计算的前提下,这三个阶段有着新的发展。  在数据获取与生成阶段,最新的研究发向就是用对抗网络来产生更多的数据。也就是说,如果在现实世界无法获得更多数据的前提下,就用机器学习算法来模拟更多的现实世界的数据,以供后续“训练”学习

7、算法之用。  所谓生成模型(GeneraTIveModel)是对数据的建模,即用大量数据来训练这个模型,以期望这个模型能产生更多类似的数据。常见的生成方法有混合高斯模型、朴素贝叶斯法和隐形马尔科夫模型等等。以混合高斯模型为例,该方法虽然有强大的逼近数据分布的能力,是非常适合概率密度估计的建模方法,但该方法不足以刻画复杂的数据,因此要用到神经元网络。  对于可以产生数据的神经元网络来说,如何训练它而使得产生的数据更接近真实数据?这就出现了生成对抗网络(GeneraTIveAdversarialNetwor

8、k,GAN)。比如用一个神经元网络来产生数据,再用另一个神经元网络来判别数据是否为真实,再通过两个网络的结果差异来优化数据生成模型。在著名的AlphaGO的训练算法中,也采用了类似的概念来生成用于训练计算机的新棋局,从而实现自对弈。  对于基于深度神经元网络的生成网络来说,一个可以改进之处就是如何利用大量未标注的真实数据。因为在训练神经元网络的时候,需要大量人工标注的数据,用以训练算法,比如标注一幅图为“花卉”。清华大学副教授、卡耐基梅隆大

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。