一文读懂:机器学习、数据科学、人工智能、深度学习和统计学之间的区别.doc

一文读懂:机器学习、数据科学、人工智能、深度学习和统计学之间的区别.doc

ID:27821973

大小:45.50 KB

页数:4页

时间:2018-12-06

一文读懂:机器学习、数据科学、人工智能、深度学习和统计学之间的区别.doc_第1页
一文读懂:机器学习、数据科学、人工智能、深度学习和统计学之间的区别.doc_第2页
一文读懂:机器学习、数据科学、人工智能、深度学习和统计学之间的区别.doc_第3页
一文读懂:机器学习、数据科学、人工智能、深度学习和统计学之间的区别.doc_第4页
资源描述:

《一文读懂:机器学习、数据科学、人工智能、深度学习和统计学之间的区别.doc》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、一文读懂:机器学习、数据科学、人工智能、深度学习和统计学之间的区别  数据科学是个广义的学科,AnalyTIcsdatascienTIst(TypeA)和BuilderdatascienTIst(TypeB)有所不同。    数据科学是个广义的学科,AnalyTIcsdatascientist(TypeA)和Builderdatascientist(TypeB)有所不同,TypeADataScientists在工作中遇到数据相关时可以写出不错的代码,但是并不必须是专家,这类datascientist可能专业是实验设计、预测、建模、统计推断或者其他统计学研究的典型部分。但是

2、一般而言,数据科学家的工作产出可不是学术统计学有时候建议的那样“p-valuesandconfidenceintervals”(正如有时候传统的药物领域统计学家会用到那样)。在Google,TypeADataScientists通常指统计学家、定量分析师、决策支持技术分析师或者数据科学家,可能还有其他的一些。  TypeBDataScientists是buildingdata的。B类和A类有些相同的统计学背景,但他们还是更好的coders,可能有专业的软件工程的训练。他们主要对在产品中使用数据感兴趣,他们建立与用户交互的模型,通常是提供推荐的(产品、可能认识的人、广告电影

3、、搜索结果之类)。  1.机器学习vs深度学习  在深度探讨machinelearning和datascience的联系之前,这里简要地讨论一下machinelearning和deeplearning。machinelearning是一套算法,来训练数据集做预测或者采取行动以使得系统最优化。举例来说,supervisedclassificationalgorithms被用来根据历史数据将想要贷款的客户分成预期好的和预期差的(goodorbadprospects)。对于给定的任务(比如监督聚类),需要的技术多种多样:naiveBayes、SVM、neuralnets、ens

4、embles、associationrules、decisiontrees、logisticregression,或者是很多技术的组合。所有这些都是数据科学的子集。当这些算法自动化后,比如无人驾驶飞机或者无人驾驶汽车,这就叫AI了,或者说的具体一点,deeplearning。如果采集的数据来自传感器并且通过互联网传播,那么这就是机器学习或数据科学或深度学习应用于物联网了。  有些人对深度学习有不同的定义,他们认为深度学习是更深层次的神经网络(一种机器学习的技术)。AI(ArtificialIntelligence)是创建于20世纪60年代的计算机科学的一个子领域,是关于解

5、决那些对人类来讲非常容易但是对计算机而言很难的任务。值得一提的是,所谓的strongAI可能可以做所有人类可以做的事情(可能除了纯粹的物理问题)。这是相当广泛的,包括各种各样的事情,比如做计划,在世界上到处溜达,识别物体和声音,说话,翻译,社交或者商业交易,还有创造性工作(比如写诗画画)等等。  NLP(Naturallanguageprocessing)只是AI要处理的语言部分,尤其是写。  Machinelearning是这样的一种情况:给出一些可以被以离散形式描述的AI问题(比如从一系列动作中选出对的那个),然后给定一堆外部世界的信息,在不需要程序员手动写程序的情况

6、下选出那个“正确的”行为。通常情况需要借助外界的一些过程来判断这个动作对不对。在数学上,这就是函数:你给一些输入,然后你想要他处理一下得到正确的输出,所以整个问题就简化为用一些自动的方式建立这种数学函数模型。和AI区分一下:如果我写了一段特别机智的程序有着人类的行为,那这就可以是AI,但是除非它的参量都是自动从数据中学会的,否则就不是机器学习。  Deeplearning是当下非常流行的机器学习的一种。它包含一种特殊的数学模型,可以想成是一种特定类型的简单块的组合(或者说是块的功能的组合),这些块可以进行调整来更好的预测最终结果。  2.DataScienceVSMach

7、ineLearning  机器学习和统计学都是数据科学的一部分。Learning这个词在machinelearning里意味着依赖于某些数据的算法,被用作一种训练模式集来调整一些模型或者算法参数。这包含很多技术,比如回归、朴素贝叶斯或者监督聚类。但不是所有的技术都适合这个分类。比如,非监督聚类——一种统计学和数据科学的方法——旨在不依靠任何先验知识和训练集监测聚类或聚类结构来帮助分类算法。需要有人来标注被发现的聚类。有些技术是混合的,比如半监督分类。有些模式侦查或者密度评估技术适合这个分类。  然而数据科学比机器学习范围大得多

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。