机器学习从业者工具使用方面大数据分析.doc

机器学习从业者工具使用方面大数据分析.doc

ID:28101282

大小:215.50 KB

页数:7页

时间:2018-12-08

机器学习从业者工具使用方面大数据分析.doc_第1页
机器学习从业者工具使用方面大数据分析.doc_第2页
机器学习从业者工具使用方面大数据分析.doc_第3页
机器学习从业者工具使用方面大数据分析.doc_第4页
机器学习从业者工具使用方面大数据分析.doc_第5页
资源描述:

《机器学习从业者工具使用方面大数据分析.doc》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、机器学习从业者工具使用方面大数据分析  数据平台Kaggle近日发布了2017机器学习及数据科学调查报告,这也是Kaggle首次进行全行业调查。调查共收到超过16000份回复,受访内容包括最受欢迎的编程语言、不同国家数据科学家的平均年龄、不同国家的平均年薪等。  下面主要看看工具使用方面的结果。请注意,该报告包含多个国家的数据,可能存在收集不够全面的情况,仅供参考。  年龄  从全球范围来看,本次调查对象的平均年龄在30岁左右。当然,各个国家的数值会有差异,中国的机器学习从业者年龄的中位数是25岁。    全球全职工作者为65.7%,其中中国为

2、53.%,美国占比较高,达70.9%。    Logistic回归是除了军事和国安领域外,最常用的数据科学研究方法。在军事和国防安全领域,神经网络被使用更多。    在工具语言使用方面,Python是数据科学家使用最多的语言。同时,统计学家对R语言的忠诚度很高。    关系型数据是最常用的数据类型,学术研究者和国防安全领域则更亲睐文本和图像。    Git是他们最常用的代码共享和托管方式。    DirtyData(脏数据)是从业者遇到的最大障碍。此外,理解不同算法的能力不够也是困扰数据工作者的一大障碍。缺乏有效管理和资金支持,是面临的两大外在

3、困境。    有趣的是,只使用Python或只使用R的都觉得他们做出了正确的选择。但是,如果你去询问那些既使用Python也使用R的人,推荐使用Python的可能会是R的两倍。    数据科学是个变化极快的领域,业内人员需要不断更新知识体系,才可以在业内保持一定地位,不被时代淘汰。StackOverflowQ&A、Conferences和Podcasts是已从业者经常使用的学习平台。

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。