数据挖掘实习报告

数据挖掘实习报告

ID:29599166

大小:36.03 KB

页数:32页

时间:2018-12-21

数据挖掘实习报告_第1页
数据挖掘实习报告_第2页
数据挖掘实习报告_第3页
数据挖掘实习报告_第4页
数据挖掘实习报告_第5页
资源描述:

《数据挖掘实习报告》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、XX年的机关后勤工作在区委、区政府的正确领导下,以邓小平理论和“三个代表”重要思想为指导,深入贯彻中央、省、市、区有关会议精神,全面落实科学发展观数据挖掘实习报告  篇一:数据挖掘实习报告  通过半年的实习,我在这里得到了一次较全面的、系统的锻炼,也学到了许多书本上所学不到的知识和技能。以下是我这次的实习鉴定。  经历了实习,对社会也有了基本的实践,让我学到了书本以外的知识,实习期间,我努力尽量做到理论与实践相结合,在实习期间能够遵守工作纪律,不迟到、早退,认真完成领导交办的工作。在实习鉴定中,我参与了整个数据分析工作,从数据获取到数据清洗、

2、数据报表的制定到模型的建立以及模型监控等等,让我充分学习了数据分析岗位的实际操作。  在实习初期,项目经理安排了我参与数据获取的相关工作,主要是编写SQL代码在linux上用Perl语言调用获取数据。起初觉得自己对SQL语言了解较多,以为这份工作非常简单。但实际操作起来才知道,在数据量达到几百兆甚至上GB级别的时候,所学的SQL根本解决不了问题。经向项目经理学习,这才知道了如何使用分层次操作等速度较快的SQL技巧。通过这两个月的实习充分认识到所学知识远远不够。按照“三个贴近”的要求,紧紧围绕全区中心工作,深入开展“平安区”、“充分就业区”创建

3、活动,着力提高市民素质,弘扬城市文明精神,为实现全区城市统筹XX年的机关后勤工作在区委、区政府的正确领导下,以邓小平理论和“三个代表”重要思想为指导,深入贯彻中央、省、市、区有关会议精神,全面落实科学发展观数据挖掘实习报告  篇一:数据挖掘实习报告  通过半年的实习,我在这里得到了一次较全面的、系统的锻炼,也学到了许多书本上所学不到的知识和技能。以下是我这次的实习鉴定。  经历了实习,对社会也有了基本的实践,让我学到了书本以外的知识,实习期间,我努力尽量做到理论与实践相结合,在实习期间能够遵守工作纪律,不迟到、早退,认真完成领导交办的工作。在

4、实习鉴定中,我参与了整个数据分析工作,从数据获取到数据清洗、数据报表的制定到模型的建立以及模型监控等等,让我充分学习了数据分析岗位的实际操作。  在实习初期,项目经理安排了我参与数据获取的相关工作,主要是编写SQL代码在linux上用Perl语言调用获取数据。起初觉得自己对SQL语言了解较多,以为这份工作非常简单。但实际操作起来才知道,在数据量达到几百兆甚至上GB级别的时候,所学的SQL根本解决不了问题。经向项目经理学习,这才知道了如何使用分层次操作等速度较快的SQL技巧。通过这两个月的实习充分认识到所学知识远远不够。按照“三个贴近”的要求,

5、紧紧围绕全区中心工作,深入开展“平安区”、“充分就业区”创建活动,着力提高市民素质,弘扬城市文明精神,为实现全区城市统筹XX年的机关后勤工作在区委、区政府的正确领导下,以邓小平理论和“三个代表”重要思想为指导,深入贯彻中央、省、市、区有关会议精神,全面落实科学发展观  完成数据获取阶段之后,项目经理开始安排数据清洗以及数据报表制定的相关工作。接到这份工作之初,对数据清洗并没有太多的认识,以为很多都是按照《数据挖掘》教材中步骤进行就可以的。但经过项目经理指导之后才知道数据清洗之前首先要对项目业务进行一定的了解,只有清晰了业务数据的来源、数据的实

6、际意义才知道哪些数据可以称为极端值,哪些数据又是不正常的,制定报告或者交给模型分析师时需要去除的等等。同时,在制定数据报表的同时学习了很多excel函数的使用,透视表的使用,PPT报告的书写等等。按照“三个贴近”的要求,紧紧围绕全区中心工作,深入开展“平安区”、“充分就业区”创建活动,着力提高市民素质,弘扬城市文明精神,为实现全区城市统筹XX年的机关后勤工作在区委、区政府的正确领导下,以邓小平理论和“三个代表”重要思想为指导,深入贯彻中央、省、市、区有关会议精神,全面落实科学发展观  在实习的后三个月,开始接触了模型的分析与监控。在学习《机器

7、学习》以及《数据挖掘》书本时,总会想到各种各样的分类模型,也总会认为模型准确率高的模型才会是好模型。在运用统计模型之前,项目经理首先向实习生介绍了目前挖掘部门常用的分类模型以及具体的一些使用方法。其中逻辑回归模型、决策树模型是常用的分类模型,回归分析和时间序列模型是常用的预测模型,这与平日所学基本一致。正当好奇为什么不使用支持向量机以及神经络模型之时,项目经理说,由于模型结果都是要给市场部门的同事报告的,所以模型结果最好能够简单易懂的。在实际工作才知道,一般除了用模型准确率来衡量模型的效果外,还有例如灵敏度、ROC曲线、RA曲线等等指标值。而

8、模型的操作过程也不是想象的那么简单,并不是用R软件上的几个函数,几行代码就能解决的,选择什么参数、选择什么样的模型,当然最重要的还是选择什么样的基础数据作为模型的训

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。