欢迎来到天天文库
浏览记录
ID:21555117
大小:76.00 KB
页数:5页
时间:2018-10-22
《数据挖掘在铸造企业的应用研究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、数据挖掘在铸造企业的应用研究杨军刘龙宁夏共享集团股份有限公司摘要:在数字时代的大背景下,越来越多的企业转型成为数字大师,使用数据来指导整个企业的生产发展、管理决策。而数据挖掘技术无疑是现代企业乘风波浪的一把利器,它能抽丝剥茧地透过现象,看清商业的本质,为企业决策提供强有力的科学依据。本文针对数据挖掘的实现进行了研宂,对这项技术在企业相关应用做了指导,在企业数据分析层面上有一定的借鉴意义。关键词:数据挖掘;特征;铸造企业;应用;作者简介:杨军(1977-),男,宁夏平罗人,毕业于西安理工大学,研宄方向为两化融合。ResearchonApplicationofDataMininginFo
2、undryEnterprisesNingxiaKOCELGroupLimited;Abstract:Inthebackgroundofdigitalera,moreandmoreenterprisesbecomedigitalmaster,usingdatatoguidetheentireenterpriseproductiondevelopment,managementdecisions.Dataminingtechnologyisatoolformodernenterprisedevelopment,itcanseethenatureofthebusinessthroughthe
3、phenomenon,andprovideastrongscientificbasisforthedecision-makingoftheenterprise.Inthispaper,theimplementationofdataminingisstudied,thetechnologyapplicationintheenterpriseisguided,whichinhasacertainreferencesignificancefortheenterprisedataanalysis.Keyword:datamining;feature;castingenterprise;app
4、lication;0引言现在数字技术已经不是苹果、谷歌等科技公司的专享技能,在当今数字技术时代,传统行业与数字技术结合,应用数字技术,挖掘数据价值冰是大势所趋。成熟灵活地使用数字技术,改变并极大地拓宽公司的战略选择,所以企业需要不断利用自己在行业方面的数据,结合现在的数字技术,建立一个企业大师系统,为企业领导层提供战略指导数据依据。在数据利用方面,大部分企业都遵循丫“整合数据-分析数据-挖掘数据-指导决策”的思路。现在大部分企业更多的认识是在数据整合这个层而,通过数据总线、数据治理机制等是可以将企业的数据进行合理化地治理、汇总。分析数据和挖掘数据层面就需要更多的专业人士进行统一建模和
5、分析,才能得到合理、正确的战略决策。这时候数据分析、数据挖掘显得更加重要。Datamining,屮文名称叫做数据挖掘。这两年伴随着大数据一词也红得发紫。数据挖掘人冰也成为各大公司争抢的重耍角色。数据挖掘一般分为两类,一种是预测性,通过分类、回归的算法将数据的预测性展示出来。另一种则是描述性的数据分析,主要方法有聚类、关联规则挖掘、时间序列分析等。有了大量的数据为基础,再根据我们的目标决策,这时候就需要选择不同的数据分析方法,就可以达到要实现的目标。在实际使用屮,又要根据实际的情况使用一种或多种工具进行分析。:据挖掘在企业应用的步骤1.1明确问题在数据挖掘屮,需要碰到不同的问题采用不同
6、的方法,有时候如果选错丫方法,就如同缘木求鱼。明确问题就显得非常重耍。明确问题的方法主要是围绕以下几个问题开展的:(1)首先明确问题属于哪种常见的类型,是分类还是聚合?所要解决的问题是属于哪个类型,这个涉及到解决问题的方法、后期分析数据采用的工具。如果想要做预测性的问题,一般需要采用分类。同样数据分析方而,划归到聚类方法。(2)所挑选的数据集合是否够大,足够支撑我们的分析。现在数据挖掘技术都是针对大样本量的。包括现在经常使用的朴素贝叶斯算法等使用的模型都比较简单,学习效率高,在大样木量下会有很好的表现,当数据集合较小的时候误差就会变得很大,精度也会达不到要求。(1)我们所使用的数据是
7、否满足设罝的问题。这是对数据源进行的验证,数据源的信息是否可以通过分析得到所需要的结果。一般会对数据的分布情况、数据维度等方面进行校验。最后得出结论。经过以上的思考,就可以确定整个分析方案需要达到的目标和后续将使用的大致技术,将会得到企业大师系统构建的蓝阁。1.2对得到的数据进行预处理这里就是对得到的数据进行一个简单筛选。大致分为数据集成,删除数据冗余、数据冲突,数据采样,数据清洗、缺省值处理及噪声处理。其中数据采样取决于我们研宄的问题、数学模型的处理能力
此文档下载收益归作者所有