欢迎来到天天文库
浏览记录
ID:36853588
大小:3.29 MB
页数:98页
时间:2019-05-16
《数据挖掘算法及其生产优化应用研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、洳≥:文硕士学位论文⑧摘要数据挖掘是近年来在流程工业领域大力推广的一项信息技术。一方面,这得益于数据挖掘技术的兴起和快速发展。随着数据采集、存储技术的发展,人类积累了大量的数据。这促使人们寻找一种有力的工具去发现数据中隐含的规则,以更好地指导实践。由此产生了数据挖掘技术。近年来,数据挖掘技术从实验室走向了现实应用,在商业、科学研究、工程技术等方面获得了非常广泛的应用,积累了大量的应用经验。另一方面,随着工业信息化进程的推进,流程工业中积累了大量的生产数据。尤其是DCS系统和实时数据库的广泛应用,生产数据开始有了完备的记录。这使得数据挖掘技术的进入成为可能。同时数据挖掘技术作为一种全新的
2、生产优化手段具有很大的优势,但由于工业数据的复杂性,这一应用又提出了许多新的难题。在这一背景下,本文尝试通过对传统的数据挖掘算法进行创新,以解决工业应用难题。首先提出了一种新的工业数据序列分析方法:BTS算法。该算法的特点在于其灵活性和搜索的高效率。由于实时控制的要求,工业数据库非常庞大:传统算法难以胜任分析和呈现的任务。而BTS算法有很强的压缩能力,并能够灵活地改变压缩率,从而能够以不同粒度对序列的局部和整体进行观察。同时,BTS算法在特征空间中引入位趋势表示法。它既是一种快速的初级相似性模型,又可以作为索引。大大提高了搜索效率。BTS序列分析表明该数据库蕴含了大量的调整行为,因此数
3、据挖掘技术可能从这些行为中发现生产系统的规律。首先采用传统算法进行挖掘。结果指出生产系统中是否存在严重的不可忽视的复杂效应,需要设计一种新的软件框架。在模型分析的基础上,提出了一个新的算法框架:决策森林。首先针对时间滞后效应,在数据处理过程中引入关系数据库对整个数据库进行大规模重组,使得每条属性中的数据能够相互关联起来。其次是变量之间的函数依赖。算法吸取了CART、bagging、boosting、SLIQ的思想,并在生产模型的基础上,建立了一系列的决策树用以模拟变量之间的关系,并由这些决策树共同作出最终判断。三唑磷的生产实践证明了该方案的有效性。关键词:数据挖掘,相似性搜索,决策树,
4、时间滞后,变量依赖AbstractDataMiningisoneofthepromisinginformationtechniquesinprocessindus仃yOnonehand,dataminingtechniqueisdevelopingveryquicklyandhasfounditsapplicationsinvariousareas.Duetothedevelopmentintechniqueofdataacquisitionanddatabase.thereisahugeamountofdataaccumulatedinhuman’sactivities.Somann
5、eedsapowerfulanalysistooltodiscovertheunderlyingandinterestingrulesfromthesehugedatabases,whichcarlbeusedtohelpustodothingsmoreeffectively.DataIIliningisthesolutionforthisproblem.Aftertenyears’development,datamininghasfounditsapplicationsinvariousareas,frombusinesstoentertainment,fromsciencetote
6、chnology.Ontheotherhand,moreandmoreinformationsystemsbegintoentertheplants.DuetotheapplicationofDCSandrealtimedatabase,operationdataofplantsCanberecordedindatabase.Thisaccumulationofprocessdatamakesitpossibletoemploydataminingtoimproveproductivity.Butprocessdataisverycomplex,whichcausesmanyappli
7、cationproblems.Thispapertriedtogiveasolutiontoovercometheproblemsencounteredinindustryapplicationofdatamining.Firstly,anewalgorithmofsequenceanalysisWasproposed:BTS,whichisflexibleandeffectiveinsimilaritysearch.Thefirstfeatu
此文档下载收益归作者所有