欢迎来到天天文库
浏览记录
ID:32966241
大小:4.03 MB
页数:135页
时间:2019-02-18
《基于区间数的不确定性数据挖掘及其应用研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、浙江大学博士学位论文基于区间数的不确定性数据挖掘及其应用研究姓名:任世锦申请学位级别:博士专业:控制科学与工程指导教师:吴铁军20060701浙江大学博士学位论文摘要尽管数据挖掘技术已经成功应用到很多领域,但是由于测量手段的局限性以及客观对象本身不确定性等原因,在自然和社会科学领域中存在大量待挖掘的数据是不准确、不确定的。如果不充分考虑这些数据的不确定性,不采用合适的数据挖掘方法,那么必然会导致挖掘模型性能下降,甚至是不可接受的。如何从大量不确定性数据中找出隐藏的知识,仍然是人们研究的主要课题。根据待挖掘数据所依据的不确定理论,不确定性数据挖掘方法可分为4种类型:随机数据挖
2、掘、灰色数据挖掘、模糊数据挖掘和区间数数据挖掘方法。本文以国家863项目钢铁生产过程的质量控制为研究背景,为解决生产过程数据不完整、不确定、大数据量的数据挖掘困难问题,提出基于SVM以及核方法的区间数数据挖掘建模方法,并用于钢铁生产过程的质量预测和质量分析。本文主要工作包括以下几个方面:1.提出了两种区间数回归建模方法。针对钢铁工业过程中的实际需要,本文提出两种区间数回归建模方法:(1)基于SVM的区间数输入、区间数输出回归建模方法。该方法把SVM从实数回归分析推广到区间数回归分析,同时继承了SVM的优点;(2)基于SVM的精确数输入、区间数输出的回归分析建模方法。该方法对
3、区间数上下界逼近回归建模的同时还考虑了上下界之间的相互信息。本算法能通过解凸二次最优化问题碍到全局最优解,有效地避免了回归模型的上界小于下界的问题。2.提出了基于多尺度径向基小波SVM的精确数输入、区间数输出的鲁棒回归分析建模方法。首先提出并使用基于多尺度径向基小波SVM方法对带有离群点的多尺度区间数样本数据集进行训练,分别得到区间数上下界初始回归模型,初始回归模型不仅能够有效地逼近多尺度样本信号、具有较好的鲁棒性和推广性能,而且在正常样本点处残差较小,在离群点处残差较大;然后以加权M一估计函数作为代价函数,并使用梯度下降法同时调整区间数上下界回归模型参数,且根据间数上下界
4、模型输出关系改变加权系数,消除了离群点对区间数回归模型的影响,解决了区间数模型输出上界小于下界的问题。3.提出了基于SVM的区间数分类建模方法。根据区间数的比较定义,该方法把区间数线性分类器转化为精确数输入的线性分类器,从而能够建立基于SVM的区间数分类器模型。本文通过设计合适的核函数,把区间数数据样本映射到高维特征空间,然后在高维空间中对样本数据进行线性分类,顺利地解决了Ⅱ浙江大学博士学位论文区问数样本线性不可分问题,克服了现有的区间数分类算法对输入维数敏感以及不适合大量数据样本等问题。4.提出一种基于核方法的区间数模糊聚类算法。本文通过设计合适的核函数,有效地扩大样本模
5、式之间的差异性,提高聚类算法对非对称数据以及混合数据模式的适应能力,且避免了直接在高维特征空间求解聚类问题。采用区间数遗传算法来求解非凸聚类优化问题得到聚类问题的全局最优解,大大提高了聚类质量。该方法解决了现有区间数聚类算法对多种聚类模式以及不对称数据聚类性能不理想的问题。5.以钢铁生产过程为应用背景,阐述了基于区间数的不确定性数据挖掘在实际生产中的应用,并与其它方法相对比。结果表明,本文提出的数据挖掘方法能够克服现有算法的缺点,并在钢铁过程的数据挖掘中取得较好的效果。关键词:区间数;回归;分类;SVlVl;核方法;多尺度学习;遗传算法;模颧聚类算法;数据挖掘浙江大学博士学
6、位论文mABSTRACTDataminingapproachhasbeensuccessfultyappliedintovariousfields,butinfactmanydataaleuncertainandimpreciseinuaturalandsocialsciencesbecauseoflimitsofmeasurementtechnologyanduncertaintiesofobjectseta1.Theinappropriatedataminingmethodsbasedontheseuncertaindatawillresultinpoor,evenun
7、aeceptedqualityofminingmodels.Howtoextracthiddenknowledgeinuncertainandimprecisedataisworthresearching.Accordingtotheuncertaintheoryonwhichdataminingmethodsarebased,fourmajorapproacheshaveproposedfordataminingunderuncertainty:dataminingforstochasticdata,datami
此文档下载收益归作者所有