基于经验模态分解及动态数据挖掘的商务数据分析方法研究

基于经验模态分解及动态数据挖掘的商务数据分析方法研究

ID:32968064

大小:5.00 MB

页数:106页

时间:2019-02-18

基于经验模态分解及动态数据挖掘的商务数据分析方法研究_第1页
基于经验模态分解及动态数据挖掘的商务数据分析方法研究_第2页
基于经验模态分解及动态数据挖掘的商务数据分析方法研究_第3页
基于经验模态分解及动态数据挖掘的商务数据分析方法研究_第4页
基于经验模态分解及动态数据挖掘的商务数据分析方法研究_第5页
资源描述:

《基于经验模态分解及动态数据挖掘的商务数据分析方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、合肥工业大学博士学位论文基于经验模态分解及动态数据挖掘的商务数据分析方法研究姓名:刘慧婷申请学位级别:博士专业:信息管理与信息系统指导教师:倪志伟20080401摘要随着计算机技术的发展和普及,企业生成、收集、存储及处理数据的能力大大提高,数据量与日俱增。大量丰富的数据使得传统的数据分析方式陷入了困境,数据挖掘技术应运而生,它是一个新兴的边缘学科,涉及机器学习、模式识别、数据库、统计、人工智能等多门学科。商务数据挖掘是数据挖掘中的一个重要研究方面,目前关于商务数据中的静态数据分析模型已经慢慢变得成熟,但是经验模态分解算法及动态数据挖掘在商务数据分析中的应用研究,仍处在起步阶段。

2、经验模态分解(EmpiricalModeDecomposition,EMD)被认为是不同于以傅里叶变换为基础的线性和稳态谱分析方法的一种时频分析方法。本文以基于经验模态分解方法及动态数据挖掘的商务数据分析为目标,研究了经验模态分解方法的基本原理和算法思想;针对其端点效应等不足,提出了新的数据延拓技术;针对EMD算法的精度和速度上的不足,提出了相应的改进措施:并研究了EMD分解、构造性神经网络覆盖算法以及K.mea/ls聚类等方法各自独特的特点,以及这些方法与其他理论的结合点,为动态数据挖掘中遇到的一些问题提供新的解决方案,并把它们应用在商务数据的分析中。主要工作包括:·1.论述

3、了本论文的研究背景;综述了时频分析方法的发展;介绍了EMD方法及其国内外研究现状,以及动态数据挖掘的研究内容;最后,阐述了本文的研究内容、总体框架和创新之处。2.介绍了基于EMD时频分析方法的一些基本概念;阐述了基于EMD的希尔伯特变换的基本原理和算法:在此基础上,用基于EMD的时频分析方法对仿真信号进行了分析验证,结果表明把该方法引入非线性非平稳序列的分析是理想的。3.介绍了EMD算法端点效应的机理;然后系统地研究了基于神经网络预测的数据序列延拓技术和镜像延拓技术的特点及性能;最后,对各种延拓技术进行了比较研究,分析了各种延拓技术的优缺点,并提出了基于多项式拟合的数据延拓技术

4、。4.从提高速度与精度两方面着手,对EMD算法进行了系统研究。首先研究埃尔米特Hermite插值和三次样条插值哪个更适合获取序列的上、下包络线,结果表明三次样条插值效果较好;接着研究利用三次样条插值获得序列数据包络线的效果,结果表明该方法是理想的;然后阐述了样条插值获得包络线存在的问题,以及已有的解决方法——基于高次(高于三次)样条插值的EMD算法并考察了效果,表明高次样条插值能提高EMD算法精度,但耗时增加;最后根据EMD算法的特点,提出了基于极值点均值的EMD算法,并对该算法的效果进行了系统地研究,结果表明该算法优于原有的EMD方法。l5.研究了动态数据挖掘中的时间序列相似

5、性匹配问题。首先利用交叉覆盖算法对序列进行分类,进而完成序列匹配;直接利用覆盖算法进行匹配虽然是有效的,可是有时存在两个序列趋势是相似的,但由于某几维相差较大而没有被归为一类,增加了“拒识点”的个数。为了提高匹配的准确性,提出了基于EMD和交叉覆盖算法的序列匹配算法,实验证明该方法可以减少“拒识点”,提高匹配算法的准确度。6.研究了动态数据挖掘中的聚类问题。由于参加聚类的序列往往维度较高,所以首先研究了数据维度的约简问题。本章提出了基于EMD和自底向_J2(Bottom.up)分段算法的维度约简方法,并把该维度约简方法和K.means算法相结合,有效完成了数据序列的聚类。7.结

6、合国家高技术研究发展计划(863计划)专题课题(2007AA042116卜‘‘面向制造业售后服务的商务智能关键技术研究”,把第五章提出的基于E№和交叉覆盖算法的序列匹配算法用于个人信用的评估,即把客户的信用历史数据序列利用EMD方法提取趋势后,再利用交叉覆盖算法进行分类,通过对历史上每个类别的若干样本进行学习,从已知的数据中找出违约及不违约者的特征,从而总结出分类的规则,用于测量借款人的违约风险,为消费信贷决策提供依据;把第六章提出的聚类算法用于超市顾客行为的聚类,通过超市的交易数据对顾客进行聚类,将顾客划分到不同的簇(或称市场分段),并用市场分段中购买率较高的商品作为该分段的

7、描述,实现对每个市场分段分别地进行促销和广告。关键词:经验模态分解,动态数据挖掘,商务数据分析,端点问题,样条插值,交叉覆盖算法,自底向上算法,K.means算法nABSTRACTWiththedevelopmentofcomputertechnology,datageneration,collection,storageandprocessinghaswitnessedincreasingimprovementinenterprises.However,greatamountofdatah

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。