欢迎来到天天文库
浏览记录
ID:11895755
大小:130.30 KB
页数:15页
时间:2018-07-14
《高维不确定数据频繁项集挖掘技术研究——论文》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、项目名称高维不确定数据频繁项集挖掘技术研究项目负责人(签名)_______________________所在学校(盖章)___________________________“研究类别”含义:基础研究:指为获得关于现象和可观察事实的基本原理及新知识而进行的实验性和理论性工作,它不以任何专门或特定的应用或使用为目的。应用研究:指为获得新知识而进行的创造性的研究,它主要是针对某一特定的实际目的或目标。试验发展:指利用从科学研究和实际经验中所获得的现有知识、生产新材料、新产品、新装置、新流程和新方法,或对现有的材料、产品、装置、
2、流程、方法进行本质性的改进而进行的系统性工作。推广应用、科技服务:指与研究与发展活动相关并有助于科学技术知识的产生、传播和应用的活动。研究项目项目名称高维不确定数据频繁项集挖掘技术研究研究类别11.基础研究2.应用研究3.试验发展4.推广应用5.科技服务依托的一级学科工学成果形式论文起止时间2014.5-2015.6经费申请总额1万元其他经费及其来源项目负责人姓名职称工作单位电子邮箱项除目负组责主人要外成五员名姓名职称学位专业工作单位承担任务本人签名项目名称项目来源起止年月排名进展项目负责人近三年来承担的研究项目大规模耦合非
3、线性系统中混沌同步和信息流动的研究宁波市自然基金2012.6-2014.6第一在研信息化环境下的高校差导化教学模式研究全国教育技术课题2013.6-2014.6第一在研面向大数据的高频金融时间序列高效用时态频繁模式挖掘研究宁波市自然基金2013.9-2015.9第二在研基于BP神经网络Ni-TiO2纳米镀层的预测及优化研究省科研厅项目2013.6-2014.6第三在研项目负责人为第一署名人的代表性成果成果名称成果来源获得时间排名等级ResearchandApplicationofAlgorithmforMiningPosit
4、iveandNegativeAssociationRules国际会议2011年第一EIAstudyofNegativeAssociationRulesMiningAlgorithmBasedonMulti_Database国际会议2013年第一EI1.本项目研究意义及国内外同类研究工作现状(附主要参考文献及出处):(1)项目的背景和意义随着计算机信息处理领域的兴起,数据挖掘技术在近几十年的发展中越来越成熟,聚类、分类、关联频繁项集、回归预测、时序模式、孤立点检测等挖掘方法已被人们所接受,但这些处理均是针对确定数据进行的挖掘。
5、事实上,随着科技的发展和信息应用需求的不断扩大,数据采集及数据处理技术得到了长足的发展,不确定性数据已广泛出现在诸多应用领域之中,如传感器网络、RFID应用、数据集成、LBS(LocationBasedServices)、Web应用等。针对确定数据的传统挖掘方法显然不能实现不确定数据挖掘的目的,近年来不确定数据中的数据挖掘问题成为了研究热点[1]。对不确定数据的研究主要有两个方面,数据管理和数据挖掘。在数据管理方面,由于传统技术已无法应对不确定数据,大批学者及工业界对研发新型的不确定管理技术有着浓厚的兴趣,已有了很多成果,主
6、要研究有不确定的表示与模型定义[2-3]、预处理与集成[4-6]、存储与索引[7-8]、查询分析处理[9-11],其技术已相对成熟。与不确定数据管理相比,不确定数据挖掘技术则起步较晚,由于数据的不确定性对挖掘的结果产生不可忽视的影响,甚至可能对研究的结论产生致命的错误,因此对不确定数据挖掘研究更显得意义重大。目前不确定数据挖掘研究主要内容有聚类、分类、频繁项集挖掘和孤立点检测,其中频繁项集挖掘是研究的重点问题之一,而且频繁项集挖掘算法主要集中在完全频繁项集,而对于最大频繁项集和频繁闭项集的研究尚不多见,从我们自CNKI论文查
7、阅来看,专门研究不确定数据的频繁项集挖掘的论文也不太多,由于高维数据存在“维灾”问题,因而研究高维不确定数据的频繁项集挖掘则更少。本项目拟对高维不确定数据及不确定数据流的频繁项集的挖掘算法进行研究,分析现有的相关的频繁项集挖掘算法的不足及缺陷,提出改进及扩展方案,在利用频繁闭项集设计高效的挖掘算法上有所突破,并通过实验验证新的算法的性能及执行效率。(2)国内外研究现状和研究趋势频繁项集挖掘起源于关联规则挖掘问题,关联规则挖掘问题首先是由Agrawal于1993年提出的[12],其目的在于确定超大型数据库中项集之间的关系,并从
8、中求出所有频项集及其支持度。在传统数据库中进行频繁项集挖掘方法主要有两种,它们是基于先验的Apriori[13-16]算法和基于树结构的FP-growth算法[17-22],之后的工作大多是在上述两类算法基础上进行改进及扩展。对于不确定数据的频繁项集,显然不能仅用传统的Apriori算法和
此文档下载收益归作者所有