欢迎来到天天文库
浏览记录
ID:37036394
大小:2.34 MB
页数:45页
时间:2019-05-17
《基于相关性度量的不确定数据频繁模式挖掘》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、分类号:学校代码:10165密级:学号:201511000956硕士学位论文基于相关性度量的不确定数据频繁模式挖掘作者姓名:高鹏学科、专业:软件工程研究方向:数据挖掘导师姓名:任永功教授2018年6月辽宁师范大学硕士学位论文摘要频繁项集挖掘作为数据挖掘过程中最基本的环节,一直是热门的研究领域之一。随着技术的进步、应用领域的不断扩展,在许多实际应用之中,例如网上商城的商品浏览信息、传感器网络、隐私保护、医院中医生的诊断数据和卫星图像数据等产生的数据可能是错误的或不完整的,由此可见不确定性数据普遍存在于现实生活中。针对确定性数据已提出了许多挖掘方法,但确定性数据与不
2、确定性数据在计算上和语义上的差异导致了它们并不适用于不确定性数据挖掘。如何在不确定性数据库中发现有价值的知识,就得到了众多学者的广泛关注。由于对不确定数据库中有效频繁项集挖掘算法的需求日益增长,促使其成了至关重要的研究领域。本文的主要工作如下:第一,本文研究当前经典的关联规则和频繁项集挖掘相关算法,并总结了不确定数据的频繁模式挖掘算法,以探究针对不确定性数据库模式挖掘新的研究策略和解决方案。简单介绍了数据挖掘中不确定性数据的来源及针对不确定性数据的一般处理模型,并综述了目前两种不确定性数据频繁模式挖掘模型,以分析基于期望支持度模型和支持度概率模型的优缺点。第二,
3、大多数不确定数据库中频繁项集的挖掘算法都基于支持度的限制来剪枝组合搜索空间,因而得到关联性很弱的频繁项集且对加权相关模式的挖掘效果不显著。针对加权不确定性数据,充分研究项集间的相关性和权重,本文提出一种新的策略:基于相关性度量的不确定数据频繁模式挖掘(UFPM-CM)。首先,本文采用一种新的树结构和一个针对树结构的新的度量来提高挖掘性能。其次,提出了新的不确定置信度度量来挖掘不确定数据库中的相关模式。最后,利用UFPM算法快速挖掘出相关性强的频繁模式。通过对两种不同类型的真实数据集Mushroom,Kosarak进行实验,将UFPM-CM算法与同类算法进行分析比
4、较,研究结果表明本文所提出的策略在同等运行环境中产生了较少但极具价值的模式且其效率更好。关键词:数据挖掘;频繁模式;加权模式;相关模式;不确定数据-I-基于相关性度量的不确定数据频繁模式挖掘FrequentpatternsminingforuncertaindatausingcorrelationmetricAbstractFrequentitemsetsmining,asthemostbasicpartofthedataminingprocess,hasalwaysbeenoneofthehotresearchareas.Withtheadvancemento
5、ftechnologyandthecontinuousexpansionofapplicationfields,theresultingdatamaybeWrongorincompleteinmanypracticalapplications,suchasproductbrowsinginformationofonlinemalls,sensornetworks,privacyprotection,diagnosticdataofdoctorsinhospitals,andsatelliteimagedata,souncertaintydataisubiquit
6、ousinreallife.Manyminingmethodshavebeenproposedforcertaindata,butthecomputationalandsemanticdifferencesbetweencertaindataanduncertaindatamakethemunsuitableforuncertaindatamining.Howtofindvaluableknowledgeintheuncertaindatabasehasattractedwideattentionofmanyscholars.Duetoanincreasingd
7、emandforefficientalgorithmsforminingfrequentitemsetsfromuncertaindatabases,ithasbecomeahotresearchfield.Themainworkisasfollows:First,thispaperstudiesthecurrentclassicassociationrulesandfrequentitemsetsminingalgorithms,andsummarizesfrequentpatternminingalgorithmsforuncertaindatatoexpl
8、orethegenera
此文档下载收益归作者所有