欢迎来到天天文库
浏览记录
ID:33400495
大小:3.80 MB
页数:68页
时间:2019-02-25
《时态文本挖掘的关联规则算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、浙江工业大学学位论文原创性声明本人郑重声明:所提交的学位论文是本人在导师的指导下,独立进行研究工作所取得的研究成果。除文中已经加以标注引用的内容外,本论文不包含其他个人或集体已经发表或撰写过的研究成果,也不含为获得浙江工业大学或其它教育机构的学位证书而使用过的材料。对本文的研究作出重要贡献的个人和集体,均已在文中以明确方式标明。本人承担本声明的法律责任。作者签名:?髦夸毒琴甄日期:纠易年r≥月>7日学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构
2、送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权浙江工业大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。本学位论文属于1、保密口,在年解密后适用本授权书。2、不保密口。(请在以上相应方框内打“4”)日期:洲二年f2,月衫日日期:d时序f百月狎日/浙江工业大学硕士学位论文文本挖掘的时态关联规则算法研究文本数据挖掘的时态关联规则算法研究摘要由于对象为文本的数据库日益增多,并且这些数据库都在频繁更新,所以针对实时更新的文本数据库应产生相应的
3、时态关联规则,以便挖掘时态文本数据库中隐藏的大量未知信息,这也将有助于发现事物发展的本质规律,使得发现的知识更加切合实际意义。虽然关联规则算法已经被深入广泛地研究,但在文本数据中时态关联规则算法研究还不多见。本文以时态文本为对象进行了时态关联规则的算法研究。首先对实验对象进行时态文本预处理,将时态文本用向量空间进行表示;然后提出时态文本表示模型及时态文本关联规则模型;再提出时态文本关联规则算法SPFM,最后通过实验对该算法进行了有效性验证。本文采用C++编程语言实现SPFM算法在时态文本关联规则挖掘中的运用。
4、我们将时态文本数据库转换为垂直数据格式,通过SPFM算法寻找有效时间,挖掘有效时间内的频繁项集,最后对时态文本进行强关联规则的挖掘,最后通过实验验证了算法SPFM是实际可行的。该算法在实际应用中有很大的意义,不仅能对医学病毒论文进行分析,也可以推广运用在计算机病毒挖掘、警务挖掘等大部分时态文本数据库中。在文本数据挖掘技术已经日渐成熟的背景下,把时态数据与文本挖掘联合起来,时态文本数据挖掘应用于各种文本数据库将为以后的研究工作有很大作用。关键词:文本,时态,关联规则,垂直数据,有效时问浙江工业大学硕士学位论文文
5、本挖掘的时态关联规则算法研究MlMNINGALGoRITHMFORTEMPoRALTEXTASSOClATIoNRULESINTEXTMININGABSTRACTWiththegrowthinthedatabasesoftext,whichiStemporalandfrequentlyupdated.correspondingtemporalassociationrulesshouldbegeneratedforthetextdatabaseandthehiddeninformationbedugout.Al
6、thoughtheassociationrulesalgorithmhasbeenintensivelyandextensivelystudied,thetemporalassociationrulealgorithmintextdataisstillunusual.Inthispaper,weproposeatemporalassociationrulealgorithmtostudythetemporaltext.Firstly,wepreprocessthetemporaltext,usmgthevec
7、torspacetorepresentthedatabase.Then,developthemodelforthetemporaltextandthetemporaltextassociationrules.Andthen,weproposethetemporaltextassociationrulealgorithm:SPFM.Finally,weverifythevalidationofthealgorithrnbyallexperiment.ThispaperappliestheSPFMalgorith
8、mintominingtemporaltextassociationrulesusebyC++programminglanguage.Weconvertthetemporaltextdatabaseintoverticaldataformat.thenuseSPFMalgorithmtofindouteffectivetime,takeouttheorrespondingfrequentitemse
此文档下载收益归作者所有