欢迎来到天天文库
浏览记录
ID:34162057
大小:3.76 MB
页数:66页
时间:2019-03-03
《时态文本挖掘关联规则算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、浙江工业大学硕士学位论文文本挖掘的时态关联规则算法研究文本数据挖掘的时态关联规则算法研究摘要由于对象为文本的数据库日益增多,并且这些数据库都在频繁更新,所以针对实时更新的文本数据库应产生相应的时态关联规则,以便挖掘时态文本数据库中隐藏的大量未知信息,这也将有助于发现事物发展的本质规律,使得发现的知识更加切合实际意义。虽然关联规则算法已经被深入广泛地研究,但在文本数据中时态关联规则算法研究还不多见。本文以时态文本为对象进行了时态关联规则的算法研究。首先对实验对象进行时态文本预处理,将时态文本用向量空间进行表示;然后提出时态文本表
2、示模型及时态文本关联规则模型;再提出时态文本关联规则算法SPFM,最后通过实验对该算法进行了有效性验证。本文采用C++编程语言实现SPFM算法在时态文本关联规则挖掘中的运用。我们将时态文本数据库转换为垂直数据格式,通过SPFM算法寻找有效时间,挖掘有效时间内的频繁项集,最后对时态文本进行强关联规则的挖掘,最后通过实验验证了算法SPFM是实际可行的。该算法在实际应用中有很大的意义,不仅能对医学病毒论文进行分析,也可以推广运用在计算机病毒挖掘、警务挖掘等大部分时态文本数据库中。在文本数据挖掘技术已经日渐成熟的背景下,把时态数据与文
3、本挖掘联合起来,时态文本数据挖掘应用于各种文本数据库将为以后的研究工作有很大作用。关键词:文本,时态,关联规则,垂直数据,有效时问浙江工业大学硕士学位论文文本挖掘的时态关联规则算法研究MlMNINGALGoRITHMFORTEMPoRALTEXTASSOClATIoNRULESINTEXTMININGABSTRACTWiththegrowthinthedatabasesoftext,whichiStemporalandfrequentlyupdated.correspondingtemporalassociationrules
4、shouldbegeneratedforthetextdatabaseandthehiddeninformationbedugout.Althoughtheassociationrulesalgorithmhasbeenintensivelyandextensivelystudied,thetemporalassociationrulealgorithmintextdataisstillunusual.Inthispaper,weproposeatemporalassociationrulealgorithmtostudyth
5、etemporaltext.Firstly,wepreprocessthetemporaltext,usmgthevectorspacetorepresentthedatabase.Then,developthemodelforthetemporaltextandthetemporaltextassociationrules.Andthen,weproposethetemporaltextassociationrulealgorithm:SPFM.Finally,weverifythevalidationofthealgori
6、thrnbyallexperiment.ThispaperappliestheSPFMalgorithmintominingtemporaltextassociationrulesusebyC++programminglanguage.Weconvertthetemporaltextdatabaseintoverticaldataformat.thenuseSPFMalgorithmtofindouteffectivetime,takeouttheorrespondingfrequentitemsets.Finally,wed
7、emonstratethattlleSPFMalgorithmispracticalandrealistic.111isalgorithmhasgreatsignificanceinthepracticalapplication.ItCannotonlybeusedinmedicalvirusthesis,butalsoCanbeusedinmostofthecomputervirusmining,policeminingandSOonintemporaltextdatabase.Wewillcombinetemporalda
8、taandtextmininginthematuringbackgroundoftextdataminingtechnology,andusetemporaltextdatamininginavarietyottextdatabase.Itwillmakeacontribut
此文档下载收益归作者所有