欢迎来到天天文库
浏览记录
ID:35102061
大小:6.11 MB
页数:52页
时间:2019-03-17
《面向大数据的高效用模式挖掘方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、麵鹿茂羅ill’-■"■^、--^■:^.-a/::;.^:;>,^::;赞宰緊.:;;;編獻;::^S:^齡簿:it知it乂麥—.議lp秦;'^1硕王研究生学位论文吝',--‘:甲',^;皆铭巧方V.,-.謬誦;.耀导面向乂数据的高效用模式挖掘.?-.',‘片'户.導;:韓记錫韻觀-.^E占範.方法研究.一'■壬'.:-'林??\*,.-*;-:-、、和叫7i;,Vhv.V,V--;.巧:-/祀转学生姓名:苗.张子論■‘.
2、‘'学号:VVV:20133Q9Q4Q108'皮飽专纖)‘一';成:樣"一 ̄"*一 ̄^.‘?^-...’Tf;..护.止:.';:;杳去巧,;古_yf一、校外导师唐菁喊論.—‘-、t?-.护翁、’‘2Q166月1日心心年:;巧奪I變變繼’;.賠:'繁纖霸挺義雜麟.鑛漏儀議猶纖議护;—I、:..,.'.'知..r;巧,遠茂霉紋嗦诚护:热袭巧髓變萬館蔡.‘-、‘’‘一-‘、皆/t/\;、北方工业大学学位论文原创性声明本
3、人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研究工作所取得的成果。除文中己经注明引用的内容外,本论文不含任何其他个人或集体已经发表或撰写过的作品成果。对本文的研究做出重要贡献的个人和集体,均己在文中W明确方式标明。本人完全意识到本声明的法律结果由本人承担。 ̄>3学位论文作者签名日期:>/<年《月/日学位论文使用授权书学位论文作者完全了解北方工业大学有关保留和使用学位论文的规定,目。P:研巧生在校攻读学位期间论文工作的知识产权单位属北方工业大学学校有权
4、保留并向国家有关部口或机构送交论文的复印件和电子版,允许学位,可允许采论文被查阅和借阅;学校可W公布学位论文的全部或部分内容用影印(保密的学位论文在解密、缩印或其它复制手段保存、汇编学位论文)后适用于本授权书。□保密论文注释:经本人申请,,,学校批准本学位论文定为保密论文密::,级,期限年自年月日起至年月曰止,解密后适用本授权书。1?(非保密论文注释:本学位论文不属于保密范围,适用本授权书。>八、本人签名::日期嗦荷iM-导师签名:日期:面向大数
5、据的高效用模式挖掘方法研究摘要随着各斤业对数据越来越重视和信息技术的快速发展,产生的数据越来越全面,并且各行业又要求能及时对己产生的数据进行,同时数据量也在快速的增长。挖掘和分析,这使得高效用的模式挖掘技术愈发重要由于大数据具有海量性、,这就要求挖掘算法有较髙的时空效率实时性和动态变化性的特点。尽管模式数一据挖掘技术取得了定的进展,但是挖掘算法的效率仍然是当前数据挖掘领域中一的研究焦点之。^IHI-Mine提出了种基于包含索引的高效用项集挖掘算法U。基于包含索引,而
6、且还有利于捜索空间的快速剪枝结构,不但可W快速发现共同出现的项目。此外,算法基于二进制位图来表示数据库,不但能够节省存储空间,而且还可充分利用位运算来提高算法的效率,算法的挖掘效率高,存储。实验结果表明开销小,可扩展性好。对高效用模式挖掘方法进行了研究,レ。根据大数据的特点ッ及典型挖掘算法一,在大数据中面临的问题,提出了种面向大数据的高效用模式挖掘算法该算法一采用滑动窗口的方法来维护数据流中当前被关注的数据,并给出种图形化的数一据结构和个表结构来维护当前窗日中的数据,使该结
7、构可W用来挖掘当前窗口一口中中高效用项集,同时也不会丢失数据影响下个窗数据的完整性。关键词:大数据,Hadoop,MapReduce框架,频繁模式挖掘,高效用项集1ResearchonHighUtilityPatternMiningMethodforBigDataAbstractWiththerapiddevelopmentofvarioussectorsoftheincreasingemhasisondatapandinfor
8、mation化chnolomorecomrehensivedataeneratedwhiletheamountofgy,pgdataisraidlrowinandtheindustralsoreues1;edtimeldatahasbeenpygg,yqyeneratedbmininandanalsis化ismakeseficientuseofatternminingygypg-te
此文档下载收益归作者所有