面向数据流的时段性高效用项集挖掘研究.pdf

面向数据流的时段性高效用项集挖掘研究.pdf

ID:50464584

大小:9.98 MB

页数:65页

时间:2020-03-06

面向数据流的时段性高效用项集挖掘研究.pdf_第1页
面向数据流的时段性高效用项集挖掘研究.pdf_第2页
面向数据流的时段性高效用项集挖掘研究.pdf_第3页
面向数据流的时段性高效用项集挖掘研究.pdf_第4页
面向数据流的时段性高效用项集挖掘研究.pdf_第5页
资源描述:

《面向数据流的时段性高效用项集挖掘研究.pdf》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、图书分类号:学校代码:颠士學位论文论文题巨面向数据流的时段性高效用项集挖掘研究研究生姓名摇导师姓名陈、汝授学科专业车欠件工程研究方向■按掘二—五年六月西南石油大学研究生学位论文知识产权声明书及学位论文版权使用授权书本人完全了解学校有关保护知识产权的规定,即:研宄生在校攻读学位期间论文工作的知识产权单位属于西南石油大学。学校有权保留并向国家有关部门或机构送交论文的复印件和电子版。本人允许论文被查阅和借阅。学校可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位

2、论文。同时,本人保证,毕业后结合学位论文研究课题再撰写的文章一律注明作者单位为西南石油大学。本学位论文属于、保密(),在年解密后适用本授权书。、不保密(请在以上相应括号内打“十)学位论文作者签名:务成指导教师签名傲例夏年月纟日年月曰西南石油大学研究生学位论文独创性声明本人声明:所呈交的研究生学位论文是本人在导师指导下进行的研宄工作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方外,本论文不包含其他人已经发表或撰写过的研宄成果,也不包含其他人为获得西南石油大学或其它教育机构的学位或证书而使用过的材料。

3、与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。学位论文作者签名:年(月义日摘要高效用项集挖掘己经成为数据挖掘中最重要的研宄问题之一。它致力于获取效用值高的项集,相比传统的频繁项集,高效用项集更能满足用户的需求。但是己有的高效用项集挖掘将商品的利润看作是独立且不变的,没有考虑到商品价格波动、折扣策略、季节性变化等因素。本文在己有高效用项集挖掘的基础上,对己有的数据模型进行扩展,提出一种新的项集挖掘模式,即“带折扣策略的高效用项集挖掘”。基于新模式,改进和提出了批量式和增量式的挖掘算

4、法。主要研究内容如下:提出了带折扣策略的高效用项集挖掘。该模型首次引入了商品的折扣策略,并综合考虑在不同时间段内商品的成本、商品销量、销售价格和折扣策略的变化情况和数据流流动性、连续性的特点,能够更加真实的挖掘出用户感兴趣的高利润项集。修改了传统的算法并将其应用于带折扣策略的高效用项集挖掘中。首先对原始数据进行数据融合,将其转换成一个表。然后利用算法找出所有的高利润项集。算法第一个阶段,循环产生和测试候选项集,找出所有的高事务权重项集;第二个阶段,重新扫描数据库,得到高事务权重项集的真实效用值来判断其是否为高效

5、用项集。提出了一种基于事务索引的批量式算法,简称为。该算法使用了一个新的结构:索引列表(用它来存储一个项集的效用信息和事务索引信息。因此不需要重复扫描原始数据库,只需对项集的索引列表进行简单的计算就能得到高效用项集,从而大大缩短了搜索时间。根据加权事务的向下封闭性,算法只需对那些高事务权重项集生成它们的索引列表,从而减小内存空间。修改了传统的频繁项集增量挖掘算法并将其应用于带折扣策略的高效用项集挖掘中。该算法结合了算法的思想,挖掘过程分为两个步骤。首先,算法保留在原始数据库中已经挖掘到的信息,并根据增量数据,通

6、过逐层迭代的方式挖掘出数据库更新后的所有高事务权重项集;其次,扫描数据库从高事务权重项集中挖掘出高效用项集。提出了一种基于事务索引的改进算法,简称为。该算法结合了、、三个算法的思想,并使用索引列表结构来存储信息。在挖掘过程中算法不需要重复扫描原始数据库和增量数据库,只需扫描索引列表就能快速得到高效用项集。通过大量的实验表明提出的新模型是可行的、可靠的,折扣策略的变化会影响到高效用项集的变化。此外,在不同的数据集分布和参数设置下算法的效率比算法快了倍;算法比算法快了大约倍;算法比算法快了大约倍。关键词:数据挖掘;

7、效用挖掘;高效用项集;折扣策略;数据流AbstractMininghighutilityitemsetshasemergedasoneofthemostsignificantresearchissuesindatamining.Itaimstoobtainhighutilityitemsets,andcanmeetmoreuserrequirementscomparedwiththetraditionalfrequentitemsets.However,theexistinghighutilityitemset

8、sminingconsiderstheprofitsofitemstobeconstantsandindependent,withoutconsideringthecommoditypricefluctuations,discountstrategy,seasonalchangesandotherfactors.Inthispaper,weextendtheexistingdatamo

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。