一种基于进制转换的数值型关联规则分析方法(可编辑).doc

一种基于进制转换的数值型关联规则分析方法(可编辑).doc

ID:62522128

大小:103.50 KB

页数:8页

时间:2021-05-12

一种基于进制转换的数值型关联规则分析方法(可编辑).doc_第1页
一种基于进制转换的数值型关联规则分析方法(可编辑).doc_第2页
一种基于进制转换的数值型关联规则分析方法(可编辑).doc_第3页
一种基于进制转换的数值型关联规则分析方法(可编辑).doc_第4页
一种基于进制转换的数值型关联规则分析方法(可编辑).doc_第5页
资源描述:

《一种基于进制转换的数值型关联规则分析方法(可编辑).doc》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、一种基于进制转换的数值型关联规则分析方法维普资讯////0>.年月计算机工程第卷第期他?博士论文?文章编号:文献标识码:中图分类号:.一种基于进制转换的数值型关联规则分析方法刘均,李人厚,郑庆华西安交通大学电信学院,西安摘要:针对基于区间划分的数值型天联规则分析斤法存在的问题,提出了种基十进制转换的分析方法。此方法将进制的属性值转换为二进制,并将二进制数值的每一位映射为二个布尔型属性,存此基础:,再采用布尔型关联规则分析方法。相对于琏十】划分的方法,此方法的优点是转化过程不存在失真,且能柯效地降低后续分析过程的时复尔度关健词:数值型关联规则;布尔型关

2、联规则;完整模式;进制转换.,,.’.’.:..,、..’【:;:?关联规则是数据挖掘领域的重要研究内容,它用于揭示定义属性模式:设,一,足一个属性集同一事物不同属性或项之间的依赖关系。根据规则中变量合,没∈的值域。,类别的不同,关联规则町以分为布尔型与数值型两种类型。对于任意,∈,二元组一,,,称为的‘个属对于布尔型关联规,,人性模式;们已做大量的研究,提出了、、、若与们,分别为腻性集与,的属等算法?。对于数值型关联规则,,现有的做法主要是通过划分区间的方法将其性模式,且,,则转化为问题,即按照特定标准,将属性值域划分为若为属性集,的一个属性模式。

3、干个区间,每个区问对应一个布尔型变定义模式包含:属性模式,包含属性模式,当且仪目前,对于问题的研究主要集巾在如何划分属性当存在模式,使得。值域的区间。现有的间划分主嘤有两种方式:使用预定义布尔型属性模式:没是属性集上的一个属定义的区间和分类进行划分。如对于“收入”属性,可划分性模式,若任意∈的值域均为,则称,为布尔型为“..”,“..”,“.”等间。该属性模式,设,:,?,种是目前常用的方式,文献中提出的划分方法属于此类,,可筒汜为。./’//型。根据数据分布进行间划分。该种划分是动念的,划定义完整模式:设∈是某个分过程满足某种挖掘标准,如最大化规则

4、的置信度。相对于数值型属性,.,?,是属性对应的布尔型属第一种方式,这种方式可在一定程度上减少划分间的数集,属性与分别表示某化为或,,,..目。文献【,中的划分方法属于该类型。:述方法适用于精。度要求不高的数据挖掘应用,对于属性值域间较大或精度要求较高的应用,如挖掘学习者种个性属性与多种学习对于属性集,若任意属性对行为之间的数值型关联规则,该方法存在以卜问题:对数,,∈中有且仅有一个属忡属,则称上据的模糊化必然导致挖掘结果的精度较低;划分区间的数目与属性值域的大小成正比,当值域较大时,必将指数级地基金项目:同家自然科学基金资助项目增加分析过程的时间复

5、杂度。作者筒介:刘均一,男,博:生,研方向:计算机协同工作,远程网络教育;李人厚,教授、博导;郯厌华,博士、教授基于进豺转换的数值型关联规则分析定穰日期:?:.相关概念一?维普资讯////.的属性模式为完整模式。模式共有种,不含有对偶属性的非完整模式共有若与分别为二进位属性集与的完整模式,,则为属性集种,故包含对偶属性的非完整模式共有一一与,互称对偶的一个完整模式。式中,.种,,十种。经优化,一的属性模式属性。.数值型关联规则分析不需要处理,当,上式趋近于,当:,上式的问题转化为问题的实质就是寻找一种非布尔值为.%。型属性模式到布尔型属性模式的映射方

6、法。针对区间划分方上述分析仍可能产生非完整模式构成的。因法存在的问题,本文提出了一种进制转换的映射方法,其基而,还需要在分析的结果集中,进一步寻找前后件均本思想是:将所有十进制属性值转化为二进制数值,对数值为完整模式的,并最终通过进制转换的方法将其转化为的每一位采用两个布尔型属性描述,分别表示该位为或。。在进制转换的基础上,通过对布尔型属性进行分析,.性能分析挖掘出前后件均为完整模式的规则,并将其转化为,最由于过程的时间复杂度与布尔型属性的个数为指终实现数值型关联规则分析。该方法的正确性等价于:对于数函数关系,因此,可通过两种方法所生成的布尔型属性个

7、任意一条满足一定支持度与置信度的数值型关联规则,通过数的对比,对基于进制转换的分析方法的性能进行该方法必生成一条满足同样支持度与置信度且前件与后件分析。均为完整模式的布尔型关联规则;反之亦然证明略;由此设某个属性的值域长度为,若采用上述方法,进一步可得:分析得到的合法的布尔型规则必须满足前?×个布尔型属性;若采用区间划分的后件均为完整模式。以下对基于进制转换的分析的过程进行说明。映射方法,设划分的最大区间为,则至少需要±::个属性值的进制转换布尔属性;显然,当较大或者较小时,即将属性值由十进制整型转化为二进制型。对于非整型的属性值,根据精度要求,将该

8、属性的所有值统一乘以固定?×,特别地,当时,即倍数,转化为整型。设,为的某个属性模式,可使上式成立。若属性模

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。