欢迎来到天天文库
浏览记录
ID:27651972
大小:226.22 KB
页数:5页
时间:2018-12-05
《关联规则与聚类分析在超市中的应用研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、关联规则与聚类分析在超市中的应用研究余承乐,柳炳祥(景德镇陶瓷学院信息工程学院,江西景德镇,333403)摘要:数据挖掘是商务智能中经常使用的一项重要技术,企业在其整个运营过程中,积累了庞大的数据信息,决策者们所需要的信息往往就隐藏在里面,数据挖掘的H的就是如何有效地处理这些数据。论文结合数据挖掘软件Clementine分析了关联规则和聚类分析这两种算法在超市中的具体应用。关键词:数据挖掘;商务智能;关联规则;聚类分析ApplicationofassociationrulesandclusteranalysisinSupermarketYuChengle,LiuBingx
2、iang(SchoolofInformationEngineering,JingDeZhenCeramicInstitute,JiangXi,China,333403)Abstract:Dataminingisanimportanttechnology,whichisoftenusedinbusinessintelligence.Enterpriseshaveaccumulatedlargeamountofdataduringtheoperationprocess,theinformationtheyneedareusuallyhidindatamining.Theref
3、ore,howtodealwiththesedataisthepurposeofdatamining.Theessay,whichanalyzestheapplicationofdatamininginbusinessintelligence,combinedwithClementinesoftwaretoanalyzethespecificapplicationofassociationrulesandclusteranalysisinthesupermarket.Keywords:businessintelligence;datamining;associationr
4、ules;clusteranalysis1引言数据挖掘技术在商务智能的应用,已成为各行业、各部门信息化的必然趋势。现代企业的发展面临着巨大的挑战,市场竞争日趋激烈,客户要求越來越个性化,各类信息量正在迅速膨胀。数据仓库技术冇效地把操作数据集成到统一的环境中,提供用户用于决策支持所需的当前和历史数据,数据挖掘技术利用各种分析工具在这些海量数据中发现模型和数据间的关系,能够帮助企业更深入、更容易地分析数据,从海量的数据中寻找对自己真正宥用的信息资源。商务智能通过对大量的数据进行自动的加工、处理和分析,实现数据句信息、信息14知识的转换,并将知识应用于决策。论文结合数据挖掘软件
5、Clementine分析了关联规则和聚类分析这两种算法在超市中的具体应用。2相关理论分析2.1关联规则算法关联分析是统计学屮经常用到的一个术语,指的是对两个或者更多变量之间可能存在的关联关系的描述。对项集Aei,BGI,KAAB=,用A->B表示一条关联规则。从广义的角度说,这种关系还可以是因果关系或时序关系。关联规则挖掘就是在数据库屮进行关联分析,是数据挖掘的众多知识类型中最力典型的•一种。Apriori算法是关联规则算法中使用最多的一种算法,其主要步骤为:①扫描全部数据,产生候选1-项集的集合CI;②根据最小支持度,由候选项集的集合&产生频繁H项粜的粜合Lu③对k〉l
6、,重复执行步骤④、⑤;④巾U执行连接和剪枝操作,产生候选(k+1)-项集的集合Ch;扫描事务数据库D,计算每个候选项目集的支持度,如果大于等于最小支持度阈值min_SUp,则加入到Lku屮;⑤如果1^:为空集,则结束,所求结果即为UU…,否则k=k+l,转步骤④继续执行。I基金项HI江两省教育厅科研项H资助(GJJ10566)2.2聚类分析算法聚类就是在事先不规定分组规则的情况下,将数据按照其自身特征划分成不同的群组。要求是在不同群组的数据之间要冇明显差别,而每个群组内部的数据之间尽量相似。其形式化描述为:L=(S,f)是数据描述语言,其中:S是表达式的集合,f:S-P(
7、Mr),Mn是而向主题n的挖掘数据集,P(M::)是Mn的了-集。对任意的eeS,f(e)是由表达式e所界定的数据项的集合,是Mn的子集。对于给定的M„,找到一个窠合{ehe2,…:ek},满足对于任意ei,e.behe2,e3,eieS,(l)Uf(ei)=M,(2)f(e:)Af(ej)=久对任意1SiSjSk(3)ei与ej的差别用它们之间的距离d(ei,ej表示。0
此文档下载收益归作者所有