欢迎来到天天文库
浏览记录
ID:36569933
大小:3.35 MB
页数:66页
时间:2019-05-12
《数据挖掘系统的应用研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、中国科学技术大学硕士学位论文数据挖掘系统的应用研究姓名:蒋方纯申请学位级别:硕士专业:计算机技术指导教师:蔡庆生20031101摘要聚类发现是数据挖掘的一类重要技术。它是一种在无导师的情况下,根攒样品趣瓣耀{娃糕疫叁动圭龟进行分类静方法。聚类{睾为统计数学豹分支已经波长蘩广泛的研究。在数据挖掘领域,有关聚攫的研究主要集中于空间数据库、多媒体数据库和图象等。这些研究的共同特点是,聚类的处理对象是幽数值属性构成的数据集。但是程商韭应耀中,将翱是在蔼韭报务梳鞫的数据仓簿中,天部分数瓣是非数值数据。对非数值数据,特别是对范畴数
2、据进行聚类比对数值数据有更多的困难,丽对它豹研究龆缀少。在本文中,重点研究了范畴数据中的聚类问题,分析了范畴数据的数学特征,绘出了范薅数据弱爨酃提铋溅度寒垒弱穗叛{樊l度赘撩念;探讨了蓬跨数据聚类静最优合并问题,给出了三个最优合并准则;在以上分析的基础上,给出三个范畴数据中的层次聚类算法。分柝了它们的时间笈杂度并比较了它们的实验结果。实验表碉提出的最饶合并准爨髓显著提高范畴数据聚类结果的证确注。察务数攒是一类姆殊款藏嚷数据。我识讨论了事努数攮麾中戆聚类超题。我们将范畴数攒的聚类簿法用予事务数据库中的事务聚类和项浆类并进
3、行了优化。我们实现了这两个算法,’讨论了它们的时间复杂度和空间复杂度。分析和实验表囊我镅翡算法gl有效豹楚理大鍪事务数据集。大量数摄之问的关联关系的发现在选择购物、决策分析葶鼹商务管理方厦其有重要豹意义。Apriori算法憝一稀有效静关联规掰挖掘算法,它探超逐级挖掘Apfiori性质。多层关联规则可以根据每个抽象层上的最小支持度闽值如何定义,使用多薅蓑喙挖握。基于约寒靛挖掘兔诲矮户聚焦,按提供瓣元翅慰即模式模扳和其他挖掘约束搜索规刚。奄力落发数撂联掇分掇系统,运雳关联发甏溪燹
4、l,采矮MicrosoftSQLSERVE
5、R2000数据仓库技术。结合安徽省电力调度通信中心的需求,选取用电量,发电量,历史采样以及历史采样与计划澍比四个主题,钵对时间、采样点、设备等缓、发毫类型筹建立缭度,用户可瑷隧意雾&选感兴趣的主题,选择不问的维度组合查看原始数据并对数据进行分析,并可用饼图,直方图,折线图,条形图等不恩的图形壹戏瓣显示。电力调度数据挖掘系统(DataMiningSystemforElectricPowerDispatching,麓称恣DMSEPD)采麓先逶戆KDD技术,耩发瑗的籁谖零浚方镬建耱予电力调度中心的决策支持、过程控制等领域,从
6、而为其科学决策提供有价值的信息;并为应爆单位避一步适艨电力市场的需器,为增强竞争性、扩大市场占蠢率打下坚实基旗,同辩为萁下~步与黧际接筑傲葑准备。樱握上述系统懿方法窝经验,运耀于学校售息瘁斡知谈发瑗系绞兹磁究。2AbstractClusteringisoneoftheimportantdataminingmethods.Itisallunsupervisedprocessofgroupingobjectsintoclassesbasedonsimilarcharacteristicsbetweenobjects.Asa
7、branchofstatistics,clusteringanalysishasbeenstudiedextensivelyformanyyears.Indatamining,mostpreviousresearchfocusonclusteringanalysisinspatialdatabases,multimediadatabases,imagedata,etc.Theseworkshaveasamecharacterthattheobjectsforclusteringareallnumericdata.But
8、incommercialareas,especiallyindatawarehousesoftradesmanandserviceproviders,muchofthedataisnon.numeric.Theproblemofclusteringnon-numericdata,especiallycategoricaldata,involvesmoredifficultiesthantherespondingproblemfornumericaldataButtherehasbeenmuchlessresearcho
9、nthisproblem.Inthisthesis,wefocusontheproblemofclusteringcategoricaldata.Westudythepattemofcategoricaldataandgivethedefinitionsoflocalsimilarityandglobalsimilarity.We
此文档下载收益归作者所有