欢迎来到天天文库
浏览记录
ID:36621265
大小:2.09 MB
页数:51页
时间:2019-05-13
《基于网格的数据挖掘框架和元数据模型研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、摘要随着众多工业、科技、公共部门的信息化,可用的数字电子数据以空前的速度在增长。知识型部门能够成功的一个关键因素是高效、有效的管理和使用这些数据,特别地把它们转化为信息和知识。数据挖掘是满足这类信息需求的技术。而传统的数据挖掘系统是在单机或本地机群上运行的系统,不能够有效、高效地对分布在各地的数据进行挖掘。为了解决这个问题,本文探讨了一种基于网格的数据挖掘的解决方案。本文主要做了两方面的工作,首先综述了数据挖掘基本概念和网格计算的相关概念及其发展历史;而后说明了基于网格的数据挖掘是解决面向数据分布领域的数据挖掘难题的方案之一。分析了一种基于GlobusToolkitVers
2、ion4和其它相关开源技术和标准的数据挖掘体系结构,归纳了该体系结构内的功能实体,分析了其调用过程和状态变化过程。根据这个体系结构设计实现的系统可以不对数据挖掘应用做任何修改,就可以把应用程序部署到网格环境中。该体系结构的主要特点有:灵活性、可扩展性、大规模性、有效性、易于理解和易于使用。其次分析了基于网格的数据挖掘元数据模型。论述了应用元数据模型是实现基于网格的数据挖掘的关键技术。通过元数据实例可以把数据挖掘应用方便地部署到网格服务器中,通过查询注册在底层网格信息服务中的数据挖掘应用元数据模型实例文件.XML文件,用户可以发现注册在网格环境中的可用数据挖掘应用,这个元数据
3、实例文件也是调度和执行数据挖掘应用任务的基础。关键词:网格计算;数据挖掘;网格架构;元数据模型分类号:TP301.6ABSTRACTDuetotheincreasedcomputerizationofmanyindustrial,scientific,andpublicsectors,theamountofavailabledigitalelectronicdataisgrowingatallunprecedentedrate.n坞effectiveandefficientmanagementandllseofthesedata,andinparticulartheirtr
4、ansformationintoinformationandknowledge,isconsideredakeyrequirementforSuccessinsuchknowledge-drivensectors.Dataminingisthede-factotechnologyaddressingthisinformationneed.ButthetraditionalDataminingsystemswhichrunonsinglemachineorlocalclusterCallnotprocessthedistributeddataeffectively,effic
5、iently.SoheregiveasolutionbaseonGridcomputing.Themainworksofthispaperincludetwoparts.Firstly,Surveyofthetheoryandtechnologiesgridcomputing.Aftercomprisingthearchitecturesofgridnowadays,thedeficienciesofthese鲥darchitecturesarepresented.Andindicatesthattosolvetheproblemsofdistributeddatamini
6、ngrealizetheDatamining酣distherightway.Byanalyzingtherequirementsofthedatamining鲥dandcomparingthearchitecturesofthe鲥ds,thispaperproposedarchitectureofthedatamining鲥d.BasedontheGlobusToolkitandotheropentechnologyandstandards,thearchitectureprovidestoolsandservicesfacilitatingthe班d—enablingof
7、dataminingapplicationswithoutanyinterventionOntheapplicationside.Criticalfeaturesofthearchitectureincludeflexibility,extensibility,scalability,efficiency,conceptualsimplicityandeaseofuse.Secondly,thispaperinvestigatemeta-dataschemausedforDatamining鲥d.Afterthea
此文档下载收益归作者所有