欢迎来到天天文库
浏览记录
ID:34371557
大小:147.73 KB
页数:3页
时间:2019-03-05
《网格的数据挖掘new》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第10期侯文国等:网格的数据挖掘·241·*网格的数据挖掘侯文国,傅秀芬,谢翠萍(广东工业大学计算机学院,广东广州510090)摘要:网格是网络计算、分布式计算和高性能计算技术研究的热点。随着科学计算领域中的数据剧烈增长以及未来网格计算环境下广域分布的海量数据共享成为现实,数据挖掘技术将在挖掘有效的信息、发现新的知识和规律发挥着重要的作用。结合网格的特点,概述了网格数据挖掘的特点和关键技术,重点讨论了网格数据挖掘的体系结构和基本过程,最后给出了基于OGSA的网格数据挖掘的例子。关键词:网格;网格计算;数据挖掘;体系结构;O
2、GSA;GIobus中图法分类号:TP274文献标识码:A文章编号:1001-3695(2004)10-0241-03DataMiningonGridHOUWen-guo,FUXiu-fen,XIECui-ping(CollegeofComputer,GuangdongUniuersityofTechnology,GuangzhouGuangdong510090,China)Abstract:GridisnowahotterresearchfieIdofgridcomputing,distributedcomputinga
3、ndhighperformancecomputingtech-noIogies.AsthenumberofdatainthescientificcomputationaIfieIdisenormousIyincreasingandinthefutureamassofshareddatadistributedgeographicaIIywiIIbereaIizedinthegridcomputingenvironment,dataminingtechnoIogywiIIpIayanimpor-tantroIeindiscov
4、eringvaIueinformation,newknowIedgeandIaws.SummarizethecharacteristicsandkeytechnoIogiesofdataminingwithgridcharacteristics.ThenwemainIydiscussthearchitectureandbasicprocessesofdataminingongrid.FinaIIywegiveanexampIeofdataminingbasedonOGSA.Keywords:Grid;GridComputi
5、ng;DataMining;Architecture;OGSA;GIobus网格是构筑在Internet上的一组新兴技术和基础设施,其!.#"网格数据挖掘的特点目标是在动态变化的,广域分布的异构虚拟组织间实现协同资(1)超级计算能力。网格计算能够为科学计算领域和社会[1]源共享,多领域的科学和工程的问题求解。数据网格计算经济生活领域提供超级的计算能力。网格的数据挖掘系统建技术是解决复杂海量科学数据的访问、存储、组织和管理的一立在网格计算的技术基础上,数据的传输具有高效的并行性特种有效技术。未来的科学计算以数据为中心,数据已
6、成为科点,而且数据处理能力超强。学、经济、医疗等领域的重要资源。在网格计算环境下,许多科(2)具有分布性和动态性,数据分布范围广。在网格计算学与工程计算问题,如高分子材料分析、生物计算、数字地球环境中,广域分布的各种资源都是动态创建和删除的。因此,等,以及信息服务、大型跨国企业、远程医疗合作将产生大量的网格的数据挖掘系统具备分布性和动态性,能够灵活调整数据数据。要分析和挖掘这些广域分布的海量数据,以获取新的科搜索的范围;另外,由于数据的分布性特点,数据挖掘算法是以学知识、规律和决策支持信息,传统的数据挖掘模式和技术是分布计
7、算的方式并考虑数据流通负载来分析数据的。无法胜任的。建立在数据网格基础上的数据挖掘结合网格计(3)具有高性能的I/O负载平衡能力。对广域分布的海量算的思想及其技术的优点,能够对广域分布的海量数据进行高数据处理的过程中,无论是数据的远程传输,还是挖掘过程中效的处理、分析和挖掘,给科学研究领域,经济领域和社会生活的数据处理、分析挖掘、模式评价等过程,数据的工作流都是很带来新的发现和巨大的价值。大的。这需要网格提供网络负载调度、管理和高性能的I/O负载平衡能力。!"网格的数据挖掘(4)高效的数据存储服务、传输服务和复制管理。在数
8、据!.!"网格数据挖掘的基本概念挖掘过程中要进行大数据集存储、复制的时候,网格能够提供高效的广域网数据高速缓存服务以解决网络带宽管理的问题;网格的数据挖掘建立在数据网格的基础设施和相关技术数据传输策略能够支持多种存储系统,并行数据传输,部分文的基础上,在广域分布的海量数据和计算资源的环境中发现数件传输和
此文档下载收益归作者所有