欢迎来到天天文库
浏览记录
ID:33173539
大小:1.95 MB
页数:68页
时间:2019-02-21
《基于xml的异构数据处理技术研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、北京工业大学硕士学位论文基于XML的异构数据处理技术研究姓名:周永健申请学位级别:硕士专业:计算机软件与理论指导教师:郑玉明20070401摘要数据处理是影响信息化管理发展的主要因素之一。数据处理主要包括数据交换以及对交换后数据的分类。其中,数据交换的目标是在异构环境中实现数据的共享,从而有效地利用资源,提高整个信息系统的性能,加快信息系统之间数据的流通“1。分类的目的是为了更好地管理数据,提高数据的利用率。目前,企业或政府部门的数据大多存储在关系数据库中,这些数据库结构不尽相同。因此,如何实现异构环境中数据的交换成为信息化建设中遇到的一个现实问题01。另一方面,随着数据交换技
2、术的不断发展,企业或政府部门接收来自其它部门的信息越来越多.这些信息种类繁多,浩如烟海,人们如何对所获得信息进行科学有效地管理是摆在人们面前一个不可回避的问题。XML与平台、语言、协议无关的特性和自描述特性使其适于跨平台的数据交换。Ⅺ订L逐步成为数据表示和信息交换的工业标准。它的出现为异构数据库之问数据交换提供了一条有效的途径⋯。在数据管理方面,传统的人工分类方法己无法适应信息时代对海量数据快速、高效的分类要求。人们渴望由计算机代替人类实现数据的分类管理,在这一需求的驱动下,文本自动分类技术应运而生。本文以电子政务应用为背景,研究了基于XML的异构数据交换技术和文本自动分类技术
3、。重点研究了关系数据库模式到XML模式的映射以及XML的关系数据库存储技术。本文通过基于用户请求的关系模式的提取、关系模式的分割、关系模式表及SQL语句的构造、映射算法的设计和数据的嵌入,完成关系模式到XML模式的映射。这种映射方法能够完整地保留关系模式的实体完整性和参照完整性约束。在实现Ⅺ咀。的关系数据库存储时,本文引入了结构和内容分别存储(也即XMLSchema和XML文档的分别保存)的方法实现XML的关系数据库存储。这种存储方法的引入,放宽了对数据发送方数据表示格式的限制,同时也节约了存储空间。为了实现对接收方所接收数据的分类管理,本文在比较现有文本分类技术的基础上,研究
4、分析了模糊聚类在文本分类中的应用,设计并实现了基于模糊聚类的文本分类器。关键词数据交换:模式映射;文本分类AbstractDatadisp∞alis∞eoftlaemaininfluetleingfacto口ofdevelopmentofinformationmanagement.Itmainlycontainstwopartsofdata旺ehangeandelassifiealionofdataatterdataatellage.Thegoalofdata“ehangeistorealizethesharingofthedatainthehete删getaeousenvir
5、onm∞t,血IlBIltilJT.1j∞印Ⅲ喇effeelively,improvesthel,ca'orm㈣ofthewholealPplicaitionsystem,andaeeelmlesdatacimullllionofinformationsystem.Andthegoalofclarificationistomanagedata卸Rci%Ⅱyandtoimprovctheeflfiei∞eyofdata眦Atpreseat,alotofdataof即把lpfi嘲orgovemmontis8协同intherelationaldatabase.ThesmKtI】feo
6、fitisdifferent.Torealizethesllaringofthedatainthehetcl'OgelleOusd嘣ba嘲becomesapracticalproblemtotheinformationd∞,elopmcnt.Ontheolhefh衄dwiIh曲曙developmentoftheteelmologyofdataa
7、c11∞ge'c,ltal,riseordc群哦m砷ofgove∞mcntr∞civekindsofinfomaation山址。咖曙form曲盯dlep砌衄b.Howtomanagethisiafonnalioneffieienflyi
8、s缸unavoidableproblemtopeople.Themeritofself,description柚djn出p目IddI∞OIIIplatform、langungo、protooolmakl_XMLbeabletoexchangedataoncro∞-plafform.XMLgradtla】lybecom月tlaestalldardofdatapre∞ltationandinformationexchange.ThemiⅢ∞ofXML蜘∞oftitle,Itsolutiontot
此文档下载收益归作者所有