欢迎来到天天文库
浏览记录
ID:32102186
大小:1.81 MB
页数:45页
时间:2019-01-31
《半结构化数据管理的动态建模技术分析与应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、■●摘要摘要由于半结构化数据缺乏类型信息、结构隐含或不规则,因此半结构化数据的存储与管理是一个十分重要的研究课题。为此,本文提出一种半结构化数据管理的动态建模技术,可针对半结构化数据存储结构不规则的特点,解决其难存储与管理的问题,并最后以村镇土地审批处理系统为实例说明此动态建模技术的有效性和可实用性。首先,本研究利用对象交换模型(OEM)建立半结构化数据的概念模型,解决半结构化数据描述不规则的问题。然后,深度优先遍历OEM模型,找出所有最大简单路径表达式,并利用分层结构思想和累加计数原则生成一个具有半结构化数据模式的动态树。由于此树形结构不仅能体
2、现半结构化数据的模式信息,方便抽取数据结构,还可针对半结构化数据类型信息缺乏、描述结构不严格等特点,随时灵活地进行更新,从而克服数据存储的不确定性。因此,本文决定将此树形结构作为半结构化数据的存储模型(逻辑模型)。最后,本研究进一步提出一套映射规则,将生成的存储模型映射到关系数据库中,以实现半结构化数据在计算机内部的物理存储。这样,日后对数据的查询就可转化为对关系表的查询,同时,也可应用传统的关系查询优化思想和查询技术来选择具体的查询执行计划。另外,本研究还初步探讨了半结构化数据的增量更新算法。该算法再次引入一种树状结构,以保存视图在数据库求值过
3、程中的信息。这样,当数据产生增量信息、数据库进行更新操作时,即可利用该树结构记录的信息对视图进行维护,从而有效降低计算量和数据的通信量。该动态建模技术打破传统管理半结构化数据的思想,从建立半结构化数据的概念模型到生成存储模型,再到实现半结构化数据的物理存储,每个阶段都可有效克服半结构化数据结构灵活多变的特点,对半结构化数据的管理工作有着现实的意义。关键词半结构化数据;动态建模;对象交换模型;分层结构;累加计数原则;模式抽取●AbstractResearchandApplicationonDynamicModelingTechnologyofthe
4、Semi--structuredDataManagementAsaresultofthesemi-structureddatalacktypeinformation,SOthestorageandmanagementofthedatawouldbeanimportantreaserchissue.Inordertosolvethedifficultissueofthedatastorageandmanagement,adynamicmodelingtechnologyofthesemi-structureddataconsidringthefea
5、tureofthestructureirregularwasproposedinthispaper.Additionally,thetreatmentsystemforlandapprovinginvillage-townwastakenasanexampletoillustratetheeffectivenessofthismodelingtechnique.First,thispaperproposedaconceptualmodelofthesemi—structureddatabasedonObjectExchangeModel(OEM)
6、whichcouldsolvethedescriptiveproblemofthedatawiththeirregularstructureeffectively.Then,foundallthebiggestsimplepathexpressionbycarryingouttheOEMdepth—firsttraversalandthen,addedthemtothedynamictreeinturnbyadoptingtheideasofhierarchicalslructureandtheprincipleofcumuiativecount
7、.Thedynamictreecouldnotonlybeabletoreflectthemodelinformation,toabstractthedatastructureseasily,butalsotoupdatemomentarilyandflexiblyconsideringthefeatureofthesemi-structureddatathatthelackindatatypeinformationandtherelaxaswell嬲thechangingindescriptivestructure,SOastoovercome
8、thestorageuncertaintyofthedata.Therefore,thispaperproposedthetree勰th
此文档下载收益归作者所有