基于xml数据的模式发现和存储研究

基于xml数据的模式发现和存储研究

ID:33544635

大小:1.49 MB

页数:56页

时间:2019-02-27

基于xml数据的模式发现和存储研究_第1页
基于xml数据的模式发现和存储研究_第2页
基于xml数据的模式发现和存储研究_第3页
基于xml数据的模式发现和存储研究_第4页
基于xml数据的模式发现和存储研究_第5页
资源描述:

《基于xml数据的模式发现和存储研究》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、东南大学硕士学位论文基于XML数据的模式发现和存储研究姓名:牛天耘申请学位级别:硕士专业:计算机应用指导教师:孙志挥20040301基于XML数据的模式发现和存储研究摘要作为一种简单的、开放的、可扩充的自描述语言,心L不仅成为Interact,上数据表示与交换的标准,而且被应用于搜索引擎、电子商务、电子数据交换蒋很多方面,受到了广泛的重视。xhIL文档的模式抽取以及数据存储问题,是XML相关研究工作中的重要内容,直接影响着XML的使用效率和功能发挥。本文论述了频繁模式挖掘工作的意义和作用,介绍了若干用于频繁模式挖掘的算法,并在现有的频繁树结构挖掘算法一一wL算法的基础上,结合XML数

2、据模型XOEM和压缩结构树的存储结构.对挖掘过程中候选模式的剪枝策略进行了改进,提出了~种高教的xML频繁模式发现算法一--XFPD算法。同时,本文进一步研究了XFPD算法所产生频繁模式的形式化描述工作,使得XML频繁模式可以转化为相应的DTD格式,并提出了DTD到关系模式的转换和优化策略,用于有效的存储频繁模式数据,对频繁模式外剩余数据的存储方法也进行了相应的讨论。利用以上生成的关系模式,本文还提出了XML数据自动导入方法,以实现XML到关系数据库的有效存储。本文从理论和实验两方面证明了在挖掘XIIIL频繁模式时。XFPD算法比wL算法具有更加良好的性能,并通过一个原型系统的实现,

3、验证了本文提出的XML数据存储方法的有效性和可行性。关键词:XML,DTD,频繁模式挖掘,数据存储,关系数据库,关系模式东南大学硕士学位论文AbstractAsakindofsimple,openandextensibleself-describinglanguage,XMLisnOtonlyanemergingInternetstandardfordatarepresentationandexchange,butalsoappliedtoIntematsearchengines,electroniccommerce,EDI,etc.Sosuchattentionhasbeenpai

4、dtoXML.HowtoextractschemafromXMLdocumentsandstoreXMLdataisanessentialprobleminXML-relatedresearch,whichdirectlyaffectstheefficiencyandfunctionofXMLdocuments.Inthispaper,wediscussthemeaningoffrequentpaRemminingtasks,andintroduceaseriesoffrequentpattemminingalgorithms.Basedontheexistingfrequenttr

5、eestructureminingalgorithm--WL,wepresenttheXMLdatamodelXOEMandcompressedstructuretree,improvethepruningstrategiesofcandidatesandthenbringforwardaneffectivealgorithmforXMLfrequentpatterndiscovery--XFPD.Afterthat,wefurtherresearchontheformalizationoffrequentpatternsproducedbyXFPD,whichtransformsX

6、MLfrequentpatternstocorrespondingDTDs.ThemappingandoptimizingstrategiesforthegenerationofrelationalschemafromDTDareintroducedtostorefrequentpatterndata.Theproblemofhowtostoreoverflowdataoutoffrequentpatternsisalsodiscussed.Usingtherelationalschemasgeneratedasabove,wepresenttheautomaticimporting

7、methodofXMLdataandimplementefficientstorageofXMLdatainrelationaldatabases.ThispaperprovesthatXFPDhasbetterperformancethanWLintheworkofminingXMLfrequentpatternstheoreticallyandexperimentally,andgivesaproofofthevalidityandfeasibilit

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。