基于混合索引结构的DOA下DRC数据检索技术研究

基于混合索引结构的DOA下DRC数据检索技术研究

ID:23296443

大小:6.36 MB

页数:57页

时间:2018-11-06

基于混合索引结构的DOA下DRC数据检索技术研究_第1页
基于混合索引结构的DOA下DRC数据检索技术研究_第2页
基于混合索引结构的DOA下DRC数据检索技术研究_第3页
基于混合索引结构的DOA下DRC数据检索技术研究_第4页
基于混合索引结构的DOA下DRC数据检索技术研究_第5页
资源描述:

《基于混合索引结构的DOA下DRC数据检索技术研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、...’.了..Vi’■-.、、■、?‘.I.、'’...:.r巧v、J分类号密级.UDC编号為許jf《入璋硕±学位论文题名和副题名基于漏合索引结构的DOA下抓C数据检索技术巧究作者姓名谢明玉指导教师姓名及职称苗放教授谢诚高级工程师申请学位级别硕±专业名称软件工程论文提交日期论文答辩曰期^^学位授予单位巧日期成都理工大学(心^月)^答辩委员会主席.致朽馬‘巧河人.…增如痴裝备、..她?.,?'.V.

2、占?20巧年5月oVV一■■‘?..■:/..V;巧...'V.巧-分类号学校代码;10616UDC密级学号:2012050392成都理工大学硕:t学位论文基于混合索引结构的DOA下DRC数据检索技术研究谢明玉指导教师姓名及职称苗放教授谢诚.离级工程师申请学位级别硕壬专业名称软件工程论文提交日期>g/jr.(r碱论文答辩日期於化/爲74伞学位授予单位和日期成都理工大学(月)气^答辩委员会主席於Q评阅人碱縣珠20巧年5月独创

3、性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,除了文中特别加标注和致谢的地方外,论文中不包含其他人己经发表或撰写过的研究成果,也不包含为获得成辄理工大学或其他教育化构的学位或证书而使用过的材料一。与我同工作的人员对本研巧所做的任何贡献均已在论文中作了明确的说明并表示谢意。、矣学位论文作者签名:據口年/日^月学位论文版权使用授权书本挙位论义作若克全了解成都理工大学有关保留、使用学位论文的规定,有权保留并向国家有关部n或机构送交论支的复印件和磁盘,允许论文被

4、查阅和借阅。本人授叔成都理工大学可W蒋学位论女的全部或部分内容编入有关数。据库进行检索,可采用影印、缩印或扫描等复制手段保存、汇编学位论文(保密的学位论文在解密后适巧本授权书)至学位论文作者签名:離^、学位论文作者喔名:病夺诚>fS年月V^日基于混合索引结构的DOA下抓C数据检索技术研究摘要、大数据时代,数据既是基础也是核屯。围绕数据构建体系架构,可W解决目前许多架构在系统集成,、系统扩展和数据管理等方面存在的瓶颈问题数据为中也的DOA系统架构随时代的需求而生,。DOA存储各种

5、各样的大数据信息并通过数据注册中也的XML元数据文档管理这些大数据。随着这些XML元数据文档的快速增长,如何能够对这些XML元数据文档进行快速检索成为DOA下一数据注册中也的第要务,也是本论文的研究课题。XML一,是种具有语义结构的标记语言,由于其特有的标记优势已经成为各种数据信息传输?、交换和存储的事实标准。由于XML文档不仅可y存储数值,而且可W存储文本数据数据;所WXML文档成为数据注册中也元数据存储的主要方式。对于这种半结构化的文档数据,本文通过改进传统向量空间检索模型的内容特征词查询,实现结构化

6、特征词查询的方式。通过设计结构化特征词对XML元数据文档片断的权重及权重向量,实现查询与XML文档片断相似性匹配计算,从而实现准确的信息检索。鉴于数据注册中私XML元数据文档结构的多变异构性和复杂性,如何为XML元数据信息检索建立索引结构,如何在信息检索中有效利用XML元数据文档的层次结构信息是本论文首要解决的两大问题。屯、为此,本文为实现数据注册中下的XML元数据信息检索,具体做了如下工作:(1)研究了DRC下的XML文档节点编码模式及相应的索引结构。在DRC中,基于XML元数据文档的存储,关于XML

7、检索技术的研究成为本文的重点。为实现高效地检索XML元数据文档的关键词,则需要对XML元数据文档建立高效的索引结构。XML节点编码模式和索引结构是XML文档检索的基础,通过研究XML文档节点编码方案,提出有效的节点编码方式,完成对XML文档节点编码。并基于这种编码方式,研究如何构建支持简单关键词检索和结构化查询的有效索引结构方案,实现对DRC下的海量元数据信息快速检索。(2)研巧向量空间模型及检索处理算法。、DRC下的XML文档结构多样,既有数据为中屯的结构化XML元数据文档,又有W文本为中也的半结构

8、化XML元数据文档,或者介于两者之间的XML元数据文档。为了提高XML文档检索效率,则需要研巧适合DRC下的XML文档的数据检索模型和方法,。通过在传统向量空间模型分析研究的基础上研究如I成

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。