xml文档信息检索研究与应用

xml文档信息检索研究与应用

ID:25387980

大小:98.79 KB

页数:10页

时间:2018-11-20

xml文档信息检索研究与应用_第1页
xml文档信息检索研究与应用_第2页
xml文档信息检索研究与应用_第3页
xml文档信息检索研究与应用_第4页
xml文档信息检索研究与应用_第5页
资源描述:

《xml文档信息检索研究与应用》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、信息检索结课论文题目:XML文档信息检索研究与应用学  院:计算机与工程学院专业:软件工程学生姓名:韩飞学号:授课教师:XML文档信息检索研究与应用韩飞(桂林电子科技大学计算机与工程学院,广西桂林541004)摘要:对XML文档中的信息检索领域的信息检索具有重要的地位。在当今的网络时代,网络所有的时间都大幅增加的数据,过程中的传播和交流,数据如果不标准的实施,则网络信息共享的特点将变得杂乱无章,获取信息过程变得非常困难。XML将成为数据描述和交换的网络上的信息标准,它将取代HTML作为网络,以节省数据交换和信息的主要形式。XML文档的信息检索和

2、传统信息检索对比,在重大分歧:对XML文档信息检索索引策略,使得信息检索时,不仅要处理XML文档的索引词也是我们需要考虑这又位于XML文档结构信息数据组织。关键字:XML;索引机制;概念;信息检索中图分类号:G354文献标识码.AResearchandApplicationInformationRetrievalforXMLdocumentsHanFei(CollegeofartanddesignofGuilinUniversityofElectronicTechnology,GuangxiGuilin541004)Abstract:Infor

3、mationRetrievalforXMLdocumentinthefieldofinformationretrievalhasanimportantposition.Intoday'sInternetage,thenetworkallthetimehaveamassiveincreaseindata,processthedatainthedisseminationandexchangeof,ifnotanimplementationofthestandard,thenthecharacteristicsofthenetworkinformat

4、ionsharingwillbecomedisorganized,accesstoinformationprocessbecomesverydifficult.XMLwillbecomethestandardfordatadescriptionandexchangeofinformationontheWeb,itwillreplaceHTMLasthemainformatfordataexchangeandinformationontheWebtosave.XMLdocumentsforinformationretrievalandtradit

5、ionalinformationretrievalcontrast,majordifferencesin:forXMLdocumentinformationretrievalindexingstrategy,makinginformationretrievaltime,notonlytodealwithXMLdocumentsindextermsalsoweneedtoconsiderwhichinturnislocatedintheXMLdocumentstructureinformationdataorganization.Keywords

6、:XML;IndexMechanism;Concept;InformationRetrieval1.XML与信息检索的关系可扩展标记语言(XML)在结构上具有自己独特的优势,与语义HTML和其他标记语言相比,具有更大的灵活性和可扩展性。随着网络信息技术的飞速发展,XML已成为互联网和信息交换、业务领域以及其他领域的数据传输的标准格式,已成为标准版本的实际应用。在当今的网络时代,信息资源的丰富性,如何有效地存储文档和数据查询的格式已经成为信息检索领域的研究热点。此外,用户在查询的时候,用自然语言来描述,最难以准确表达自己的需求,所以如何提高信息检

7、索的效率,在语义层面上也成为信息检索领域的一个热门话题。伴随着检索模型的出现,它为解决上述问题提供了有效途径,在陆续出现的检索模型中,贝叶斯网络检索模型是一种不确定性知识表达与推理模型,是现阶段处理不确定信息技术的主流[1],特别是它有良好的知识表现形式和处理不确定性问题的能力,在信息检索领域已经有了比较广泛的应用[2]。1.1XML简介XML是由万维网联盟(W3C)所使用的标记语言,XML是可扩展标记语言。最重要的特点是允许用户定义的标记符合他们的需要,只要符合XML的规则,所以具有良好的适应性和可扩展性。组成XML文档可以看作是一个文件包含

8、的一些标签,这些标签的内容和属性包括在组成,扩展XML文档,XML文档的后缀名是xml。万维网联盟所推广的XML,主要的目标是将互联网的资源共享理念进

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。