欢迎来到天天文库
浏览记录
ID:33901675
大小:2.69 MB
页数:81页
时间:2019-03-01
《基于semantic+web的语义检索模型的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、华东师范大学硕士学位论文第一章绪论1.1研究背景及意义20世纪以来,人类进行信息生产的能力高速增长,据统计,70年代以来全世界每年出版图书50万种以上、期刊10万种以上、专利约50万件、科技报告约90万件、会议文献10多万篇、产品样本50多万种,每年发表的科技论文总数近500万篇,并呈指数式增长,真可谓信息浩如烟海,如何从这浩如烟海的信息中找出所需信息,就成为信息检索的重任【11.“信息获取的不对等决定了经济、政治发展的不平衡”,对于个人、商家、企业乃至一个民族、国家而言,谁能掌握信息的主动权,就能在现代竞争中处于有利地位.信息检索技术能帮助人们从浩瀚的数据中抽取出对用户有用的
2、信息,能极大的节省了用户的查询时间。调查数据显示,目前有68.2%的人经常使用搜索引擎,它是目前仅次于电子邮件的网络应用;另有41%的人通过搜索引擎进入购物网站,84.6%的新网站是通过搜索引擎被发现。同时,科学证明,搜索引擎是未知状态下发现有效信息的最有效方式【甜.这些数据足以表明,先进的信息检索技术对于网民和商业用户来说,都是极具实用价值的。目前的主流搜索引擎为Web用户提供了一个友好的检索入口,用户只需提供检索式(关键词列表)便能搜寻到相关网页。但是,这些搜索引擎只返回排序的检索结果列表,提供极少甚至不提供文档间的语义关系。由于Web上语义信息的匮乏,使得知识工作者不得不
3、在获取真正需要的信息前,花费大量的时间进行无谓的浏览和阅读。Web上当前的信息检索关注的是用户需求和信息库,而极少关注信息间的语义关系.Web上的信息不是机器可利用的形式,仍然需要以人为方式来区分信息的含义及其与需求间的关系.近年来,人们对下一代Web--SemanticWeb的发展和研究产生了浓厚的兴趣。当前,Web内容是按照供人类理解的形式设计的,而却很难被计算机所理解。SemanticWeb的内容是按照某种语义方式进行结构化设计,以便该内容不仅被计算机所理解,同时也为人类所理解。将语义引入信息检索领域,是对信息检索和信息管理技术功能和有效性的一个巨大的提升,是改变当前信息
4、检索诸多瓶颈的重要解决方案。对新型语义信息检索技术的研究也能推动相关科研领域的发展。因此,语义信息检索技术研究具有较高的学术理论意义和一定的实用价值。.1.华东师范大学硕士学位论文1.2国内外研究现状1.2.1.SemanticWeb研究现状SemanticWeb最先由TimBerners.Lee于1998年提出。在w3c(wbddWideWebConsortium)组织内,有一批专门人员致力于对该系统的改善、扩展和标准化,并已开发出许多语言、出版物、工具等。然而,SemanticWeb技术仍处于幼儿阶段,该技术的未来虽然光明,但关于SemanticWeb的发展方向和早期Sem
5、anticWeb的特征等各方面尚未取得最后的一致性.在SemanticWeb中,信息被赋予描述良好描述的特性,这使得计算机和人类能更好地合作。W3C的SemanticWeb活动,聚集了大量学术界和产业界的精英,旨在指定和实现SemanticWeb的标准和技术,使得Web上的数据以某种方式得到描述和链接,以便这些数据在跨应用中得到更有效的发现、自动处理、集成和重用。当Web成为机器与人类共享和处理数据的场所时,Web将发挥其最大的潜力。计算机必须存取结构化的信息集和推理规则集,才能进行自动推理.SemanticWeb所面临的挑战是提供一种语言,这种语言能够同时表达数据和规则以便进
6、行数据推理,并允许来自现存知识表示系统的规则移植到Web。开发SemanticWeb的重要技术包括XML(eXtensibleMarkupLanguage),RDF(ResourceDescriptionFramework)和OWL(OntologyWebLanguage),这些技术的相应标准在W3C、学术界和产业界的共同努力下已在全世界范围内得到认可和一定范围的应用。在SemanticWeb中,XMLSchema作为基础构件,与XML一起,尽管缺少语义约束,但对具有语义约束力的RDF、RDFSchema和OWL起到很好的语法、结构与数据类型上的支撑作用。RDF是一种对Web资
7、源进行信息表达的语言,其目的在于表达Web资源的元数据,如标题、作者、Web页面更改日期、Web文档的版权和注册信息、语言、格式、内容条目等。RDFSchema并不直接提供特定应用类以及属性的词汇,而是提供描述这些类和属性的工具,并显示哪些类和属性在一起使用。OWL被设计成适用于那些面向机器信息处理的内容而不是仅向人类呈现信息的应用,OWL通过提供更多具有形式化语义的词汇,以便在Web内容的机器可理解性方面强于XML+XMLSchema和RDF+RDFSchema等所能达到的程度..2.华东
此文档下载收益归作者所有