欢迎来到天天文库
浏览记录
ID:32868302
大小:31.50 KB
页数:3页
时间:2019-02-16
《《web信息检索》word版》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、理想的Web信息查询模式浅谈黄小文(浙江省诸暨市实验职中311800)[摘要]:Web信息查询模式是互联网信息共享的一个重要研究课题,实现信息查询的快速、高效、准确是研究的目标,本文通过讨论就信息查询涉及的关键技术,阐述了笔者眼中理想的Web信息查询模式的基本观点。[关键词]:Web,信息,查询模式一、引言二十一世纪是信息高度密集发展的时代,Internet和Web已经成为人们日常生活和工作学习中不可缺少的部分。随着技术的发展和普及,Web已经成为一个全球性的巨型公众信息空间,而且仍在不断的扩张。几年前我们还只能够通
2、过电视和报纸得知新闻或者天气预报的内容,只能通过商场和厂家的宣传材料获得产品的资料,只能从少数认识的人口中得到对最新电影的评价,等等。传统的信息获取渠道和方式不仅单一,而且缺乏,往往不能满足我们对信息的要求。而较之传统的获取信息的方式,Web信息查询具有更大的便利性,也更加全面。无须质疑,Web上面巨大的信息量为我们提供了获取任何信息的可能性。然而正是因为这种“众人拾柴火焰高”、“大家齐来添砖加瓦”的信息发布方式,Web上的信息量不断的膨胀。随着Web规模的日益庞大,要在Web中查找自己想要的信息变得越来越困难,很多
3、人都发现自己花在搜索信息的时间大大增加,有的时候甚至Google了一天还是没能找到对自己有用的东西。这些现象我们称之为Web信息查询中的“信息迷向”和“信息过载”,也是当前的Web信息查询模式本身的不足所带来的问题。要快速、高效、准确的找到所需信息就要改进Web信息查询模式,这里就我在使用过程中想到的几个方面来谈一下对理想信息查询的几点看法。二、理想信息查询模式对于用户而言,进行Web信息查询一般是通过直接浏览网页、使用搜索引擎和分类目录等等方式进行的。这种信息查询的模式能够让我们尽可能多的得到相关的信息,但问题正如
4、前面所说,相关未必是最需要的信息。另外,在对信息查询需求的描述、对多个信息源的处理方面、对用户行为的分析和适应等等方面,还存在有很多的不足。3那么,理想的Web信息查询模式到底是什么样的呢?相信每一个经常使用Web进行信息查询的人都会有自己的看法。从普通用户的观点来看,理想的模式应当使得查询准确、高效和方便,能够做到“所答即所问”。以下几点是我所认为的在现有模式的基础上,理想的Web信息查询模式所应当具备的特点:1.符合语言习惯,易于描述需求的查询语言在查询语言方面,用户可以用自然语言将需求清楚地描述,比如“什么树的
5、叶子有苹果的味道”、“人民中路附近有那些娱乐设施”这样符合我们平常语言习惯的句子。而对信息查询提供者而言,理解用户的查询需求需要提取句子的语义,将其转化为机器能够理解的规范化的语言,这就需要用到自然语言处理技术。在目前的搜索引擎中所用到的自然语言处理技术尚且有限,尤其是中文自然语言处理,只能识别一些简单的短语和常见的句子结构;由于自然语言处理使信息查询变得更加方便、快速和准确,目前已经有越来越多的搜索引擎支持自然语言搜索特性。而如何能让用户在Web信息查询中无限制的使用自然语言,同时又能很好的准确地理解用户的需求,还
6、需要进一步的研究。系统能否准确表达用户查询,这对信息查询的准确度是最为重要的,同时系统也应能够向用户提供模糊查询方式,所以系统应将数据库技术与信息检索技术联合使用,提供精确查询功能与模糊查询功能。2.用户即时需求与个性化的信息主动服务相结合的操作方式在操作方式上,除了在提交查询请求后及时地得到结果,用户还能够得到个性化的信息主动服务,定制一些查询,而信息提供商源源不断收集Web信息,一旦发现满足(或者更为满足)用户的查询则将通知给用户。这类似于目前的一些信息定制服务,比如一些电子商务网站上注册定期的电子邮件通知,或者
7、短信的定制,以及一些金融方面的业务,这些都涉及到信息推送和数据流技术。这些信息定制服务有一个共同点是用户只能在提供者所提供的内容中进行选择,而采用信息主动服务方式的Web查询的内容和时间不应当受到信息提供者的限制;另外,Web信息主动服务还能够通过对用户的需求分析从而找到用户未表示但潜在的兴趣,从而主动的为用户提供相关的信息。Web挖掘技术能够支持这一点。Web挖掘是数据挖掘应用于Web上的产物。Web挖掘包含了从Web数据中发现潜在有用的未知信息或者知识的全部过程,涵盖了数据库中的知识发现(KDD)的过程。Web结
8、构挖掘和使用记录挖掘对于用户定制个性化的查询服务非常必要。通过这两种Web挖掘的方式,信息提供者能够获取用户访问模式信息,帮助理解用户的意图和行为,对搜索引擎的信息分类与索引方式进行重新组织,为用户提供个性化的服务。另外,还可以了解Web结构,分析系统性能,改进Web站点的结构及其服务质量,改进Web系统设计。33.支持基于内容、语义和知识的查
此文档下载收益归作者所有