超文本检索技术的发展_谭晓冬.pdf

超文本检索技术的发展_谭晓冬.pdf

ID:52768310

大小:516.62 KB

页数:7页

时间:2020-03-30

超文本检索技术的发展_谭晓冬.pdf_第1页
超文本检索技术的发展_谭晓冬.pdf_第2页
超文本检索技术的发展_谭晓冬.pdf_第3页
超文本检索技术的发展_谭晓冬.pdf_第4页
超文本检索技术的发展_谭晓冬.pdf_第5页
资源描述:

《超文本检索技术的发展_谭晓冬.pdf》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、超文本检索技术的发展谭晓冬(北京大学信息管理系100571),【摘要】本文讨论了将超文本技术用于信息检索的优越性介绍并分析了基于导引浏览和基于提问的两种超文本检索,系统中一些有代表性的模型及其检索方法认为超文本检索系统必须将超文本技术和传统的检索方法结合起来,并向智能化方向发展。【关键词】超文本、信息检索、检索模型VanvarBush,。自从nex945年提出超文本索系统以文献为单位检出的必须是整篇文献、,,思想以来由于计算机技术的发展超文本的研其次传统的检索系统采用准确匹配的检:,,究取得了很大进展已开发出许多实验性或实索方法检索结果是一组未经排列的文献无法,、Intermedi

2、aKMS(theKnowledge;,用系统如区分它们的重要性而在超文本检索系统中文、、,ManagementSystem)HyPertiesNePtune,。献是结构化建立的并非处于同一层次用户使、,、ueerear,GidHypd等用于计算机辅助教学计用超文本检索系统时可以看到文献间链路以、、、算机辅助设计图书馆参考咨询电子出版著,及两个文献间路径或相隔的结点数并由此确、、、、作环境知识管理软件开发数据库管理联机定文献的重要性。同时,还可根据需要在没有链。参考手册和文档等方面随着超文本技术的日路的文献间加上链路。,趋成熟将超文本技术用于信息检索领域的研再,,次一般检索中由于不熟

3、悉检索语言和。究也正在不断深人,。检索策略给用户造成很大困难尤其是跨数据、,一将超文本技术用于库检索时由于每个数据库具有不同特征和使,。用不同的检索语言更增加了检索的难度而超信息检索的优越性,,文本系统可通过链路浏览找到所需信息避免。所谓超文本就是信息的非线性组织和访问了检索语言的复杂性问题。另一方面,超文本系:它与普通文本有四大区别,统还可以作为一个独特的用户界面将不同数(l)内容表述方式的多样性与直观性(不仅据库的检索语言一体化。,、、;有文字还有图片照片地图⋯⋯)、(2;)内容非线性排列和单元关联性二超文本检索系统,(3)动态性一机交互性和超友好性;人,nCarlso,。根据

4、的观点超文本检索系统可(4)口头通讯交流思想,:分为三类基于导引浏览的检索系统基于提问这些特点使超文本信息检索系统与传统的。。的检索系统以及智能检索系统信息检索系统相比有很多优越性一(一)基于导引浏览(navigationbased),,的首先它以知识单元为单位通过链路将同,检索系统一文献或不同文献的相关部分连接起来检索1.;系统模型时可深人到知识单元(文献片段)而传统的检,这也是最一般的超文本系统模型由一993年11月15日收到。Agosti提出它表达了现有超文本系统中信息·29·。存贮和;检索的特点所处的位置º知道超文本网络中存在某些位,,传;统的信息检索系统所管理的数据库由两

5、置但不知如何到达»忘记从分支返回或忘:;大部分组成文献(或文献代表)集合和辅助数记计划要查的分支结点¼不知道文献中是否。,(a;。据paradta)其中辅助数据与每个文献相联还有别的相关结构½忘记已访问过哪些结点,,系表示文献的语义内容构成了集合的检索入这些都会影响用户检索到所需信息。目前解决。:口这一问题的方法主要有,(1)使用有效的浏览器(browser)同样超文本系统管理的数据库(即超文:,本)也由两部分组成对信息结构网络的图形表示称为浏览器;。er-(1)文献(或文献代表)集合它使用户能大致了解信息的组织情况Int。、、(2)连接集合中文献的链路网这个网是将mediaNep

6、tuneNoteeard等系统都使用图形语义相关或结构相关的文献连接起来的结构。浏览器帮助用户定位。最常见、最重要的图形浏。(oaroser文献集合由多维空间结构(取决于时定链览器是全局浏览器glblbw)通过它可路)的文。,,。网的结构献组成实际上超文本是以以在网络中四处移动看到所有的结点全局浏,。文献间有时是文献内链路网为基础的览器在系统的界面上占据了重要的位置。但是,链路网是:能够用来在超文本中导引浏览的只使用全局浏览器也存在一些问题工具。如果两个语义相关的文献间没有链路,在首先,由于屏幕面积所限,一次只能看到网,,浏览时就不能访问(检索)到它们唯一的方法络的一小部分其余的必

7、须滚屏或改变浏览窗、。,,;是查找它们都具有的字符串关键字或属性值口才能显示其次缺少语义信息只能显示结:,,链路网有双重功能一方面它将同一文献或不点名称和结点间链路有时会使人对网络的实,;,、、同文献的相关部分结构化地连接起来这是传际内容和范围产生误解再次计算滚屏重新;,,;统的检索系统无法实现的另一方面它能将语显示需要很长时间而且由于结点和链路不断,,,,义相近的文献连接起来这时链路网与传统检增多全局浏览器的问题会更加严重难以使。,索系统中的辅助数据起相同的作用同时

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。