11 基于动态超文本的文献检索的设计与实现

11 基于动态超文本的文献检索的设计与实现

ID:6779743

大小:54.50 KB

页数:6页

时间:2018-01-25

11 基于动态超文本的文献检索的设计与实现_第1页
11 基于动态超文本的文献检索的设计与实现_第2页
11 基于动态超文本的文献检索的设计与实现_第3页
11 基于动态超文本的文献检索的设计与实现_第4页
11 基于动态超文本的文献检索的设计与实现_第5页
资源描述:

《11 基于动态超文本的文献检索的设计与实现》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、11基于动态超文本的文献检索的设计与实现卢苇王利强(计算机科学系)摘要∶本文提出了一种适用于Internet上文献资料检索的超文本动态生成方法,并定义了一种用于表示超文本链接的图¾超文本链接网(HyperTextLinkNet,HTLN)。关键词∶超文本文献检索国际互联网环球网11.11引言随着国际互联网(Internet)和环球网(WorldWideWeb,即WWW)的迅速发展,全国大部分大学已建立自己的校园网,并通过中国教育科研网(Cernet)接入Internet。大部分网络用户感觉到国外的网络信息纷乱芜杂,真正有用的不多,而国内的上网资源简直少的可怜

2、。遍览全国高校提供的上网信息,介绍学校概况的居多,而真正有价值的信息则很少。鉴于目前这种状况,迫切要求各高等院校在网上提供一批有价值的高水平的文献资料,供高校师生检索和查询。只有大量有价值的信息上网,校园网和Cernet才能真正发挥它们的作用,为教育和科研服务。传统的手工文献检索方式,已落后于飞速发展的科技水平,远远不能满足科研和教学的需要。现代的计算机图书情报管理系统,虽然具有存储量大,检索速度快等特点,但由于它的传统的字符界面,给不熟悉计算机的用户带来很大的不便。Internet与超文本(Hypertext)技术的发展,为文献资料的检索和查询带来了一场新

3、的革命。将文献数据存储到WWW服务器上,用户利用电话线或局域网,可以很方便地访问其上的信息,由于超文本提供了简单易用的用户界面,因此普通用户很容易使用浏览工具(如Netscape、Explore等)进行信息的查询与检索。在WWW服务器上超文本的组织方式有多种,我们在这里提出了一种新型的动态超文本的存储与生成方案,并给出了程序的实现算法。11.22超文本的组织在WWW服务器上可以按照不同的方式组织超文本,使之更有效地提供检索服务。最常用的组织方式主要有以下几种∶(1)、目录树方式假设有如图1所示的文献分类,按传统的目录树分类方式,可在计算机上组织为图2所示的形

4、式。自然科学¼数学计算机科学物理学¼图形图形技术数据库技术网络技术¼关系数据库面向对象数据库知识库¼图1sciencemathematicscomputerphysicsgraph&imagedatabaseetworkRDBOODBKB图2这种组织方式清晰明了,易于扩充。但由于目录较多,为维护、更新带来较大的难度。用户的检索只能分级进行,不能直接对文献标题和关键词进行模糊查找。如果数据量较大,进行文献的检索则颇费周折。(2)、利用关系数据库存储可以把文献资料编辑为超文本的形式,存储到如图3所示的关系中。文章编号分类号文章标题关键词内容

5、(超文本方式)A0001TP02现代通讯技术微波通讯、红外通讯现代通讯技术¼¼¼¼¼¼图3网络技术这里你可以查询有关最新的网络技术以太网技术10Base-210Base-2技术10Base-510Base-210Base-T利用细缆¼快速以太网技术交换以太网技术FDDI技术ATM技术图4利用关系型数据库系统,很容易实现对超文本的维护和检索,但如果要动态地对超文本信息进行更新,则有一定的难度。例如有图4所示的超文本链接,如果有关10Base-2的以太网技术已经过时,则可以在关系中将有关10Ba

6、se-2的文章删去,但因为原来在多处文章中有指向10Base-2的超文本链接,需查找出所有引用10Base-2的文章,将链点信息删除。利用图3所示的关系结构则较难实现。基于以上存储方式的优点与不足,我们提出了以下超文本文件组织方式。因为超文本本身是利用超链点相互指向的,可利用图的方式来表示这种链接。t1c2c1c4t2C3c5t3c7c6图5我们把这种图定义为超文本链接网(HyperTextLinkNet,简称HTLN)。HTLN由以下几部分组成∶(1)、分类集合CC={c1,c2¼cn}是分类的有限集合,n>=0。(2)、超文本文件集合TT={t1,t2¼

7、tm}是超文本文件的有限集合,m>=0。可知分类集合C与超文本文件集合T之间没有公共元素,即CÇT=Æ。(3)、分类结点的链接关系I定义Ici为由ci指向分类结点集I(ci)的有向边,I(ci)ÌC。(4)、超文本链接关系O定义Oci为由ci指向超文本文件结点集O(ci)的有向边,其中O(ci)ÌT;定义Oti为由 ti指向分类结点集或超文本文件结点集O(ti)的有向边,若xÎO(ti)则有(xÎC且xÏT)或(xÏC且xÎT)。我们将HTLN记作H=(C,T,I,O)。则图5可表示为H=(C,T,I,O)C={c1,c2,c3,c4,c5,c6,c7}T=

8、{t1,t2,t3}I=Ic1ÇIc2ÇIc3ÇIc

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。