基于xml技术搜索系统设计和实现

基于xml技术搜索系统设计和实现

ID:5941339

大小:26.50 KB

页数:5页

时间:2017-12-29

基于xml技术搜索系统设计和实现_第1页
基于xml技术搜索系统设计和实现_第2页
基于xml技术搜索系统设计和实现_第3页
基于xml技术搜索系统设计和实现_第4页
基于xml技术搜索系统设计和实现_第5页
资源描述:

《基于xml技术搜索系统设计和实现》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、基于XML技术搜索系统设计和实现  摘要:为了实现局域网中服务器资源的深度共享与有效检索,主要介绍了基于XML技术的搜索系统的设计与实现过程。系统实现了文本、音频、视频、图片资源的共享,测试表明用户可以通过一台主机即可访问位于局域网中不同服务器上的资源。关键词:AJAX;分布式信息检索;RMI;dom4j中图分类号:TP393文献标示符:A1系统需求分析通过分析得出本系统主要设计目标包括以下六个方面:(1)系统最终实现多种形式的资源检索,包括文档、音频、视频以及图片。(2)具备高级检索功能,其中包括按所需词查询,按排除词查询,多词联合查询。(3

2、)对于用户输入的关键词具备拼音-汉字识别转换功能,例如输入“pingguo”,则搜索结果会按照“苹果”一词进行检索并显示与之相关的资源。(4)支持文档预览和流媒体播放功能。用户可以在线浏览文档、播放视频。(5)后台管理功能。后台管理包括用户管理、服务器管理、资源管理模块。5(6)各服务器上的用户可以对自己提供的资源进行一些基本信息的维护,主要包括资源删除与修改。2系统设计2.1设计思想局域网内有多台服务器,各服务器之间通过RMI技术进行通信。本系统突破了传统的“主从服务器”的设计,采用了“平等服务器”的设计概念。即局域网内的所有主机均为服务器,

3、并且每台服务器均运行维护一个服务器列表。当有新的服务器开启或关闭时,其他服务器会收到相应的注册或注销的指令,以此来维护服务器列表。每台服务器上的资源被索引到Web容器根目录下的test.xml文件中,本系统通过解析XML文件以获得资源的具体信息。XML解析模块通过采用dom4j技术来实现XML文件的处理,极大提高了搜索的效率。当第一次运行环境时,系统自动检测是否建立全文索引,如果没有系统将自动在后台开辟线程,建立全文索引。全文索引支持doc、xls、ppt、docx、xlsx、pptx、txt、wps、dps、rtf、pdf、zip、rar共十

4、三种文件格式的全文索引。2.2系统结构设计5系统结构化设计的核心是把模块分解设计,采用自顶向下、逐层分解的方法,整个系统划分成多个子模块,分别完成不同的功能,各模块具有一定的独立性,降低系统的复杂性和耦合性。本系统分为启动功能模块和资源预览功能模块,结构图分别如图1所示。2.3XML文件中字段设计针对资源特征以及本系统的搜索与共享特性,结合局域网内服务器的IP属性,在XML文件中设立了以下表述字段。表1资源表述属性字段字段名称字段意义id资源编号title资源标题keywords资源关键字url资源所在地址……3系统模块设计3.1服务器注册/注

5、销模块服务器的注册/注销模块用以解决局域网内的各个服务器之间的识别问题,使各服务器进行维护本机的服务器列表。每台服务器运行用于通信的Socket程序,当局域网内有新的服务器启动或关闭时会通过组播技术向其他主机发送注册或注销请求,收到此请求的服务器会将其IP地址在本机的服务器列表中进行添加或移除,这样就达到了服务器注册与注销的功能。3.2资源的维护模块5服务器管理员登录系统后,均可以在后台进行共享资源的发布。管理员只需要将所要共享的资源放在服务器的resources目录下,并在后台的管理系统中填写资源的相关信息即可实现对发布信息资源的维护。3.3

6、XML解析处理模块采用dom4j技术来实现对XML文件的解析处理,大大提高了解析效率和搜索效率。在该系统中,通过使用dom4j技术来操纵XML文件,避免了使用数据库记录信息的繁琐,同时更便于资源检索。3.4资源检索模块各用户在登录系统后,均可以在系统主页的资源检索框内输入资源的关键字来进行资源检索。系统会根据输入的关键字,对分布在局域网内的所有服务器的共享资源进行检索,得到结果后返回给用户。3.5资源预览与下载模块当用户检索到自己所需要的资源之后,可以对资源进行预览。音频和视频格式均可以嵌入到网页上查看预览效果。预览过后,可以下载当前预览资源。

7、4系统测试系统部署发布成功后,综合运用了单元测试、集成测试和确认测试三种测试方法对系统进行了测试,较好地完成了对本系统的测试工作,系统测试过程和结果如下。5进入搜索系统,在搜索框内输入所查询资源的关键字,点击搜索按钮,检索资源结果。然后,测试搜索系统资源预览效果,文档可以嵌入网页式预览,支持的主要文件格式包括:word、ppt、pdf。结语本文通过运用Struts2.0技术搭建起系统框架,dom4j解析技术解析xml资源文件,综合运用Java程序语言、JSP、JavaScript等Web开发技术实现了系统功能。系统整体界面友好、层次分明、操作简

8、单,各模块之间的耦合度较低,通过综合运用单元测试、集成测试和确认测试,系统实现了局域网内资源的深度共享与有效检索,为局域网资源的有效利用和信息整合提供

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。