web多媒体数据实时索引的设计与实现

web多媒体数据实时索引的设计与实现

ID:33582931

大小:211.50 KB

页数:5页

时间:2019-02-27

web多媒体数据实时索引的设计与实现_第1页
web多媒体数据实时索引的设计与实现_第2页
web多媒体数据实时索引的设计与实现_第3页
web多媒体数据实时索引的设计与实现_第4页
web多媒体数据实时索引的设计与实现_第5页
资源描述:

《web多媒体数据实时索引的设计与实现》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、16计算机与数字工程第34卷"""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""!Web多媒体数据实时索引的设计与实现付东来李元(贵州大学计算机软件与理论研究所贵阳550025)摘要:分析讨论了Intranet环境下对搜索引擎Web站点文本、MP3、图片三类数据的实时索引问题。我们的工作与Googie、百度不同的是MP3、图片数据采用的挖掘特征信息进行实时索引的方法,减少了索引文件对磁盘空间的需求,削减了人工分类的麻烦。最后在BOT和LUCENE软件包的基础

2、上,设计并实现基于上述分析技术的Web搜索引擎。经实际测试,效果良好。关键词:IntranetWeb搜索引擎中图分类号:TP37DesignandImplementationoftheReal-timeIndexofWebMultimediaDataFuDonglaiLiYuan(InstituteofComputerScience,GuizhouUniversity,Guiyang550025)Abstract:Thispaperdiscussesthereai-timeindexprobiemofthreekindsofresou

3、rcesinciudingtexts、mp3andpicturesofwebsiteunderIntranetenvironment.Inordertoreducethedemandforthemagneticdiscspace,cutdowntheartificiaiciassifyingtroubie,Weadoptamethodtoexcavatecharacteristicinformation.Themethodisdifferentfromindexingmp3andpicturesofGoogieorBaidu.Fina

4、iiy,byus-ingBOTandLUCENEkits,thispaperdesignsandimpiementsabove-mentionedsearchengine.Theresuitissatisfyingintestingactuaiiy.Keywords:Intranet,Web,searchengineClassnumber:TP37WWW技术规范,通过简单的浏览器界面,方便地1引言集成各类已有网络;它继承了Internet的全部优点,讨论Intranet环境下的搜索引擎问题,设计实而且能够有效地保证组织内部信息的安全性

5、。现了一个对Web站点文本、MP3、图片三类数据进尽管Intranet在技术上的许多方面与Internet行实时索引与Web在线检索引擎。与Googie、百度相同,但在应用范围以及管理方式上却有很大的区不同的是MP3、图片数据的实时索引采用挖掘特征别。具体说来,主要有以下几个显著特征:信息的方法,优点是减少了索引文件对磁盘空间的第一,虽然并不是每一台主机都有域名,但几需求,削减了人工分类的麻烦,缺点是可能存在资乎所有的计算机都有一个相对固定的IP地址,尽源不能链接、图片不能在查询结果中实时显示,对管有的采用DHCP服务器来分配IP地址

6、,但一旦MP3、图片的索引范围不全。但是,在Intranet环境第一次分配也就相对固定了。下我们完全可以通过加强网站建设的管理,加强与第二,IP地址数量较少、范围已知,而且其中网站管理员的沟通与配合,扬长避短,充分发挥该主机主要是Web和FTP服务器。做法的优势。第三,主机不一定连接运行。很多计算机在不2服务器的特点工作时会关机,从而Web服务器也就停止了工作。Intranet是利用Internet技术在组织内部建立的第四,Web服务器之间超链接较少。很多部门一种信息交换网络系统,采用TCP/IP通信协议和级Web服务器不与其他服务器

7、之间建立超链接。!收到本文时间:2005年6月24日基金项目:贵州科学基金项目(编号:黔科合2004GGY002)资助第34卷(2006)第3期计算机与数字工程l7"""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""""Cutting用Java写的全文索引引擎工具包,200l年3设计原则及功能目标年底成为APACHE基金会jakarta的一个子项目。3.l设计原则目前的最新版本为Lucenel.4.3。Lucene共提供了针对Intranet本身的特点,在方案设

8、计当中应七个程序包,本文仅用了Org.apache.Lucene.遵循以下三条设计原则:search、Org.apache.Lucene.index、Org.apache.首先,我们要保证搜索的完整性,即所有提供Luce

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。