欢迎来到天天文库
浏览记录
ID:33502222
大小:1.76 MB
页数:62页
时间:2019-02-26
《基于xml%2fjava的元搜索引擎的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、广东工业大学硕士学位论文基于XML/Java的元搜索引擎的研究姓名:何玉菁申请学位级别:硕士专业:计算机应用技术指导教师:傅秀芬20040501摘要元搜索引擎通常被称为搜索引擎之上的搜索引擎。用户只需递交一次检索请求,由元搜索引擎负责转换处理后提交给多个预先选定的独立搜索引擎,并将所有查询结果集中起来以整体统一的格式呈现到用户面前。而Java是由SunMicrosystems公司所开发的一个高级程序语言,Java提供了一个跨平台的方案,可支持分布式处理环境。Java语言成为了结合XML(eXtensibleMarkupLanguagel的最佳选择。XML以一种开放的
2、自我描述方式定义了数据结构,在描述数据内容的同时能突出对结构的描述。由于数据显示与内容分开,XML定义的数据允许指定不同的显示方式,使数据更合理地表现出来。本文介缁了搜索引擎和元搜索引擎的发展历史,讨论了元搜索引擎的基本工作原理并对元搜索引擎进行了分类,比较了元搜索引擎与独立搜索引擎相比的优点,讨论了元搜索引擎的几个关键技术,并分析了元搜索引擎面临的问题和将来的发展趋势。作者提出了一个元搜索引擎模型MySearch,它包括了用户界面代理,检索代理,查询数据库这三个部分。在此基础上,还探讨HTML数据到XML数据的转换;研究了JAVA,XML与JDBC的结合问题,也即
3、与数据库的结合问题。并用JAVASERVLET和XML建了一个基于XML、JAVA的元搜索引擎。XML作为一种数据表示的形式对Web上的数据检索和挖掘应用将带来巨大的优势。关键词:XML,Java,元搜索,Web挖掘,MySearch模型=::—一:变三兰查耋三兰堡圭兰堡丝耋AbstractMetasearchengineisregardedassearchenginebasedonsearchengines.Usersonlyneedtosubmitsearchrequirementsonce,itistheresponsibilityofthemetasearc
4、henginetotransform,processandhandovertherequirementstomultiplepre—selectedindependentsearchengines,thenpresentthesearchresultsinauniformformattousers.JavaisakindofadvancedprogramminglanguagedevelopedbySunMicrosystems,anditprovidesaschemeindependentofplatforms,anditalsocansustaindistrib
5、utingprocessingenvironment.JavaisthebestchoicetobecombinedwithXML.XMLusesanopen,self-describedmodetodefinedatastructure;itcandescribedatacontentaswellasstructure.Duetotheseparationofdatadisplayanddatacontent,itiSallowedtoshowXMLdatawithdifferentmethod.Thisthesisintroducesthedevelopingh
6、istoryofsearchengineandmetasearchengine;discussestheworkingprincipleofmetasearchenginesandclassifythem;comparesthestrongpointsofmetasearchenginewithsearchengine;italsodiscussesseveralkeytechnologyofmetasearchengine,andanalysestheproblemsandtrendofmetasearchengineinthefuture.Theauthorbr
7、ingforwardmetasearchenginemodelMySearch,itmainlycomprisesuserinterfaceagent,searchagentandsearchdatabase.BasedonMySearchmodel,theauthorprobesintothetransformofHTMLtoXML,thecombinationofJava,XMLandJDBC,andbuildsameta—searchenginebasedonXML,JavausingJavaServletandXMLtechniques.XMLwillb
此文档下载收益归作者所有