欢迎来到天天文库
浏览记录
ID:31979530
大小:1.57 MB
页数:49页
时间:2019-01-30
《信息检索系统算法库的研究论文》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、中文摘要伴随着万维同的发展,越来越多的人开始以网络进行生活、工作和学习。信息检索已经构成网络的一个不可或缺的因素。在进行信息检索时,用户希望能够检索出所有感兴趣的信息,这就需要滤掉不相关的信息,从而获得最有价值的信息。在这种情形下,Web数据挖掘应运而生。而挖掘算法种类繁多,每种算法都有其适用的情形。如何选择合适的算法进行数据处理成为人们面临的问题。本文针对上述问题及挖掘算法应用的普遍性,构建了算法库系统。该系统旨在为信息检索提供算法支持。我们给出了算法调用和管理的框架。通过映像和元对象协议实现算法
2、库的核心功能和系统控制功能的分离。这样,可以通过添加新的元对象来引入新的调用机制,而基本算法保持稳定。从而使系统具有良好的扩展性。在算法的选取中,考虑项目所要处理的数据特点,针对当前XML文档结构聚类算法的一些不足,提出采用段匹配的概念来计算两棵XML文档树中的路径相似性。在整个聚类过程中,算法还把一组相关文档与一个XML聚类代表相关联,并给出了聚类代表的计算方法。进而,通过比较聚类代表,发现新的聚类时更新聚类代表来完成文档的聚类。在上述工作的基础上,设计和开发了一个图形界面化算法库原型体统来实现算
3、法的示例调用和管理。关键词;Web数据挖掘文档聚类文档分类信息检索映像元对象协议ABSTRACTWiththerapiddevelopmentofWorldWideWeb,thewayinwhichpeopleacquireusefulinformationhasbeenchangingdrastically.MoreandmorepeoplebegintomakeuseofWebtolive,workandstudy.InformationRetrievalhasbecoll'leallevita
4、bleelementoftheWeb.Whensecxchinginformationwithsearchengine,peoplewanttogetthemostconcernedinformationbymeal略ofdiminatingtheirrelevant.Moreover,whattheyobtainshouldbemostvaluabletothem.AlltheseresultinthebirthofWebDataMining.Whel-easthere’他SOmanytypeso
5、falgorithmsandeachoneappliestoaspecificcase.Tochoosethebestonetoprocessingdatabecomesaproblem.Inthepaper,wedevelopanalgorithmslibrarysystemtoprovidealgorithmsupportfortheinformationretrievalsystem,whichprovidestheframeworkforfunctioncallandmanagement.B
6、asedOnreflectionandmeta-objectprotocol,Werealizetheseparationofspecificfunctionconcernsandsystem—controllingon嚣.Usingmeta-objectprotocol,wecanaddnewmeta-objeetsintothissystem.Suchasystemiseasytoexpand.Whenchoosingthealgorithmstoberealized,weanalizethec
7、haracteristicsofthedatatobeprocessedinOUrprojectandproposetheconceptionofsegmentmatchingagainstthedefectsofthemethodsinexistence.weusingthisconceptiontocalculatethesimilaritybetweentwo仃e鹤.Theninthewholeclusteringprocession,WeequipeachdusterwiIhanXMLclu
8、sterrcpl-嚣entative,whichsubsumesthemosttypicalstructuralspecificsofasetofXMLdocuments.Alsowegivethearithmeticforconstructingtherepresentative.Thenclusteringisacenmplishedbycomparingclusterrepresentatives.andupdatingtherepresentativesass
此文档下载收益归作者所有