欢迎来到天天文库
浏览记录
ID:46583151
大小:156.89 KB
页数:3页
时间:2019-11-25
《基于WEB挖掘的智能门户搜索引擎的研究》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、维普资讯http://www.cqvip.com基于Web挖掘的智能门户搜索引擎的研究李岩陈新中杨炳儒(北京科技太学信息I程学院,北京100083)E一:liyan
2、ily@263net_摘要搜索引肇是人们在Intel'net上快速获得信息的重要工具之一,但是由于中文自身的特点,使得检索蛄秉的准璃性和相关性不是很高.将web挖掘技术应用到搜索引擎领域,从而产生智能搜索引擎,将鲁培用户提供一个高效、准璃的web检索工具。文章首先介绍了搜索jI擎的工作原理和相关概惫,然后舟绍了web挖掘的定义、分类和
3、应用。最后,详细讨论了Web挖掘技术在智能搜索亏f擎的重要应用。关t词搜索引鼙web掘智能搜索文章螭号1002—8331一(2002)04—0034_03文献标识码^中国分类号TP393ResearchonWebMining-basedIntelligentSearchEngineLiYanChertXinzhongYangBingru(Informationengineeringschool,UniversityofScienceandTechnologyBeljing,Beijing1OOO8
4、3)Al~traet:ThesearchengineisaveryimportanttoolforpeopletoobtaininformationOnInteract.Becauseofthechar-acterofChinese,theveracityandrelativityoftheretrievalresultarenotveryhigh.UsingWeb-miningtechnologyintosearchennefield,intelligentsearchengineisforme
5、d,whichwillpm~derisersaneffe~eandaccuratewebinforma—tionsearchingt∞LThispaperintroducesthetheo~andcorrelativeconceptionofsearchginefirst,thenthedefinition,cXassificationandtheapplicationofwebminingareintroduced.Atlast,theimportantapplicationsofwebmini
6、ngteehnol-ngYinintelligentsearchenginearediscussedindetailKeywords:Searche“g
7、ne,Webmining,Intelligentsearching1引言对网页内容进行聚类;二是对网上的超链结构进行分析;三是w0dd一如web是一个巨大的、潜在的知识库,web用户对用户的点击行为进行分析。以上三种方式都是通过web挖可以通过使用搜索引擎快速、方便地找到所需的各类信息。据掘技术来实现的。CNNIc发布的统计资料表明,网上信息检索
8、已经占到网络应将Web挖掘技术应用到中文信息检索领域可以使用户可用的55.91%.成为除E—mail以及新闻谢览之外人们使用最多以更加准确、快速、全面地寻找到有价值的信息。的互联网应用1994年,第一个搜索引擎WoddWidewebWorm(wWWW)2搜索引擎综述问世,其可见所得web页只有110,0oO个,那时候大家一味追当用户使用b浏览器来访问一个搜索引擎时,看剜的只求的是数据库的太小,即收集的网页的多少.;醢着耐络信息的是引擎中被称作“前端的一部分(见圈1),前端是人机交互的爆炸性增长,人
9、们发现对同一用户提问,这种搜索引擎往往会界面.谢览器与Web服务器相连,用户通过浏览器提出搜索请返回给用户成千上万个检索到的weh页,而其中很大一部分求.然后web服务器就在一个大型的索引数据库中。查找相匹与用户的检索要求无关,用户在浏览的过程中浪费了大量的时配的条文,列出找到的站点索引.并通过浏览器把检索结果返间且慢慢地失去了耐心;大约从1996年起,搜索引擎技术开始回给用户。注重网页质量与相关性的结音,这主要是通过三种方式:一是搜索引擎的后端则通过人工方式或由称为蜘蛛(Spider)的已编数对
10、索据网引库站的幛田l搜索引擎的组戚基金瑁目:教育部科技重点项日资助(教技nq[2ooo1751)作者筒介:事暑,女,博士研究生,济南大学信息工程学院讲师.主要研究方向为数据挖掘,挖掘。陈新中,男.博士研究生,主要研究方向为数据挖掘.Web挖掘,橱炳儒.男,教授.博士研究生导师.研究方向:推理机箭与知识发现,柔性建模与集成技术。342002_4计算机工程与应用维普资讯http://www.cqvip.com圈2Web挖掘的分类机器人程序,对遇到的同址进行索Bf,并不断对索引数据库进容
此文档下载收益归作者所有