欢迎来到天天文库
浏览记录
ID:32966741
大小:5.67 MB
页数:59页
时间:2019-02-18
《基于web日志挖掘的用户信息需求识别研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、华中师范大学硕士学位论文基于Web日志挖掘的用户信息需求识别研究姓名:邱娣申请学位级别:硕士专业:情报学指导教师:李进华201205摘要当今时代,信息爆炸和信息迷向是所有信息用户所面临的现状之一。面对互联网我们渴望能通过搜索引擎从海量的信息中找到自己所真正需要的信息。由于用户自身的知识、背景以及所处的环境等各种因素,用户提交给搜索引擎的查询词往往不能准确的表达其信息需求。目前有学者单独研究用户基于搜索引擎的信息行为规律,期望能从用户的行为中发现用户的兴趣;也有学者考虑通过网络的形式进行问卷调查获取用户信息需求。本文所不同的是将用户的信息行为特征结合数据挖掘技术来建立识别用户信息需求
2、的模型,以此来自动获取用户的信息需求,并期望将该模型用于提高搜索引擎的效率。本文侧重在通过用户的信息行为特征来挖掘用户的查询日志,建立用户信息需求的自动分类模型。本文首先对Web日志挖掘和用户信息需求两个方面的理论进行研究与分析,阐述了本文研究的理论基础,并提出要研究的问题。其次针对日志挖掘的数据预处理阶段做了详细的描述,介绍了本文数据的来源,数据的格式以及日志数据的清洗转换:用户识别等预处理操作过程。然后对用户的信息搜索行为进行分类,主要是针对用户的潜在搜索行为,利用简单的统计方法总结出搜索引擎用户一些基本的行为特征和规律。最后将基于搜索引擎的用户信息需求进行划分,分别为导航类信
3、息需求和信息事务类信息需求,并利用用户的信息行为特征建立用户信息需求的自动分类模型。关键词:日志挖掘;信息检索;用户研究;Web日志;需求识别⑨硕士学位论丈MASTER’STHESISAbstractToday,informationexplosionanddisorientationisoneoftherealitiesfacedbvallinformationusersintheera.Wreareeagertofind也einformationwhatreallyneedbysearchenginefromSOmuchinformation.T11euseroffencan’
4、taccuratelyexpresstheirinformationneedsbysubmittingaquerywordstosearchenginesbecauseofuser’sknowledge,background,andtheenvironmentinavarietyoffactors.Somescholarsstudiedtheuser’sbehaviorbasedonthesearchengines,theyexpecttofounduser’Sinterestfromtheuserbehavior.Someothersgottheuser’sinformation
5、needsbyquestionnairesurveyonthenetwork.T硒Spaperwhatisdifferentthatuser’Sbehaviorcharacteristicofinformationwillbecombinedwiththedataminingtechnologytobuildidentifytheuser’sinformationdemandmodel。inordertogettheuser。Sinformationneeds。andexpectamodelforimprovingtheefficiencyofthesearchengine.The
6、paperfocusesontheinformationinthroughtheuserbehaviorcharacteristictomininguserloginquires,toestablishtheuser'sinformationdemandclassificationmodel.First,thepaperstudiedthemaintheoryandtechnologyofWbblogminingandtheuser’Sinformationneeds.describedthetheoreticalbasisofthisstudy,andproposedtostud
7、ytheissue.Next,thepapergaveadetaileddescriptionofpre-processingstagetoweblogdata,andintroducedthesourceofthedata,dataformat,thecleaningofthelogdataconversion,useridentificationandotherpre.treatmentprocedure.Then,classifytheuser'sinforma
此文档下载收益归作者所有