基于web日志挖掘的用户信息需求识别研究

基于web日志挖掘的用户信息需求识别研究

ID:32966741

大小:5.67 MB

页数:59页

时间:2019-02-18

基于web日志挖掘的用户信息需求识别研究_第1页
基于web日志挖掘的用户信息需求识别研究_第2页
基于web日志挖掘的用户信息需求识别研究_第3页
基于web日志挖掘的用户信息需求识别研究_第4页
基于web日志挖掘的用户信息需求识别研究_第5页
资源描述:

《基于web日志挖掘的用户信息需求识别研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、华中师范大学硕士学位论文基于Web日志挖掘的用户信息需求识别研究姓名:邱娣申请学位级别:硕士专业:情报学指导教师:李进华201205摘要当今时代,信息爆炸和信息迷向是所有信息用户所面临的现状之一。面对互联网我们渴望能通过搜索引擎从海量的信息中找到自己所真正需要的信息。由于用户自身的知识、背景以及所处的环境等各种因素,用户提交给搜索引擎的查询词往往不能准确的表达其信息需求。目前有学者单独研究用户基于搜索引擎的信息行为规律,期望能从用户的行为中发现用户的兴趣;也有学者考虑通过网络的形式进行问卷调查获取用户信息需求。本文所不同的是将用户的信息行为特征结合数据挖掘技术来建立识别用户信息需求

2、的模型,以此来自动获取用户的信息需求,并期望将该模型用于提高搜索引擎的效率。本文侧重在通过用户的信息行为特征来挖掘用户的查询日志,建立用户信息需求的自动分类模型。本文首先对Web日志挖掘和用户信息需求两个方面的理论进行研究与分析,阐述了本文研究的理论基础,并提出要研究的问题。其次针对日志挖掘的数据预处理阶段做了详细的描述,介绍了本文数据的来源,数据的格式以及日志数据的清洗转换:用户识别等预处理操作过程。然后对用户的信息搜索行为进行分类,主要是针对用户的潜在搜索行为,利用简单的统计方法总结出搜索引擎用户一些基本的行为特征和规律。最后将基于搜索引擎的用户信息需求进行划分,分别为导航类信

3、息需求和信息事务类信息需求,并利用用户的信息行为特征建立用户信息需求的自动分类模型。关键词:日志挖掘;信息检索;用户研究;Web日志;需求识别⑨硕士学位论丈MASTER’STHESISAbstractToday,informationexplosionanddisorientationisoneoftherealitiesfacedbvallinformationusersintheera.Wreareeagertofind也einformationwhatreallyneedbysearchenginefromSOmuchinformation.T11euseroffencan’

4、taccuratelyexpresstheirinformationneedsbysubmittingaquerywordstosearchenginesbecauseofuser’sknowledge,background,andtheenvironmentinavarietyoffactors.Somescholarsstudiedtheuser’sbehaviorbasedonthesearchengines,theyexpecttofounduser’Sinterestfromtheuserbehavior.Someothersgottheuser’sinformation

5、needsbyquestionnairesurveyonthenetwork.T硒Spaperwhatisdifferentthatuser’Sbehaviorcharacteristicofinformationwillbecombinedwiththedataminingtechnologytobuildidentifytheuser’sinformationdemandmodel。inordertogettheuser。Sinformationneeds。andexpectamodelforimprovingtheefficiencyofthesearchengine.The

6、paperfocusesontheinformationinthroughtheuserbehaviorcharacteristictomininguserloginquires,toestablishtheuser'sinformationdemandclassificationmodel.First,thepaperstudiedthemaintheoryandtechnologyofWbblogminingandtheuser’Sinformationneeds.describedthetheoreticalbasisofthisstudy,andproposedtostud

7、ytheissue.Next,thepapergaveadetaileddescriptionofpre-processingstagetoweblogdata,andintroducedthesourceofthedata,dataformat,thecleaningofthelogdataconversion,useridentificationandotherpre.treatmentprocedure.Then,classifytheuser'sinforma

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。