信息检索中语段形式用户需求的分析

信息检索中语段形式用户需求的分析

ID:34609712

大小:492.60 KB

页数:63页

时间:2019-03-08

信息检索中语段形式用户需求的分析_第1页
信息检索中语段形式用户需求的分析_第2页
信息检索中语段形式用户需求的分析_第3页
信息检索中语段形式用户需求的分析_第4页
信息检索中语段形式用户需求的分析_第5页
资源描述:

《信息检索中语段形式用户需求的分析》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、申请上海交通大学硕士学位论文信息检索中语段形式用户需求的分析学院班学校:系:级:号:上海交通大学电子信息与电气工程学院B05033921050339036硕士生:学科专业:胡学营计算机软件与理论导师:陆汝占教授上海交通大学电子信息与电气工程学院2007年12月ADissertationSubmittedtoShanghaiJiaoTongUniversityfortheDegreeofMasterofScienceAnalysisofUser’sChunkQueryinInformationRetri

2、evalAuthor:HuXueyingSpecialty:ComputerSoftwareandTheoryAdvisor:Prof.LuRuzhanSchoolofElectronicsandElectricEngineeringShanghaiJiaoTongUniversityShanghai,P.R.ChinaDecember,2007信息检索中语段形式用户需求的分析摘要如何准确快速地在互联网上获取信息已成为现在的研究热点。目前的大部分搜索引擎是根据用户输入的关键字组合进行词串匹配,返回大量网页,准确

3、率低。在信息检索中,根据用户的查询输入,准确地理解用户的查询意图,是提高搜索结果准确性的关键所在。用户的真正意图是一个整体,表示一个完整的概念。分析用户需求,就是将形式上离散的输入,还原成用户的完整的原始的需求概念。以此概念为指导,可以预期大幅提高搜索效果。本文对语段形式的用户需求进行分析,这种形式的需求在用户查询日志中出现最多。本文通过概念图来表示需求概念,用节点表示概念,用弧表示概念间的关系。首先人工总结出几个常见的查询领域类别,标注出各查询类别的概念框架图。然后对查询进行预处理:利用搜索引擎进行粗切分,再

4、用基于网络挖掘技术训练得到的若干复杂专有名词识别器,对切分后的结果进行识别。我们用专有名词识别和规则匹配的方法来将用户的查询进行归类,并识别出用户需求中含有的相应类别的属性的值,填充到该类别的概念框架图中。由此得到用户需求的概念图。本文收集了搜索引擎日志中大量出现的若干类别的用户查询实例,对系统的有效性进行测试。实验结果表明,对特定的若干类别的查询输入,系统有着较好的分析结果。关键词:用户需求分析概念图复杂专有名词识别网络数据切分IAnalysisofUser’sChunkQueryinInformationR

5、etrievalAbstractHowtoretrieveinformationquicklyandcorrectlyfrominternetisnowanimportantresearchdomain.Nowadays,mostofthesearchenginesarebasedonkeywordmatching,whichmatchesthestringsusersinputswithstoreddocuments.Thereforesearchenginesoutputtoomanyinformation

6、mostofwhichisuseless.Understandingtheuser’sintentionaccordingtotheuser’sinputininformationretrievalisakeypointtoimprovetheperformanceofsearchengines.User’srealintentionisawholeconcept.Analyzingtheuser’squeryistorecoveruser’soriginalqueryconceptbythediscretei

7、nput.Itwillimprovethesearchperformanceremarkably.Inthepaper,weanalyzetheuser’schunkquery.Thiskindofqueryismostfrequentinusers’querylog.Conceptualgraphisusedtorepresentqueryconcept.Inthegraph,avertexrepresentstheconceptandaedgerepresentstherelationbetweenconc

8、epts.First,welabelouttheconceptualframegraphsofsomequeryclassesbymanualsorting.Second,wedosomepreprocessingbeforeanalyzingqueryinput,includingsegmentationandnameentityrecognition,bothofwhichareb

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。