web信息处理与应用:queries

web信息处理与应用:queries

ID:5313204

大小:5.47 MB

页数:49页

时间:2017-12-07

web信息处理与应用:queries_第1页
web信息处理与应用:queries_第2页
web信息处理与应用:queries_第3页
web信息处理与应用:queries_第4页
web信息处理与应用:queries_第5页
资源描述:

《web信息处理与应用:queries》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、QueriesWeb信息处理与应用金培权(jpq@ustc.edu.cn)课程知识结构Chp.1IntroductionChp.2CrawlerChp.8NERChp.10TextMiningChp.3TextProcessingChp.9RelationExtractionChp.11SocialNetworkChp.4IndexingAnalysisChp.5QueriesChp.12WebInformationApplicationsChp.6RankingChp.7EvaluationChp.13Advan

2、cedTopics*Web信息处理与应用2金培权(jpq@ustc.edu.cn)本章讨论的问题Web如何有效地表达和回答用户查询?Crawler/SpiderTextProcessingQuery/RankingInfo.ExtractionIndexingWebMiningWeb信息处理与应用3金培权(jpq@ustc.edu.cn)Web查询处理的过程如何有效地表达和回答用户查询?Index-basedsearchuserqueryranking结W112W2果优W3134集化…8改进Wn24Web信息处理与

3、应用4金培权(jpq@ustc.edu.cn)本章主要内容查询表达相关性反馈查询扩展Web信息处理与应用5金培权(jpq@ustc.edu.cn)一、查询表达InformationRetrievalGivenaqueryandacorpus,findrelevantdocuments.query:user’sexpressionoftheinformationneedcorpus:therepositoryofretrievableitemsrelevance:satisfactionoftheinform

4、ationneed查询表达排序(nextchp.)Web信息处理与应用6金培权(jpq@ustc.edu.cn)一、查询表达问题:如何准确、正确地表达用户查询?Aquerycanrepresentverydifferentinformationneedstable:furniture,datastructure,…office:aworkplace,softwareAquerycanbeapoorrepresentationoftheinformationneedQuerytermswillnotalwaysap

5、pearintheindex,e.g.,planevs.aircraftSome(new)queriesaredifficulttoexpress.Web信息处理与应用7金培权(jpq@ustc.edu.cn)一、查询表达局部(Local)优化方法:对用户查询进行局部的分析相关性反馈relevancefeedback全局(Global)优化方法:进行一次性的全局分析(比如分析整个文档集)来产生同/近义词词典(thesaurus)查询扩展queryexpansionWeb信息处理与应用8金培权(jpq@ustc.

6、edu.cn)二、相关性反馈用户在查询后标记相关/不相关文档,然后(迭代)更新查询以获得更好的结果MotivationYoumaynotknowwhatyou’relookingfor,butyou’llknowwhenyouseeit“findmemoredocumentslikethis…”Queryformulationmaybedifficult;simplifytheproblemthroughiterationWeb信息处理与应用9金培权(jpq@ustc.edu.cn)InitialQueryWe

7、b信息处理与应用10金培权(jpq@ustc.edu.cn)RevisedQueryWeb信息处理与应用11金培权(jpq@ustc.edu.cn)二、相关性反馈Userissuesa(short,simple)queryTheusermarksreturneddocumentsasrelevantornon-relevant.Thesystemcomputesabetterrepresentationoftheinformationneedbasedonfeedback.Relevancefeedback

8、cangothroughoneormoreiterations.Idea:itmaybedifficulttoformulateagoodquerywhenyoudon’tknowthecollectionwell,soiterate通常用术语“adhocretrieval”来表示那种无相关反馈的常规检索Web信息处理与应用12金培权(jpq@ustc.ed

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。