基于Web挖掘关键词建议模型探究

基于Web挖掘关键词建议模型探究

ID:47847190

大小:66.50 KB

页数:7页

时间:2019-11-26

基于Web挖掘关键词建议模型探究_第1页
基于Web挖掘关键词建议模型探究_第2页
基于Web挖掘关键词建议模型探究_第3页
基于Web挖掘关键词建议模型探究_第4页
基于Web挖掘关键词建议模型探究_第5页
资源描述:

《基于Web挖掘关键词建议模型探究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、基于Web挖掘关键词建议模型探究摘要:关键词建议能优化用户查询,提高检索准确率。针对传统关键词建议技术的不足,提出了一种基于Web挖掘的关键词建议优化方法,建立了系统模型,并详细介绍了模型中各模块的功能和实现技术。关键词:Web挖掘;关键词建议;查询扩展;用户兴趣中图分类号:TP311文献标识码:A文章编号:1009-3044(2012)13-3129-02TheModelResearchofKeywordsSuggestionBaseonWebMiningXIAOHai-peng,DENGXiao-heng(InformationScienceandEngi

2、neeringCollege,CentralSouthUniversity,Changsha410083,China)Abstract:Keywordssuggestioncanoptimizetheuse”squery,improveretrievalPrecision.Accordingtothedeficiencyofthetraditionalkeywordssuggestiontechnology,ThispaperputsforwardaoptimizationmethodofkeywordssuggestionbasedonWebmining,e

3、stablishthesystemmodel,andIntroducesthefunctionandtechnologyofeachmoduleindetai1.Keywords:Webmining;keywordssuggestion;queryexpansion;userinterest随着互联网技术的飞速发展,特别是Web2.0时代的到来,网民既是信息的消费者也是信息的生产者,互联网的信息量与日俱增。网民逐渐习惯使用搜索引擎的来检索相关信息。据2010年CNNIC发布的网络研究报告显示:74.3%的用户通过在搜索引擎上输入关键词来检索相关信息。但由于网民

4、的关键词表述和搜索引擎系统的词库有一定的差别,特别是中文语义中的同义词,歧义词等现象,让用户通过查询关键词难以快速获取相关信息。因此,2008年以来,Google和百度等搜索引擎先后推出关键词建议服务。所谓“关键词建议”是指用户在搜索框输入关键词后,会在搜索关键词的下面弹出建议关键词供用户选择。例如搜索“Web”,会弹出“Webqq"、“Webmsn"、“Webservice"等关键词供用户选择,用户选择一个合适的关键词,就能检索到相关文档。这一方面优化了用户查询关键词,另一方面也提高了检索的准确率(Precision)o目前,传统关键词建议方法主要是根据社会

5、热点或与原始查询词有包含关系的词来提供建议的,它忽略了用户兴趣,无法满足用户个性化的需求。1传统关键词建议技术的不足关键词建议其实只是搜索引擎中查询扩展技术的一个应用。所谓查询扩展指的是利用信息学、统计学、计算机语言学等多种技术,将与原查询有包含关系或语义相关的词语添加到原始查询,得到比原始查询质量更高的新查询,然后重新检索文档集,以改善信息检索系统的召回率和准确率,解决信息检索领域的用户查询词和搜索引擎系统词不匹配问题,弥补用户查询信息不准确的缺陷。目前,最常用的查询扩展方法有三种:基于用户相关反馈的查询扩展、基于自动局部分析的查询扩展和基于自动全局分析的查

6、询扩展。基于用户相关反馈的查询扩展中,信息检索系统向用户返回一组检索结果后,用户需要参与标出那些相关的文档,然后系统从用户标出的文档中提取重要的特征词作为查询扩展产生新的关键词建议,该方法能准确的判断相关文档,但其缺点是过分依赖用户的参与。为了解决这个问题,学者们提出了基于自动局部或全局分析的两种查询扩展方法,它们都应用了数据挖掘中的聚类技术,从用户检索的结果文档中提取特征词,然后进行聚类,最后将与原始查询关键词关联度最高的关联词集合用于关键词建议。很显然,这种关键词建议技术也存在着缺陷。首先,用户一次查询的结果文档数据是庞杂的,庞大的源数据必将导致关键词建议

7、效率低下。其次,在检索结果文档中,只有少部分文档是与用户兴趣相关的,大部分是噪音数据。以此为源数据进行特征词聚类,没有考虑用户兴趣,得到的关键词建议只是社会的热点,难以满足用户个性化需求。综上所述,针对传统关键词建议技术在个性化建议上的不足,该文提出一种基于Web挖掘的关键词建议优化模型,以期为用户提供个性化的关键词建议。2基于Web挖掘的关键词建议优化模型Web挖掘是利用数据挖掘技术从与WWW相关的资源和行为中抽取感兴趣的、有用的模式和隐含信息的过程。根据挖掘对象的不同,Web挖掘可分为Web使用挖掘、Web文本挖掘和Web结构挖掘三大类。结合Web挖掘技术

8、和现有传统关键词建议方法,该文设计了一

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。