自然语言在智能信息检索中的应用

自然语言在智能信息检索中的应用

ID:5328957

大小:452.42 KB

页数:6页

时间:2017-12-08

自然语言在智能信息检索中的应用_第1页
自然语言在智能信息检索中的应用_第2页
自然语言在智能信息检索中的应用_第3页
自然语言在智能信息检索中的应用_第4页
自然语言在智能信息检索中的应用_第5页
资源描述:

《自然语言在智能信息检索中的应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、万方数据囤童喜惦拓2006年第1期·信息工作·自然语言在智能信息检索中的应用刘宁(天津工业大学图书馆天津300160)柴雅凌(天津工业大学图书馆天津300160)摘要:文章结合自然语言在国内外的瘦用现状,分析了自然语言检索的发展趋势,同时对自然语言标引技术和处理方法进行了探讨,阐述了自然语言智能检索原理及其在智能搜索引擎中的应用,并就其在智能检索中的应用改进提出了意见,认为第三代搜索引擎的自然语言化是一种必然趋势。、关键词:自然语言标引后控词袁智能检索中图分类号:C254.0文献标识码:A文章编号:1

2、003—6938(2006)01—0091—05TheApplicationofNaturalLanguageinIntelligentSearchingLiuNingChaiYaling(TianjinPolytechnicUniversity,Tianjin,300160)Abslrad:7rh。papermainlydiscussedonthecurrentsituationofthenaturallanguage.analysedthedevelopingtrendoftheinformati

3、onretrievallanguage.Meanwhile,formulatedtheindexingandtheprocessingtechnologyofthenaturallanguage.itexpoundedtheprinci-p】eofintelligentsearching,andtheapplicationintheintelligentsearchengine,atlast,thewriterproposessomepersonalviews.Itisacertaintyofnatu

4、ralizationforthethirdgenerationsearchengine.Keyworcls:NaturallanguageindexingControlled—TermIntelligentsearching●CLCnumber:G254.0Documenfcode:AArffcIelD:1003—6938(2006)ol一0091—05自然语言是情报检索语言中的非规范化语言,是指人们日常说话、写文章和交流所用的语言。自然语言检索就是利用自然语言进行标引和检索,它是把出现的每一个词或短

5、语都看作一个检索入口,允许自然语言直接获取原文中的有关章节、段落和句子。自然语言直接面向用户,可用作标引用语和数据库语言,具有方便、易用、标引成果可共享等优点,它已成为智能检索中最常用、最方便的检索语言。1自然语言智能检索应用的现状1.1自然语言智能标引在国外的应用状况国外对自然语言在信息检索中的应用很活跃,并且已经取得了实质性进展。如法国把自然语言分析成名词词组后再收稿日期:2005—04—19;责任编辑:党燕妮与机器内词表匹配,匹配技术用句法模式,在自然语言接口与情报检索语言相结合方面取得了很大进

6、展。⋯典型代表是自然语言接口系统TOPIc——文本主题词专家语法分析系统、IRES一自然语言询问的词形和句法分析系统、ADRENAIr一文本检索自然语言处理系统。在美国把自然语言处理应用到情报检索领域,实现了真正的非布尔逻辑检索,出现了WIN系统,FREE—STYLE系统与MNIS系统,这些系统的检索方法是以相关排序和智能文本处理为基础的,根据与提问的相关性或相似性进行排序,改变了布尔检索的方式。荷兰的CSDOS全文库,就是一个自然语言提问系统,可以使用自然语言查询,用户可以用正常的会话语法组织查询内

7、容,就像请求别人回答一样,只需将自己认为应该在全文91万方数据刘宁柴雅凌:自然语言在智能信息检索中的应用档中出现的检索词输入即可。美国两大法律全文数据商(WestLaw,MeadData)均提出了自然语言提问检索接口,特点之一是可以输入类似自然语言的提问,检索系统可以自动查找使用了同义词的文献,相信不久的将来可以查到或者显示相关词下的文献。I.2自然语言智能标引在国内的应用状况我国自然语言标引方面的应用比较滞后,但也有一些自己的成果。就目前来看应用最广泛的是基于人工智能的计算机标引,拉。这一观点最早是

8、由卢恩在1957年提出的,其主要思想是:一篇文章中—个词再现的频率是这个词的重要性的有效测试。一个句子中具有给定重要测试的词的相关状态,成为该句子重要性的有效测试。按照词语出现的频率,以一定的标准排除高频词与低频词,剩下的就是最能代表文献内容的词。自然语言标引是指采用原文中的信息作为标引源,从中选取能够有效表明信息内容的特征词,以实现信息检索系统的最大功能。自然语言标引经历了人工标引阶段和计算机自动标引阶段。自动标引是指利用计算机技术从各种文献中自动提取

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。