欢迎来到天天文库
浏览记录
ID:31360646
大小:102.50 KB
页数:3页
时间:2019-01-09
《基于自然语言处理的农业领域搜索系统的设计与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、基于自然语言处理的农业领域搜索系统的设计与实现 摘要:随着互联网的蓬勃发展,互联网上的信息越来越丰富,各个领域信息越来越丰富,给人们的生产生活带来极大的便利,因此,快速、便捷的搜索技术应运而生,针对各个领域的搜索方法越来越准确和快捷。本文结合目前搜索领域的理论、技术,将自然语言自动分词方技术应用到农业领域搜索过程,设计了一个以自然语言处理为基础的农业搜索引擎模型,给出了该模型的体系结构,该模型主要由知识库、自然语言处理器、索引库、用户接口等组成,给出了各模块功能的详细算法,并基于java实现了一个B/S结构的农业领域搜索引擎系统,该系统为用户准确快速获取农业领域信息提供
2、有效的支撑。 关键词:自然语言处理;农业领域;搜索技术;B/S结构 一、引言 谷歌、百度等综合搜索引擎的搜索结果基本上可以满足用户需求,且这些搜索引擎的性能仍在根据用户的需要在进行不断优化。对于农业方面的信息,这2种搜索引擎都能提供海量的信息,供农业领域查询。但这2种搜索引擎在搜索时的信息量大、查询不准确、深度不够以及专业化、智能化等方面存在弊端3。针对这种情况,一些人提出了垂直搜索引擎的新概念,垂直搜索引擎是搜索引擎的细分和延伸,是对行业信息资源、结构化和非结构化数据、专业业务需求进行深层次整合,定向分字段抽取数据进行加工处理后形成有价值的信息,再将这些信息以专业
3、化个性化的服务提供给用户。农业搜索引擎就是利用垂直搜索引擎这项新技术而发展起来的专门针对农业领域而开发的系统,通过农业搜索引擎查询到的农业信息会更直接、更快捷、更专业。分词是搜索引擎建立索引的重要环节。我们固然可以对单个汉字建立索引,但是那样建立的索引,体积庞大,效率低下,检索缓慢,精确率低。分词完毕后,就能大大减少索引的体积,提高检索的效率。对于检索领域来说,分词可能仍非必要环节,但是对于自然语言处理领域来说,分词就必不可少。本文提出了基于自然语言处理的农业搜索方法,在实现了搜索系统,通过在系统的开发实践中,发现问题,优化问题。 二、基于自然语言处理的农业领域搜索引擎
4、模型 系统主要通过不同的自然语言处理方式,实现对具有权限的用户输入的文本进行处理,根据处理结果调用搜索引擎进行搜索。界面上可以选择不同的处理方式,对同一自然语言处理产生不同的分词结果并显示,并调用现有的搜索引擎中搜索,显示结果。系统主要实现以下功能:(1)搜索用户权限管理(2)三种自然语言处理算法实现(3)根据自然语言处理结果去搜索农业信息(4)领域字典的建立,更新和存储(5)设计系统界面和用户接口,为用户提供相关的反馈信息。搜索引擎如下图。 三、系统实现 系统开发环境:本系统本系统采用B/S结构,不限制用户的使用人数,无客户端限制。使用myEclipse进行开发,
5、数据库使用mysql数据库存放数据字典和权限数据。3 用户搜索界面提供了三种自然语言处理方法,用户可以根据需要输入需要检索的信息,直接输入一句话,系统会自动对这句话进行分析处理,然后提交搜索引擎,进行检索,并将检索结果按相关度排序,反馈给用户。 四、结论与展望 与传统的目录查询、关键词查询相比,自然语言查询更加贴近我们的生活习惯,更加具有人机交互,更加人性化。大部分人不会使用布尔逻辑去表达想搜索的内容和需求,他们更加喜欢使用自然语言进行检索。基于自然语言的农业信息搜索方法可以更加方便、快速和精确的获取相关信息。现有的搜索系统大多是自然语言处理方法都没有考虑领域特性,
6、一般应用,我们完全可以采用现成的系统,但是这些系统大多数难以适用于农业搜索领域,农业搜索引擎在为广大用户提供农业信息的查询方面做出了应有的贡献。各项数据表明,在查询农业信息方面,农业的专业搜索引擎的查全率和查准率优于综合搜索引擎。与此同时,农业搜索引擎的搜索功能,搜索结果稳定程度信息量等方面还存在不足有待完善。 参考文献 [1]刘迁,贾惠波.中文信息处理中自动分词技术的研究与展望[J].计算工程与应用.2006(3) [2]吴江.中文自然语言理解技术与智能检索[J].图书馆学研究,2006. [3]郭来德,刘辉林,刘兰哲.农业信息搜索引擎设计与实现[J].河北工程
7、大学学报:自然科学版,2007,24(3):41-43.3
此文档下载收益归作者所有