文本特征信息搜索与分类系统设计【计算机科学专业】【毕业设计+文献综述+开题报告】

文本特征信息搜索与分类系统设计【计算机科学专业】【毕业设计+文献综述+开题报告】

ID:479641

大小:3.06 MB

页数:49页

时间:2017-08-09

文本特征信息搜索与分类系统设计【计算机科学专业】【毕业设计+文献综述+开题报告】_第1页
文本特征信息搜索与分类系统设计【计算机科学专业】【毕业设计+文献综述+开题报告】_第2页
文本特征信息搜索与分类系统设计【计算机科学专业】【毕业设计+文献综述+开题报告】_第3页
文本特征信息搜索与分类系统设计【计算机科学专业】【毕业设计+文献综述+开题报告】_第4页
文本特征信息搜索与分类系统设计【计算机科学专业】【毕业设计+文献综述+开题报告】_第5页
资源描述:

《文本特征信息搜索与分类系统设计【计算机科学专业】【毕业设计+文献综述+开题报告】》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、(20届)本科毕业论文文本特征信息搜索与分类系统设计摘要:随着信息技术的发展与应用以及互联网的逐渐普及,庞杂的文本信息流急剧增多,这对我们的认知与决策带来了很大的压力。本论文主要用JAVA语言,运用搜索引擎和文本挖掘等相关技术,按照用户提交查询的关键词(文本特征)来查找在Web上与之匹配的信息以实现文本特征信息的搜索,通过相关的调整和分类,用户能够有效、迅捷地获取所要的文本信息。关键词:文本特征;搜索引擎;分类TheSystemDesignofTextFeatureInformationSearchandClassificationAbst

2、ract:Asinformationtechnology’sdevelopmentandapplicationandInternetpenetration,thesharpincrementofnumeroustext informationflow,wehavemuchpressureonourknowledgeanddecision.ThesystemmainlyisdesignedbyJAVAlanguage,throughtechnologiesaboutsearchengineandtextminingandsoon.Accord

3、ingtouserssubmittingquerykeywords(textfeature),thesystemlooksforsomeinformationonWebtorealizetextfeatureinformationsearch.Throughrelatedadjustmentsandclassification,userscangettextinformationeffectivelyandquickly.Keywords:textfeatures;searchengine;classification目录1在特征文本中搜索

4、引擎的重要性11.1搜索引擎的发展11.2搜索引擎的相关技术11.2.1搜索语法11.2.2网络蜘蛛21.2.3提取文档中的文本内容21.2.4中文分词21.2.5自然语言处理21.2.6创建索引库21.2.7用户界面设计与实现21.3搜索引擎在文本特征中的应用22在特征文本中文本挖掘的重要性22.1文本挖掘的发展22.2文本挖掘的相关技术22.3文本挖掘在特征文本信息的应用23实现特征文本信息搜索与分类系统的对策23.1文本挖掘23.2搜索引擎23.3模块设计23.3.1搜索界面设计23.3.2搜索引擎设计23.3.3数据库设计23.3.

5、4结果显示界面设计24总结2致谢2附录21在特征文本中搜索引擎的重要性1.1搜索引擎的发展现如今,除了门户的互联网外,搜索引擎已成为第二大核心技术。随着互联网的普及和网上信息的爆炸式的增长,在短短十年的时间内,搜索引擎迅猛地发展起来,它越来越引起人们的重视。搜索引擎技术现在已成为计算机界争相研究和开发的对象,已成为一个非常热门的话题。通过统计和分析搜索引擎技术和检索任务方面的词语,一方面可以反映出对搜索引擎的关注程度,另一方面也能大致分析出搜索引擎的发展现状以及发展趋势。文献[1]对搜索引擎的发展大致分割成3个阶段。第一个阶段里的搜索引擎以

6、雅虎为标志,主要依靠人工分拣信息,用分类目录搜索信息。这一阶段的搜索引擎技术还处于萌芽阶段。虽然这样,但此时各种搜索引擎概念也相继出现了,如目录式搜索引擎、全文搜索引擎、元搜索引擎等。这一阶段,词频相对较高的关键词是全文检索、智能检索、多媒体、图像搜索、语义网络、分类目录、分类主题等。这个时期分类搜索是网络搜索的主流。搜索引擎在第二个阶段里开始迅速发展。最负盛名的搜索引擎当数Google,它在1999年以不可抵挡的势头走向世界,依靠机器抓取、分析进行网页搜索,带动了新技术PageRank和锚文本技术的发展。此阶段的热点词语有关键词检索、倒排

7、索引、全文索引、自动摘要、链接分析等。这段时期链接分析技术、PageRank算法以及Hit算法等如火如荼地展开。人们基本认为Web信息检索开始进入了新一代搜索引擎阶段。第三个阶段里搜索引擎的研究变得非常火热,搜索引擎越来越向智能化、个性化、专业化的方向发展,同时也不断地涌现出新的具有鲜明特色的搜索引擎产品。通过对文本分类、聚类、用户行为分析、分布式、相关反馈、智能代理、查询扩展等高频词的分析,我们可以看出,人工智能、数据库、数据挖掘、自然语言理解等领域的研究有力地促进了搜索引擎的发展。1.2搜索引擎的相关技术1.2.1搜索语法实现一个搜索语

8、法是专业搜索引擎都需要的,基本的搜索语法包含以下逻辑运算符:(1)或:要求搜索结果可以包括运算符两边的任意一个查询词,符号包括(OR、

9、)。(2)与:要求查询词必须出现在搜索结果

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。