主题网络爬虫的设计与实现——界面及数据库模块设计-毕业论文.doc

主题网络爬虫的设计与实现——界面及数据库模块设计-毕业论文.doc

ID:18987807

大小:1.06 MB

页数:48页

时间:2018-09-27

主题网络爬虫的设计与实现——界面及数据库模块设计-毕业论文.doc_第1页
主题网络爬虫的设计与实现——界面及数据库模块设计-毕业论文.doc_第2页
主题网络爬虫的设计与实现——界面及数据库模块设计-毕业论文.doc_第3页
主题网络爬虫的设计与实现——界面及数据库模块设计-毕业论文.doc_第4页
主题网络爬虫的设计与实现——界面及数据库模块设计-毕业论文.doc_第5页
资源描述:

《主题网络爬虫的设计与实现——界面及数据库模块设计-毕业论文.doc》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、主题网络爬虫的设计与实现本科毕业论文(科研训练、毕业设计)题目:主题网络爬虫的设计与实现——界面及数据库模块设计姓名:学院:软件学院系:软件工程专业:软件工程年级:学号:指导教师:职称:年月X主题网络爬虫的设计与实现摘要随着网络信息的迅速发展,搜索引擎已成为人们获取有用信息必不可少的工具。以何种策略有效地访问网络资源是专业搜索引擎中网络爬虫研究的主要问题。本文对搜索引擎中网络爬虫的搜索策略进行简要分析,总结提高搜索效率的因素,使人们对网络爬虫的搜索算法有个大概了解,以及对新一代搜索引擎的期望,以便更快捷获取自己需要的信息。搜索引擎作为网络信息搜寻的工具,它以一定的策略在互联网中搜集

2、、发现信息,对信息进行理解、提取、组织和处理,并为用户提供检索服务。爬虫搜索引擎主要由三部分组成:搜索器、数据库和用户界面。搜索器搜索到Internet的Web页面后,将页面信息存入索引数据库,最后通过用户界面提供给用户。文章主要介绍数据库的组织和索引过程的实现。本文简要描述了主题爬虫设计中主题相关度分析以及爬虫具体实现过程,侧重点在于系统的界面设计及数据库设计模块。界面部分通过引入插件来改变原有面板的外观,以达到美化的效果;数据库部分对数据库的设计特点、方法以及步骤等做了简单的介绍,通过对系统的需求分析进行数据库的概念结构设计、逻辑结构设计和物理结构设计。另外本文还介绍了爬虫系统

3、的各模块之间的相互关系,结合图例给于说明分析,通过对爬虫系统的运行流程进行简要分析,测试并验证了系统的可行性和有效性。最后对开发工具以及所用到的插件做了相关说明。关键词:网络爬虫搜索引擎插件索引X主题网络爬虫的设计与实现AbstractInrecentyears,searchengineturnsmoreandmoreimportantforustogetusefulinformation.HowcanWebcrawlervisitthewebefficientlyinthedomainofTopicSpecificSearchEnginehasbecomethemainprobl

4、em.Thispaperanalysizeswebcrawler’ssearchingstrategies.Thispaperwantstomakepeopleknowthewebcrawler’sstrategyandlongforthenewsearchingenginesoastogetinformationquicklywhichtheyneed.Searchengineisatoolofserchinginformationintheinternet,itcollect,discoversaninformationintheInternetbycertainstrateg

5、yandcarryoncomprehension,withdrawtotheinformation,organizationandprocessing,andprovideanindexserviceforthecustomer.Webcrawler’ssearchengineofaInternetconsistsofthreeparts:searcher,Databaseanduserinterface.SearchersearchesWebpageofaInternetandthensavesthepageinformationintoindexDatabaseandprovi

6、desthemforusersbyinterfaceintheend.ThispaperintroducesorganizationofDatabaseandtheimplementofindexprocess.Thispapersynopsisintroducetherelateddegreeanalysisandtheprocessofthewebcrawlerdesign.Themainpartistheinterfacedesignandthedatabasedesign.Theinterfacepartleadsplug-instochangeoriginalextern

7、alappearanceoffront-panelsoastochangetheeffectofbeautification.Andsimplyintroducethedesigncharacteristics,methodandstepofdatabasepart,designthelogicstructure,theconceptstructureandthephysicalstructureofthedatabaseaftertheneedanalysis.Mo

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。