资源描述:
《面向web_service的网络爬虫设计与实现毕业设计论文》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、毕业设计(论文)说明书题目:面向webservice的网络爬虫设计与实现毕业设计(论文)任务书题目:面向webservice的网络爬虫设计与实现毕业设计(论文)原创性声明和使用授权说明原创性声明本人郑重承诺:所呈交的毕业设计(论文),是我个人在指导教师的指导下进行的研究工作及取得的成果。尽我所知,除文中特别加以标注和致谢的地方外,不包含其他人或组织已经发表或公布过的研究成果,也不包含我为获得及其它教育机构的学位或学历而使用过的材料。对本研究提供过帮助和做出过贡献的个人或集体,均已在文中作了明确的说明并表示了谢意。作者签名: 日 期: 指
2、导教师签名: 日 期: 使用授权说明本人完全了解大学关于收集、保存、使用毕业设计(论文)的规定,即:按照学校要求提交毕业设计(论文)的印刷本和电子版本;学校有权保存毕业设计(论文)的印刷本和电子版,并提供目录检索与阅览服务;学校可以采用影印、缩印、数字化或其它复制手段保存论文;在不以赢利为目的前提下,学校可以公布论文的部分或全部内容。作者签名: 日 期: 一、原始依据(包括设计或论文的工作基础、研究条件、应用环境、工作目的等。)WebServices技术是一种基于XML语言和标准的网络协议实现的分布式计算技术。WebS
3、ervices技术是可以改变软件产业面貌和软件应用模式的技术之一。WebServices技术可以将Internet上的各种信息资源和服务功能整合在一起,在任何时间、任何地点向用户提供优质的服务。WebServices技术还有助于改变企业对IT系统的应用方式和依赖程度。所以WebServices技术成为了网络上的主流技术之一,随之也来的是大量的开发人员开始开发Web服务,随着时间的推移,网络上出现了大量的Web服务。但是,大量的Web服务分布在网络中的各个地方,给用户寻找特定功能的服务造成了不小的麻烦,也给服务开发者在原有的服务上进行再次开发造成了不便。本课题的任务就是研究如何
4、把网络上分散的Web服务搜集在一起。二、参考文献[1]孙立伟,何国辉,吴礼发;网络爬虫技术研究;ComputerKnowledgeandTechnology电脑知识与技术;Vol.4,No.15,May2010,pp.4112-4115[2]李盛韬,余智华,程学旗.Web信息采集研究进展【J】.计算机科学,2003.[3]S.Chakrabarti,M.vandenBergandB.Dom.FocusedCrawling:ANewApproachtoTopic-SpecifiWebResourceDiscovery[C].InProceedingsofthe8thIntern
5、ationalWorldWideWebConference,Toronto,Canada,1999.[4]郑力明,易平;DesignofCrawlerBasedonHTMLParserInformationExtraction;微计算机信息,MicrocomputerInformation;09,June,2009。[5]J.Cho,H.Garcia-Molina.Theevolutionofthewebandimplicationsforanincrementalcrawler[C].InProceedingsofthe26thInter-nationalConferenc
6、eonVeryLargeDatabase,Cairo,Egypt,2000.[6]李文泽;个性化垂直搜索引擎研究;河南大学;2007-11-07;[7]曾伟辉,李淼.深层网络爬虫研究综述[J].计算机系统应用,2008.[8]周立柱,林 玲.聚焦爬虫技术研究综述[J].计算机应用,2005年9月.[9]S.Chakrabarti,M.vandenBergandB.Dom.FocusedCrawling:ANewApproachtoTopic-SpecificWebResourceDiscovery[C].InProceedingsofthe8thInternationalWo
7、rldWideWebConference,Toronto,Canada,1999.[10]陈汶滨,夏学梅.基于聚焦爬虫的手机天气预报系统[J].今日科苑.2009年第2期.[11]邱哲,符滔滔.开发自己的搜索引擎--Lucene2.0+Heritrix.人民邮电出版社,2007-4.[12]罗刚.自己动手写网络爬虫.清华大学出版社.2010-10-1;[13]Heritrix官方网站[EB/OL].crawler.archive.org[14]seeda网站[EB/OL].webservices.see