欢迎来到天天文库
浏览记录
ID:50145055
大小:4.04 MB
页数:63页
时间:2020-03-06
《软件更新信息系统的开发研究.pdf》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、..?’、女‘,一,V.单位代码10巧3:密级:考皮《化巧女俗A哪论文题目:软件更新信息系统的开发研究学号1212022646姓名m导师屈井桌心葦二"■■I■■I■?I—?专业学位类别工梧硕±令薪类型全日制专业(领域>电子与通信工程论文提交日期2015年5月I南京邮电大学学位论文原创性声明本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究成果。
2、尽我所知,论文中不包含其他人已经发表或撰写过,除了文中特别加W标注和致谢的地方外。的研究成果,也不包含为获得南京邮电大学或其它教育机构的学位或证书而使用过的材料一与我同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。|一本人学位论文及涉及相关资料若有不实切相关的法律责任。,愿意承担研究生签名、赢日期;而侵:斧南京邮电大学学位论文使用授权声明本人授权南京邮电大学可保留并向国家有关部口或机构送交论文的复印件和电子文档;允许论义被查阅和借阅;可1^将学位论文的
3、全部或部分内容编入有关数据库进行检索;可W采用影印、缩印或扫描等复制手段保存、汇编本学位论文。本文电子文档的巧容和纸质一致。讼文的内容相。论文的公布(包括刊登)授权南京邮电大学硏究生院办理涉密学位论文在解密后适用本授权书。研究生签名:签名:)4、日期:為瓜b.巧_导师邪TheresearchofsoftwareupdateinformationsystemThesisSubmittedtoNanjingUniversityofPostsandTelecommunicationsfort
4、heDegreeofMasterofEngineeringByQiongXuSupervisor:Prof.JingquanZhouMay2015摘要随着网络技术的迅速发展,互联网每天都在产生大量的数据,各种应用软件的数量在不断增多,且软件更新速度越来越快。如何有效地从这些大量信息中提取所需要的有价值的软件更新信息,是急需解决的问题。本文根据对软件更新信息的实际需要,研究并开发了软件更新信息系统,该系统包含网络爬虫和Web网站开发两大部分,主要工作包括:首先,搜集各个软件信息的网站并加以分析,确定网络爬虫的具
5、体实现方案,采用Python语言以及最佳优先搜索策略实现网络爬虫,并研究多线程网络爬虫算法,提出多线程与标记队列管理相结合的方法,避免了多线程爬虫引起的“串扰”问题,提高了采集效率以及准确率;其次,为方便用户直观地查看软件最新信息,采用Java语言开发web网站并显示软件信息,研究JFinal框架、bootstrap等技术,快速开发网站并优化界面显示,另外给用户提供了邮件订阅的功能;再次,研究MySQL数据库的性能,并研究python、Java连接和管理数据库,采用MySQL数据库来保存软件信息和邮件订阅信息
6、;最后,将软件更新信息系统在实际应用中进行测试,性能满足公司的现有要求。实际系统的测试数据表明,系统在采集速率以及准确率上都有了一定的优化提高,验证了所设计系统的可靠性和有效性。关键词:网络爬虫,多线程,最佳优先搜索,web开发,JFinal框架IAbstractWiththerapiddevelopmentofnetworktechnology,theInternetisgeneratinglargeamountsofdataeveryday,thenumberofvarioussoftwareapplic
7、ationsisontherise,andthesoftwaresupdatefasterandfaster.Howtoextractvaluabledataeffectivelyfromsuchafloodofinformationisanurgentthingtoresolve.Accordingtotheactualneedsofsoftwareupdateinformationrequirement,thethesisresearchsanddevelopsthesoftwareupdateinfor
8、mationsystem.ThesystemincludeswebcrawlerandWebsitedevelopment,mainworkincludes:Firstly,itcollectsandanalyzesvariouswebsiteofsoftwareinformation,determinestheWebcrawlerimplementationscheme,usesPythonand
此文档下载收益归作者所有