毕业设计(论文)-基于web的行业新闻采集系统

毕业设计(论文)-基于web的行业新闻采集系统

ID:6794793

大小:2.20 MB

页数:74页

时间:2018-01-25

毕业设计(论文)-基于web的行业新闻采集系统_第1页
毕业设计(论文)-基于web的行业新闻采集系统_第2页
毕业设计(论文)-基于web的行业新闻采集系统_第3页
毕业设计(论文)-基于web的行业新闻采集系统_第4页
毕业设计(论文)-基于web的行业新闻采集系统_第5页
资源描述:

《毕业设计(论文)-基于web的行业新闻采集系统》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、景德镇陶瓷学院工学学士学位论文(设计)题目:基于Web的行业新闻采集系统学号:姓名:  xxxx院(系): 信息工程学院 专业:信息管理与系统 完成日期:  指导老师:      分类号  学校代码UDC密级  学号景德镇陶瓷学院信息工程学院毕业论文基于web的行业新闻采集系统指导老师:xxxx副教授景德镇陶瓷学院信息工程学院申请学位级别学士  专业名称xx信息管理与系统论文提交日期2011年12月28日论文答辩日期2011年1月5日学位授予单位和日期景德镇陶瓷学院答辩委员会主席:xxxxxx论文评阅

2、人:2011年1月5日摘要随着互联网的飞速发展,信息时代的到来,面对网络上泛滥的新闻信息,而采集和过滤一些有用的信息对于我们来说是十分重要的。行业新闻采集系统是将非结构化的新闻文章从多个新闻来源网页中抽取出来保存到结构化的数据库中的过程。尤其是对于大型门户网站,比如新浪,腾讯他们每天的网站信息都更新,而且范围很广,全国各地,甚至全球发生的信息都能每天看到更新,而他们正是利用采集系统从各大媒体网站,外国网站采集过来的。因此,信息的采集至关重要。一般的网站新闻发布平台都是采用人工输入信息,对于中小型网站这

3、样的工作量很算可以,但是网站大了,信息就很庞大了,像那种分类信息网,更新的工作就变得很复杂,如果有专门的类似搜索引擎能检索采集到最新的行业信息然后发布在自己的网站上,因此建立专门的行业新闻采集系统,从相关行业网站采集有效的新闻信息,比如采集陶瓷行业新闻,从各大陶瓷网站采集有关陶瓷关键字的新闻列表,然后帅选入库,可以减少很多工作量,而且可以有效的进行修改和过滤工作。目前比较有名的采集系统有火车头,视采新闻采集器[2]、万能新闻采集器、新浪新闻采集器。关键字:行业新闻采集;.net;SQLserverht

4、tp://www..comhttp://i..comhttp://www.sankeyo.comhttp://www.mowu68.comhttp://www.hbms.cnAbstractWiththerapiddevelopmentoftheInternet,theadventoftheinformationage,facethefloodofnewsinformationnetwork,andthecollectionandfiltersomeusefulinformationforus,iti

5、sveryimportant.Newsgatheringsystemiswillunstructurednewsarticlesfrommultiplesourcesofnewspageextractedsavedtothestructuraldatabaseinprocess.Especiallyforlargewebportal,suchassina,tencenteverydaytheywebsiteinformationupdates,andtherangeisverywide,allover

6、thecountry,andeventheglobalhappenedtoseeupdateinformationeveryday,andtheyaretheuseofacquisitionsystemfromthemajormediawebsite,foreignwebsitecollected.Therefore,thecollectionoftheinformationisveryimportant.Thegeneralwebnewsreleaseplatformareusingartifici

7、alinputinformation,forsmallandmediumwebsitesuchworkloadiscalculatecan,butthesiteisbig,theinformationisverybig,liketheclassificationandinformationnetwork,updatetheworkisverycomplex,ifhavespecialsimilarsearchenginecanretrievecollectiontothelatestinformati

8、onandthenreleasedonhiswebsite,thusestablishingspecialcollectionsystem,fromrelatedwebsitecollectioneffectivenewsinformationcanreducealotworkload,andcaneffectivelymodifiedandfilterwork.Atpresentmorefamouscollectionsystemhasalocomot

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。