欢迎来到天天文库
浏览记录
ID:33302100
大小:1.78 MB
页数:55页
时间:2019-02-23
《信息采集系统的实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、东北大学硕士学位论文信息采集系统的实现姓名:陶袁申请学位级别:硕士专业:计算机应用技术指导教师:袁淮20040101东北大学硕士学位论文摘要在Internet技术普及的今天,银行的信息处理在很大程度上仍然依赖人来进行。层层传递、层层审批的处理方式严重制约银行的发展。信息处理的过程中出错的可能性极大;而且不同的银行之间以及相同银行的不同部门之间无法实现信息的共享;这给银行业的发展带来极大的障碍,实现银行信息管理(信息采集和信息发布)自动化势在必行。现在市场上确实提供不少的信息采集产品,他们提供的信息采集
2、产品多数都是对连八Internet网上的信息实现在线的监控和采集;采集的过程中多数是依赖关键字进行搜索:导致可采集的信息量比较大,对硬件的要求比较高,增加了单位的成本;保存采集到的文档也只能把整个文档保存在—起;无法实现对Excel文档、word文档或rxt文档的分解保存,不利于对采集后的信息的管理;不能满足用户的特殊需求。本文通过对信息采集技术和用户需求的实际研究,设计出具有信息采集功能的实用系统,此系统设计用文档库保存被采集的数据,用x儿文件作为校验采集文档数据的模板文件,实现复杂的问题简单化:本
3、文着重研究、探讨实现的具体过程和得到的相应的结论。该论文要解决的以下问题:(i)用文档库保存被采集的文档,实现对具有特定格式的w硎文档、Exoel文档、Txt3℃档的在线采集,并按照用户指定的格式保存起来;(2)由用户自己设定采集目录、采集应用的校验模板和保存副示数据库的表的结构,最大程度满足用户的需求;(3)采用单线程技术,能够动态的监控被采集的目录,及时采集上传的文档;(4)线程的启动和停止完全由用户自己决定,更有效的分配系统资源;(5)利用特定的手段有效的保证在数据库操作过程中数据的完整性:同时
4、防止数据库中数据被动重复;(6)该系统支持检索功能和被采集的信息出错后的胁ail即时通知功能。极大的方便用户的操作。【关键字】信息采集,数据库连接池,线程。文档解析,内容过滤,邮件一Ⅱ东北大学硕士学位论文ABSTRACTNowadays,thetechnologyofIntemethasalreadygainedgroundatlarge.Dealinginformationatbank啪sclydependsOilpeople.Thewayoflransferfinginformationorapp
5、mvmginformationlayerandlayerpacksthedevelopmentofbankgreatly.Theerrorwashappenedduringtheprocedtaeandtheinformationcan'tbesharedindifferentbanksordifferentpartsofthesamebank.Theseholdbackthedevelopmentofbankmostly,automationofdealinginformationinthebank
6、isimperativeunderthesituation.No.therearealotofproductsinthemarket.TheproductwhattheyprovidedalmostaretheltliI喀watchingtheIntemetandcollectingthedocumentwithkeywords.ThisdemandedOnhardwarestrictly,andwouldincreasethecost.Theyputthewholedocumenttogethera
7、ftertheycollectedthem_Soanyonewouldmeetdifficultlywhentheydealthem,andthiscannotmeetthespeeialdemandsofusers.AfterworkingoverthetechnologyofinformationeoU∞tinganddemandsofusers,Idesignedapracticalinformationcollectingsystem.Igetthetempledocumentbytheway
8、ofXMLdocumentinthesystem,thisCallsimplethecomplicatedproblem.111ethesismainlydiscussesthe舯)oedI聆ofpracticeandsomeconelusion1hequestionwhichshouldsolveisbelow:(1)mdocumentswerestoredinthedocumentstoreroom,thesystemcallcolleclingth
此文档下载收益归作者所有