欢迎来到天天文库
浏览记录
ID:34702182
大小:1.52 MB
页数:66页
时间:2019-03-09
《基于动态领域知识体系信息采集方法及实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、NanjingUniversityofAeronauticsandAstronauticsTheGraduateSchoolCollegeofEconomicsandManagementInformationCollectionResearchwhichisbasedonDynamicFieldofKnowledgeandImplementationAThesisinManagementScienceandEngineeringbyWangWeixiAdvisedbyProfessorMaJingSubmittedinPartialFulfillmentoftheRequir
2、ementsfortheDegreeofMasterofManagementMarch,2012承诺书本人郑重声明:所呈交的学位论文,是本人在导师指导下,独立进行研究工作所取得的成果。尽我所知,除文中已经注明引用的内容外,本学位论文的研究成果不包含任何他人享有著作权的内容。对本论文所涉及的研究工作做出贡献的其他个人和集体,均已在文中以明确方式标明。本人授权南京航空航天大学可以有权保留送交论文的复印件,允许论文被查阅和借阅,可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或其他复制手段保存论文。(保密的学位论文在解密后适用本承诺书)作者签名:日期:南京航
3、空航天大学硕士学位论文摘要作为一个庞大的动态信息资源库,互联网已经成为各类机构信息采集的重要渠道之一,专题的信息采集变得十分重要。但是目前面向网络的信息搜索是基于关键词技术的,采集结果零碎,内容孤立,数据量大。本文在项目任务需求基础上,提出一种基于动态领域知识体系的专题信息采集方法,本方法是在基础领域知识体系基础上,结合关键词的发现,并在领域专家干预下实现的,从而实现专题信息采集的动态适应性,对提高采集质量有很好的研究意义。本文首先对信息采集和信息更新的基础理论方法和研究现状进行了简介,介绍了Web信息采集的基本原理和信息更新的方法以及相关技术。然后针对Web内容进行专题信息
4、采集的策略设计,其中主要是对一般网页的采集策略设计、论坛数据的采集策略设计、领域知识体系的更新设计。有了相关采集策略后,进行系统的需求分析,分析现有领域知识体系应用于专题信息采集上面的不足,再进行系统的分析与设计,包括领域知识体系的建立,系统功能结构的分析,其中系统核心是对预置的领域知识体系进行半自动化更新,从而进一步提高专题信息采集的采全率,最后实现系统,针对特定的国防领域知识体系的专题信息采集设计了实验,对本文提出的方案设计进行测试。本文的主要贡献在于在传统的专题信息采集的基础上提出了不同信息源的采集策略和领域知识体系更新的半自动算法,并在系统中进行应用测试,在提交给用户
5、实际使用的过程中得到认可。关键词:信息采集,领域知识体系,专题采集系统I基于动态领域知识体系的信息采集方法及实现ABSTRACTDynamicinformationasahugeresourcelibrary,theInternethasbecomethekindsofinstitutionsisoneimportantchannelforinformationcollection,informationgatheringtopichasbecomeveryimportant.However,thecurrentnetwork-orientedinformationisbas
6、edonkeywordsearchtechnology,collectingtheresultsoffragmented,isolatedcontent,largevolumesofdata.Thispaper,basedonmissionrequirementsintheproject,proposedasystembasedondynamicdomainknowledgethematicinformationcollectionmethods,thismethodisbasedonthebasicareasofknowledge,combinedwiththediscov
7、eryofkeywords,andexpertsinthefieldinterventiontoachieve,inordertoachievethematicinformationcollecteddynamicadaptability,toimprovethequalityofagoodcollectionofresearchsignificance.Thisfirstupdateoftheinformationcollectionandinformation-basedtheoreticalapp
此文档下载收益归作者所有