欢迎来到天天文库
浏览记录
ID:32882685
大小:2.38 MB
页数:85页
时间:2019-02-17
《基于语义web技术的非结构化文档管理方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、中图分类号:TP391论文编号:102870912-S049学科分类号:120100硕士学位论文基于语义Web技术的非结构化文档管理方法研究研究生姓名施秀丽学科、专业管理科学与工程研究方向管理信息系统指导老师张明宝副教授南京航空航天大学研究生院经济与管理学院二О一二年三月NanjingUniversityofAeronauticsandAstronauticsTheGraduateSchoolCollegeofEconomicsandmagementUnstructuredDocumentManagementMethodBasedonSemanticWebTechnologyATh
2、esisinManagementScienceandEngineeringbyShiXiuliAdvisedbyAssociateProf.ZhangMingbao.SubmittedinPartialFulfillmentoftheRequirementsfortheDegreeofMasterofManagementScienceMarch,2012承诺书本人郑重声明:所呈交的学位论文,是本人在导师指导下,独立进行研究工作所取得的成果。尽我所知,除文中已经注明引用的内容外,本学位论文的研究成果不包含任何他人享有著作权的内容。对本论文所涉及的研究工作做出贡献的其他个人和集体,均已
3、在文中以明确方式标明。本人授权南京航空航天大学可以有权保留送交论文的复印件,允许论文被查阅和借阅,可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或其他复制手段保存论文。(保密的学位论文在解密后适用本承诺书)作者签名:日期:南京航空航天大学硕士学位论文摘要目前,伴随着数据库技术、数据挖掘技术、数据仓库技术等的成熟和广泛应用,结构化文档管理问题已经基本得到解决;信息技术的广泛应用带来非结构化文档激增,但对其应用效率低下,而新兴管理思想的涌现以及全球化竞争的日益加剧迫切要求对组织中的非结构化文档资源进行有效的管理。非结构化文档管理正日益成为互联网时代信息资源管理
4、的一个关键问题。本文将语义Web技术及标准引入非结构化文档的分析、标记和应用过程,以形成一套有效的非结构化文档管理方法,满足企业应用的迫切需求。本文首先系统介绍了语义Web的相关理论,其中重点是语义Web的三大关键技术:XML、RDF及本体。之后围绕非结构化文档管理生命周期的全过程:获取、标记、组织/存储及应用,分析了每个环节目前还存在的问题。之后引入语义Web技术进行分析和解决,重点解决了:1)文档标记中涉及到的标记语言(外表特征和内容特征两方面)、标记过程及标记工具,并最终形成完整的结构化的标记描述,以利于计算机进行理解和自动处理;2)组织方法采用基于本体的组织方法代替传统线性
5、组织方法,以满足分布式的网络信息组织的需要,同时存储方式采取监督机制来协同源文档和标记文档之间的同步关系,以确保两者同时更改和删除;3)最后具体的应用则从信息检索、自动分类、智能推理三个方向来分析:信息检索时利用本体进行查询扩展,并根据语义相似度进行检索排序;自动分类则以领域本体作为分类树,以形成动态统一的分类标准;智能推理方面则利用本体和描述逻辑来实现计算机理解的、规范化的描述,并利用描述逻辑的推理功能进行智能推理。最后,在完成前面分析和解决问题的基础上,形成了完整的非结构化文档管理框架,详细描述非结构化文档管理生命周期的全过程,并设计了一个企业邮件管理原型系统,以验证研究的可行
6、性和正确性。关键词:非结构化文档,语义Web,可扩展标记语言,资源描述框架,本体i基于语义Web技术的非结构化文档管理方法研究ABSTRACTAtpresent,asdatabasetechnology,datamining,datawarehousingtechnologiesarematureandwidelyused,structureddocumentmanagementissueshavebeenbasiclysolved;theextensiveapplicationofinformationtechnologybringssurgeunstructureddocume
7、nts,butitshasnoefficientapplication,andincreasingglobalcompetitionrequireeffectivemanagemenoftheorganization'sunstructureddigitalinformationresources.Unstructureddocumentmanagementisincreasinglybecomingakeyissueininformationresourcemana
此文档下载收益归作者所有