软件工程毕业设计(论文)-基于wordnet的xml文档语义相似性计算方法

软件工程毕业设计(论文)-基于wordnet的xml文档语义相似性计算方法

ID:34220026

大小:1.73 MB

页数:67页

时间:2019-03-04

软件工程毕业设计(论文)-基于wordnet的xml文档语义相似性计算方法_第1页
软件工程毕业设计(论文)-基于wordnet的xml文档语义相似性计算方法_第2页
软件工程毕业设计(论文)-基于wordnet的xml文档语义相似性计算方法_第3页
软件工程毕业设计(论文)-基于wordnet的xml文档语义相似性计算方法_第4页
软件工程毕业设计(论文)-基于wordnet的xml文档语义相似性计算方法_第5页
资源描述:

《软件工程毕业设计(论文)-基于wordnet的xml文档语义相似性计算方法》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、毕业设计(论文)说明书学院软件学院专业软件工程年级2007级姓名指导教师2011年6月15日毕业设计(论文)任务书题目:基于WORDNET的XML文档语义相似性计算方法学生姓名学院名称软件学院专业软件工程学号指导教师职称教授讲师一、原始依据1、工作基础:近年来,随着互联网技术的飞速发展,网络上的信息资源呈不断的扩张趋势,无论在数量还是领域范围上,都爆炸式增长。这在丰富网络资源的同时,使得有效信息、知识的获取变得更加困难,因此,关于结构及语义相似性测量的研究成为数据挖掘、机器学习等领域中的研究热点之一。事实上,相似性及其度量方法一

2、直是数据挖掘、机器学习等领域中的研究主题之一,也是Web数据挖掘系统所要解决的关键问题之一。从1996年W3C提出XML工作草案,1997年召开第一次XML会议开始,到近年来XML、语义网(SemanticWeb)及OWL等相关技术的研究与发展,使得面向内容的数据挖掘等成为可能。在面向内容的智能信息处理中,基于结构(如树、图)表示模式,计算结构化数据的结构相似性并从中挖掘知识,在数据挖掘及相关领域得到了广泛的研究。但数据的结构相似性研究并不能解决语义冲突问题,不能从根本上消除网络环境下的信息孤岛和实现信息资源的互联互通和资源共享

3、。随着语义网和本体(ontology)的发展,这个问题得到了较好的解决,国内外学者从不同的角度(概念相似度、文档相似度、半结构文档相似度)都进行了深入研究,而XML作为一种应用越来越广泛的文档记录方式,对XML语义相似度的研究也受到了普遍的关注和研究。但目前对基于XML半结构语言计算语义相似性的研究没有一套成熟、高效的计算方法,自然语言与计算机语言之间仍然存在一道鸿沟,严重影响了对互联网信息的应用效率。2、研究条件:在目前研究成果的基础上,依托于南开大学信息学院数据库与信息系统实验室。近7年来,该室对XML结构相似性计算方法、基

4、于结构相似性计算的Web挖掘方法等进行了深入研究,在此基础上,展开了XML的语义相似性研究。研究平台和应用环境为Windows7,软件开发工具为VisualStudio2008。3、应用环境:通过本方法,结合适当的领域词典,可对用户需求的信息、知识进行有效匹配,结合南开大学的已有项目,研究成果将应用于Web数据挖掘方法与系统;同时,还可以应用于知识工程、数字图书馆、各专业领域的信息检索、信息过滤、自然语言处理、数据集成及语义Web等许多方面。4、工作目的:本课题基于由普林斯顿大学设计的认知语言学词典WordNet,设计并实现一套

5、用于计算XML基本语义相似性的计算方法。并以本课题为基础,为将来在更广阔范围的应用做准备。二、参考文献[1]LinD.AnInformation-TheoreticDefinitionofSimilarity[C].In:ProceedingsoftheFifteenthInternationalConferenceonMachineLearning.SanFrancisco,CA,USA:MorganKaufmannPublishersInc.1998.296-304.[2]Tversky,A.1997.Featuresofs

6、imilarity.J.PsychologicalRev.84:327-352.[3]Boanerges,A.M.,Christian,H.W.,Satya,S.S.,Amit,S.I.andBudakA.2005.Templatebasedsemanticsimilarityforsecurityapplications.TechnicalReport,LSDISLab,ComputerScienceDepartment,UniversityofGerogia,January.[4]Jiang,J.J.,David,W.C.1

7、997.Semanticsimilaritybasedoncorpusstatisticsandlexicaltaxonomy.Proc.Int.Conf.ResearchonComputationalLinguistics.Taiwan,pp.1-15.[5]Peter,F.,Martin,K,ErichJ.N.1991.Semanticvs.structuralresemblanceofclassestoappearinspecialSIGMODRECORDissueonsemanticissuesinMultidataba

8、seSystems,20:4.[6]GoldstoneRL,SonJY.Similarity[J].PsychologicalReview.2004,100:254-278.[7]LiM,ChenX,XinML,etal.TheSimilarityMetric[

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。