中文信息的语义数据挖掘技术研究

中文信息的语义数据挖掘技术研究

ID:36717632

大小:9.75 MB

页数:82页

时间:2019-05-14

中文信息的语义数据挖掘技术研究_第1页
中文信息的语义数据挖掘技术研究_第2页
中文信息的语义数据挖掘技术研究_第3页
中文信息的语义数据挖掘技术研究_第4页
中文信息的语义数据挖掘技术研究_第5页
资源描述:

《中文信息的语义数据挖掘技术研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、湖南大学硕士学位论文中文信息的语义数据挖掘技术研究姓名:翟晓华申请学位级别:硕士专业:系统工程指导教师:孙炜20080414硕士学位论文摘要传统的信息由于缺乏统一的语义描述,充斥着大量繁杂重复信息,面对这些海量信息,如何快速、有效地从“信息海洋”中获取人们所需的信息成为难题。让信息具有语义,使计算机能够理解信息含义,进而对信息进行加工处理,能从根本上解决这一难题,更好地实现信息共享。由于中文信息的特殊性和复杂性,使得中文信息处理难度相对较大,而信息语义化的要求则对中文信息处理提出了更高要求。用户不再仅仅满足获取直接信息,而需要

2、获得更多的隐含语义信息,数据挖掘正是为了满足这一需求诞生的。但传统的数据挖掘需要领域专家协助,并依靠数据驱动,逐渐不能满足用户的需求。而本体作为客观知识的语义形式化描述,在数据挖掘中引入基于本体的语义分析技术,有助于解决信息处理的语义化问题,为实现中文信息语义挖掘做出贡献。论文结合信息产业部电子产业发展基金项目的开发,对中文信息的语义数据挖掘技术进行了系统的研究。首先分析了中文信息处理的特点及各项关键技术,并对中文分词技术进行了深入探讨,实现了一种采用正向最大匹配和词典分词算法的中文分词器。然后在深入介绍了本体论相关知识之后,

3、提出了一种基于本体的语义数据挖掘(OsDM)技术,给出了其工作流程和原理,并对涉及的领域本体构建、语义标注和语义推理等关键技术进行了分析研究,给出了切实可行的解决方案,为语义数据挖掘技术的应用奠定了良好的基础。最后基于OsDM技术模型设计并实现了一个中文信息语义检索系统。该系统以参考背景知识自行构建的MyFnlitOnto领域本体作为知识库,利用本体描述语言OwL的语义推理能力,对检索词进行推理扩展,来获得更准确的用户意图,返回更准确的检索结果信息。同时,系统为了克服领域局限性,系统还实现了全文检索功能,提供了更好的用户体验、

4、更完整的功能和更可靠的系统性能,初步实现了信息检索智能化。关键词:中文信息处理:本体:语义数据挖掘:信息检索II!兰堡塞塑曼兰鍪堡堡堡茎奎至塞AbstractDuetothe1ackofaunifiedsemanticdescription,mereareplemyofcomplexandduplicateinfomatiOnintraditionalinfo肌ation.Facingwithmassiveinfomlation,hOwtoobtainusefulinformationquicklyaIldefrectivel

5、yfromthe’。Info珊ationOceall”isaverydimcultproblem.Introducingsemamicinfomationintocomputcrinfo咖ationprocessisafundamentalsolutiontothisproblem,andcanachievebettersharingofinfb珊ation.BecauseofthespecialnatureandcomplexityofChineseinfbmation,it’sdimculttoprocessChinese

6、info珊ationrelatiVely.semanticinformationputahi曲erdemandonChineseinf0珊atioⅡprocessing.Usersnolongermeetthedirectaccesstoinfomationonly,andneedtogetmoreimpliedsemanticinfoml“on.dataminingcomesoutforthis.HoweVer,traditionaldataminingneedexpens’shelpinthefieldandrelyond

7、ata—driven.GraduallyitIsunabletomeettheneedsofusers.Ont0109yisthefomaldescriptionoftheobjectiVeknowledge.Dataminingcombinedwimsemanticanalysistechn0109ybasedonont0109ycansolveinf0咖ationsemanticprocessingproblemsalldcontributetorcalizationofChinesesemanticdatamining.

8、SupportedbyMII’selectronicsindustrydevelopmentfund,thesemanticdatami血ngtechnologyofChineseinfomationisstudiedinthisthesis.Firstly,aimingat

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。