基于语义信息的问题分类研究

基于语义信息的问题分类研究

ID:34100499

大小:6.66 MB

页数:62页

时间:2019-03-03

基于语义信息的问题分类研究_第1页
基于语义信息的问题分类研究_第2页
基于语义信息的问题分类研究_第3页
基于语义信息的问题分类研究_第4页
基于语义信息的问题分类研究_第5页
资源描述:

《基于语义信息的问题分类研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、国内图书分类号:TP391.1国际图书分类号:004西南交通大学研究生+学位论文密级:公开年姓专业.筐呈皇信息处堡指导老师艺红迅数援二零一四年五月ClassifiedIndex:TP393.098U.D.C:004SouthwestJiaotongUniversityMasterDegreeThesisRESEARCHONQUESTIONCLASSIFICATIOINBASED0NSEMA套ITICM。ORMATIONGrade:2011Candidate:胁KunAcademicDegreeAppliedfor:MasterDegreeSpeciality:Signa

2、landInformationProcessingMay24,2014西南交通大学学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权西南交通大学可以将本论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复印手段保存和汇编本学位论文。本学位论文属于1.保密口,在年解密后适用本授权书;2.不保密d使用本授权书。(请在以上方框内打‘寸’)学位做作者签名.孕研指导老师签名.赤酉日飙沙‘怜c_日期2锄L饥¨L.一西南交通大学硕士学位论文主要工作

3、(贡献)声明本人在学位论文中所做的主要工作或贡献如下:(1)综合分析了百度百科网页半结构特征,并提出了一种利用百度百科网页半结构化特征计算百科词条语义相似度的方法。(2)提出了一种自动抽取百科词条instanc挣of关系的方法,并构建了一个能提供语义支持的语义知识库。(3)提出了一种基于语义知识库的问题分类方法,实验表明该方法能有效解决问题分类特征向量空间数据稀疏问题。本人郑重声明:所呈交的学位论文,是在导师指导下独立进行研究工作所得的成果。除文中已经注明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的研究成果。对本文的研究做出贡献的个人和集体,均已在文中

4、作了明确说明。本人完全了解违反上述声明所引起的一切法律责任将由本人承担。学位论文作者签名:日期:矽l炽岁1fp西南交通大学硕士研究生学位论文第1页摘要随着信息急速膨胀,如何更准确、快速地从海量信息中获取用户真正需要的信息成了一个越来越重要的课题。问答系统具有理解用户以自然语言提出的问题、精准定位和快速抽取问题的正确答案等特点,成为解决此问题的有效手段。问题分类是问答系统的核心组成部分,可以为答案的选择和抽取提供语义限制和约束。在某种程度上,问题分类类似于文本分类,都是通过分析文本中包含的信息来确定文本类型。与文本分类相比较,问题分类面临着许多难题,主要有:1.用于问题表

5、示的特征向量空间维数过大,且特征向量相关性较小。2.问题相对短小,所以形成的特征向量空间过于稀疏。为了克服上述两个难题,本文着眼于特征词语的语义,构造了具有语义支持能力的知识库,并提出了一种基于语义的问题分类方法。本文主要工作有三方面内容:首先,提出了一种基于百度百科自动获取词语语义相似度的方法。该方法将百度百科词条与其相关词条作为图中节点,而且它们之间存在链接关系,然后利用SimRank算法计算百科词条语义相似度。其次,基于百度百科词条之间的语义相似度,提出了一种自动抽取百科词条instance-of语义关系的方法。首先,下载并整理百科开放分类树,将其作为语义知识库的

6、概念层次,然后对语义相近的百科词条进行聚类,并计算各个类别下百科词条所属概念(概念即是百科开放分类),即完成百科词条instance.of语义关系的抽取和语义知识库的构建。1最后,提出了一种基于语义知识库的问题分类方法。首先,将问题进行泛化,即将问题中出现的词语转化为所属概念,然后对泛化后的问题集进行特征提取,并利用S'VmI进行问题分类。为了验证本方法的有效性和可用性,我们以百度知道和手机助手的问题作为实验数据集。实验结果表明,本课题构建的语义知识库能提供语义支持,且基于语义的问题分类方法解决了特征向量空间维数高、相关性小、数据稀疏等问题,取得了较高的准确率。关键词:

7、语义知识库:百度百科:语义相似度;insta.1lCe.of:问题分类;SVM西南交通大学硕士研究生学位论文第1I页AbstractWiththerapidexpansionofhfformation,itbecomesamoreandmoreimportanttopichowtoao∞sswhatweneedfrommassiveamountofinformationaccuratelyandquickly.Qu碰ollAnsweringsystem,whichcanunderstand哪er’squestionin撒删language

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。