欢迎来到天天文库
浏览记录
ID:35063757
大小:4.42 MB
页数:51页
时间:2019-03-17
《基于多特征融合的汉语语句相似度计算》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、I硕dr学位论义■基于多特征誠合的汉语语句相似度计算郎:;t峰哈尔滨巧业大学2016年b月学校代码:10240学号:Y1310120306学化冷文基于多特征融合的巧语语句相似度计算部炎峰指导教师姓名:王忠建教授申请学位级别:工学硕±学科专业:计算机应用技术----1论文提交日期:20160401论文答辩日期:2060604授予学位单位:哈尔滨商业大学授予学位日期:麟系炼痛余尖《UniversitCode:10240yRegisterCode:Y1310120306D
2、issertationfortheDereeofMastergChineseSentienceSimilaritComuta村onBasedyponMu-l村featuresFusionCandidate:GaoYanfengSupervisor:Prof.WangZhongjianAssocia化Supervisor:AcademicDereeAliedfor:MasterofEnineeringppggSpeciality:ComputerApplicationTechnol
3、ogyDa化ofOralExamination:June2016,Universit:HarbinUniversitofCommerceyy哈尔滨商业大学硕±学位论文原创性声明工作,。本人郑重声明:本论文的所有,是在导师的指导下由作者本人独立完成的有关观点,。除文中己、方法、数据和文献等的引用己在文中指出并与参考文献相对应经注明引用的内容外。对,本论文不包含任何其他个人或集体己经公开发表的作品成果。本文的研究做出重要贡献的个人和集体,均己在文中W明确方式标明本论文文责自负。^w签字日期:学位论文作者签名:安
4、j!?年^月日|哈尔滨商业大学硕±学位论文版权使用授权书本论文系作者本人在哈尔滨商业大学攻读硕±学位期间,在导师指导下完成的硕±>>,本论文的研究内容不得学位论文。本论文的研究成果归哈尔滨商业大学所有1^>其他单,位的名义发表、使用学位论文的规定同意学。本人完全了解哈尔滨商业大学关于保留校保留,;学校可W公布本论文的全部、送交本论文的复印件允许本论文被查阅和借阅、或部分内容,可W采用影印、缩印或其他复制手段保存汇编本学位论文。。保密□,在年解密后适用本授权书本学位论文属于不保密口。学位论义作者签名;听知畔签字日期:
5、年/月^曰导师签名:签字曰期:年月曰^摘要汉语语句相似度计算是在分析汉语语句相关特征之后,根据语句特征设定语句相似一一,个具体数值度的计算标准结合这些标准来计算出。汉语语句相似度计算作为项非,常重要的实用技术,长期W来作为研巧人员关注的热点和难点并被广泛应用于自然语言处理的众多领域。文中详细介绍了汉语语句相似度计算的方法W及存在的困难,通过对关系向量模型的语句相似度计算方法进行解析,,根据汉语语句的关键词、句长、词序等特征提出了一种基于多特征融合的没语语句相似度计算方法,通过。该方法W关系向量模型为基础深入研究
6、汉语语句的特征,利用前后相邻词的共同出现对权重值向量进行加权处理,调整不同特征词的权重。方法W关键词词形的相似度为重点,适当的考虑了语句的局部结构和同义词的情况。在综合分析表层特征和语句结构的基础上,本文对语句的相似度计算问题进行深入探索和创新,着重进行了下几个方面的研究:)1分析汉语语句,找出其中与语句相似度有关的特征。这些特征对语句相似度影响,因此通过实验选取其中对语句相似度影响较大的特征(关键词程度不同、句长、词序等)用于相似度计算。2)提高了关键词和语句长度对关系向量模型影响的有效性,并加入了词序、非关键,使相似
7、度计算的正确率得到提高词等影响因素。通过实验验证了提出方法在计算新闻标题相似度时的准确率较高。提出的相似度计算方法不仅在处理长度差较大的两个语句相似度时优于关系向量模型,而且发现在带标点符,语句相似度计算的准确率依然较高号W及不去停用词的情况下。关键词相似度;关键词;多恃征融合--IAbstractAJbstractm,Chinesese打tencesiilaritycomutationisbasedontiieanalysisofChinesesentencespfeatu化s.Accordin
8、gtothesefeaturess巧化es
此文档下载收益归作者所有