基于多特征融合的汉语语句相似度计算

基于多特征融合的汉语语句相似度计算

ID:35063757

大小:4.42 MB

页数:51页

时间:2019-03-17

基于多特征融合的汉语语句相似度计算_第1页
基于多特征融合的汉语语句相似度计算_第2页
基于多特征融合的汉语语句相似度计算_第3页
基于多特征融合的汉语语句相似度计算_第4页
基于多特征融合的汉语语句相似度计算_第5页
资源描述:

《基于多特征融合的汉语语句相似度计算》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、I硕dr学位论义■基于多特征誠合的汉语语句相似度计算郎:;t峰哈尔滨巧业大学2016年b月学校代码:10240学号:Y1310120306学化冷文基于多特征融合的巧语语句相似度计算部炎峰指导教师姓名:王忠建教授申请学位级别:工学硕±学科专业:计算机应用技术----1论文提交日期:20160401论文答辩日期:2060604授予学位单位:哈尔滨商业大学授予学位日期:麟系炼痛余尖《UniversitCode:10240yRegisterCode:Y1310120306D

2、issertationfortheDereeofMastergChineseSentienceSimilaritComuta村onBasedyponMu-l村featuresFusionCandidate:GaoYanfengSupervisor:Prof.WangZhongjianAssocia化Supervisor:AcademicDereeAliedfor:MasterofEnineeringppggSpeciality:ComputerApplicationTechnol

3、ogyDa化ofOralExamination:June2016,Universit:HarbinUniversitofCommerceyy哈尔滨商业大学硕±学位论文原创性声明工作,。本人郑重声明:本论文的所有,是在导师的指导下由作者本人独立完成的有关观点,。除文中己、方法、数据和文献等的引用己在文中指出并与参考文献相对应经注明引用的内容外。对,本论文不包含任何其他个人或集体己经公开发表的作品成果。本文的研究做出重要贡献的个人和集体,均己在文中W明确方式标明本论文文责自负。^w签字日期:学位论文作者签名:安

4、j!?年^月日|哈尔滨商业大学硕±学位论文版权使用授权书本论文系作者本人在哈尔滨商业大学攻读硕±学位期间,在导师指导下完成的硕±>>,本论文的研究内容不得学位论文。本论文的研究成果归哈尔滨商业大学所有1^>其他单,位的名义发表、使用学位论文的规定同意学。本人完全了解哈尔滨商业大学关于保留校保留,;学校可W公布本论文的全部、送交本论文的复印件允许本论文被查阅和借阅、或部分内容,可W采用影印、缩印或其他复制手段保存汇编本学位论文。。保密□,在年解密后适用本授权书本学位论文属于不保密口。学位论义作者签名;听知畔签字日期:

5、年/月^曰导师签名:签字曰期:年月曰^摘要汉语语句相似度计算是在分析汉语语句相关特征之后,根据语句特征设定语句相似一一,个具体数值度的计算标准结合这些标准来计算出。汉语语句相似度计算作为项非,常重要的实用技术,长期W来作为研巧人员关注的热点和难点并被广泛应用于自然语言处理的众多领域。文中详细介绍了汉语语句相似度计算的方法W及存在的困难,通过对关系向量模型的语句相似度计算方法进行解析,,根据汉语语句的关键词、句长、词序等特征提出了一种基于多特征融合的没语语句相似度计算方法,通过。该方法W关系向量模型为基础深入研究

6、汉语语句的特征,利用前后相邻词的共同出现对权重值向量进行加权处理,调整不同特征词的权重。方法W关键词词形的相似度为重点,适当的考虑了语句的局部结构和同义词的情况。在综合分析表层特征和语句结构的基础上,本文对语句的相似度计算问题进行深入探索和创新,着重进行了下几个方面的研究:)1分析汉语语句,找出其中与语句相似度有关的特征。这些特征对语句相似度影响,因此通过实验选取其中对语句相似度影响较大的特征(关键词程度不同、句长、词序等)用于相似度计算。2)提高了关键词和语句长度对关系向量模型影响的有效性,并加入了词序、非关键,使相似

7、度计算的正确率得到提高词等影响因素。通过实验验证了提出方法在计算新闻标题相似度时的准确率较高。提出的相似度计算方法不仅在处理长度差较大的两个语句相似度时优于关系向量模型,而且发现在带标点符,语句相似度计算的准确率依然较高号W及不去停用词的情况下。关键词相似度;关键词;多恃征融合--IAbstractAJbstractm,Chinesese打tencesiilaritycomutationisbasedontiieanalysisofChinesesentencespfeatu化s.Accordin

8、gtothesefeaturess巧化es

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。