一种新的复合核函数及在问句检索中的应用-免费文档

一种新的复合核函数及在问句检索中的应用-免费文档

ID:17524945

大小:57.00 KB

页数:22页

时间:2018-09-02

一种新的复合核函数及在问句检索中的应用-免费文档_第1页
一种新的复合核函数及在问句检索中的应用-免费文档_第2页
一种新的复合核函数及在问句检索中的应用-免费文档_第3页
一种新的复合核函数及在问句检索中的应用-免费文档_第4页
一种新的复合核函数及在问句检索中的应用-免费文档_第5页
资源描述:

《一种新的复合核函数及在问句检索中的应用-免费文档》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、本文档下载自文档下载网,内容可能不完整,您可以点击以下网址继续阅读或下载:http://www.mianfeiwendang.com/doc/29cf0ec7c296011f0ce488d5一种新的复合核函数及在问句检索中的应用第33卷第1期电子与信息学报Vol.33No.12011年1月JournalofElectronics&InformationTechnologyJan.2011一种新的复合核函数及在问句检索中的应用王君*李舟军胡侠胡必云(北京航空航天大学计算机学院北京100191)②①①①②①(新加坡国立大学计算机学院新加坡117590)摘要:问句检索在问答系统中有着重要的

2、作用,其核心问题在于研究查询问句与候选问句之间的相似性计算问题,实现问句之间的高精度匹配。该文采用树核函数的方法计算问句之间的结构相似性,并针对原有算法的不足,做了相应的改进。为降低句法解析器性能对树核函数的影响,该文在改进的树核函数基础上,将其与字符串核结合,提出了一种能同时融合问句的句法信息,词性信息和词序信息的复合核函数,用以计算问句之间的综合语义相似性。在社区问答系统Yahoo!Answer的数据上进行测试,相对传统的基于词频的特征向量法,问句检索平均准确率提高了24.02%。关键词:信息检索;问答系统;问句检索;复合核函数中图分类号:TP391文献标识码:A文章编号:1009-58

3、96(2011)01-0129-07DOI:10.3724/SP.J.1146.2010.00268NovelCompositeKernelandApplicationtoQuestionRetrievalJunLiZhou-junHuXiaHuBi-yun①①①②①(Schhttp://www.mianfeiwendang.com/doc/29cf0ec7c296011f0ce488d5oolofComputerScienceandEngineering,BeihangUniversity,Beijing100191,China)②(SchoolofComputing,NationalUn

4、iversityofSingapore,Singapore117590):Questionretrievalplaysimportantroleinquestionandansweringsystems.Themainproblemishowtomeasurethesimilaritybetweencandidatequestionsandqueryquestion.Thispaperpresentsatreekernelbasedmethod,namedweightedtreekernel,tocalculatethesimilarityofsentences’structuresandp

5、roposesimprovementstotheoriginaltreekernelalgorithm.Inordertoreducetheeffectontreekernelbringingbysyntacticparsing,acompositekernelisproposedbasedontheweightedtreekernelandtwootherstringkernels,whichcancapturesyntax,part-of-speechandlexicallevelinformationofasentence,tocalculatethesemanticsimilarit

6、ybetweenquestionsentences.ExperimentalresultsonYahoo!Answersdatasetshowthatthephttp://www.mianfeiwendang.com/doc/29cf0ec7c296011f0ce488d5roposedmethodoutperformstraditionalvectorspacemodelbasedmethodsby24.02%inquestionretrievalaccuacry.words:Informationretrieval;Questionansweringsystem;Questionretr

7、ieval;Compositekernel引言问答系统是一种自然语言检索,也称作问答式信息检索。它既能够让用户用自然语言句子提问,又能够为用户返回一个简洁、准确的答案,而不是一些相关的网页。考虑到自然语言理解技术的难度和鲁棒性,问答系统从研究初期就提出并开展了基于问答对的技术路线的研究,即从问答对库中检索出于用户问题最为相似的问答对并把答案部分直接反馈给用户的技术路线。(FrequentAskQuestion

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。