欢迎来到天天文库
浏览记录
ID:17524945
大小:57.00 KB
页数:22页
时间:2018-09-02
《一种新的复合核函数及在问句检索中的应用-免费文档》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、本文档下载自文档下载网,内容可能不完整,您可以点击以下网址继续阅读或下载:http://www.mianfeiwendang.com/doc/29cf0ec7c296011f0ce488d5一种新的复合核函数及在问句检索中的应用第33卷第1期电子与信息学报Vol.33No.12011年1月JournalofElectronics&InformationTechnologyJan.2011一种新的复合核函数及在问句检索中的应用王君*李舟军胡侠胡必云(北京航空航天大学计算机学院北京100191)②①①①②①(新加坡国立大学计算机学院新加坡117590)摘要:问句检索在问答系统中有着重要的
2、作用,其核心问题在于研究查询问句与候选问句之间的相似性计算问题,实现问句之间的高精度匹配。该文采用树核函数的方法计算问句之间的结构相似性,并针对原有算法的不足,做了相应的改进。为降低句法解析器性能对树核函数的影响,该文在改进的树核函数基础上,将其与字符串核结合,提出了一种能同时融合问句的句法信息,词性信息和词序信息的复合核函数,用以计算问句之间的综合语义相似性。在社区问答系统Yahoo!Answer的数据上进行测试,相对传统的基于词频的特征向量法,问句检索平均准确率提高了24.02%。关键词:信息检索;问答系统;问句检索;复合核函数中图分类号:TP391文献标识码:A文章编号:1009-58
3、96(2011)01-0129-07DOI:10.3724/SP.J.1146.2010.00268NovelCompositeKernelandApplicationtoQuestionRetrievalJunLiZhou-junHuXiaHuBi-yun①①①②①(Schhttp://www.mianfeiwendang.com/doc/29cf0ec7c296011f0ce488d5oolofComputerScienceandEngineering,BeihangUniversity,Beijing100191,China)②(SchoolofComputing,NationalUn
4、iversityofSingapore,Singapore117590):Questionretrievalplaysimportantroleinquestionandansweringsystems.Themainproblemishowtomeasurethesimilaritybetweencandidatequestionsandqueryquestion.Thispaperpresentsatreekernelbasedmethod,namedweightedtreekernel,tocalculatethesimilarityofsentences’structuresandp
5、roposesimprovementstotheoriginaltreekernelalgorithm.Inordertoreducetheeffectontreekernelbringingbysyntacticparsing,acompositekernelisproposedbasedontheweightedtreekernelandtwootherstringkernels,whichcancapturesyntax,part-of-speechandlexicallevelinformationofasentence,tocalculatethesemanticsimilarit
6、ybetweenquestionsentences.ExperimentalresultsonYahoo!Answersdatasetshowthatthephttp://www.mianfeiwendang.com/doc/29cf0ec7c296011f0ce488d5roposedmethodoutperformstraditionalvectorspacemodelbasedmethodsby24.02%inquestionretrievalaccuacry.words:Informationretrieval;Questionansweringsystem;Questionretr
7、ieval;Compositekernel引言问答系统是一种自然语言检索,也称作问答式信息检索。它既能够让用户用自然语言句子提问,又能够为用户返回一个简洁、准确的答案,而不是一些相关的网页。考虑到自然语言理解技术的难度和鲁棒性,问答系统从研究初期就提出并开展了基于问答对的技术路线的研究,即从问答对库中检索出于用户问题最为相似的问答对并把答案部分直接反馈给用户的技术路线。(FrequentAskQuestion
此文档下载收益归作者所有