自动问答系统的研究与实现

自动问答系统的研究与实现

ID:36803275

大小:2.25 MB

页数:59页

时间:2019-05-15

自动问答系统的研究与实现_第1页
自动问答系统的研究与实现_第2页
自动问答系统的研究与实现_第3页
自动问答系统的研究与实现_第4页
自动问答系统的研究与实现_第5页
资源描述:

《自动问答系统的研究与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、安徽大学硕士学位论文摘要摘要自动问答系统目前已经成为一个研究热点。常见的自动问答系统一般包括问题理解、信息检索、答案抽取,有些基于常问问题库的自动问答系统还包括FAQ模块。本文主要研究了自动问答系统中两个相关的算法,句子相似度算法和答案抽取算法,同时设计并实现了一个金融领域的自动问答系统。句子相似度算法是自动问答系统中的一个关键算法,不仅可以用于自动问答系统中的FAQ模块,还可以应用在答案抽取模块。本文首先介绍了现有的句子相似度算法,并对其优缺点进行了分析,进而提出改进的VSM算法,用于计算用户问题和

2、候选问题之间的句子相似度。’对VSM算法的改进是在传统的向量空间模型中添加了语义信息和一定句法信息。改进的VSM算法无需对句子的各项特征设置权重,降低了权值设置造成的计算误差,提高了句子相似度计算的准确性。在答案抽取中,本文对已有的答案抽取算法进行了分析和研究,并提出基于窗口模型的答案抽取算法。该算法通过两层过滤,将句子的词特征信息,语义特征信息以及句法特征信息添加到答案抽取中,利用窗口模型解决了由于分词系统无法识别词组所引起的问题。最后本文设计并实现了一个金融领域的自动问答系统。该系统包含四个模块,

3、问题理解模块、信息检索模块、答案抽取模块以及FAQ模块。当用户提交问题之后,系统首先通过改进的VSM算法计算问题与常问问题库中问题的句子相似度,若相似度大于某个阈值,则直接返回对应问题的答案给用户。反之,则对用户问题进行问题理解、信息检索、答案抽取等操作,从本地文档中抽取出与用户问题相关的答案句子返回给用户。问题理解主要采用现有基于规则和句法分析相结合的方法来进行问题分析;信息检索模块使用开源工具lucene提供检索服务。系统同时使用两种方式获取用户答案,提高了系统的效率,同时还可以自动更新常问问题库

4、,提高了系统的准确性。关键词:自动问答系统;句子相似度;答案抽取;向量空间模型;窗口模型安徽大学硕士学位论文自动问答系统的研究与实现ABSTRACTQuestionansweringsystemhasbecomeahotresearchtopic.Questionansweringsystemsalwayshavequestionanalysis,informationretrievalandanswerextraction,somequestionansweringsystembasedonFAQh

5、avetheFAQmodule.Thispaperstudiesthetwoalgorithmsinquestionansweringsystem,sentencesimilarityalgorithmandanswerextractionalgorithm,designedandimplementedafinancialquestionansweringsystem.Sentencesimilarityalgorithmisakeyalgorithmofquestionansweringsystem

6、,notonlyfortheFAQmoduleinquestionansweringsystemcanalsobeappliedtotheanswerextractionmodule.Thispaperdescribestheexistingsentencesimilarityalgorithmandanalyzestheiradvantagesanddisadvantages,thenproposesanimprovedVSMalgorithm,whichusedtocalculatethesent

7、encesimilaritybetweentheuserquestionandcandidatequestions.neimprovedVSMalgorithmaddssemanticinformation,andsyntacticinformationinthetraditionalvectorspacemodel.TheimprovedVSMalgorithmdoesn’tneedtosetweightforthecharacteristicsofthesentence,reducethecalc

8、ulationerrorcausedbyweightsettingandimprovetheaccuracyofsentencesimilaritycalculation.Intheanswerextraction,thepaperanalyzedandresearchedthecommonanswerextractionalgorithmsandproposedtheanswerextractionalgorithmbasedonthewindow.b

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。