银联客户服务自动问答系统的设计与实现

银联客户服务自动问答系统的设计与实现

ID:35100857

大小:3.61 MB

页数:72页

时间:2019-03-17

银联客户服务自动问答系统的设计与实现_第1页
银联客户服务自动问答系统的设计与实现_第2页
银联客户服务自动问答系统的设计与实现_第3页
银联客户服务自动问答系统的设计与实现_第4页
银联客户服务自动问答系统的设计与实现_第5页
资源描述:

《银联客户服务自动问答系统的设计与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、赚柄觀少著图硕±学位论文胃EJUm\^p?圓银联客户服务自动间答系统的设计与实现作者姓名_山显魅学校导纖名、职孫臟教較S^企业导师姓名、职敌備科副研巧届邏申请学位类别工巧硕+、 ̄4"'^l:lniI学校代码10701学号1303121802分类号TP31密级公开西安电子科技大学硕士学位论文银联客户服务自动问答系统的设计与实现作者姓名:山显辉领域:计算机技术学位类别:工程硕士学校导师姓名、职称:顾新教授企业导师姓名、职称:何战科副研究员学院:计算机学院提交日期:2015年11月DesignandImp

2、lementationofAutomaticQuestion-AnsweringSystemforUnionPayCustomerServiceAthesissubmittedtoXIDIANUNIVERSITYinpartialfulfillmentoftherequirementsforthedegreeofMasterinComputerTechnologyByShanXianhuiSupervisor:GuXinProfessorHeZhankeAssociateResearchFellowNovember2015西安电子科技大学学位论文独创性(或创新性)声

3、明秉承学校严谨的学风和优良的科学道德,本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加W标注和致谢,论文中不包含其他人己经发表或撰写过的研究成果中所罗列的内容外;也不包含一为获得西安电子科技大学或其它教育机构的学位或证书而使用过的材料。与我同工作的同事对本研究所做的任何贡献均己在论文中作了明确的说明并表示了谢意。学位论文若有不实么处一,本人承担切法律责任。日期—I'I本人签名:玉驾可:西安电子科技大学关于论文使用授权的说明目本人完全了解西安电子科技大学有关保留和使用学位论

4、文的规定,日:研究生在校攻读学位期间论文工作的知识产权属于西安电子科技大学。学校有权保留送交论文的复印件,允许查阅、借阅论文;学校可公布论文的全部或部分内容,允许采用影印、缩印或其它复制手段保存论文。同时本人保证,结合学位论文研究成果完成的论文、发明专利等成果,署名单位为西安电子科技大学。保密的学位论文在。_年解密后适用本授权书威本人签名:1愛^导师签名;戸-克'言;:日期日期摘要摘要经过十几年的快速发展,中国银联已经覆盖了全国的34个省市自治区,并且拥有大量的客户。目前,中国银联发展很快,不断推出新的业务。用户数量的

5、快速增长导致用户对相关业务的查询及其投诉也明显增加,这直接加剧了银联客户服务部门的压力。如果只以人工服务的方式,则客服人员需要频繁的进行相同问题的简单重复回答,直接加剧了客户服务人员的工作压力。如果咨询业务繁忙,则会增加客户等待人工服务的时间,这会降低客户对银联客户客服的满意度。为了有效减小客服人员的压力和减少人力成本投入,本文提出银联客户服务自动问答系统的研究,实现使用自然语言回答用户问题的银联客户服务自动问答系统。系统接收用户提出的问题后会从预先创建的FAQ(FrequentlyAskedQuestions)库中查找用户问题在FAQ库中是否已经存在;如果用户问题在F

6、AQ库中存在,则系统将问题对应的答案返回给用户。如果用户问题在FAQ库中不存在,那么情况会复杂很多。系统会对用户提出的问题进行问题理解,然后利用问题理解模块获得的关键词使用高效率的搜索引擎进行信息检索。本文取检索结果的前60个网页作为抽取答案的文档集合。系统在信息检索模块获得的文档集合中进行答案选取处理操作。QA系统将相似度最高5个候选句子作为答案返回给用户[17]。本文的问句相似度设计不单纯的采用ED或者LCS,而是利用这两种方法各自的优势,设计出满足相似度性质要求的公式。为了提高系统的响应能力和效率,本文使用功能强大的、跨平台的Lucene检索系统在FAQ语料库上创

7、建索引。本文使用TF-IDF算法实现关键字提取功能。一个词的TF-IDF值越大则说明该单词越重要,该词具有更高的权重。本文采用的中文分词方法是最大正向匹配法。从节省内存空间和提高查找效率两方面考虑,本文采用一种高效率的文本前缀处理结构Trie树来存储分词字典。本文采用多线程编程技术编写网页数据抓取程序。多线程可以显著提高数据抓取的效率,减小系统响应用户输入的时间。最后,采用的空间向量模型方法实现答案抽取。经过多方面的测试,系统符合用户的基本需求。如果用户输入的问句与FAQ库中的某些句子相似度阈值不小于0.5,则说明用户问题在FAQ库中能够

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。