智能问答系统的设计与实现

智能问答系统的设计与实现

ID:25595172

大小:52.50 KB

页数:6页

时间:2018-11-21

智能问答系统的设计与实现_第1页
智能问答系统的设计与实现_第2页
智能问答系统的设计与实现_第3页
智能问答系统的设计与实现_第4页
智能问答系统的设计与实现_第5页
资源描述:

《智能问答系统的设计与实现》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、智能问答系统的设计与实现引言1.1选题背景与研究意义呼叫中心、客服中心是能够让客户通过语音等方式咨询自己想要获取的知识并且给出解答的机构。一般来说,传统的呼叫中心、客服中心以人工服务为主,如电信、联通、移动等公司的人工服务等。由于呼叫中心必须保证能够随时解答用户提出的问题,因此需要24小时安排客服人员来回答客户提出的问题,极大的浪费了人力资源。此外,随着新媒体的爆发式增长,用户量与服务量的激增,使得传统的呼叫中心、客服中心已经面临大量实时化的重复数据,给信息的管理和存储带来极大的挑战。因此,在移动互联网时代,传统的人工坐席已经无法满足用户和市场需求,亟

2、需自动化的问答系统去实现和替代传统的人工解答。如今,互联网的快速发展,改变了餐饮、销售、银行等传统行业的运营模式,也给传统的呼叫中心的运营带来新的困难。从传统的、电视、计算机到新的智能、平板设备、穿戴设备,种类众多的终端设备层出不穷,带来爆炸式的信息增长。NIC(中国互联网络信息中心)在2015年1月发布的第35次中国互联网络发展状况统计报告显示,在台式电脑,笔记本电脑使用率增长保持相对稳定的情况下,使用、平板作为互联网接入设备的比率增长显著,如图1-1所示。接入渠道从传统的网点、、网站、邮件发展为即时通讯、微博、微信、SNS,导致呼叫中心、客服中心需

3、要应对大量实时的用户问题。针对上述信息化新特性和挑战,如何使呼叫中心、客服中心适应互联网环境、提高用户满意度己成为一个备受重视的研究热点。.1.2建设目标与研究内容本论文设计并实现了一个新型的智能问答系统,该系统能够满足用户对特定领域的问答需求,允许用户输入一些错误问题并将其纠正,能够识别出用户的口语化表达并且匹配正确的答案。本文所述的智能问答系统能够方便标注人员梳理知识库,能够理解用户的问题,并且对于用户指定的问题能够返回准确的答案。本文主要研究基于混合向量模型的排序学习模型,包含词向量、卷积神经网络、语言模型以及排序学习等内容。其中,词向量是指连续

4、空间的词向量模型,是一种通过训练单词的向量对上下文向量进行预测或用上下文向量预测训练单词的向量表示方法。卷积神经网络是指由输入向量生成局部卷积神经元,并且生成过程中的权值信息被每个局部卷积神经元所共享的神经网络模型。语言模型特指N元语法模型,是指将一个序列的概率表征为最后N个元素的概率的统计语言模型。排序学习是指通过机器学习的方法进行对己知结果进行再次排序的学习模型。2.智能问答系统的关键技术2.1语言模型本章主要介绍关于智能问答系统的国内外研究现状以及关键技术。国内研究现状主要介绍基于本体的问答系统以及开放领域智能问答系统。国外研究现状主要介绍智能问

5、答系统的历史以及国外典型的问答系统。本文所述智能问答系统算法模型中,主要包括智能纠错模块、相似度度量模块以及排序学习模块等算法模块。其中智能纠错模块主要运用的技术是语言模型、相似度度量模型,相似度度量模块主要运用的技术是词向量、卷积神经网络,排序学习模块主要运用的技术是排序学习,算法模型中的基础模型主要运用的技术是Lucene。语言模型包括N元语法模型、神经网络语言模型、循环神经网络语言模型等。本文中的语言模型是基于N元语法的统计语言模型。N元语法模型最早于ClaudeShannon在信息论中提出的一个问题,即给定一个字母序列(如:序列forex),下

6、一个字母的概率是多少。从训练数据中,可以由该序列的历史信息得出其下一个字母的概率分布,所有下一个可能出现的字母的概率和为对于语言模型来说,从训练语料中能够统计出给定的词序列预测下一个可能的词的概率的过程即为统计语言模型,其中序列包含的词的最大个数就是所谓的N元语法模型。.2.2词向量词向量(ikolov等人提出的连续空间的词向量表示方法,该模型有效的避免了向量稀疏性的问题,并且能够在较低维度将单词表征为某一向量。Mikolov提出的连续空间词向量技术(ContinousBagofL描述用户对于凉山州政府政务智能问答系统的功能需求。知识库梳理模块主要由公

7、司内部数据标注人员使用,数据标注人员使用知识库梳理模块的用例图如图4-1所示。标注人员使用知识库梳理模块能够完成本体类的标注工作,其中本体类在本系统中表示办事项的类别,如:身份证、户口以及居住证等。同时标注人员需要依据本体类将标注结果展示给用户,因此需要完成知识维度展示以及知识拓扑展不。本文所述智能问答系统中需要人工设置领域内关键词,用以区分和精确匹配答案,因此知识库梳理模块还应该能够允许标注人员手动添加知识库关键词。因政务问答系统的特殊性,系统应该能够实时添加一些应急问答对,因此本系统需要具备常用问题添加功能。本节所述知识库梳理阶段应该主要满足知识库

8、的编辑工作,因此需要完成标准问题以及标准答案的添加,并为标准问题添加扩展问题。..结论限定领域

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。