欢迎来到天天文库
浏览记录
ID:32808653
大小:55.20 KB
页数:4页
时间:2019-02-15
《基于深度学习的自动应答研究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、基于深度学习的自动应答研究一、引言随着数据时代的发展,企业的业务类型也日益电子化与复杂化,如何让用户在繁杂的业务数据中想要找到他们需要的信息正在变得越来越困难。在这样的情形下,搜索引擎(Google,Bing,百度等等)并不能完全满足用户对信息发现的需求,此时用户倾向于通过客服等应答系统快速找到目标信息。随着人工智能技术的不断发展,一些企业已经推出了智能化的口动应答服务,如Siri,Contana,以及华为、淘宝的智能客服,在应用上都取得巨大的成功。这也进一步地说明了在当前环境下,在面对海量的数据时,用户需要这种更加智能的,更加了解他们需求、口味和喜好的信息发
2、现机制。自动应答服务作为一•种基础服务与客服的冇效补充,出现由來已久,但一直以来存在信息抽取效率低,或者部分系统仅仅做了模糊匹配,而没有实现对抽象概念的理解。在2006年深度学习被提岀以来,图灵实验似乎也不再那么可槊而不可及,一些企业开始利用深度学习来建立和优化深度学习在人工智能领域的种种应用,例如2013年的GoogleBrain项目以及京东的Jimi机器人,这些前人的实践让我们看到了深度学习在自动应答服务上的应用可行性。银行作为一个客服密集型的行业,具有领域知识相对集中、服务用户群体相对较为广大等特点,这些特点使得银行在实践自己的智能化自动应答系统时天然具
3、有一定优势。本文以银行客服为例,介绍基于深度学习的自动应答系统的设计思路与架构。二、自动应答与深度学习1、自动应答系统应答系统(QuestionAnsweringSystem,QA)是信息发现的一种高级形式,它能用准确、简洁的自然语言回答用户用自然语言提出的问题,是目前人工智能和自然语言处理领域中一个倍受关注并具有广泛发展前景的研究方向。因为在很多情况下用户英实并不明确自己的需要,或者他们的需求很难用简单的关键字来表述。随着自动化应答的出现,用户获取信息的方式从简单的冃标明确的数据搜索转换到更高级更符合人们使用习惯的信息发现。自动应答系统给某个提问提供简单而精
4、确的冋答,与信息检索任务有很大的差别。目前的信息检索系统能让我们对与提问切题的相关文献进行定位,把从文本的关键字匹配中抽取到的答案呈现给用户。在信息检索中,相关文本的识别是使用将提问与文献集匹配的方法来实现的,信息检索系统并不负责回答用户的问题。信息发现与信息检索不同,信息发现需要理解用户的语意,并找到正确的答案一一答案和提问之间通常并不存在关键词上的直接匹配。以百度提问为例,一个典型的自动应答的答案应该如图1所示。百度提问并没有简单检索提问的关键词把所有符合关键词的结果筛选出来供用户自行选择,而是理解了这个问题并直接给出了回答。以百度知道为例,一个自动应答系
5、统的架构如图2所示。一个自动应答系统包括问题分析、答案抽取、知识库这三个主要模块。用户的问题依次经过问题分析、答案抽取这两个模块的处理。问题分析模块对用户的提问进行分析,确定问题的语义类型,预测答案的类型,例如答案是回答人物、时间、地点还是回答人物的年龄、商品的价格等;判断用户的提问是否为确定性问题,对于有明确具体答案的确定性问题,分析问题的结构并直接定位用户的所求。答案抽取模块从知识库中检索问题的答案并返回给用户。对于确定性问题,根据问题的要点直接检索Ontology并返回答案;对于非确定性问题或者未找到答案的确定性问题,通过检索优质问答资源获取答案,即计算
6、用户的提问与优质问答资源中问题的相似度,获取相同问题或同义问题,直接返回满足提问的答案。可以看出,自动应答系统所使用的技术有很多,如自然语言处理、分词、语言理解、知识图谱、命名实体识别、意图识别、问答匹配等等,在任何一个部分/环节进行改进都会提高整体的效果,但最主要的影响自动问答准确率的方面冇两个:一是对问题的理解,先对用户输入的文本进行识别,再对识别后的命名实体进行抽取,对应到人名、地名、商品名、机构名等不同类别,以便更好地理解用户的语言。二是兀配正确的答案,通过抽取和排序候选答案,给用户反馈最佳答案和建议。这种情况下,需要引入深度学习技术,以提高答案的准确
7、率。2、深度学习深度学习(DeepLearning)是机器学习的一个分支,它基于试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的一系列算法。2006年,加拿大多伦多人学教授GeoffreyHinton提出了深度学习这一概念,该概念主要包含有两个主要观点:(1)多隐层的人工神经网络具有优异的特征学习能力,学习得到的特征对数据有更本质的刻画,从而有利于可视化或分类;(2)深度神经网络在训练上的难度可以通过“逐层初始化”(layer-wisepretraining)来有效克服,在深度学习屮,逐层初始化是通过无监督学习实现的。当前多数分类、回
8、归等学习方法为浅层结构算法,其局限性在
此文档下载收益归作者所有