欢迎来到天天文库
浏览记录
ID:8078271
大小:104.57 KB
页数:19页
时间:2018-03-05
《对话管理中基于槽特征有限状态自动机的》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、对话管理中基于槽特征有限状态自动机的1方法研究黄民烈朱小燕(清华大学计算机系智能技术与系统国家重点实验室北京100084)摘要对话系统的研究已经成为人机交互技术发展的新热点,而对话管理则是其中最重要的组成部分。本文在当前对话管理的各种实现方法的基础上,提出了一种基于槽特征的自动机设计方法,其中应用了状态压缩和状态集、动作集的子空间划分,并着重以确认过程为例,阐述了确认策略控制函数及其对对话过程的影响。文中还提出了一种树形的意图分层结构,并将这种分层结构应用于主题检测与主题切换,成功解决了多主题对话系统的主题切换问题。最后,实验表明
2、本文提出的设计方案在策略控制、主题检测与主题切换等方面具有较好性能,同时也具有一定扩展性。关键词对话系统;人机交互;对话管理;对话策略控制对话管理模块是对话系统中一个非常重要的组成部分。对话管理的核心内容,就是通过一定的策略控制,指导人机交互顺利进行。通过间接或直接的言语行为,新的对话轮次的发起,对话澄清和纠正,上下文历史记录和语用信息等因素获得相互理解。尤其是在实时语音输入对话系统中,当语音识别错误或者用户提供的信息不完整时,对话管理模块可以对用户进行引导,人机交互得以顺利进行。在多数较早期的天气、航班、旅馆信息查询对话系统中,
3、如GALAXY[1],一般采用填槽法实现对话管理。填槽法把对话过程看作对槽的填充过程,通过不断交互,直至对话目标实现。因为槽相应于数据库中表的条目,所以这种方法也称填表法(FormFilling),而表的条目也对应语义框架中的格。填槽法所实现的对话过程比较机械,人机交互的自然度较低,但实现复杂度较低,易于开发成熟的商业实用系统。另一种技术潮流就是有限状态自动机(FSM)方法[2]。这种方法把对话过程看成是自动机的状态转移过程,主要工作是设计自动机的状态和状态转移条件。KenjiAbe等人把用户和系统看成两个独立的有限状态自动机,把
4、对话过程看成是两个自动机进行信息交换的过程[3]。这种方法虽然思路新颖,但用户模型的不确定性很大,所描述的自动机转移条件过于复杂,状态定义也不甚明晰。和本文的方法相比,上述方法一般针对问题的所有状态进行处1本项目受国家自然科学基金(60272019),(60321002)资助1理,设计每个状态和每条转移弧,没有进行相应状态空间和动作空间的划分,自动机的规模无法控制,而最大的不足在于,缺乏有效的策略控制。在自动机的状态表述方面,MatthiasDenecke提出了用多个信息(如槽被提示的次数,可信度得分,相对频率,语义分析质量,领域
5、一致性等)来引导对话过程[4]。但这些信息如何表述在自动机的状态定义和转移上,原文中没有定义。本文提出的槽特征虽然简单,但较好地利用了可信度得分和对话上下文等信息,而且很好融入状态定义、转移和策略控制中。近年来,EstherLevin等人引入了马尔可夫决策过程(Markovdecisionprocess,MDP)[5],将对话过程映射为一个统计模型,并且引入各种算法如增强学习算法用于模型参数的估计。这种方法把对话策略控制看成是在一定代价函数下最优问题的求解过程。但是,这种设计需要上万量级的对话训练样本,样本的获取与标注都非常困难;
6、而且系统设计复杂,学习算法不易收敛,在一般的对话系统应用中,很难实现。本文的研究由于缺乏必要对话资源,只好放弃统计学习方法,但从中借鉴了策略控制函数的基本形式,较好地实现了策略控制。随着语音技术不断进步和成熟,多主题的对话系统成为研究重点。Bor-ShenLin等人把分布式智能Agent引入对话管理过程,实现了一个多主题的对话系统[6]。在这种设计中,特定主题的对话模型用一个智能Agent表示,主题之间的切换与共享通过Agent之间的通讯实现,并有协调器管理各Agent之间的协作,在每个Agent内部,通过自动机控制状态。这种设计
7、能实现较高的智能性,缺点就是设计复杂度较高,尤其是Agent之间的通讯设计,智能体本身也需要较多的对话资源,向相近领域移植需要重新生成Agent。XiaojunWu等人曾提出了一种主题森林的设计方法[7],利用与或树将主题组织成树的形式。这种方法在逻辑上比较清楚,但缺乏必要的层次性,而且树的扩展不易进行,对主题的检测机制原文中也没有论及。在这些方法的启发下,本文提出的意图分层树则较好地阐明了层次性、可扩展性和多主题检测机制等关键问题。总而言之,在前人工作的基础上,本文的改进体现在:其一,在自动机的状态表征方面,提出了用二维槽特征结
8、构表征状态的方法,很好地反映了槽的状态在对话过程中的变化。同时,采用槽的语义分类作为状态表示的组元,而不是具体槽值,有效地避免了状态空间的膨胀,在大规模词表的对话系统应用中意义更加显著。其二,将传统自动机的状态集和动作集进行子空间划分,把自动机的状
此文档下载收益归作者所有