口语对话系统中的语句主题提取

口语对话系统中的语句主题提取

ID:5265064

大小:187.71 KB

页数:5页

时间:2017-12-07

口语对话系统中的语句主题提取_第1页
口语对话系统中的语句主题提取_第2页
口语对话系统中的语句主题提取_第3页
口语对话系统中的语句主题提取_第4页
口语对话系统中的语句主题提取_第5页
资源描述:

《口语对话系统中的语句主题提取》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、口语对话系统中的语句主题提取王彬江铭虎(清华大学中文系计算语言研究室,北京100084)E-maiI:wang-b01@maiIs.tsinghua.edu.cn摘要语句的主题提取是口语对话系统中话语分析部分的工作。目前的口语对话系统大多将自然语言处理的重点放在语法和语义平面,而忽视了对上下文语境的分析,该文提出一种基于规则的语句主题提取方法,通过自底向上与自顶向下两种分析器完成主题与用户意图的提取,为系统的自然语言生成提供更准确的领域知识,从而大大提高了系统的整体性能。关键词主题提取口语对话系统自然语言理解文章编号1

2、002-8331-(2004)18-0058-03文献标识码A中图分类号TP391ExtractionoftheTopicfromUtterancesinaSpokenDialogSystemWangBinJiangMinghu(ComputationaILinguisticsLab,ChineseDepartment,TsinghuaUniversity,Beijing100084)Abstract:ExtractionofthetopicfromutterancesispartofthediscourseanaIy

3、sisinaspokendiaIogsystem.Atpre-sent,manyspokendiaIogsystemstakethekeypointonsemanticsurface,ignoringthecontextdependentinterpretationofutterances.Thispaperpresentsanapproachtoextractionofuser'sintentionsandtopicsthroughbottom-upandtop-downanaIysis.Itcanprovidemo

4、reknowIedgeforsystemandthereforeenhancethesystemperformancegreatIy.Keywords:topicextraction,spokendiaIogsystem,naturaIIanguageunderstanding1主要根据语言学者的总结[6]。而基于语料库的策略需要用到两引言人机口语对话系统是语音识别技术走向实用的一个重要个概率:P(TIW)和P(IIW)。P(TIW)是主题T的条件概率,P(II研究方向。口语对话系统的目标是能够让人通过自然语言表达W)

5、是用户意图I在一个对话中出现过的词符集W下的条件概自己的思想,与计算机就某一领域的内容进行信息交互[1]。近年率。这两个概率通过对已标注的语料库的分析来估测,并用来来各国都投入了大量人力、物力、财力来研究口语对话系统,美抽取主题和识别用户意图。H元语法模型或隐马尔可夫模型(HMM)也可以用来描述对话中的主题与用户意图的转移过程[7]。国有DARPA的Communicator计划,欧洲有ARISE计划、RE-WARD计划、VERBMOBIL计划等。很多著名的学府与研究机语料库的规模越大,标注越精准,建立起来的对话模型也就

6、越构都在开展这项研究,如MIT的SLS实验室、CMU的ISL实验可靠。室、Lucent-BeII实验室、日本的ATR实验室、OGI的CSLU中论文提出了一种基于知识的主题抽取方法,以实现从一个心和PhiIips公司等[2]。国内也有中科院自动化所、清华大学、香口语对话系统的用户话语中抽取该句的主题和用户意图。该口港中文大学、台湾大学等多家研究单位从事此方面研究。语对话系统的主要任务是导购信息服务。作者用两种知识源来口语对话系统可分为四个层次:人机交互层,自然语言处描述对话历史:一个是用户意图转移网络图,用来描述从一个理

7、层,对话管理层,应用程序层。目前很多口语对话系统都将自意图到另一个意图的可能转换途径;另一个是主题树,由查询然语言处理层研究的重点放在语法和语义平面,这样处理的一对话中可能出现的主题构成。假设主题是沿着主题树发展的。个问题是无法理清一段对话的整体内在联系[3]。而对话往往由这样当对话进行时,不同主题的发展就会形成一棵子树,文中于口语中省略、指代、结构歧义等现象的存在,使得分析的结果称之为动态主题树。具有歧义。这就要求我们用话语分析(DiscourseAnaIysis)模块用自底向上和自顶向下两种分析方法来提取主题。自底

8、向利用上下文语境和相关的领域知识进行排歧从而能得到最后上的方法是通过将一系列预先设定的规则应用于话语的语义的语义表示[4]。话语分析后存储的对话历史还可以帮助系统推解释中,从而得到主题与用户意图的候选者。自顶向下的方法测用户下面将说的话语,以实现语言处理模型的动态转换,从主要是由对话历史的当前状态决定候选者,而对话历史则由对而提高

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。