欢迎来到天天文库
浏览记录
ID:53735838
大小:254.49 KB
页数:5页
时间:2020-04-21
《中文手机导购对话系统中的语义信息提取.pdf》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、文章编号:1007—1423(2014)04—0052—05DOI:10.3969~.issn.1007—1423.2014.04.013中文手机导购对话系统中的语义信息提取林仙茂,黄沛杰,杨德,吴秀鹏,黄强(华南农业大学信息学院,广州510642)摘要:语义信息提取是对话系统的核心问题之一研究限定领域对话系统的语义信息提取方法及其在中文手机导购领域的应用。给出手机销售领域的语义信息,介绍语义提取的总体技术框图,详细介绍正则表达式匹配、单句消歧、上下文消歧等关键技术的实现测试结果表明.该方法能较好地完成对话中用户输入句子的语义信息提取任务。关键词:语义信息提取:对话系统
2、;手机导购;语义消歧基金项目:广东省部产学研结合项目(No.2011A090200072)、广东省大学生创新训练计划项目(No.1056412151)0引言略特点.这造成语义歧义处理上的困难对话系统(Dia1ogueSystem)指的是通过自然语言1领域语义信息与人交流的计算机系统.主要研究如何能让计算机理对话系统中的领域语义信息包括基本语义知识和解自然语言的含义.并对人给计算机提出的问题.通过评价性语义知识当前系统的手机销售领域的基本语对话的方式.用自然语言进行回答。研究对话系统的目义知识共有77个属性.这些属性是参考主流电子商务的是让计算机具有类似人类的思维从而帮助
3、人们完成网站上的手机信息选定的.表1是当前系统中的基本更多的T作.从这个角度看.能胜任某一专业领域工作语义知识片段的限定领域对话系统.比开放领域的聊天机器人更有表1基本语义知识片段研究和应用价值Il_限定领域对话系统已经被广泛应用于机器辅助、信息查询和信息咨询等领域,例如计算机属挂基长语义知识品牌品牌,牌子,三,苹果,华为,索尼,诺基业,摩托辅助英语学习l2_、天气信息查询[】、地铁查询l4l、航班预罗拉,小米,魅族,中兴,黑莓,步步高,⋯定、导游系统[61、导航系统l7l、酒店推荐_8l等。本文研究的价格,价钱,价位,多少钱,多少块钱,多少元钱,便自:【O,1000)
4、,一般,适中,普通【1oo0,2ooo),较高/中文手机导购系统属于信息咨询类中较为复杂的网上侨格贵[2000,),以上,以下,人概,大约,左右,大丁,小于,不超过,少/低/便宜点,高/贵一点,数字(0<商品销售咨询限定领域数字<2()(】【)(】)+块,元,数字(0<=数字0o00)+到+数字语义信息提取(SemanticInformationExtraction)是(o<-~字<20000)输入雳文输入方式,手写,键盘,触屏,触控,语音输入对话系统的核心问题之一语义信息提取就是将用户输入句子中的有效领域语义信息提取出来.并形成一基本语义知识覆盖多种不同的知识.以价格
5、属性定的语义表现形式.它将作为对话系统后续处理阶段为例,包括:的理解基础要准确地提取语义信息.涉及到模式匹(1)概念性知识:“价格”、“价钱”、“价位”、“多少配、语义消歧等技术手段.特别是在对话系统中,由于钱”、“多少块钱”、“多少元钱”:有对话上下文的联系.用户输入往往具有口语化的省@(2)定性知识:“便g[o,1000)”、“一般/适中/普通则进行消歧,若最终仍存在歧义,则可进行反问,否则『1000,2000)”、“较高/贵[2000,)”;生成语义单元序列.并作为输入传递给下一个处理阶(3)定量知识:又可以进一步细分为两种:段。同时,定义了语义单元的格式,它看上
6、去是一个●概数知识:“以上/大于”、“以下//J、于”、“左右/大JSON字符串,如下:概”、“不超过”、“少/低/便宜一点”、“高/贵一点”;{●确数知识:“数字(0<=数字<20000)+块/元”、”语义标准名lI.“数字(0<=数字<20000)+到+数字(0<=数字<20000)”。【评价性语义知识则是参考主流电子商务网站用户{”语义值lf.”值1”.反馈信息以及调研一些手机实体店的销售过程制定.”匹配位置lf.”下标1”当前系统中共有l1个属性.表2是评价性语义知识片},段{表2评价性语义知识片段”语义值『I_”值2”.”匹配位置『l_”下标2”属性毒船篁孓型
7、箍铷外澎外形,好看,一般,难看,漂亮,时髦,潮流,},时尚,经典,过时,老土莅价比性价比,高[100,85),中[85,70),fk~[70,0)热门热门,流行,受欢迎,最热】}其中.语义标准名是指诸如“品牌”、“型号”、“价2语义信息提取方法格”等规范的参数名称.而语义值是指诸如“诺基亚”、2.1算法框架“三星”、“2000元”等具体的参数值。用户输入句子中可总体算法框架如图1所示。能包含多种语义.每种语义也可能存在不止一个语义值尽管在实际对话中,一句话中出现多种语义和多个用户输入语义值并不多见.但本文仍考虑了这种情况并最终生正则匹配及
此文档下载收益归作者所有