欢迎来到天天文库
浏览记录
ID:34099646
大小:44.75 KB
页数:3页
时间:2019-03-03
《开放领域汉语知识问答方法》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第31卷第11期计算机工程2005年6月Vol.3111ComputerEngineeringJune2005博士论文文章编号10003428(2005)11000103文献标识码A中图分类号TP311.52开放领域汉语知识问答方法姜吉发(中国科学院计算技术研究所北京100080)摘要给出了一种开放领域汉语知识问答中某些问答类型的模式的获取方法和所获取模式的精度计算方法对几个选定的问答类型使用该法获取它们各自所对应的浅层文本模式然后在这些模式的指导下对各个问答类型下的一些问题进行答案查找结果表明采
2、用浅层文本模式匹配方法来应对开放领域汉语知识问答是有效的关键词开放领域汉语知识问答模式获取模式匹配QuestionAnsweringMethodofChineseKnowledgeinOpeningFieldJIANGJifa(InstituteofComputingTechnology,CAS,Beijing100080)AbstractThispapergivestheattainingmethodofsomequestionansweringtypesmodeofanopeningfield
3、Chinesequestionansweringanditsprecisioncalculation.Forsomeselectedquestionansweringtypes,themethodisusedtoattaintheircorrespondingflattextmodes,andthensearchthekeysofeachtypes’questionunderthesemodes’guide.TheresultshowstheavailabilityofopeningfieldCh
4、ineseinformationquestionansweringusingthemethodofflattextmodesmatching.KeywordsOpeningfield;Chinese;Questionanswering;Modeacquisition;Modematching1概述设定0关于事实的提问在知识问答的可能提问中占很1.1知识问答的定义大的比例正确应对关于事实的提问对于一个QA系统来知识问答QA是指从一个有限大的文档集合DS={d1说是至关重要的下面研究的事实f就是关于某
5、个对象od2d
6、DS
7、}中找出用户使用一个自然语言语句所提出问题的某个静态或动态属性a的属性值v的描述即f=例子f1=<毛泽东出生年1893年>f2=<爱迪生发能的软件系统明电灯>1.2开放领域QA是研究目标设定1QA关于事实f=的知识问答是在知道目前对QA的研究集中在开放领域QA上所谓开放oav中任意两个元素的条件下试图确定第3个元素的领域QA是指不限定问答类型和答案所在文档集合的QA过程一般来说用户在提问中给出o和a要求回
8、答v或目前世界上可以称为开放文档集合的就是WWW因而可以给出v和a要求回答o说开放领域QA就是基于WWW的非受限问答类型的QA设定2对于事实f=可以将之泛化为一个1.3QA的一般过程和答案选择的一般做法事实类F=其中O是o所属的语义类V是vQA的一般过程是对于一个给定的问题从一个文档所属的语义类例如由事实f1=<毛泽东出生年1893集合中使用搜索引擎检索出一个相关文档集合从该相关文年>可以泛化出一个事实类F1=9、人出生年age10、年档集合中找出可能含有答案的候选语句11、段落再从这些龄>F1能概括关于某某人的出生年的无数事实由事实f2=候选语句段落中找出精确简短的答案其中的关键问题<爱迪生发明电灯>可以泛化出一个事实类F2=12、是如何从这些候选语句段落中找出精确简短的答案人发明tool13、用具>F2能够概括关于某某人发明什么工解决这个问题的一般做法有两种一是采用基于知识的具的无数事实[124]设定3对于一个关于事实f=的提问q=f(o浅层文本模式匹配来选择可能的问题答案二是不对问题和答案进行句法分析或浅层句法分析而是采用基于词a)或q=f(va14、)可以有nn>=1种提问方式q1q2频的概率统计计算从候选语句段落中选择与问句相似qn与之对应对于事实f可以有mm>=1种陈述方式度最较大的语句段落作为答案目前第一种做法这mm>=1种陈述方式就是关于q的m个答案a1a2成为主流方法并广为人们采用我们所建的汉语开放领域am事实f将a1a2am和q1q2qn关联了起来知识问答系统也采用这种做法只是要根据汉语不同于英语的特点对QA的影响对该法作适当调整基金项目国家重点基础研究项目(G1998030507-4,G1998030510)1.
9、人出生年age
10、年档集合中找出可能含有答案的候选语句
11、段落再从这些龄>F1能概括关于某某人的出生年的无数事实由事实f2=候选语句段落中找出精确简短的答案其中的关键问题<爱迪生发明电灯>可以泛化出一个事实类F2=12、是如何从这些候选语句段落中找出精确简短的答案人发明tool13、用具>F2能够概括关于某某人发明什么工解决这个问题的一般做法有两种一是采用基于知识的具的无数事实[124]设定3对于一个关于事实f=的提问q=f(o浅层文本模式匹配来选择可能的问题答案二是不对问题和答案进行句法分析或浅层句法分析而是采用基于词a)或q=f(va14、)可以有nn>=1种提问方式q1q2频的概率统计计算从候选语句段落中选择与问句相似qn与之对应对于事实f可以有mm>=1种陈述方式度最较大的语句段落作为答案目前第一种做法这mm>=1种陈述方式就是关于q的m个答案a1a2成为主流方法并广为人们采用我们所建的汉语开放领域am事实f将a1a2am和q1q2qn关联了起来知识问答系统也采用这种做法只是要根据汉语不同于英语的特点对QA的影响对该法作适当调整基金项目国家重点基础研究项目(G1998030507-4,G1998030510)1.
12、是如何从这些候选语句段落中找出精确简短的答案人发明tool
13、用具>F2能够概括关于某某人发明什么工解决这个问题的一般做法有两种一是采用基于知识的具的无数事实[124]设定3对于一个关于事实f=的提问q=f(o浅层文本模式匹配来选择可能的问题答案二是不对问题和答案进行句法分析或浅层句法分析而是采用基于词a)或q=f(va
14、)可以有nn>=1种提问方式q1q2频的概率统计计算从候选语句段落中选择与问句相似qn与之对应对于事实f可以有mm>=1种陈述方式度最较大的语句段落作为答案目前第一种做法这mm>=1种陈述方式就是关于q的m个答案a1a2成为主流方法并广为人们采用我们所建的汉语开放领域am事实f将a1a2am和q1q2qn关联了起来知识问答系统也采用这种做法只是要根据汉语不同于英语的特点对QA的影响对该法作适当调整基金项目国家重点基础研究项目(G1998030507-4,G1998030510)1.
此文档下载收益归作者所有