资源描述:
《基于概念图知识表示的问题回答系统的研究》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、基于概念图知识表示的汉语问题回答系统的研究摘要:问题回答的核心是自然语言理解基础上的搜索问题.因汉语的灵活性和复杂性,使汉语的理解成为汉语问题回答研究的技术难点.现有汉语问题回答依靠关键字查询方法信息检索和答案抽取.系统实质是关键字匹配,没有语法和语义分析,属于简单自然语言理解范畴,且答案准确率低.本文以概念图知识表示为基础,按汉语语法和语义分析,形式化定义了问题回答,提出了基于概念图知识表示的汉语问题回答的系统结构和研究方法,并归纳出汉语中常见疑问句型,构造了疑问句概念图.经测试分析,疑问句概念图反映了现有疑问句基本情况,
2、解决方案切实可行.该课题的研究,对问题回答和自然语言理解的研究具有一定参考价值.关键词:概念图;知识表示;问题回答;自然语言理解中图法分类号:TP391文献标识码:AResearchontheQuestionsAnsweringSysteminChineseBasedonKnowledgeRepresentofConceptualGraphsPeiqiLiu1,ZengzhiLi2(1Schoolofinformationandcontrolengineering,Xi’anuniversityofarchitecturea
3、ndtechnology,Xi’an710055,China,2Schoolofelectronicsandinformationengineering,Xi’anJiaotonguniversity,Xi’an710049,China)Abstract:Thecoreofquestionsansweringisasearchingbasedonnaturallanguageunderstanding.BecauseoftheflexibilityandcomplexityofChinese,thestudyoftheChi
4、nesequestionansweringhasbecomeverydifficulty.ThecurrentChinesequestionsansweringreliesonkeywordstoqueryandretrievetheanswer.Thenatureofthesesystemsisthekeywordmatching.Ithasn’tanysyntaxandsemanticsanalysisandbelongstosimplenaturallanguageunderstanding.Itsansweringa
5、ccuracyislow.Inthispaper,theresearchmethodsofthequestionsansweringinChinesesyntaxandsemanticanalysis,whichbasedontheknowledgerepresentationoftheconceptualgraphs,isproposed.Accordingtothemethods,thequestionsansweringisformaldefinited,andthesystemstructureisdesigned.
6、TheconceptualgraphsoftheinterrogativesentencesinChinesearealsoconstructedbycommonstatementinChineseinterrogativesentencesinthispaper.Aftertest,theconceptualgraphsoftheinterrogativesentencesreflectthebasicsituationofexistingquestionsinChinese,andthesolutionisfeasibl
7、e.Theresearchmethodsarevaluableforthequestionansweringandnaturallanguageunderstanding.Keywords:Conceptualgraphs;Knowledgerepresentation;Questionanswering;Naturallanguageunderstanding问题回答(QuestionAnswering,QA)是自然语言处理领域的一个相当活跃分支,其研究内容是理解用户用自然语言提问,通过大规模信息资源自动检索,给出满足用户
8、需求的准确答案.问题回答系统主要技术是自然语言理解.国外对问题回答系统的研究较早,并已取得了可喜成果,较著名的系统有美国麻省理工学院基于Web的Start系统,密歇根大学的面向开放领域多种语言的AnswerBus系统等.国内在这方面的研究起步较晚,由于汉语语法、语义和表示形式的复杂性,使中