基于支持向量机的问句分析

基于支持向量机的问句分析

ID:14477580

大小:53.00 KB

页数:15页

时间:2018-07-28

基于支持向量机的问句分析_第1页
基于支持向量机的问句分析_第2页
基于支持向量机的问句分析_第3页
基于支持向量机的问句分析_第4页
基于支持向量机的问句分析_第5页
资源描述:

《基于支持向量机的问句分析》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、基于支持向量机的问句分析第2"007期年8月计算机技术与发展COMPUTERTECHNO【DGYANDDEVELOPM旺NTVo1.17No.8Aug.2007基于支持向量机的问旬分析刘颖,韩杰,滕至阳(东南大学计算机科学与工程学院,江苏南京210096)摘要:为提高问答系统对问句理解的准确率,以概念层次网络理论结合传统计算语言学为思路,提出了适用于限定领域中问句分析模型,根据限定领域的知识特点,设计了新的问句分类方法.在此问句分类方法的基础上,构建了基于支持向量机理论的问句分类器.在以实际教学过程中所收集的真实问句为问题集和训练集的测试中,取得了较好的实践效果.关键词:概念层次网络理

2、论;问句分类;支持向量机;中文信息处理;问答系统中图分类号:TP391.1文献标识码:A文章编号:1673—629X(2007)08—0001—04ResearchofQuestionAnalysisBasedonSupportVectorMachineLIUYing,HANJie,TENGZhi—yang(Sch~lofComputerSci.andEng.,SoutheastUniversity,Nanjing210096,CbAna)Abstract:Anovelclosed—domainorientedquestionanalysismodulebasedonhierarchi

3、calnetworkofconceptsandtraditionalcomputa.tionallinguisticsispmpo~to~lancetherateofaccuracyofquestioninterpretationofflquestionansweringsystem.Anewquesti~cat.alogisdevelopedonthebasisofcharacteristicsofclosed—domain.Anovelquestionclassifierbasedonsupportvectormachineiscon.structedonthegroundsoft

4、hisnewtcatalog.Theresultofexperimentstestedonquestionsgatheredduringprocessofinstructionshowsbetterpromisetothismethod.Keywords:hierarchicalnetworkofconceptstheory;questioncatalog;supportvectormachine;Chineseinformationprocessing;questionansweringsystem0引言问答系统(QuestionAnsweringSystem),又称人机对话系统(H

5、umanMachineConversation,HMC),是指系统接受用户以自然语言形式描述的提问,从大量半结构化或者非结构化的数据中,获取能回答此自然语言形式问句的准确,简洁,个性化的答案.这种答案通常是一小段正面回答用户提问的文本,而不是像目前大多数基于关键字串匹配技术的信息检索系统那样返回数以千计的文档链接.在远程教育中,为了提高网络教学质量,限定专业领域内的智能答疑系统成为研究热点.要实现限定领域内的问答系统,本质上要解决对用户问题的理解和对领域知识文本的理解,从而使系统根据用户具体问题从知识文本中提取相应信息转化为用户需要.笔者以概念层次网络(HierarchicalNetw

6、orkof收稿日期:2006—10—09基金项目:国家"十五"重大科技攻关项目(2509000012)作者简介:刘颖(1975一),男,江苏淮阴人,硕士,研究方向为嵌入式系统,自然语言理解等;滕至阳,教授,研究方向为人工智能,ICAI等.Concepts,HNC)理论为指导构建了面向限定领域的问答系统OSAnsExtr,提出在特定领域中的问句分析模型,注重对限定专业领域内中文问句在语义概念层次上进行分析,抽取出问句中的领域知识和语义信息,提高问答系统的性能.1系统介绍答疑解惑是教学过程中不可缺少的环节.文中以《现代操作系统教程》uJ课程答疑为背景,结合HNC理论构建系统总体模型,如图1

7、所示,其特点是能够抽取问句文本中的领域知识和语义信息并据此回答用户提问.系统定位于限定专业领域,一定程度上减少了系统的复杂性.系统主体部分采用目前比较流行的问答系统模型,即由问句分析,文档检索,句段检索,答案抽取四个模块组成.当用户通过系统接口提交自然语言形式的问句文本时,系统首先调用由领域知识库和HNC知识库支持的HNC句类分析器对文本预处理,提取领域信息和语义信息以备系统后续部分使用.问句分类部分根据文本预处理中提取的领域信息和语义信息对问

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。