基于SVM的汉语问句分类研究【毕业论文】

基于SVM的汉语问句分类研究【毕业论文】

ID:472059

大小:415.50 KB

页数:33页

时间:2017-08-07

基于SVM的汉语问句分类研究【毕业论文】_第1页
基于SVM的汉语问句分类研究【毕业论文】_第2页
基于SVM的汉语问句分类研究【毕业论文】_第3页
基于SVM的汉语问句分类研究【毕业论文】_第4页
基于SVM的汉语问句分类研究【毕业论文】_第5页
资源描述:

《基于SVM的汉语问句分类研究【毕业论文】》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、本科毕业设计(20届)基于SVM的汉语问句分类研究27摘 要【摘要】问答系统是搜索信息的高级形式,其中问句理解模块中的问句分类任务能够为后续的信息搜索模块缩小搜索的范围,并对答案抽取模块制定抽取策略起到帮助的作用,对整个问答系统的性能提高具有推动作用。目前汉语问答系统尚处在发展阶段,尤其需要追求每个过程的品质,所以汉语问句分类作为首要子过程极具研究价值。借鉴国外英语问答系统中问句分类的方法,引入统计学理论,采取支持向量机SVM对汉语问句进行分类比较可行且有效,由于问句集经过处理后得到的特征向量模型的空间维数较高,SVM可以有效解决高

2、维问题;问句向量特征独立性较大,SVM能够不受特征独立性假设的影响;问句向量特征较少,SVM具有主动学习能力。此外,如果缺乏用于公测的问句集,支持向量机在自行构建的问句集上仍然可以得到相对最优的结果,具有良好的泛化和推广性。【关键词】问答系统;汉语问句分类;支持向量机;特征词。27Abstract【ABSTRACT】QA(questionanswering)systemisahigh-levelformforsearchinginformation,amongthequestioncomprehensionmodule,thetas

3、kofquestionsclassificationcanshrinkthesearchingrangefortheinformationsearchmodulewhichisfollow-up,andhelptheanswerextractionmoduletoformulateextractionstrategy,improvetheperformanceoftheQAsystem.AtpresentChineseQAsystemisstillatthedevelopmentstage,especiallyshouldpursu

4、itqualityateveryprocess,soastheprimarysub-process,Chinesequestionclassificationdeservesahighstudyvalue.TakeexamplebythequestionclassificationmethodinforeignEnglishQAsystem,introducingStatisticalLearningTheory,andusingsupportvectormachine(SVM)toclassifyChinesequestionsi

5、smorefeasibleandeffective.Becauseafterword-to-dataconversion,thecorpusarereceivedahigherdimensionfeaturespace,SVMjustcansolvesuchproblemofhigh-dimension;thecorrelationsofcharacteristicsinquestionvectorareweak,SVMcanbeunaffectedontheimpactofcharacteristicsindependenceas

6、sumption;thecharacteristicsofquestionvectorareverysparse,SVMhastheabilityofactivelearning.Inaddition,undertheconditionoflackingcorpusforopentest,SVMwithgoodgeneralizationandextensioncanstilltoreachrelativebestresultsonself-builtcorpus.【KEYWORDS】questionansweringsystem;

7、Chinesequestionclassification;supportvectormachine;characteristicword。27目 录摘 要IIAbstractIII目 录IV1绪论11.1课题背景11.1.1国外问答系统研究现状11.1.2国内问答系统研究现状11.1.3问答系统基本原理21.1.4汉语问句分类概论21.2文章概要31.2.1课题研究内容31.2.2论文组织结构32支持向量机理论52.1问句分类中的统计学52.1.1统计学习理论52.1.2VC维和推广性的界52.1.3结构风险最小化SRM原则62.

8、1.4支持向量机发展62.2支持向量机原理62.2.1最优分类面与线性问题62.2.2核函数与非线性问题82.2.3支持向量机在分类上的应用92.3本章小结93汉语问句表示过程113.1自然语言处理技术113.1.1分词技术113.1

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。