资源描述:
《基于混合模型的中文问题分类与解析研究.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、基于混合模型的问题分类与解析研究基于混合模型的中文问题分类与解析研究摘要本文首先分析了当前问答系统及问题分类领域的研究现状,总结一些存在的问题。然后,在语法、语义和领域三个层面以及分类信息应用的方面,对中文问题分类方法进行了讨论。在语法分类层面,汇总了语言学家的一些成果,对分类学的制定进行了讨论,并用ID3决策树算法实现了问题疑惑程度的分类;在语义分类层面,通过改进朴素贝叶斯分类方法以及加入语言学特征和对特征的筛选排序,实现了两个层次的分类;在领域分类层面,本文作为首先的尝试者,沿用语义分类的方法,利
2、用维基百科的分类学和知网本体扩展词集实现了过去只在文本分类上进行的领域分类;在应用方面,主要探讨了各个分类信息的应用以及问题复杂度的制定。接着,针对上面三个层面的分类方法,本文开发了测试系统,做了具有一定规模的实验,并做了详细的分析。最后,通过总结以上的工作,得出如下结论:语法分类信息有助于开发人性化问答系统;混合模型进行语义分类效果可以得到明显提升;领域分类的效果欠佳,方法有待进一步改进;人类认知过程与计算机处理自然语言信息存在矛盾,多层信息综合也许是解决方法之一。关键字:问答系统,分类学,语发分类
3、,语义分类,领域分类,多层信息综合基于混合模型的问题分类与解析研究RESEARCHONCHINESEQUESTIONCLASSIFICATIONANDANALYSISBASEDONAHYBRIDMODELABSTRACTThepaperfirstlyanalyzesthestateoftheartonQuestionAnsweringandQuestionClassification,andsummarizessomeexistentproblems.Afterthat,methodsofChines
4、eQuestionClassificationarediscussedinseveralaspects,includingsyntacticlayer,semanticlayer,domainlayer,andapplicationlayer.Inthesyntacticlayer,itcollectssomefruitsfromlinguisticians,talksovertheestablishmentofthequestiontypology,andimplementstheclassific
5、ationofdoubtfulnessofthequestionsusingID3DecisionTreealgorithm;inthesemanticlayer,throughtheimprovementofNaiveBayesClassificationandtheaffiliationoflinguisticproperties,andtheselection,filterandsortoftheproperties,thepaperimplementstheclassificationontw
6、osub-layers;inthedomainlayer,quathefirstonetodotheexperiments,withthesamemodelusinginthesemanticlayer,thedomainclassificationisaccomplishedinvirtueofthetypologyofWikipediaandHowNettoextendthewordset;inapplicationlayer,theapplicationoftheresultoftheclass
7、ificationoneachlayerandtheformulationofQuestionComplexityarediscussed.Afterthen,aimingatthethreelayerstalkedabove,theauthordevelopsasystemfortheexperiments,conductsseveralexperimentsonafairlybigscale,andalsodoeslotsofanalysisindetail.Atlast,aftersummari
8、zingtheworkabove,thepaperconcludes:theclassificationonsyntacticlayercanhelpdevelopingaquestionansweringsystemwithhumannature;hybridmodelcanupgradetheclassificationonsemanticlayergreatly;theclassificationondomainlayerisnotverysati