基于语义组块分析的汉语语义角色标注

基于语义组块分析的汉语语义角色标注

ID:37560812

大小:310.99 KB

页数:10页

时间:2019-05-25

基于语义组块分析的汉语语义角色标注_第1页
基于语义组块分析的汉语语义角色标注_第2页
基于语义组块分析的汉语语义角色标注_第3页
基于语义组块分析的汉语语义角色标注_第4页
基于语义组块分析的汉语语义角色标注_第5页
资源描述:

《基于语义组块分析的汉语语义角色标注》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第23卷第5期中文信息学报Vol.23,No.52009年9月JOURNALOFCHINESEINFORMATIONPROCESSINGSep.,2009文章编号:1003-0077(2009)05-0053-09基于语义组块分析的汉语语义角色标注丁伟伟,常宝宝(北京大学计算语言学研究所,北京100871)摘要:近些年来,中文语义角色标注得到了大家的关注,不过大多是传统的基于句法树的系统,即对句法树上的节点进行语义角色识别和分类。该文提出了一种与传统方法不同的处理策略,我们称之为基于语义组块分析的语义角色标注。在新的方法中,语义角色标注的流程不再是传统的/句法分析)))语义角色识别)))语

2、义角色分类0,而是一种简化的/语义组块识别)))语义组块分类0流程。这一方法将汉语语义角色标注从一个节点的分类问题转化为序列标注问题,我们使用了条件随机域这一模型,取得了较好的结果。同时由于避开了句法分析这个阶段,使得语义角色标注摆脱了对句法分析的依赖,从而突破了汉语语法分析器的时间和性能限制。通过实验我们可以看出,新的方法可以取得较高的准确率,并且大大节省了分析的时间。通过对比,我们可以发现在自动切分和词性标注上的结果与在完全正确的切分和词性标注上的结果相比,还有较大差距。关键词:计算机应用;中文信息处理;语义角色标注;语义组块分析;条件随机域;序列标注中图分类号:TP391文献标识码:

3、AChineseSemanticRoleLabelingBasedonSemanticChunkingDINGWeiwei,CHANGBaobao(InstituteofComputationalLinguistics,PekingUniversity,Beijing100871,China)Abstract:Inrecentyears,theChineseSRL(semanticrolelabeling)hasarousedtheintensiveattention.ManySRLsystemshavebeenbuiltontheparsingtrees,inwhichtheconsti

4、tuentsofthesentencestructureareidentifiedandthenclassified.Incontrast,thispaperestablishesasemanticchunkingbasedmethodwhichchangestheSRLtaskfromthetraditional/parsing-semanticroleidentification-semanticroleclassification0processintoasimple/semanticchunkidentification-semanticchunkclassification0pi

5、peline.Thesemanticchunking,whichisnamedafterthesyn-tacticchunking,isusedtoidentifythesemanticchunk,namelytheargumentsoftheverbs.Basedonthesemanticchunkingresult,theChineseSRLcanbechangedintoasequencelabelingprobleminsteadoftheclassificationprob-lem.Weapplytheconditionalrandomfieldstotheproblemandg

6、etbetterperformance.Alongwiththeremovaloftheparsingstage,theSRLtaskavoidsthedependenceonparsing,whichisalwaysthebottleneckbothofspeedandprecision.Theexperimentshaveshownthattheoutperformsofourapproachpreviouslybest-reportedmethodsonChineseSRLwithanimpressivetimereduction.Wealsoshowthattheproposedm

7、ethodworksmuchbetterongoldwordsegmentationandPOStaggingthanontheautomaticresults.Keywords:computerapplication;Chineseinformationprocessing;semanticrolelabeling;semanticchunking;con-ditionalrandomfields;sequencela

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。