基于辅助短语标记的名词短语识别.pdf

基于辅助短语标记的名词短语识别.pdf

ID:51238696

大小:487.94 KB

页数:8页

时间:2020-03-22

基于辅助短语标记的名词短语识别.pdf_第1页
基于辅助短语标记的名词短语识别.pdf_第2页
基于辅助短语标记的名词短语识别.pdf_第3页
基于辅助短语标记的名词短语识别.pdf_第4页
基于辅助短语标记的名词短语识别.pdf_第5页
资源描述:

《基于辅助短语标记的名词短语识别.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第31卷第1期2014年2月沈阳航空航天大学学报JoumalofShenyangAerospaceUniversityVol-31No.1Feb.2O14文章编号:2095—1248(2014)01—0052-08基于辅助短语标记的名词短语识别刘飞,周俏丽,张桂平(沈阳航空航天大学知识工程中心,沈阳110136)摘要:名词短语的识别是自然语言处理领域中非常重要的子任务。而名词短语的识别性能与识别效率一直是研究人员关注的焦点,为了达到兼顾二者的目的,提出了一种基于辅助短语标记识别名词短语的方法。首先,在分析了短语不同分类体系的基础上,构

2、建了一种映射公式,并根据该公式对不同分类体系的短语类别之间进行映射。然后,根据映射结果及短语的概率分布进行辅助短语标记的组合。实验结果表明,本文的方法在提高F值的基础上,有效地降低了系统的时间开销。关键词:辅助短语标记;名词短语;映射公式中图分类号:TP391.1文献标志码:Adoi:10.3969/j.issn.2095—1248.2014.01.012RecognitionofChinesenounphrasebasedonauxiliaryphrasemarkLIUFei,ZHOUQiao—li,ZHANGGui—ping(Kn

3、owledgeEngineeringResearchCenter,ShenyangAerospaceUniversity,Shenyang110136)Abstract:NounPhraseRecognitionisoneofthemostcriticalcomponentsinnaturallanguageprocessingfield.Thenounphraserecognitionperformanceanditsefficiencyarethefocusofresearchers’attention.Inordertocomb

4、inethetwoelements,thispaperproposesamethodofrecognizingnounphrasesbasedonauxil—iaryphrasemark.First,thispaperpresentsamappingbetweenphrasesbyusingthemappingformulabasedonthedetailedanalysisofthedifferentclassificationsystemofthephrases.Then,accordingtothemappingresultsa

5、ndtheprobabilityofthedistributionoftheauxiliaryphrasemark,lotsofcombinationsareestab—lished.ExperimentalresultsshowthatthismethodeffectivelyreducesthetimeofnounphraserecognitionwithoutreducingtheF-value.Keywords:auxiliaryphrasemark;nounphrase;mappingformula自然语言处理的主要任务是使

6、机器自动的理解人类语言,而名词短语的识别是自然语言处理领域中非常重要的子任务,它直接关系到文本分析和文本处理的正确性。例如,信息抽取系统将名词短语作为它的主要识别对象。同时,名词短语的识别又是自然语言处理领域中许多子任务的基础。名词短语的实质是关于名词的特殊表达,例如,为了表达“心情愉悦”,通常会附带~系列的例如“跑”、“跳”、“笑”之类的动词,然而通过这些动词很难猜测出文章所要阐述的主要内容。但是,我们可以根据“心情”、“笑容”、“开心”之类的名词,便可以轻而易举的揣测出文章所要表达的主要思想。由此可见,为了使机器自动理解人类语言,

7、名词短语的识别是其必经之路。此外,作为一项重要的基础研究,名词短语的自动识别与分析对于自然语言处理领域中的许多应用研究,包括句法分析、信息检索、信息抽取、机器翻译等,都具有重要的实践意义¨J。当前,针对名词短语(NP)的识别,研究较多的主要有最短名词短语的收稿日期:2013—10一24基金项目:国家科技支撑计划项目(项目编号:2012BAHl4F00);辽宁省教育厅科学研究一般项目(项目编号:L2012056)作者简介:刘飞(1987一),女,辽宁大连人,在读硕士,主要研究方向:知识管理与智能人机交互,E-mail:fei一12011

8、@163.com;张桂平(1962一),女,辽宁本溪人,教授,主要研究方向:自然语言处理,机器翻译,E—mail:zgp@ge—soft.corn。第1期刘飞,等:基于辅助短语标记的名词短语识别53识别和最长名词短语的识

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。