基于规则的词语搭配识别研究

基于规则的词语搭配识别研究

ID:36790755

大小:970.56 KB

页数:36页

时间:2019-05-15

基于规则的词语搭配识别研究_第1页
基于规则的词语搭配识别研究_第2页
基于规则的词语搭配识别研究_第3页
基于规则的词语搭配识别研究_第4页
基于规则的词语搭配识别研究_第5页
资源描述:

《基于规则的词语搭配识别研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、山西大学硕士学位论文基于规则的词语搭配识别研究姓名:赵巧蓉申请学位级别:硕士专业:基础数学指导教师:王素格20060601摘要搭配是两个词之问的组合,它介于词和短语之间。由于短语是多个词的组合,内部层次关系复杂,难以有效利用词语信息,而搭配可以在词和短语之间架起了一个桥梁,为建立完全的句法分析器服务。搭配可以用于自然语言形成、计算词典编撰学、句法分析等。由于目前大部分是采用统计方法进行搭配识别,利用规则来识别词语搭配的研究比较少。本文主要研究体宾动词和名词以及谓词动词与动词构成的动宾搭配。(1)介绍了已有的一些识别搭配对的方法:使用频率信息的搭配识

2、别,基于均值与方差的搭配识别,基于假设测试和互信息的搭配识别,基于熵的搭配识别,以及统计定量描述词语搭配所需的三个评价指标及其判别搭配的算法。(2)从语料库中获取大量实例,特别是统计方法判别错误的实例,通过人工以及人机交互的手段对实例分析,总结出动词与名词的搭配识别规则,同时对获取的规则进行了实例分析。结果表明这些规则可以正确识别语句中的词语搭配,提高识别搭配的准确率和召回率。(3)利用统计方法与规则相结合的方法,对语料中获取的句子进行了搭配测试,测试的结果表明,该方法是可行的。(4)举例说明了本文规则的有效性以及规则的局限性。关键词:动宾搭配;规

3、则;搭配识别;实例分析中图分类号:TP391ABSTRACTCollocationiSatwo—wordscombinationbetweenWOrdandphrase.Becausephrasesarecombinatedfrommorewords.whicharedi硒culttoeffectivelyuselexicalinformationforcomplicatedhiberarchyrelationsinthem.Socollocationscallofferhelpforbuiltingcompleteparsingasabridge

4、betweenwordandphrase.Furthermore,collocationscanbeusedfornaturallanguagegeneration,computationallexicographyandparsingetc.Now,comparingmostmethodsforcollocationrecognitionbasedonstatistics,studiesonrulesareless.Inthispaper,Chineseverb—noun,verb—verbcollocationsrecognitionismai

5、nlyresearched.(1)Somesignificantandeffectiveexistingmethodsareintroduced.Forexample,selectionofcollocationbyfrequency,selectionbasedonmeanandvarianceofthedistancebetweenfocalwordandcollocatingword,hypothesistesting,mutualinformation,entropy,preliminaryquantitativeanalysiswitht

6、hreeevaluatingthresholdsandthealgorithmforcollocationrecognition.(2)Thoughanalysisingagreatdealofexamplesespeciallylosinginstatisticsbymanualandmanual—machineways,wheretheseexamplesareacquiredfromcoprus.Verb-Nouncollocationrecognitionrulesareconcluded.Andthentheseacquiringrule

7、saboveareanalysisedonexamples.Theresultsindicatedthattheserulescanbecorrectingrecognizedandprecisionandrecallareimproved.(3)Usingahybridmethodbasedacquiringfromcorpusaretested.methodiSfeasible.Ollstatisticsandrules,sentenceseTheexperimentresultsindicatedthe(4)Theavailabilityan

8、dlocalizationofrulesaredemonstratedbyexamplesKEYWOEDS:verb—ob

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。