欢迎来到天天文库
浏览记录
ID:32515640
大小:2.57 MB
页数:52页
时间:2019-02-10
《复句关系词自动标识系统中规则库及其维护方法的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、⑨硕士学位论文MASTER’STHESlS摘要中文信息处理包括字处理、词处理、句处理和篇章处理三大内容,复句作为汉语语法的重要实体单位,其处理过程为中文信息处理的重要内容。“词处理”中汉语自动分词已有很大进展,而“句处理”中的复句信息化成果还很少,目前对复句的研究以提取关系词为基础,研究复句中关系词的自动识别对中文翻译和文本挖掘有很大意义。本文的研究即着眼于复句中关系词自动标识的基础部分一规则。在复句中关系词自动标识的研究中,基于统计与基于规则两种方法的结合是目前主流的方法,而两者中后者是前者的研究基础,
2、本文即以基于规则的专家系统理论为基础探索关系词的自动标识。针对汉语语言的复杂性,本文首先分析汉语复句语料库,从中探索大量复旬语料中规则的表示方法,即研究如何将语言现象归纳整理成以文字形式描述的规则。在描述规则时讨论规则的特征表示方法,包括其数据结构表示并根据不同的特征进行相关分类。由于文字规则机器无法识别,本文通过制定统一的形式化标准,将文字规则形式化为规则引擎可以识别的逻辑规则;其次,根据规则的特征规律建立规则库,即设计不同的规则表存储类型不同的规则,讨论规则库的逻辑结构设计和规则的物理存储,从而实现“
3、静态存储,动态使用”,使得规则引擎能通过调用规则库中的规则达到关系词自动识别的目的;最后,由于规则库在使用过程中,随着规则的添加、修改、删除等更新规则库的操作,规则库的一致性很难得以保证,且随着规则的增多和内容的日趋复杂,人工维护出现很多弊端,因此本文建立一个基于抽象推理树模型的规则库维护系统并代码实现来检测规则的一致性和完整性,以此保证规则库的准确率和实用性。本文通过对规则库维护工具的用法测试,根据其检测结果并加以人工确认。实验结果表明,抽象推理树模型在规则库的检测中是可行有效的。关键词:复句关系词;自
4、动识别;规则的形式化;规则库;规则库维护;⑨硕士学位论文MASTER’STHESlSAbstractTheresearchofCllineseinfom撕onprocessingi11cludesmreeilllport卸tpaIts,whicht0t11econcreteisw‘)rdprocessing,wordsprocessingandsentenceprocessing.AsaIlimportalltuIlitoft11eChinesesentence,processingofCompounds
5、entenceisallimportaIltcomponentforCIlinesemfomation.Presentresearchofw陆chmailllvtot11eex仃actofrelation、vordsandthe咖dyofmispaperfocuSt11eresearChofmles,wKchisthemnilaIllentalpaJtofautomaticallyidentifies.AtpresenttlleresearChaboutcompoundsentensemailllyiIl
6、cluiIest、^,o嬲pectS:t11eidenti6c撕0nofsub—clauSea11dcompoundsentence.T11ispaperstlldieshowt0es伽lishnlemlebaSeontlleb嬲isofthemeoryofthemle-baSedeXpertsystem,a11dresearchhowtomaintenanceit,wmchist11et11eoreticalbaSistorealizeautomaticidentifica-tionofrelation
7、alword.Thei11novationofthispaperliesin廿leeXtractionprocessofthemlesandtheStoragetechnologyinwhichusedif绝renttables内rdifIferentconstraints,andproposedmemaintenancemethodaccordingtlleactll甜situation.Accordingt0mecoll】IpleXit)roftlleC11inesel锄gager,thjsp印er6
8、rStan翻yzesChineseco印usofcompoundsentence,矗omWhjchtoexplore廿leexpressionmetllodofmles,whichistoex锄inehowthelanguagephenomenonsI蛐m撕zedtotherulesdescribediIltextfo瑚.DiscuSsionmecharacterrcpresentationoft11ermesiIldescr
此文档下载收益归作者所有