浅议基于动态贝叶斯网的中文专有名词识别

浅议基于动态贝叶斯网的中文专有名词识别

ID:35131313

大小:835.58 KB

页数:37页

时间:2019-03-19

浅议基于动态贝叶斯网的中文专有名词识别_第1页
浅议基于动态贝叶斯网的中文专有名词识别_第2页
浅议基于动态贝叶斯网的中文专有名词识别_第3页
浅议基于动态贝叶斯网的中文专有名词识别_第4页
浅议基于动态贝叶斯网的中文专有名词识别_第5页
资源描述:

《浅议基于动态贝叶斯网的中文专有名词识别》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、山西大学硕士学位论文基于动态贝叶斯网的中文专有名词识别姓名:刘杰申请学位级别:硕士专业:计算机软件与理论指导教师:杨尔弘20060601摘要专有名词的识别是中文信息处理领域的重要研究课题之一,目前尚未得到很好的解决。在大规模真实文本为基础的语料库研究的重要性日益突显的情况下,如何提高大规模语料库的质量成为关键,而专有名词的识别质量是影响语料库加工质量的一个重要因素,专有名词识别的自动化也能提高大规模语料库加工效率。此外,在信息抽取、问答系统、术语学研究等各个研究领域应用领域,专有名词的识别也是其基础性步骤。本文针对真实中文文本中较为频

2、繁出现的人名、地理政治地名还有组织机构名三类专有名词,提出了一种基于动态贝叶斯网模型的专有名词自动识别方法,该方法把文本中的局部特征、全局特征及语言学经验知识融入一个极具表达和推导能力的随机概率模型中,可以很好地识别专有名词。研究内容主要包括以下几个方面:1.对专有名词的分类做了较好的研究,分析它们在单句中的局部特征,在此基础上,建立了专有名词的局部特征变量之间的相互依赖关系。2.研究了专有名词在真实中文文本的互指等语篇信息,利用有效的互指消解规则,解决了专有名词名义性互指等问题,把全局信息融入系统,保证了有效地识别专有名词。3.采用

3、了基准模型与动态贝叶斯网模型相结合的方法,取长补短,充分利用了两种模型的各自优点,既保证了识别系统的效率,也保证了识别结果的准确率。4.为了提高专有名词识别效果,我们考虑了自然语言文本中的局部信息,此外更主要的是考察其语篇信息,并且针对中文文本中人名、组织机构名及地理政治名的识别,构建专有名词识别动态贝叶斯模型(DBNS)。我们把“是否某类专有名词”作为分词后中文文本的每个词的属性之一,从而把专有名词识别问题转换成一个分类问题。特别是考虑了正在识别的词与已经识别为某类专有名词的前一个词之间的一种联系等语篇信息,综合利用了随机模型和基于

4、特征推理方法的优点。我们选用山西大学中文评测语料中共230篇作为实验材料,随机抽取其中180篇用于训练动态贝叶斯模型参数,剩余的50篇用于测试,然后同Nymble模型单独识别的结果比较,我们把动态贝叶斯模型作为Nymble的补充,在略微降低了专有名词识别召回率情况下,较大地提高了准确率和F值,特别地我们应用动态贝叶斯模型消除了Nymble方法识别结果中的模糊专有名词60%的错误结果。由此可见,因为动态贝叶斯识别模型考虑r待识别词的在文本中的诸多语篇信息,弥补了只考虑局部信息的隐马尔科夫模型一--Nymble方法的局限,所以改善了专有名

5、词的识别效果。关键词:动态贝叶斯模型;专有名词:语篇信息ChinesePropernamesRecognitionBasedOnDynamicBayesianNetworkLIUJie(ComputerSoftwareandTheory)DirectedbyProf.YANGErhongABSTRACTTherecognitionofpropernamesisoneofthebasictasksonnaturallanguageprocessingresearch,beingnotperfectlygiventheendanswer.

6、Theautomaticrecognitionofpropernamesinthetextcanimprovetheefficiencyofsettingupofthelarge—scalecorpus.Inaddition,propernamesrecognitiongiveproptothenaturallanguageprocessinginthefieldofinformationextraction,questionansweringsystemandSOon.WeapplytheDynamicBayesianNetwork

7、s(DBNs)totherecognizingofpersonname,organizationnameandgeo—politicallocationappearingfrequentlyintherealtextfiles.Itoffersanelegantwaytointegratelocalandglobalinformationofcontextintoonemodel.TheeffortinthispaperincludesDohardresearchintheclassilyinginpropernames,locati

8、onfeaturesinasinglesentence,thenconstitutethelocalfeaturevarietiesanddependencyamongthem2.DoanalysistotheCO—re

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。