现代汉语的句型识别试探-毕业论文 - 副本 (2).doc

现代汉语的句型识别试探-毕业论文 - 副本 (2).doc

ID:10993911

大小:239.50 KB

页数:33页

时间:2018-07-09

现代汉语的句型识别试探-毕业论文 - 副本 (2).doc_第1页
现代汉语的句型识别试探-毕业论文 - 副本 (2).doc_第2页
现代汉语的句型识别试探-毕业论文 - 副本 (2).doc_第3页
现代汉语的句型识别试探-毕业论文 - 副本 (2).doc_第4页
现代汉语的句型识别试探-毕业论文 - 副本 (2).doc_第5页
资源描述:

《现代汉语的句型识别试探-毕业论文 - 副本 (2).doc》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、现代汉语的句型识别试探本科毕业论文(科研训练、毕业设计)题目:现代汉语的句型识别试探姓名:学院:软件学院系:软件工程专业:软件工程年级:学号:指导教师(校内):职称:指导教师(校外):职称:年月日13现代汉语的句型识别试探现代汉语的句型识别试探摘要本文尝试采用自设计的词库、句型模式对合乎现代汉语规范的单句进行句型匹配,给出实验的解决方案和实验模型的测试结果和分析,并针对中文信息处理的发展现状及汉语语法特性提出期待方案。关键词 中文信息处理句型句法结构句型分析器词库13现代汉语的句型识别试探AtentativestudyofcurrentChinesesente

2、nceparsingAbstract:Theexperimentparttriestoestablishaparser,whichcanparsethesentencewhichmeasuretothesyntaxcriterionofcurrentChinese.Andthisparserwillmakeuseofserioussyntaxstatisticalrulesandalexiconeditedbymyself.Inthispaper,atfirst,itanalyzeseachfactorinfluencingtheexactnessquotie

3、ty,andthen,itgivestheexperimentmodel,offerstheexperimentresultandanalysis,andbringsforwardthemethodsofamelioration.Keywords:ChineseinformationprocessingChinesesyntaxparsingParserLexicon13现代汉语的句型识别试探目录引言5第一章影响句型识别的几个因素61.1词库61.2分词技术61.3规则统计71.4更多的语法知识的支撑81.5基于语义理解的尝试91.6解决方案101.6.1实验

4、方案101.6.2期待的解决方案10第二章词库的设计112.1名词112.2动词112.2.1一般行为动词112.2.2助动词和趋向动词122.3人称代词122.4“得、地、的”132.5兼类词问题132.6其他问题14第三章分词算法153.1逆向最大匹配法(BWW)153.2算法分析15第四章压缩句子成分164.1压缩规则164.2 压缩算法18第五章句型模式建立205.1句型归纳原则205.2实验的句型系统模式205.3规则分析23第六章仿真实验分析246.1实验246.2实验分析246.2.1测试结果统计分析246.2.2改进方法256.2.3扩展方面2

5、6结论27致谢语28[参考文献]28附录1:实验模型收录的词语集29附录2:词语属性标志标注集31附录3:测试用句3213现代汉语的句型识别试探引言  句法结构分析是中文信息处理的一个层面,当中文信息处理从早期的“字处理阶段”到“词处理阶段”的发展中,已经可以预见“句处理阶段”的到来。相较于词是“最小的能独立运用的语言单位”,句子则是“能够表达一个相对完整意思的语言单位”,因此句子分析无疑对语义理解具有重要意义。在其他众多的应用领域中,对输入文本进行句法分析恐怕是必不可少的一项处理任务。  句型是就句子整体格式来观察分析的。具体句子是数不清,但句子类型却是有限

6、。依用途或语气,句子可分陈述句、疑问句、祈使句、感叹句;依结构,句子可分作单句和复句。复句由若干分句组成,所以相较而言,单句结构比较“单位”,单句又可分为主谓句、非主谓句,其句法结构比较典型,在本文的实验部分拟就合乎现代汉语规范的单句结构进行自动分析匹配,而本文就实现思想、从底到上的实现技术以及出现的难题和期待的解决方案进行描述。13现代汉语的句型识别试探第一章影响句型识别的几个因素1.1词库没有词库,什么都无从谈起。句子一般由一组词组成,这些词根据自身的语法特性在句子中充当“主、谓、宾、定、状、补”等不同成分。所以无论进行何种层面的中文信息处理,其前提必然是

7、切出一个一个的词,然后才能谈短语或句子的句法结构,才能谈语义。而词库的建立就是“必然中”的“必须”,切词是按照词库中的词来切分句子。计算机从事句法分析所凭借的语言知识不外乎来自机器词库和句法规则。因此,词库就是做饭的“米”,有米才能做饭,米多饭才会多,否则,巧妇难为无米之炊。同时词库中词的收录是否科学、全面,词类划分是否准确、语法知识是否充分都直接影响到后续研究。1.2分词技术分词的正确率直接影响句型识别的准确率。如果输入语句未经分词处理,就无从根据句中出现的每个具体词到机器词库中去查找相应的语言知识,不知道每个具体词的词性等词汇知识也就不可能直接调用相关的句

8、法规则来正确判断短语或句子的句法结构。

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。