欢迎来到天天文库
浏览记录
ID:35087207
大小:5.77 MB
页数:60页
时间:2019-03-17
《汉语词法分析平台的构建》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、I乂玉键又大'爹D化IANUNIVERSITYOFTECHNOLOGYI福损±享恆巧文MASTE民ALDISSERTATION鐵汉语词法分析平台的构建工程领域算机技术计作者姓名叶子语指导教师_____黄_整根__教擾2〇1660答辩日期______^M_专业学位硕±学位论文汉语词法分析平台的构建Theconstrue村onofChineselexicalanalysislatformp作者姓名:叶子语工
2、程领域;计算机技术学号;31409075指导教师:黄德根教授完成日期:2016年6月1日夫金巧义夫#DalianUniversityofTechnology大连理工大学学位论文独创性声明作者郑重声明:所呈交的学位论义,是本人在导师的指导下进行研究工作所取得的成果。尽我所知,除文中邑经注明引用内容和致谢的地方外,本论文不包含其他个人或集体己经发表的研究成果,也不包含其他己申请学位或其他用途使用过的成果一。与我同工作的同志对本研究所做的贡献均&在论文中
3、做了明确的说明并表示了谢意。若有不实之处,本人愿意承担相关法律责任。、*、^技学位论文题目:足為^1矣多右片:^>司乎|^o'■^A作者签名:ih日期=g年月心日大连理工大学专业学位硕±学位论文摘要随着现代化信息技术的不断发展,计算机的数量快速增加,互联网内的信息量极速一。膨胀,计算机技术已经和人们的日常生活息息相关自然语言处理是计算机科学领域个重要的研巧课题,它的研究对象是人们日常使用的语言,通过对自然语言的研巧和处理,实现自然语言和计算机之间的互相理解
4、和正常通信。一个重要的问题词法分析是自然语言处理领域,大部分机器翻译的问题都需要进行。,而、资词法分析目前,对于词法分析的研巧和实现大都局限在实验层次办公移动化一源共享化的互联网环境决定了个在线共享的实用性平台更具有现实意义。互联网上也一己经出现了些实用性的词法分析平台,能够实现基本的分词和词性标注的功能,但由、法为今后的相关性研究工作提供支持。于源码不可修改词性标注集不同等原因,无一本文在实验室研究的基础上,独立开发了个,结合实验室的分词和词性标注源码。在平台中,,词法分析的
5、平台,加入了人工干预的部分用户可W对分词结果进行修正系统会定时地启动线程对修正的结果扫描,找到修正结果中含有的新词用来扩充新词词,典。对于每个用户,将需要暂时,还可W申请临时词典使用的新词添加到临时词典中性地自定义分词结果。用户在提交分词请求的时候,可W选择原始分词、使用新词词典分词和使用临时词典分词等多种分词方式。词性标注方面,用户可对句直接标注,也可W使用分词的结果进行标注,修正的词性标注的结果也可W为今后的标注效果的提高提供数据依据。,本文通过小概率事件置入的规则,弥补了统计方法
6、上的局限性使得统计和规则更。平台中还加入了权限管理、工具下载和工好地融合,接口的公开化也方便了功能调用作量统计等模块,后台服务器开发选用口EE的SSM框架,数据库采用MySQL,服务器环境Ubuntu。关键词:词法分析;新词词典;用户词;人工干预典--I.汉语词法分析平台的构建TheconstructionofChineselexicalanalysisplatformAbstractWith比erapiddevelopmentofmodemi
7、nformation1;echnology,thenumberofcomputersandtheamountofinformationintiheIrUernetarebothincreasingraidl.Comut:er1:echnolopypgy'hasbeencloselrelat;edtoeolesdailylife.NLPnaturallanuaerocessinisanypp(ggpg)'iorta打tresearchto
8、ilmppicn化efiedofCompu化rScienceitsresearchobectiseolesnatural,jpplanuae.Throuhtheresearchandrocessinon打aturalualizethenolggpglangaerermagg,^imuldtll.communcationandtuaund
此文档下载收益归作者所有