境外地名翻译系统研究与应用

境外地名翻译系统研究与应用

ID:42870856

大小:4.74 MB

页数:85页

时间:2019-09-20

境外地名翻译系统研究与应用_第1页
境外地名翻译系统研究与应用_第2页
境外地名翻译系统研究与应用_第3页
境外地名翻译系统研究与应用_第4页
境外地名翻译系统研究与应用_第5页
资源描述:

《境外地名翻译系统研究与应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、硕士学位论文_參I地名翻译系统研究与应用:境外^i作者姓名陈昕学校导师姓名、职称杜军朝教授企业导师姓名、职称黎明高工1申请学位类别工程硕士学校代码10701学号1503321751分类号TP39密级公开西安电子科技大学硕士学位论文境外地名翻译系统研究与应用作者姓名:陈昕领域:计算机技术学位类别:工程硕士学校导师姓名、职称:杜军朝教授企业导师姓名、职称:黎恒明高工学院:计算机学院提交日期:2018年5月ResearchandApplicationonForeignGeogr

2、aphicalNameTranslationSystemAthesissubmittedtoXIDIANUNIVERSITYinpartialfulfillmentoftherequirementsforthedegreeofMasterinComputerTechnologyByJackChenSupervisor:DuJunChaoTitle:ProfessorSupervisor:LiHengMingTitle:SeniorEngineerMay2018西安电子科技大学学位论文独创性(或创

3、新性)声明秉承学校严谨的学风和优良的科学道德,本人声明所呈交的论文是我个人在导师指导下进行的研宄工作及取得的研宄成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不包含其他人己经发表或撰写过的研究成果;也不包含为获得西安电子科技大学或其它教育机构的学位或证书而使用过的材料一同工。与我作的同事对本研究所做的任何贡献均己在论文中作了明确的说明并表示了谢意。一学位论文若有不实之处,本人承担切法律责任。>乙本人签名:日期:滅-,_%^1西安电子科技大

4、学关于论文使用授权的说明?本人完全了解西安电子科技大学有关保留和使用学位论文的规定.,即研宂生在校攻读学位期间论文工作的知识产权属于西安电子科技大学。学校有权保留送交论文、的复印件,允许查阅借阅论文;学校可以公布论文的全部或部分内容,允许釆用影印、缩印或其它复制手段保存论文。同时本人保证,结合学位论文研究成果完成的论文、发明专利等成果,署名单位为西安电子科技大学。保密的学位论文在年解密后适用本授权书。_::本人签名^___导师签名i6J日期:jnff.

5、日期:摘要摘要地名是国家基础地理信息的重要组成部分,在人们的日常生活中起到了重要的作用。对于政府而言,国家间、地区间的政治交往、文化交流、经济交易都离不开地名数据的支撑。对于军方而言,准确、全面的全球地名信息,对于维护国家主权、保障国家安全、提升国防实力具有重要的现实意义和深远的战略意义。随着科学技术的飞速发展,国家间、地区间的交流日益频繁,我国建立全球地名数据库的需求也日益迫切。但是目前我国在境外地名数据的获取和译写方面相对滞后。其根本原因在于技术手段的落后。因此,本文主要在境外地名数据的获

6、取和译写方面进行了研究。首先,笔者搜集并对比分析了境外主流地名数据库中数据的内容和格式,建立了外国地物属性与我国《基础地理信息要素分类与代码》(国标)的对应关系,通过FME软件对不同数据源的数据进行了数据的融合、去重等数据改化工作。形成了一套完整的格式统一的待翻译全球地名数据源。其次,对境外地名翻译的相关理论和地名专名音译进行了深入研究。抽象出地名翻译特别是专名音译的作业流程。通过对语言专家经验知识的总结,实现了地名音节的初步划分。根据实验测算,经过初步划分后可以减少约70%的数据库查询次数,极大的

7、提高了效率。通过借鉴中文分词算法中的双向匹配算法和统计分词思想,实现了专名音译并提取出了一些辅助切分规则,这些规则可以对专家经验知识进行补充,进一步提高了音节划分的准确率。最后,笔者通过编程开发出了一款多国家、多语种的地名翻译软件。目前该软件已经实现了14种语言的罗马化(或原文)地名翻译功能,且已预留好了接口,方便新语种的接入。通过对部分语种1万个标准地名数据的测试,笔者发现了一些共性问题并加以改进,使得翻译正确率有所提高。印地语地名的正确率由83.7%提高到了97.6%,缅甸语地名的正确率由72.

8、4%提高到了89.8%,均高于人工翻译水平。可以说该软件的研发使得大规模、工程化的地名生产成为可能,也为建立全球地名数据库奠定了基础。目前,我们已经使用该软件完成了数据源中印度全境地名翻译,约55万条,缅甸全境地名翻译,约5万条的译写工作,经过审核验收,该批次数据已导入全球地名数据库中,使得全球地名数据库中的地名数据得到极大的丰富。关键词:多语种,地名翻译,音节划分,地名数据库,双向匹配IABSTRACTABSTRACTPlacenameisanimportantpa

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。