专利文献的检索工具(系统) 能自动翻译专利文献的翻译系统.docx

专利文献的检索工具(系统) 能自动翻译专利文献的翻译系统.docx

ID:57790159

大小:9.96 KB

页数:4页

时间:2020-03-27

专利文献的检索工具(系统) 能自动翻译专利文献的翻译系统.docx_第1页
专利文献的检索工具(系统) 能自动翻译专利文献的翻译系统.docx_第2页
专利文献的检索工具(系统) 能自动翻译专利文献的翻译系统.docx_第3页
专利文献的检索工具(系统) 能自动翻译专利文献的翻译系统.docx_第4页
资源描述:

《专利文献的检索工具(系统) 能自动翻译专利文献的翻译系统.docx》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、专利文献的检索工具(系统)能自动翻译专利文献的翻译系统  本文介绍了一个面向专利文献翻译的、实用的汉英机器翻译系统,包括系统的总体设计、系统中使用的主要翻译技术等。  随着我国对知识产权认识的不断提高以及国际交流的迫切需要,传统的由专利翻译人员进行手工翻译的方式已经不能满足目前急剧增长的专利文献翻译需求,一定程度上阻碍了我国专利技术的推广和交流。机器自动翻译和辅助翻译正是解决这一问题的有效途径。近年来机器翻译技术取得了很大的突破,特别是统计机器翻译技术的发展,使得翻译质量有了很大的提高,为专利文献翻译提供了新的有力的手段。    专利文献翻译的特点    相对于普通文本的翻

2、译来说,专利文献翻译具有以下特点:  ●涉及的专业领域多。专利文献具有很强的领域特性,直接利用现有的通用翻译软件很难得到理想的翻译结果。不过专利文献所属的领域可以根据国际专利分类号划分,相对比较清楚。同时,专利翻译经过多年的积累,比较容易获得特定领域的双语平行语料库(ParallelCorpus),这对机器翻译的语料收集和语料的领域划分提供了方便。  ●使用的专业术语和法律术语多。专利文献中包含大量的专业术语和法律术语,因此对译员的综合素质要求很高。相应的,专利翻译所需支付的报酬也非常高。举例来说,在国外将本国语言译成外文所支付的翻译费大约在每100个源词30~50美元。对

3、一些比较罕见的语种,翻译服务的价格还会更高。因此利用自动翻译或辅助翻译解决专业术语和法律术语的翻译问题,可以大大降低专利翻译的成本。  ●翻译的语言种类多。由于专利文献具有一定的国别特性,因此专利文献往往需要实现不同语言之间的翻译。如果每种语言翻译方向都建立一个翻译系统则需要大量的开发成本。因此,使用语言无关性好的翻译技术是比较合理的选择。  ●文献形式规范、语言严谨。专利文献具有一定的法律文件特性,因此相对于新闻或口语翻译,文本的格式比较固定,用语也较为规范。专利文献中经常包含一些固定句型,即俗称的“句套子”,如“本发明的目的是X”,“权力要求N所述的X,其特征是Y”,其

4、中X、Y可以是任意词语或句子,N是任意数词组合。这些句型模板适合机器的自动翻译。  通过分析专利文献的上述特点可以看出,对于形式比较规范、领域比较确定的专利翻译而言,使用机器翻译方法是有可能取得较好的翻译效果的。特别是最近快速发展的统计机器翻译技术,具有语言无关性好、领域可移植性好、知识获取方便、开发周期短等特点,非常适合用于构建专利文献翻译系统。  中科院计算所多语言交互技术实验室在机器翻译方面有着多年的研究经验,近年来在统计机器翻译方面的研究取得了很好的成绩。而北京东方灵盾科技有限公司对专利文献翻译有巨大需求,希望借助于自动翻译软件进一步提高翻译质量和翻译效率。受东方灵

5、盾科技有限公司委托,计算所研究人员利用多语言交互实验室已经积累的统计机器翻译技术,结合专利文献翻译的特点,设计并实现了一个特定领域的汉英专利文献翻译系统。该系统目前的翻译领域为传统中药专利文献。由于采用了以统计为主的机器翻译技术,该系统可以很容易地移植到其他技术领域的专利翻译。    系统总体设计    为了方便大规模、多用户、并发执行的任务需求,本系统采用了服务器/客户端的网络服务模式,并采用多线程调度。系统的物理结构和逻辑流程如下:  1.物理结构  汉英专利文献机器翻译系统的物理结构由两部分组成,包括:  ●翻译引擎服务器:负责提供翻译服务,管理翻译资源。  ●客户端

6、:负责向用户呈现翻译结果,提供辅助翻译工具,将用户请求提交给服务器。  其中,服务器端主要放置翻译核心解码器及其所需的各种资源,如短语表、语言模型、模板库、词典、记忆库等。服务器端对这些资源进行统一管理,合理调度,同时服务器端负责各用户线程的调度与时间片分配,协调各用户提交的任务的优先级。  客户端又分为普通用户客户端和管理员用户客户端,不同的用户具有不同的权限。客户端提供方便的用户编辑、修改界面,同时提供给用户查看任务状态及服务器状态的功能,并能对服务器上的部分资源进行实时访问和修改,通过客户端,用户能够方便地批量上传文件进行翻译,并可以对返回的结果进行修改、重新提交翻译

7、、批量导出翻译结果等。  服务器和客户端两部分均为可独立运行的进程,通过网络实现互相连接。  2.逻辑流程    系统逻辑结构是系统的整体业务框架,它描述了从数据输入,经过系统的内部处理得到期望结果,一直到最后输出的全过程(本系统的逻辑流程参考图见图1)。  具体来说,该系统的主要流程描述如下:  ●翻译服务:负责翻译用户提交的句子或文本文件,输出翻译结果。翻译过程中会调用记忆库管理程序、词典管理程序、模板库管理程序,还要访问统计翻译模型库。  ●记忆库管理:负责组织、管理记忆库,执行翻译实例的查询、添加、修改、删

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。