欢迎来到天天文库
浏览记录
ID:33334084
大小:238.28 KB
页数:6页
时间:2019-02-24
《单词型术语的结构自动分析》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、载《中国科技术语》,2009年,第3期,Vol.11,No.3单词型术语的结构自动分析冯志伟摘要:本文根据计算术语学的原理,使用有限状态转移网络对单词型术语进行自动分析。首先以英语术语为例,介绍了有限状态转移网络的基本原理和分析过程,然后,分别讨论了德语、法语和汉语的单词型术语的自动分析问题,最后讨论了分析结果的形式表示方法。关键词:计算术语学,有限状态转移网络,自动词法分析,Automaticanalysisofsingle-wordtermstructureFENGZhiweiAbstract:Basedonfundamen
2、talprincipleofcomputationalterminology,theauthorautomaticallyanalyzesthesingle-wordtermsbytheFiniteStateTransitionNetwork(FSTN).Inthispaper,thebasicprinciplesandanalysisprocessofFSTNareintroducedinexamplesofEnglishterms,thentheautomaticanalysisofGerman,FrenchandChine
3、sesingle-wordtermsarediscussed,lastlytheformalexpressionofanalysisresultisalsodiscussed.Keywords:computationalterminology,FiniteStateTransitionNetwork(FSTN),automaticmorphologicalanalysis.1998年的计算语言学国际会议COLING-ACL’98上,组织了世界上第一次计算术语学的讨论会(FirstWorkshoponComputationalTe
4、rminology),这次讨论会首次使用的“计算术语学”这个学科名称。从此在术语学的研究中,明确地引进了自然语言处理(Natural①LanguageProcessing,简称NLP)的方法和技术,出现了“计算术语学”(computationalterminology)这样的学科。冯志伟在1997年的术语学与知识转播国际会议上发表的《日语形态的有限状态转移网②络分析》一文,是我国学者最早的研究计算术语学的论文,可是当时并没有引起我国术语学界的关注,在我国术语学研究中,几乎还没有其他的文章专门讨论过计算术语学的问题,本文根据计算术
5、语学近年来的新发展,介绍计算术语学中单词型术语的结构自动分析方法,希望我国术语学工作者能够关注计算术语学这个新兴领域的研究,以推动我国术语学研究现代化的进程。单词型术语结构分析的目的是让计算机知道单词型术语的结构,并且把与该术语有关的①D.Bourigault,Ch.Jacquemin,Marie-ClaudeL’Homme,RecentAdvancesinComputationalTerminology,JohnBenjaminsPublishingCompany,2001.②冯志伟,日语形态的有限状态转移网络分析,《术语学与
6、知识转播国际会议论文集》,1997年,北京。语言学信息(主要是形态信息)自动地加在该术语上,为术语进一步的自动处理做好准备。③这是计算术语学最为基础的工作。单词型术语是由一个单词构成的,其中仅仅包含一个单词。一般地说,单词可以由词根、词缀和词尾构成,词根和词缀可以组成词干,词根后面也可以没有后缀而单独成为词干,在这种情况下,为了表述上的方便,我们就直接简单地把它叫做词干。这样,我们就可以用如下的“有限状态转移网络”(FiniteStateTransitionNetwork,简称FSTN)来表示一个单词的④词法分析过程。图1用限状
7、态转移网络作词法分析在图中,如果一个单词只包含词干(这时词干也就是词根),则其遍历过程是:q0→qf.如英语的form(“形式”)。如果一个单词包含前缀、词干,则其遍历过程是:q0→q0→qf.如英语的reform(“改革”,re-是前缀,form是词干)。如果一个单词包含词根、后缀,则其遍历过程是:q0→q1→qf.如英语的formation(“形成”,form是词根,-ation是后缀)。如果一个单词包含前缀、词根、后缀,则其遍历过程是:q0→q0→q1→qf.如英语的reformation(“革新”,re-是前缀,form
8、是词根,-ation是后缀)。如果一个单词包含词干、词尾,则其遍历过程是:q0→q2→qf,如英语的forms(form是词干,-s是词尾)。如果一个单词包含前缀、词干、词尾,则其遍历过程是:q0→q0→q2→qf.如英语的formations(form是词根,
此文档下载收益归作者所有