GBT26235-2010-信息技术信息处理用蒙古文词语标记.pdf

GBT26235-2010-信息技术信息处理用蒙古文词语标记.pdf

ID:32046711

大小:290.50 KB

页数:16页

时间:2019-01-31

GBT26235-2010-信息技术信息处理用蒙古文词语标记.pdf_第1页
GBT26235-2010-信息技术信息处理用蒙古文词语标记.pdf_第2页
GBT26235-2010-信息技术信息处理用蒙古文词语标记.pdf_第3页
GBT26235-2010-信息技术信息处理用蒙古文词语标记.pdf_第4页
GBT26235-2010-信息技术信息处理用蒙古文词语标记.pdf_第5页
资源描述:

《GBT26235-2010-信息技术信息处理用蒙古文词语标记.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、ICS35.040L71圆亘中华人民共和国国家标准GB/T26235--2010信息技术信息处理用蒙古文词语标记Informationtechnology--Mongolianwordandexpressionmarksforinformationprocessing2011—01-14发布2011-05-01实施宰瞀鹳鬻瓣警糌瞥星发布中国国家标准化管理委员会促19前言⋯⋯⋯⋯⋯⋯⋯⋯⋯1范围⋯⋯⋯⋯⋯⋯⋯·2术语和定义⋯·⋯⋯⋯3标记的范围⋯⋯⋯····4标记的级别及命名方法5词语标记代码⋯⋯⋯·目次GB/T26235--2010刖罱GB/T26235-

2、-2010本标准是依据《现代蒙古语}(1964)等语法著作为基础,规定了信息处理用的蒙古文词语标记。本标准由全国信息技术标准化技术委员会提出并归口。本标准起草单位:中国电子技术标准化研究所、内蒙古大学、内蒙古师范大学、内蒙古教育出版社、内蒙古自治区蒙古语文工作委员会、北京北大方正电子有限公司、潍坊北大青鸟华光照排有限公司。本标准起草人:那顺乌日图、何正安、青格乐图、确精扎布、六十三、淑琴、贺喜格都仁、唐英敏、吕建春、阿荣塔娜。Ⅲ信息技术信息处理用蒙古文词语标记GB/T26235--20101范围本标准规定了信息处理用蒙古文词语标记,只包括某种语文现象或单位

3、的标记符号。本标准适用于蒙古文的各种语料库、词汇集~词典、语文知识库等。2术语和定义下列术语和定义适用于本标准。2.1蒙古文信息处理Mongolianinformationprocessing用计算机对蒙古文形、音、义等信息进行输入、排序、存储、输出、统计、提取等。2.2标记单位taggingunit蒙古文信息处理中使用的词汇、词法、正字法及其他单位,如单词、复合词、固定词、习用语、成语、缩略语、构形附加成分、连接元音、字母、数字、标点符号等。2.3词类wordclass词的语法分类,根据词法形态、句法功能、语义特征划分出来的类。2.4不确定词ambigu

4、ousword无法确定词性的词或词素,包括:a)无法确定词性的同形兼类词(如没有上下文环境的形式);b)不能单独使用的复合词成分,如fiy(ilyolan),tomsi(tog—atomsifigey),say(gajarsayfigey),xu(XUluubang);c)形容词最高级形式:ub(ubulagan),xab(xabxar—a)等。2.5复合词compoundword由两个实词(有时也包括辅助意义的词)组成,语法和词汇上都构成一个单位的固定短语。2.6固定词fixedword由一个实词和一个虚词组成,连用成型且未转义的固定短语。2.7习用语h

5、abitualusage由一个转义形容词和一个实词组成,主谓结构且表达一个词汇意义的固定短语。2.8成语idiom由3个或3个以上词组成,充当一个句子成分的固定短语。2.9缩略语abbreviation专有名词或常用语的简略形式。】GB/T26235--20102.10构形附加成分morphologicalforms只增加语法意义的词法形态。2.11连接元音connectivevowel辅音结尾的词干后,加接以“S,G,N,M,R,L,Y”辅音开头的附加成分时,词干后增加的元音或音节。2.12标记tag对文本中标记单位的类别进行标注的代码。3标记的范围本标

6、准包括词类、复合词、固定词、习用语、成语、缩略语、构形附加成分、连接元音、字母、数字、标点符号等的标记。4标记的级别及命名方法4.1第一级标记的命名方法用大写英文字母标记第一级。如:A(来自adjective):形容词S(来自sula):语气词4.2第二级标记的命名方法用小写英文字母标记第二级。如:Qn(来自noun):名量词Qc(来自Lag):时间量词Qv(来自verb):动量词4.3第三级标记的命名方法用数字标记第三级。如:Fa0:形容词级附加成分的原级Fal:形容词级附加成分的比较级4.4第四级标记的命名方法用数字标记第四级。如:Fall:形容词级附

7、加成分的比较级1Fal2:形容词级附加成分的比较级25词语标记代码本词语标记代码分为词类标记代码、构形附加成分标记代码、其他标记代码。以下是词语标记内容。注:表中右上角的数字表示该项所包含的附加成分或连接元音数n代表与词干分写的附加成分...:代表任意成分。为了简化分类,将。动态词尾”放在“连接元音”部分。5.1词类标记代码词类标记代码见表1。2表1词类标记代码GB/T26235--2010标记代码序号语文现象/单位词类名称代码说明第一级第二级第三级lN名词2Ne普通名词eng3siregeNel可数名词4Ne2不可数名词5Nt专有名词6batusiixe

8、Ntl人名7Nt2地名86bormonggol—ilnyexesu

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。