欢迎来到天天文库
浏览记录
ID:35013318
大小:8.34 MB
页数:85页
时间:2019-03-16
《基于《说不完的故事》语料库的藏文短语分析研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、分类号:10密级:公开馨《;*乂赛硕±学位论文姪目:基于《说不完的故事》语料库的巧文短语分析研究荀巧勺游叙’钱:5琴y带甲|。气p气巧巧《:且正才让学号:Y121740427学院:中国民族倍度技术研究院专业:中困少数民巧巧曾文学____研究方向:巧文信底处理导师:多杰妻玛f曲教巧)二0—五年五月studyonT化et;anPhrasesin化eCorusofp《The及odTales》yAThesisSubmittedforthe
2、DegreeofMasterCandidate:DanzhengcairangSupervisor:Prof.DuojiezhuomaNorthwestUnivershyforNationa化iesLanzhou,China摘要要让计算机来识别藏文短语则首要的条件是人类先要找出藏文短语的语法,规则。凭借着这些规则从真实语料当中找到并提取和分析藏文短语送样才能计,_算机识别藏文短语。藏族经典民间文学《说不完的故事》中的序言及十一篇短片故事集作为本文的语料采用多拉教授的藏文词性标
3、记集为标注依据藏语语法对短语的理论,,议前提选定藏文句子并应用直接成分法对语輯中的藏文短语进行乂工括号标注。这些序言及其十一篇短片故事集中共有7777个藏文短语分巧九个类型,分别为名词短语、动词短语、形容词短语、数量短语、副词性短语、时间性短语、特殊短语、滾语和习语。送些藏文短语从计量、模型、内部结构、外部结构、,句法成分语义角色等六个方面进行分析终建立了藏文短语的信息库。,,最本信息库中的1657个名词短语按结构模型分为六种结构模型按内部结,;构分为主格结构、主虚结构、宾格结构、同位结构、并列结构、中定结构和复指结构;
4、按外部结构分为名词性短语和准名词性短语,在句子里充当主语和宾语。其中包含的4270个动词短语按结构模型分为五种结构模型;按内部结构分为状中结构、宾动结构、主谓结构、并列结构和中补结构按外部结构分为动词性短:语和准动词性短语在句子里充当谓语。包含的347个形容词短语按结构模型,分为八种结构模型按内部结构分为状中结构、宾动结构、主谓结构、并列结构、;中补结构和中定结构按外部结构分为动词性短语、形容词性短语和名词性短语,;在句子可切充当主语、谓语和宾语。包含的656个数量短语按结构模型分为六种结构模型按内部结构分为并列结构和中定结
5、构按外部结构分为数量性短语;:和名词性短语。包含的287个副词性短语按结构模型分为八种结构模型按内:部结构分为状格结构和并列结构在句子里充当状语。包急的316个时间性短,语按结构模型分为十种结构模型按内部结构分为复指结构、定中结构和中定结:构,在句子里充当时间状语。包含的201个特殊短语,按结构模型分为四种结构模型,其余包含了16个请语和27个习语。关键词:藏文短语信息库说不完的巧事藏文信息处理IAbstractT*ranobearereuiskefor化ecornutors化ieco打ize化
6、eT化etanhsesisbasedopqpphumanbeinsunderta打dtherammarrulesofT化etanpharses.Then化eserulesggdependonhowtoextractandanalzeinrealcorusamong化eta打hrases:ypTpTherefaceandelevenshortseriesfromT化eta扫classicfb化化eratureof《<Thep,BodyTales?areasmc
7、orus.Firs讨,IusedrofessorDuoLasspeechtaintoypypgggtag化ecorpus.Thenselected了化etansente打cesappliedimmediateCO打stituentstobrackettheTibetanhrasesband.pyhThereare7777T化etanhrasesm化isrefaceandelevenshortstories.Thosepp了化etanhrasesdevidedi
8、nninecaterories.Thearenounhrases,verbphras
此文档下载收益归作者所有