汉语句法树库检索系统的设计与实现

汉语句法树库检索系统的设计与实现

ID:38164008

大小:247.13 KB

页数:3页

时间:2019-05-29

汉语句法树库检索系统的设计与实现_第1页
汉语句法树库检索系统的设计与实现_第2页
汉语句法树库检索系统的设计与实现_第3页
资源描述:

《汉语句法树库检索系统的设计与实现》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、·12·(总694)汉语句法树库检索系统的设计与实现2006年文章编号:100325850(2006)1120012203汉语句法树库检索系统的设计与实现DesignandRealizationoftheChineseSyntaxTreebankRetrievalSystem魏善德郑家恒(山西大学计算机与信息技术学院太原030006)【摘要】句法树库是一项重要资源,它能为汉语语言研究和信息处理提供一个有利的数据平台。汉语句法树库检索的实现用到了流操作和GDI+图形操作。汉语句法库检索系统是基于句法树库

2、的应用系统,提供了对句法树库的检索和统计,并且能够根据树库中的合法语句画出该语句的树状结构图,进而使用户对语句的句法结构有一个形象、直观的了解。【关键词】句法树库,短语功能,短语结构中图分类号:TP311.52文献标识码:AABSTRACTTheSyntaxTreebankisakindofimportantresources,whichcanprovideanadvantageousdataplatformforlanguageresearchandinformationprocessingofCh

3、inese.TherealizationofChineseSyntaxTreebankretrievalsystemwillusestechnologiesofStreamandGDI+.TheChineseSyntaxTreebankretrievalsystemisanapplicationsystembasedonSyntaxTreebank,whichofferssearchandstatisticstotheSyntaxTreebank,andcandrawthedendriformstru

4、cturechartfollowingthelegitimatesentenceoftheTreebank,andthenenabletheusertohaveavivid,intuitionistunderstandingofthesentencestructure.KEYWORDSSyntaxTreebank,phrasestructure,phrasefunction句法标注作为分词、词性标注和语义标注的中间系统设计为三个功环节,有着承上启下的重要作用。一个好的句法树库将能模块:为下一步的语义标

5、注工作打下良好基础。句法树库蕴●检索模块:根涵丰富的句法信息,它为研究者提供带有句法标记的据用户给定的检索汉语真实文本素材,使之能够从中获得有关句法的各条件从树库中检索种信息。句法树库还可以进行数据统计、例句抽取等工出符合条件的所有作,为汉语语言学、计算语言学等领域的研究提供便利语句。●统计模块:对条件。指定的句法树库进目前,人们对汉语句法树库的研究侧重于句法的行短语统计及错误分析,对已有的句法树库的利用研究报道不多。本文阐统计。述的汉语句法树库检索系统是基于句法树库的应用系●句法树显示模块:根据用户

6、选择的语句,画出该统。检索功能使得研究者可以从短语功能或结构入手,语句的树状图即句法树。考察某一特定类型短语的内部构造模式。统计功能可本系统的系统层次如图1所示。以提供有关各短语功能或短语结构的出现次数和频率。句法树显示模块可以为汉语语言学习者提供语句2检索功能的实现的句法树,能够使学习者对语句的句法结构有一个形检索模块提供对句法树库所在目录的选择功能。象、直观的了解。在选择了检索目录后,用户就可以根据需要选择短语1系统的设计功能检索、短语结构检索和词语检索三种方式中的任何一种进行检索。三种检索方式所

7、调用的检索函数是汉语句法树库检索系统是一个基于句法树库而设同一个函数的,只需将需要检索的短语标记或词语当计的系统,它包括检索、统计、句法树显示三个模块。本作字符串参数传递给检索函数即可。系统使用的句法树库为国家语言应用研究所提供。本检索算法的步骤如下:32006206229收到,2006209201改回33基金项目:国家自然科学基金(60473139)项目;山西省自然科学基金(20051034)项目资助。333魏善德,男,1984年生,在读硕士,研究方向:中文信息处理;郑家恒,女,1948年生,教授,

8、博士生导师,研究方向:中文信息处理。第19卷第11期电脑开发与应用(总695)·13·①判断句法树库目录sPath是否存在,如果不存点是词语和短语功能标记的定位问题,以及短语间的在执行12,否则执行2;②算法初始化i=0,found=层次划分问题。false,将需要查找的字符串赋值给ttf;③根据sPath标准的句法树库例句如下:查找出sPath目录下的所有文本文件名称,放入数组①[BH[ZW肖邦önh[ZZ[ZC愤慨öa地öu]DPsFiles中;④读

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。