齐普夫定律在中文短语知识中的呈现-论文.pdf

齐普夫定律在中文短语知识中的呈现-论文.pdf

ID:55606210

大小:787.66 KB

页数:12页

时间:2020-05-20

齐普夫定律在中文短语知识中的呈现-论文.pdf_第1页
齐普夫定律在中文短语知识中的呈现-论文.pdf_第2页
齐普夫定律在中文短语知识中的呈现-论文.pdf_第3页
齐普夫定律在中文短语知识中的呈现-论文.pdf_第4页
齐普夫定律在中文短语知识中的呈现-论文.pdf_第5页
资源描述:

《齐普夫定律在中文短语知识中的呈现-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、JOURNALOFTHECHINASOCIETYFORSCIENTIFIC情报学报ISSN1000—0135ANDTECHNICALINFORMATIONISSN10(】0—0135第33卷第1期11—22,2014年1月Vo1.33No.1,11—22January2014doi:10.3772/j.issn.1000-0135.2014.01.002齐普夫定律在中文短语知识中的呈现谢靖陈静王东波(1.南京中医药大学经贸管理学院信息管理系,南京210046;2.南京大学信息管理学院,南京210093、南京医科大学图书馆,南京210029;3.南京农业大

2、学信息科学技术学院,南京210095)摘要本文对大规模汉语短语树库中的短语直接成分进行了抽取,在统计各短语结构直接成分频次的基础上排序,并进行短语成分的齐普夫定律验证。实验由局部及整体两部分组成:在局部实验中,对单一短语直接成分进行齐普夫定律验证;在整体实验中,对全部短语直接成分进行齐普夫定律验证。实验结果表明,在汉语短语树库中,短语的直接成分分布符合齐普夫定律。这个现象表明,从计量角度而言,汉语短语具有其内核知识,并以内核为基础在最省力原则下对不同语境进行派生,这种派生首先要围绕语法内核知识进行构建,同时又要根据不同语境进行拓展。本研究一方面实现了面向

3、短语层次的语法知识抽取,从计量角度揭示了汉语短语构成的分布规律;另一方面对于中文信息处理中的短语识别、自动句法分析等研究提供短语基础知识支持,这些知识最终可应用于术语短语识别、自动标引、知识抽取、语义分析等研究。关键词齐普夫定律汉语短语构建直接成分分析汉语短语知识汉语树库最省力法则Zipf’SLawinChinesePhrasesXieJing。ChenJingandWangDongbo(1.SchoolofEconomicsandManagement,ⅣⅡ蛳ngUniversityofChineseMedicine,』\,口njing210046;2.

4、LibraryofNanfingMedicalUniversity,Nanjing210029;SchoolofInformationManagement,NanjingUnivers,Nanjing210093;3.CollegeofInformationScience&Technology.NanjingAgriculturalUniversity,Nanjlng210095)AbstractThepaperextractsimmediateconstituentsofChinesephrasesbasedonlarge—scaleChinesetr

5、eebank,TsinghuaChineseTreebankandPennChineseTreebank.Afterarrangingimmediateconstituentssequencesaccordingtotheirranks,wetakelocalandglobaltestsaboutZipf'sLaw.IntwoChinesetreebanks,thephenomenonofZip~sLawisapparentlyarrested.Fromthepointofviewofquantitativelinguistics,thepaperpro

6、vesthateachofChinesephraseshasacoreconceptofinter-relationshipamongvariousderivations.ThesederivationsshouldreflectthecoreconceptandthencouldbeextendedindifferentcontextaccordingtOZipf~PrincipleofLeastEffort.Ontheonehand,thediscoveryinthispaperrevealsthedistributionofChinesephras

7、e’Ssyntacticconstituentsbyextractingsyntacticalknowledgeonphraseleve1.Ontheotherhand,thisdiscoverywillhaveflstronginfluenceontheresearchesinChineseinformationprocessing,suchasauto—identificationofChinesephrase,automaticsyntacticanalysis,andSOon.Thephraseknowledgecouldbeappliedto收

8、稿日期:2013年5月24日作者简介:谢靖,男,1981年生,江苏徐州人。毕业于

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。