综合型语言知识库的建设与利用

综合型语言知识库的建设与利用

ID:6185400

大小:446.50 KB

页数:26页

时间:2017-11-14

综合型语言知识库的建设与利用_第1页
综合型语言知识库的建设与利用_第2页
综合型语言知识库的建设与利用_第3页
综合型语言知识库的建设与利用_第4页
综合型语言知识库的建设与利用_第5页
资源描述:

《综合型语言知识库的建设与利用》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、广义虚词知识库 与 汉语理解研究俞士汶朱学锋刘云北京大学计算语言学研究所Email:yusw@pku.edu.cn2007年2月1日,云南西双版纳第十一届全国少数民族语言文字信息处理学术研讨会特邀报告973课题“文本内容理解的数据基础(2004CB318102)”主要内容虚词对语言理解的影响汉语中的虚词汉语自动分析中的虚词广义虚词知识库的建设结语与致谢主要内容虚词对语言理解的影响汉语中的虚词汉语自动分析中的虚词广义虚词知识库的建设结语与致谢关于“语言”英国《新科学家》周刊2005年4月9日的文章——生命进化的十大奇迹:脑(第3项)和语言(第4项)脑常常被视作进化过程中的最高成就,因为它赋予了

2、人类一些高级特征,例如语言、智慧、意识。语言是进化的终极发明。在令人类区别于动物的特征中,语言处于核心地位。语言也许称得上是人类的决定性特征之一。我们的祖先如何实现了语言从无到有的飞跃,这也许是科学史上最大的谜。语言是生物进化的最后一笔。这是因为语言令那些掌握了它的动物超越了纯生物的范畴。语言系统是动物进化到人的两大标志之一。人类语言系统的特征:丰富的词汇、复杂的结构、虚词的作用文本内容理解与其他数字内容理解的关系婴儿学习语言离不开对母亲(包括家人)的心率、体温、声音、形象、动作的感知。人阅读文本时,语音、影像、经验对文本理解有着不可分离的巨大作用。文本中的插图对文本理解也有辅助作用。甚至一

3、张照片所讲的故事胜过千言万语。文本可以超越时空的局限准确地传达信息(口说无凭,以书为证),记录逻辑思维产生的创造性成果。戏剧、影视、歌曲等艺术形式的传情达意也离不开语言(戏文、歌词、对白)、文字的帮助。多数乐曲的标题、绘画的题词对这些艺术的理解有相当明显的启示作用。文本内容理解是其他形式的数字内容理解的子课题。 文本内容理解和其他数字形式的信息理解需要相互融合。文本内容理解的数据基础图像序列内容理解口语化语音信息的分析与识别多源感知信息的融合多媒体信息检索大规模文本内容计算凤凰卫视中文台(2005-7-29)介绍了美国的一幅漫画————一美元纸币上的华盛顿头像扭头瞧着纸币左半边的一行字:“M

4、adeinChina”,一脸无可奈何的表情。在其他信息传播形式中,言简意赅的文字往往能起到画龙点睛的作用一个实例关于自动升降晾衣架的对话妻子:“嘿,过了一年才坏。”丈夫:“什么呀,才一年就坏了。”丈夫理解了妻子的意思吗?——背景知识:保修期——知识激活机制?——虚词词义:才(数量词前后,意义不同)虚词对语义的影响主要内容虚词对语言理解的影响汉语中的虚词汉语自动分析中的虚词广义虚词知识库的建设结语与致谢虚词不是内容词,而是功能词。虚词不能充任汉语主要句法结构中的句法成分:主语、谓语、述语、宾语、补语,定语、状语、中心语。虚词对于语句、会话、篇章的完整结构(也是句法功能)和意义的表达却是不可缺少

5、的。汉语是典型的分析语,虚词在汉语中的语法作用不同于屈折语的英语、俄语和黏着语的日语。虚词研究一直是汉语语法研究的重要组成部分。虚词基本上是封闭的,词典中的虚词数量有限。2.汉语中的虚词(1)新的虚词产生的速度远远比不上新的实词。尽管词典中虚词的数量有限(静态出现),但在真实文本中单个虚词的平均频度(动态出现)远远高于单个实词的平均频度。而且虚词是通用的高频词。虚词的个性比实词显著。助词是最典型的虚词,数量很少。同属助词的“的”、“得”、“着”、“了”、“过”、“所”几乎没有什么共同的语法属性。面向语言信息处理,有必要加大对虚词研究的力度,有必要建立“广义虚词知识库”。2.汉语中的虚词(2)

6、主要内容虚词对语言理解的影响汉语中的虚词汉语自动分析中的虚词广义虚词知识库的建设结语与致谢虚词的辨析——从文本中识别虚词——分析线索神经紧张得到了崩溃的程度。神经紧张得到了缓解。汉语自动分析中的虚词(1)虚词的句法语义功能及其表述《现代汉语语法信息词典》依托词组本位语法体系《现代汉语语义词典》采用“广义配价模式”“的”接在动词后面构成的“的”字结构,体词性的,功能:(1)可以作定语修饰名词,即形成“动词+‘的’+名词”结构;(2)代替名词,即可以出现在主宾语的位置上。自指意义,只能出现于(1):“驾驶的技术”,“走的姿势”转指意义,可以出现于(2):“走的出发了”,“有吃的”。还要进一步给出

7、“动词+‘的’”表示自指或转指的条件。配价信息:“走”主体应该是人,“吃”的客体是食物。“技术”、“姿势”分别是“驾驶”、“走”这些动作或行为本身的属性,只是自指。虚词(“的”)的句法语义信息不是能够孤立描述的,同其前后搭配的词语是密切关联的。汉语自动分析中的虚词(2)虚词的隐现与冗余分配学生一个任务。接受老师一个任务。等价于给学生分配一个任务。从老师(那里)接受一个任务。“的”的作用*分配学生的一个任务。接

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。