基于xml的汉语框架网的语义表示与实现

基于xml的汉语框架网的语义表示与实现

ID:23477582

大小:51.00 KB

页数:6页

时间:2018-11-07

基于xml的汉语框架网的语义表示与实现_第1页
基于xml的汉语框架网的语义表示与实现_第2页
基于xml的汉语框架网的语义表示与实现_第3页
基于xml的汉语框架网的语义表示与实现_第4页
基于xml的汉语框架网的语义表示与实现_第5页
资源描述:

《基于xml的汉语框架网的语义表示与实现》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、基于XML的汉语框架网的语义表示与实现第一章引言1.1研究背景及意义汉语框架语义知识库Fillmore的框架语义学作为理论基础,FrameNetm为参照,以汉语语料事实为依据的供计算机使用的汉语词汇语义数据库。CFN主要是由框架库、句子库和词元库所构成的。目前构建了323个汉语框架,渉及3947个词元,标注了20000条句子,为计算机进行汉语框架语义分析及其应用研巧提供了宝贵的汉语语义资源[2]。如何有效的对汉语框架网[M]的资源进行知识表示,是实现其应用价值的关键所在。本文使用可扩展标记语言(XML)来表示CFN资源数据,提供统一的

2、描述方法,实现机器自动高效读取,同时XML语言又方便展示为适合人类阅读和理解的网页,送些都为后续研究及相关语义辅助工具的应用提供帮助。.........1.2国内外研究现状目前自动问答系统是自然语言处理的一个热点,它需要依赖大量的语义知识来进行语言的语义表示,因此上世纪80年,人们开始致力于构架语义资源知识工程,国内外较著名的有FrameNet、以ordNet、知网、语言技术平台(LanguageTenologyat  基于XML的汉语框架网的语义表示与实现第一章引言1.1研究背景及意义汉语框架语义知识库Fillmore的框架语义学作

3、为理论基础,FrameNetm为参照,以汉语语料事实为依据的供计算机使用的汉语词汇语义数据库。CFN主要是由框架库、句子库和词元库所构成的。目前构建了323个汉语框架,渉及3947个词元,标注了20000条句子,为计算机进行汉语框架语义分析及其应用研巧提供了宝贵的汉语语义资源[2]。如何有效的对汉语框架网[M]的资源进行知识表示,是实现其应用价值的关键所在。本文使用可扩展标记语言(XML)来表示CFN资源数据,提供统一的描述方法,实现机器自动高效读取,同时XML语言又方便展示为适合人类阅读和理解的网页,送些都为后续研究及相关语义辅助工

4、具的应用提供帮助。.........1.2国内外研究现状目前自动问答系统是自然语言处理的一个热点,它需要依赖大量的语义知识来进行语言的语义表示,因此上世纪80年,人们开始致力于构架语义资源知识工程,国内外较著名的有FrameNet、以ordNet、知网、语言技术平台(LanguageTenologyat  基于XML的汉语框架网的语义表示与实现第一章引言1.1研究背景及意义汉语框架语义知识库Fillmore的框架语义学作为理论基础,FrameNetm为参照,以汉语语料事实为依据的供计算机使用的汉语词汇语义数据库。CFN主要是由框架库、

5、句子库和词元库所构成的。目前构建了323个汉语框架,渉及3947个词元,标注了20000条句子,为计算机进行汉语框架语义分析及其应用研巧提供了宝贵的汉语语义资源[2]。如何有效的对汉语框架网[M]的资源进行知识表示,是实现其应用价值的关键所在。本文使用可扩展标记语言(XML)来表示CFN资源数据,提供统一的描述方法,实现机器自动高效读取,同时XML语言又方便展示为适合人类阅读和理解的网页,送些都为后续研究及相关语义辅助工具的应用提供帮助。.........1.2国内外研究现状目前自动问答系统是自然语言处理的一个热点,它需要依赖大量的语

6、义知识来进行语言的语义表示,因此上世纪80年,人们开始致力于构架语义资源知识工程,国内外较著名的有FrameNet、以ordNet、知网、语言技术平台(LanguageTenologyatform,LTP等。其中FrameNet和语言技术平台都选择使用XML作为底层数据表示。FrameNet是一个以框架语义学为理论,以框架为基础的基于英语词汇的真实文本的人机可读的词汇数据库[11。FmmeNet目前收集词条超过10000余条,针对每个词汇都有详尽的解释,用于指导词汇的正确学习。针对每个词元进行实例标注,达17万条,为精确定文语义角色提

7、供独有的数据集。目前FrameNet作为一个开源的数据集岡,己被世界各地自然语言处理的研究人员下载使用。此外,中国、日本、葡萄牙、德国和西班牙等国的自然语言处理领域的学者也将研究的重点投向以框架语义学为基础的资源库建设,同时建设具有各国语言特色的框架语义知识资源库。在平台展示资源方面,FrameNet使用XML标记语言,将句子库、词兀、框架和框架关系生成机器可读的XML文件,在文件添加属性ID将10000多条资源联系在一起。为了方便查询,FrameNet构建索引,通过Framelndex.xsl文件进行控制。问时建立fodatal.5

8、把所有资源统一的营理。为了让资源展现出来美观,让研究人员更容易发现框架语叉特点进而进行研究和应用,FrameNet将框架元素和口标词等,都做了不同程度的修饰,通过调用Frame.xsl文件对其字体的颜色、样式进行控制。国

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。