基于可拓学的自然语言处理与系统建模研究new

基于可拓学的自然语言处理与系统建模研究new

ID:33489545

大小:312.64 KB

页数:4页

时间:2019-02-26

基于可拓学的自然语言处理与系统建模研究new_第1页
基于可拓学的自然语言处理与系统建模研究new_第2页
基于可拓学的自然语言处理与系统建模研究new_第3页
基于可拓学的自然语言处理与系统建模研究new_第4页
资源描述:

《基于可拓学的自然语言处理与系统建模研究new》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、万方数据第38卷第7期20O6年7月哈尔滨工业大学学报JOURNALOFHARBININST【TUTEOFTECHNOLOGYVoL38No.7July2006基于可拓学的自然语言处理与系统建模研究郑鑫1,秦建军2,陈汉辉1,李伟宏1(1.北京交通大学计算机与信息技术学院,北京100044,E·mail:chx啦@si眦.com;2.北京交通大学机械与电子控制工程学院,北京100044)摘要:研究了将可拓模型的自动建模技术应用于自然语言处理,并将此模型应用于自然语言理解.利用可拓模型及自然语言理解相关技术来描述语言信息、知识表示和知

2、识推理,并设计实现了一套由自然语言到可拓模型的自动建模系统.通过构建基于知网的物元概念表、事元概念表和关系元概念表去训练输入的自然语言文本,从中提取出具有一定成熟度的基元模型,再通过基元可拓变换规则进行可拓推理.关键词:可拓学;自然语言处理;知识表示与推理中图分类号:TPl8文献标识码:A文章编号:0367—6234(2006)07—1209—04NaturallanguageprocessinganditssystemmodelingbasedonE】i【tellicsZHENGxinl,QINJian-jun2,CHENHan.

3、huil,UWei—hon91(1SchoolofComputeraIldInfommti∞rIkhnology,BeijingJiaotongUniversity,Beijing100044,Bei_jiIlg100044,China,E—mail:China锄@163.com;2schoolofMech明icalandElectricalControlEn舀neering,BeijingJi80tongUniversity,Beijing100044)Abstract:Applingtheautomaticextensionmo

4、delingtechnologytothenatumllanguageprocessingisre—searchedinthispaper,andtllemodeliseasytorealizetIlenaturallanguageunderstanding.Thelanguagede—scription,knowledgerepresentationandknowledgereasoningarerealizedbyt11eextensionmodelarIdtIlenatu—mllaIlguageprocessingtechno

5、logy,andan叫tomaticmodelingsystemf而mthenaturallaIlguageto出ee妣en—sionmodeIisdesigned.Thesystemiscons扛uctedbythreedatatables,theyarematte卜elementconcepttable,赶fai卜elementconcept枷e锄drelation—elementconcepttable.TheyaJ.eusedtotraintIleinputnaturallan—guagetext,andt}Iebase—e

6、lementmodelwhichh踮acertaindegreeofmaturationisextIacted,thenextensionreasoningisrealizedbythebase—elementtmnsfo珊ation-.KeywOrds:Extenics;natumllaIlguagepmcessing;knowledgerepresentationaIldreasoning从计算机科学特别是从人工智能的观点看,自然语言理解的任务是建立一种计算机模型,这种计算机模型能够给出象人那样理解自然语言(即人们日常使用的汉语

7、、英语等)的结果⋯.自然语言理解的一个重要方面在于怎样向计算机表达知识、表达怎样的知识以及怎样建立知识之间的联系与推理,即怎样将大脑的联想、推理(判断)与选择过程应用于处理语言的模型中.现代计算机的物理结构和逻辑结构非常清晰,而我们收稿日期:2006一04—01.基金项目:国家自然科学基金重点资助项目(5033504JD);国家自然科学基金资助项目(50405004).作者简介:郑鑫(1987一),男,本科.需要的是一套可行的形式化思维机制,使机器能处理自然语言信息.为使机器理解人类自然语言,在长期研究的基础上形成了两种基本的方法:

8、基于规则的方法和基于统计的方法.基于规则的方法在本质上是演绎的,基于统计的方法在本质上是归纳的,两种方法都缺少更加灵活有效的联想与变数,不能通过添加知识来得到更好结果.实际上,自然语言本身就是一种知识表示方法,将自然语言形式化为可拓模

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。