自然语言处理范文

自然语言处理范文

ID:46359122

大小:56.12 KB

页数:4页

时间:2019-11-23

自然语言处理范文_第1页
自然语言处理范文_第2页
自然语言处理范文_第3页
自然语言处理范文_第4页
资源描述:

《自然语言处理范文》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、自然语言处理范文  自然语言处理是计算机科学领域与人工智能领域中的一个重要方向它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法自然语言处理是一门融语言学、计算机科学、数学于一体的科学因此这一领域的研究将涉及自然语言即人们日常使用的语言所以它与语言学的研究有着密切的联系但又有重要的区别自然语言处理并不是一般地研究自然语言而在于研制能有效地实现自然语言通信的计算机系统特别是其中的软件系统因而它是计算机科学的一部分  自然语言处理范文  自然语言处理是计算机科学领域与人工智能领域中的一个重要方向它研究能实现人与计算机之间用自然语言

2、进行有效通信的各种理论和方法自然语言处理是一门融语言学、计算机科学、数学于一体的科学因此这一领域的研究将涉及自然语言即人们日常使用的语言所以它与语言学的研究有着密切的联系但又有重要的区别自然语言处理并不是一般地研究自然语言而在于研制能有效地实现自然语言通信的计算机系统特别是其中的软件系统因而它是计算机科学的一部分  语言是人类区别其他动物的本质特性在所有生物中只有人类才具有语言能力人类的多种智能都与语言有着密切的关系人类的逻辑思维以语言为形式人类的绝大部分知识也是以语言文字的形式记载和流传下来的因而它也是人工智能的一个重要甚至核心部分用自然

3、语言与计算机进行通信这是人们长期以来所追求的因为它既有明显的实际意义同时也有重要的理论意义:人们可以用自己最习惯的语言来使用计算机而无需再花大量的时间和精力去学习不很自然和习惯的各种计算机语言;人们也可通过它进一步了解人类的语言能力和智能的机制实现人机间自然语言通信意味着要使计算机既能理解自然语言文本的意义也能以自然语言文本来表达给定的意图、思想等前者称为自然语言理解后者称为自然语言生成因此自然语言处理大体包括了自然语言理解和自然语言生成两个部分历史上对自然语言理解研究得较多而对自然语言生成研究得较少但这种状况已有所改变无论实现自然语言理解

4、还是自然语言生成都远不如人们原来想象的那么简单而是十分困难的从现有的理论和技术现状看通用的、高质量的自然语言处理系统仍然是较长期的努力目标但是针对一定应用具有相当自然语言处理能力的实用系统已经出现有些已商品化甚至开始产业化典型的例子有:多语种数据库和专家系统的自然语言接口、各种机器翻译系统、全文信息检索系统、自动文摘系统等自然语言处理即实现人机间自然语言通信或实现自然语言理解和自然语言生成是十分困难的造成困难的根本原因是自然语言文本和对话的各个层次上广泛存在的各种各样的歧义性或多义性(ambiguity)一个中文文本从形式上看是由汉字(包括

5、标点符号等)组成的一个字符串由字可组成词由词可组成词组由词组可组成句子进而由一些句子组成段、节、章、篇无论在上述的各种层次:字(符)、词、词组、句子、段……还是在下一层次向上一层次转变中都存在着歧义和多义现象即形式上一样的一段字符串在不同的场景或不同的语境下可以理解成不同的词串、词组串等并有不同的意义一般情况下它们中的大多数都是可以根据相应的语境和场景的规定而得到解决的也就是说从总体上说并不存在歧义这也就是我们平时并不感到自然语言歧义和能用自然语言进行正确交流的原因但是一方面我们也看到为了消解歧义是需要极其大量的知识和进行推理的如何将这些知

6、识较完整地加以收集和整理出来;又如何找到合适的形式将它们存入计算机系统中去;以及如何有效地利用它们来消除歧义都是工作量极大且十分困难的工作这不是少数人短时期内可以完成的还有待长期的、系统的工作以上说的是一个中文文本或一个汉字(含标点符号等)串可能有多个含义它是自然语言理解中的主要困难和障碍反过来一个相同或相近的意义同样可以用多个中文文本或多个汉字串来表示因此自然语言的形式(字符串)与其意义之间是一种多对多的关系其实这也正是自然语言的魅力所在但从计算机处理的角度看我们必须消除歧义而且有人认为它正是自然语言理解中的中心问题即要把带有潜在歧义的自

7、然语言输入转换成某种无歧义的计算机内部表示歧义现象的广泛存在使得消除它们需要大量的知识和推理这就给基于语言学的方法、基于知识的方法带来了巨大的困难因而以这些方法为主流的自然语言处理研究几十年来一方面在理论和方法方面取得了很多成就但在能处理大规模文本的系统研制方面成绩并不显著研制的一些系统大多数是小规模的、研究性的演示系统  最早的自然语言理解方面的研究工作是机器翻译1949年美国人威弗首先提出了机器翻译设计方案20世纪60年代国外对机器翻译曾有大规模的研究工作耗费了巨额费用但人们当时显然是低估了自然语言的复杂性语言处理的理论和技术均不成热所

8、以进展不大主要的做法是存储两种语言的单词、短语对应译法的大辞典翻译时一一对应技术上只是调整语言的同条顺序但日常生活中语言的翻译远不是如此简单很多时候还要参考某句话前后的意思大约9

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。