自然语言处理与人工智能

自然语言处理与人工智能

ID:43847419

大小:1.81 MB

页数:3页

时间:2019-10-15

自然语言处理与人工智能_第1页
自然语言处理与人工智能_第2页
自然语言处理与人工智能_第3页
资源描述:

《自然语言处理与人工智能》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、专题第 11 卷第5 期2015 年 5 月自然语言处理与人工智能白硕关键词:自然语言处理知识大脑计划上海证券通信有限责任公司“善解人意”是构筑表现在外部的语言和大脑里的念?这确实是一个问题。那么,概念到底是不是一一对应的。语言到底是怎么回事?这是研智能系统的必要条件有人举例说,蒙古语中与“马”究自然语言理解和自然语言处说起实现各种各样的智能相关的词汇有几十种,爱斯基理的人必须面对的问题。我们系统,大家都认为能“善解人意”摩人用于表示“雪”的词汇也说要善解人意,“人意”在哪里?应该是一个基本条件,而其实现有几十种,而不生活在马和雪

2、它藏在语言符号怪阵的背后。的一个重要桥梁就是语言。著名的对人工智能系统的图灵测文字语音电子输入试实际上就是要通过对话,也就是通过语言来判断隐藏在那“浅层”见效快,门个不可见的位置跟你对话的到槛低,可以摆脱语言“浅层”语言知识的学家自己玩词法底是人还是机器。还有美国哲“深度”学习仍然改浅层合称“语法”变不了其“浅层”特性学家约翰·希尔勒(JohnSearle)句法提出的一个思想实验——“中深层“深层”语言知识长1“深层”的作用链波文屋子(Chineseroom)”:一个及“浅层”,是解决什么样,至今仍众说语义纷纭,遑论学习了浅层疑难

3、问题的最终屋子里的人都不懂中文,只懂手段英文,但可以执行特定的规则,语用“音乐会说话”把符号搬来搬去,最后的效果是把英文翻译成中文。问题是,到底谁懂中文?图1“人意”隐藏在符号怪阵的背后另外,从亚里士多德到布尔,从莱布尼兹到维特根斯坦,的世界的人用于描绘“马”和如图1所示,语言最表层可实际上哲学在20世纪初有过一“雪”的词汇就很少。是语言造能通过文字或语音的方式表现,次重要的“语言学转向”,就是就了概念,还是概念造就了语也可能通过电子输入的方式表从拍脑袋的思辨转变到针对文言?是全人类有共同的概念,现。再向下有“词法”、“句法”本。

4、语言学领域也有人在思考,还是有一种语言就塑造一套概和“语义”,乃至“语用”,这是1也译作“华语房间”。26第 11 卷第5 期2015 年 5 月语言学界标准的层次划分。图中在语言层次上的“深”和“浅”但我认为这是正确的路。红色的虚线上方通常被认为是是两个概念。如果语言模型停留语言学领域的知识到底是什“浅层”,涉及到一点点句法,句在浅层,就是把深度学习用到极么?如果不知道知识是什么,或法的大部分在下方。虚线之下的致,得到的结果也有局限。但是者理解得不透彻,就想学习,效部分被认为是“深层”。浅层的在语言模型深层的机器学习研究果会差得

5、很远。深层的知识躲在语言模型的研究见效很快,门槛就复杂了。因为浅层的东西大家后面,或者说:你可以这样理解,很低,计算机科学家和工程师基都看得见,深层的很多东西是看他可以那样理解,似乎没有什么本上可以自己进行研究。然而深不见的,看不见就会造成各说各硬标准能够把它们提取出来。但层的语言学知识,有一些地方可话,没有统一的标准。所以,这是大家要解决的问题和难点是明能说不清楚。例如,上海电台有个方面的研究非常困难。确的:一个是递归嵌套的深度;另一个是语言成分远距离相关的宽度。相关成分相距越远、递归嵌套层数越深,浅层模型越难处理。只要这两个难

6、点有所突破,不管把语言模型设计成什么样,肯定都能在某种程度上反映深层的语言学知识。我在自然语言处理领域的研究兴趣主要集中在三个方面:一是关注语言学的知识到底是什么;二是利用递归神经网络实现语言知识的自动获取,比如可以在系统中添加栈和计数器,可以把规则编译成递归神经图2基于规则的系统是“傻子”,基于统计的系统是“疯子”网络等,这个领域值得特别关注;一档节目叫“音乐会说话”,不有一种说法叫:基于规则的三是用自然语言作为知识表示,论按照什么分词标准,很多的分系统是“傻子”,基于统计的系直接进行模式推理和检索。词系统都会把它分成“音乐会/

7、统是“疯子”。基于规则的系统说话”,也就是说“音乐会”被在规则不能覆盖的地方表现极其自然语言处理与当作一个词的分法在这些系统中糟糕;基于统计的系统,因为很“大脑”是应该占优势的。但是这档节目多模型现在只能做到浅层,深层名称的意思实际上是“音乐/会/的不知道怎么做,所以有局限(如语言研究对人工智能有重要说话”,只有用到了深层的句法图2所示)。基于统计处理的深意义:第一,语言是一个自然的和语义,甚至语用,才能确定这层语言模型是有的,但深层模型交互界面,“善解人意”绕不开是一个隐喻,才能发现正确的分研究需要资源建设积累的支撑,这个界面;

8、第二,语言的背后是词方案是什么。如果没有资源建设,深层语言模一套知识,怎么学习和表示它,现在人们对深度学习充满了型研究无从谈起。统计又要有语与一般知识的学习和表示是有共期待。但是必须说明,学习的度料的积累,这双重的积累是瓶颈,性的;第三,语言是一个

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。