欢迎来到天天文库
浏览记录
ID:27840770
大小:1.24 MB
页数:17页
时间:2018-12-06
《人类进化的历程当中语音起到了多大的作用.doc》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、人类进化的历程当中语音起到了多大的作用 黄学东:大家好!今天我主要想和大家分享一下微软的故事,相信一定会很激动人心。但在正式分享之前,我想介绍一下人类进化的历程当中语音起到了多大的作用。 达尔文的进化论已经说明,最新的科学验证也再次证明,我们人和大猩猩DNA的相似度接近99%,就那1%的区别造就了我们是这个地球的主宰。为什么呢?因为我们更聪明吗?还是漫长的进化过程当中有什么其他因素?计算机视觉非常重要,但动物的视力其实比人还厉害,晚上的夜猫子看得比人更厉害,但我们仍然是这个地球的主宰。最重要的原
2、因之一是我们的语音和语言,所以大家可以在今天准时地来到这个地方和我们一起讨论人工智能激动人心的进展。语音和语言对人类的进化是起到决定性作用的,当然对人工智能的进化也有同等的重要性。 微软在过去的几年当中多次创造了接近人类水平的人工智能进展。以今天的ImageNet作为图像识别的标准,微软两年前就第一次在图像识别斯坦福大学的ImageNet达到了超越人的水平。去年微软又宣布公开测试级对话系统Switchboard的最新成果最新成果。这是语音领域大家都很熟悉的一个很重要的任务,就是识别两个人在电话上的
3、交谈,微软第一次在业界达到了超过普通人的专业水平。今年在斯坦福大学的SQuAD阅读理解挑战赛,微软再次达到了媲美人类的水平。上个月微软再次创造了在中文和英文翻译上达到了超过专业人员翻译质量的水平,这是前所未有的。所以这确实是一个激动人心的时刻,人类进化的长河当中语音起了决定性的作用,今天在人工智能的进化当中语音和语言会起到同样的作用。 去年《经济学人》有一篇封面文章,总结了过去的四十年语音和语言的重要进展,早在五十年代IBM就开始了机器翻译的工作,那个时候我还没有出生。过去的几年当中有三个很重大的
4、历史事件:苹果第一次推出Siri,也就是手机上的个人助理。Google推出了基于神经翻译的产品,大大推动了机器翻译的进步。微软第一次在业界历史性地创造了超越人的自然对话系统——语音识别系统。 这张图显示了过去的二十年当中语音识别的同行们通过不懈的努力,创造出了很多辉煌的成果,但有一条红线,就是Switchboard错误率一直在10%以上,直到最近几年因为深度学习的进展,微软和IBM的公开评测当中一直起到了领头羊的作用。 去年微软是第一次达到了5.1%的水平,超过了普通转录人员的标准,也是非常
5、激动人心的进展。采用的方法是组合了多种不同的深度神经网络,包括ResNet、LACE和BLSTM,通过并行的处理组合成了一个工程上完美的语音识别系统,其实在云上是不费吹灰之力的,只是计算机的资源会比较多。 微软在语音合成领域也有很多进展。我们支持将近包括50种语言的语音合成系统,而且它的质量也达到了4.3MOS,这是非常振奋人心的。 这是微软和哈曼音箱联合推出的联想语音识别系统,唤醒智能音箱的时候不是非常自然,微软最近和小米联合推出了全双工的语音对话系统,就是唤醒以后可以连续讲,不需要每
6、次都说唤醒词“小娜”再说语音指令。这是微软核心的语音技术在中国落地的一个非常好的案例,它的基本思想非常简单,就是我跟你讲话,比如我见到邓院士每次都说“邓院士,今天你好吗?”“邓院士,你今天吃饭了没有?”所以大家会觉得很烦,全双工的系统只要唤醒一次,接下来就可以很自然地跟它交互。 大家可以看出,全双工的语音交互在中国已经落地,和小米的合作产品今天可以很便宜地买到一台,让它帮你扫地、开灯、看股票,这些都没问题,如果实在闲得慌的话可以和小冰聊天斗嘴,这是已经落地的产品。 和大家介绍一下最近微软在机器翻译上
7、的重大突破。就像《经济学人》说过的,1954年开始IBMWason就开始了机器翻译的研发工作,那个时候是传统的机器翻译,根据自然语言的处理方法。后来IBM再次引导了新潮流,将语音识别的核心技术统计方法使用在机器翻译上,PeterBrown这些人把语音翻译的质量推向了新高度。过去的几年因为神经网络学习的进步,我们再次把机器翻译推向了新的高度,但还没有达到人的水平。 非常振奋人心的是,今年微软公司首次在公开测试当中中英新闻翻译当中第一次达到了类人的水平,这是非常了不起的历史性里程碑,这样对帮助中国的声音走
8、向世界是毫无疑问的,因为翻译的水平和专业人员是同等可比的。 微软不仅是在研发上进行推广,实际上很多产品已经落地。比如PPT,你们只要下载一个PresentationTranslator的插件,所有的讲话可以同声翻译、同声传录,而且是免费的。下载以后可以支持60种语言、100个人在课堂上同步交流。演讲之前可以让大家扫描二维码,通过微软翻译的手机应用可以加入对话。大家知道,字幕当中只能显示一种语言,如果是60种语言怎么办?没关系,也可以显
此文档下载收益归作者所有