谷歌要逆天AI“读唇”软件 准确率竟比人类还高3倍.doc

谷歌要逆天AI“读唇”软件 准确率竟比人类还高3倍.doc

ID:28146155

大小:62.00 KB

页数:3页

时间:2018-12-08

谷歌要逆天AI“读唇”软件 准确率竟比人类还高3倍.doc_第1页
谷歌要逆天AI“读唇”软件 准确率竟比人类还高3倍.doc_第2页
谷歌要逆天AI“读唇”软件 准确率竟比人类还高3倍.doc_第3页
资源描述:

《谷歌要逆天AI“读唇”软件 准确率竟比人类还高3倍.doc》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、谷歌要逆天AI“读唇”软件准确率竟比人类还高3倍  今年3月份,谷歌DeepMind开发的人工智能系统AlphaGo围棋战胜世界冠军李世石,占据了各大科技媒体的头条,当时可谓是风光无限,  谷歌人工智能部门DeepMind正与牛津大学研究人员合作,希望开发出全球最先进的“读唇”软件,可能比人类的“读唇”能力还要出色。  为实现这一目标,研究人员选取了数千个小时的BBC电视短片,上传到一个神经网络上,对其“读唇”软件进行训练,即根据主播嘴部运动来识别其播报内容。  结果,这款“读唇”软件的唇读准确率高达46.8%。相比之下,基于同样的测试内容,人类唇读的准确率只有12.4%。    这项研究

2、基于牛津大学之前的一款人工智能“读唇”系统“LipNet”。LipNet能将视频中人物的嘴部运动与其台词进行匹配,准确率高达93.4%。当然,该准确率主要基于一些相对简单的句子。  DeepMind这款“读唇”软件名为“看、听、分析与拼写”(Watch,Listen,Attend,andSpell),与LipNet不同的是,DeepMind的软件致力于更难的长句。  为此,谷歌神经网络观看了来自BBC的约5000个小时的流行电视节目,包括《晚间新闻》和《提问时间》和《今日世界》等,共包含了11万个不同的句子,1.75万个不同的单词。相比之下,测试LipNet的句子只包含了51个不同的单词。

3、    谷歌对此表示:“这项研究的目的是识别人们谈话时的短语和句子,有声音或没有声音都能识别。与之前的相关研究不同,它们仅限于有限数量的单词或短语,而我们的研究针对无限制的自然语言长句。”  DeepMind团队认为,他们新开发的这款软件除了能帮助听力损伤人群,还支持其他一系列应用,包括注释电影、利用唇部动作与Siri和Alexa等数字助理通信等。

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。