Siri的重大改进-为Siri引入机器学习技术.doc

ID：27499985

大小：63.00 KB

页数：4页

时间：2018-12-04

资源描述：

《Siri的重大改进-为Siri引入机器学习技术.doc》由会员上传分享，免费在线阅读，更多相关内容在应用文档-天天文库。

1、Siri的重大改进:为Siri引入机器学习技术　　Apple的Siri可以说是最著名的语音助手之一，其中不必按按钮便能向Siri下指令的「HeySiri」功能也受到许多好评，近日在博客中，Siri团队除了表示计划运用机器学习持续改进这项功能，也解释了iOs设备的HeySiri功能的运作方式，以及未来计划持续改进的目标。　　所谓的「HeySiri」功能，就是让使用者不必按按钮、只需在语音指令前加上HeySiri，手机便会自动启动并遵照指示行动。　　但Apple究竟是怎么做到的？博客文章指出，「HeySiri」的进化与解决了「关键片语检测」（key-phrasedetection）问题相关，

2、同时运用了DNN来进行了早期建模工作，并使用了递归神经网络（RNN）来进行多样化的训练与学习。　　　　Siri团队解释，之所以选择以「HeySiri」作为触发语，是因为即使在这项功能推出以前，人们在运用按钮呼唤Siri也会自然而然的在请求前加上这句话。这原先是一个方便用户的简单决定，但早期的离线实验中，HeySiri的简洁和口语性却为开发团队带来额外的挑战。　　Siri团队主要面临的错误辨识挑战为三种，分别为当用户表达类似短句时、当非用户说出HeySiri时，以及最令Siri团队头痛的当非用户说出类似短句时。　　为了让Siri不被类似短句及非用户误导，团队先是将焦点由寻常语音辨识目标的「

3、说话内容」转移至辨识「说话者」的身份，利用说话者辨识（speakerrecognition,SR）并结合相关技术来增进侦测关键短句的系统质量。　　　　以目前来说，Apple会要求首次使用的用户以要求的5个短句来语音来完成说话者辨识系统的注册，但除了这种显性注册模式之外，团队也设计了另一种隐性模式（implicitenrollment）的辨识：透过纪录用户一段时间内的语音，进而提高对说话者辨识的稳健性。　　当然考量到个人隐私的因素，音频将保留于设备上而并非云端，但这种设计目前仍有一些疑虑存在，如果早期纪录的语音片段并非用户本人，那么设备可能会错误的拒绝用户指令或错误的接受非用户的声音，如此

4、一来功能将变得毫无用处。　　展望未来，除了像所有语音辨识系统一样得想办法克服环境噪音的问题，Siri团队还希望未来用户能不需经过任何训练与注册，在开始使用「HeySiri」功能后透过用户的许可，透过生活里的指令中便能将语音辨识资料的内容持续增长与更新。　　虽然还不清楚这些改动何时会推出，但Apple经常会在每年6月全球者开发大会上谈到Siri的重大改进，相信在不久的未来我们很快就能听到一些好消息。

当前文档最多预览五页，下载文档查看全文

侵权申诉



1 1 2 3 4 / 4



此文档下载收益归作者所有

当前文档最多预览五页，下载文档查看全文

温馨提示：
1. 部分包含数学公式或PPT动画的文件，查看预览时可能会显示错乱或异常，文件下载后无此问题，请放心下载。
2. 本文档由用户上传，版权归属用户，天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容，确认文档内容符合您的需求后进行下载，若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误，付费完成后未能成功下载的用户请联系客服处理。

Siri的重大改进-为Siri引入机器学习技术.doc

Siri的重大改进-为Siri引入机器学习技术.doc

相关文章

相关标签