科大讯飞 自动驾驶布局聚焦智能语音.doc

科大讯飞 自动驾驶布局聚焦智能语音.doc

ID:28122172

大小:190.50 KB

页数:8页

时间:2018-12-08

科大讯飞 自动驾驶布局聚焦智能语音.doc_第1页
科大讯飞 自动驾驶布局聚焦智能语音.doc_第2页
科大讯飞 自动驾驶布局聚焦智能语音.doc_第3页
科大讯飞 自动驾驶布局聚焦智能语音.doc_第4页
科大讯飞 自动驾驶布局聚焦智能语音.doc_第5页
资源描述:

《科大讯飞 自动驾驶布局聚焦智能语音.doc》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、科大讯飞自动驾驶布局聚焦智能语音  具体用来证明视觉方面能力的例子是Cityscape的榜单成绩。后者是一个用来评估视觉算法的数据集,可以检验算法在城区场景语义理解方面的表现。今年10月,科大讯飞在自动驾驶场景分割任务中获得了第一名,主要是使用了名为“层次分割”的技术。  很长一段时间里,科大讯飞在车载前装领域都是通过车机系统供应商间接向车企提供服务,业务只聚焦在智能语音技术。  不过在2016年科大讯飞年会上,我们看到了一款汽车互联系统“飞鱼助理”。科大讯飞正式宣布——未来会包办一整套车机系统的软硬件和数据服

2、务,角色向TSP转型。  时隔一年,飞鱼升级到了2.0版本,并且形成了更加清晰完整的产品架构。而且我们发现,除了核心的智能语音交互,科大讯飞开始做视觉了。  科大讯飞自动驾驶布局聚焦智能语音  具体用来证明视觉方面能力的例子是Cityscape的榜单成绩。后者是一个用来评估视觉算法的数据集,可以检验算法在城区场景语义理解方面的表现。今年10月,科大讯飞在自动驾驶场景分割任务中获得了第一名,主要是使用了名为“层次分割”的技术。  很长一段时间里,科大讯飞在车载前装领域都是通过车机系统供应商间接向车企提供服务,业务

3、只聚焦在智能语音技术。  不过在2016年科大讯飞年会上,我们看到了一款汽车互联系统“飞鱼助理”。科大讯飞正式宣布——未来会包办一整套车机系统的软硬件和数据服务,角色向TSP转型。  时隔一年,飞鱼升级到了2.0版本,并且形成了更加清晰完整的产品架构。而且我们发现,除了核心的智能语音交互,科大讯飞开始做视觉了。    年会现场用来展示飞鱼2.0的广汽传祺GS8  飞鱼2.0更新了什么?  在飞鱼1.0版本上,整个交互体验更加自然。人和车对话的时候,车就可以记住上下文,理解每一个指代的意思。你可以不用多次唤醒就能

4、调用导航、音乐、拨打电话等功能,也可以在车说话时打断它。  在今年的年会现场,飞鱼2.0版本做了升级。科大讯飞汽车事业部副总经理谢信珍告诉记者,去年展示飞鱼1.0时更多还是一种未来规划,但今年的2.0版本已经是可以落地的产品。  大家可以从上面的视频看到几个之前没有的亮点:  1.知道该听谁的话。新版系统知道要采集哪个方向的声音,锁定驾驶员是说出唤醒词的位置后,副驾座位的声音就不会出现“抢麦”情况。要实现这个功能,主要是对麦克风阵列和软件算法做升级。  2.连接后台账号系统。飞鱼2.0可以在唤醒后“主动服务”。

5、它会提醒你今天是老婆大人的生日,推荐老婆大人喜欢的餐厅,推荐喜欢的电影然后购票。系统和个人的绑定更深。  3.接入了车辆总线系统。在1.0中,系统只能用语音控制音乐、导航、电话等信息娱乐功能。在2.0版,我们可以用语音控制开关天窗、调节空调温度这些和行车安全影响不大的功能。  除了第一点是智能语音技术上的更新,后两项都是包办软硬数服一体化后,语音有机会和车、和人发生的更多关联。  当然,后两项也代表了一种选择。更加个性化的服务意味着对个人数据使用权的开发,这是用户面临的选择。更加懂得汽车意味着车辆数据的开放,这

6、是主机厂面临的选择。  把眼睛叫醒  在智能语音交互之外,图像识别也在汽车场景下找到了发挥功能的机会。  坦白说,在参会前看到预告时,记者以为视觉技术更多会用在驾驶员身份鉴别。因为科大讯飞研发主管赵艳军曾经说过,AIUI在定义之初,“就没有把语音作为唯一的交互方式,而是把它设想为结合了人脸、人体追踪、手势、红外等多种方式为一体的人机交互解决方案”。  所以当科大讯飞说要借助摄像头的眼睛看向车外时,记者还是有些意外的。  泊车辅助  视觉首个应用场景会是泊车。在有清晰车位线的情况下,可以借助泊车摄像头观察外部情况

7、,找到合适车位时,用交互的方式提醒用户打方向盘,辅助车辆进入车库。没有车位线时,也可以司机在屏幕上划线选择停车位置,系统把车停到库中。当然也可以看到,在一开始的版本中,还没有涉及车辆控制层面的内容。  目前视觉的部分仍然由科大讯飞的研究院来推进,选择的泊车应用也是一个相对简单的场景。在回答“和专门做视觉的企业比,科大讯飞有什么优势”这个问题时,汽车业务部副总经理谢信珍提到了科大讯飞在技术源头上的积累。他认为语音对信号连贯性的要求更高,做语音跨到图像会更容易。  Cityscape数据集成绩  具体用来证明视觉方

8、面能力的例子是Cityscape的榜单成绩。后者是一个用来评估视觉算法的数据集,可以检验算法在城区场景语义理解方面的表现。今年10月,科大讯飞在自动驾驶场景分割任务中获得了第一名,主要是使用了名为“层次分割”的技术。  数据集测试成绩可以在某种程度上反映科大讯飞的算法能力。不过实际应用中,科大讯飞的算法要面对嵌入式平台和实时性两个方面的考虑。谢信珍表示,科大讯飞的优势在于工程优化能力,

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。