欢迎来到天天文库
浏览记录
ID:32392093
大小:177.88 KB
页数:4页
时间:2019-02-04
《智能语音交互》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、智能语音交互快速开始智能语音交互快速开始快速开始欢迎开启智能语音交互(NaturalLanguageService)之旅!阿里云智能语音交互可提供语音识别(ASR),语音合成(TTS),自然语言理解(NLU)的等服务。-ASR:语音识别服务,提供语音转文本服务。-TTS:文本转语音服务,提供将文本转为普通话语音的语音合成功能。-NLU:自然语言理解服务,提供自然语言处理功能。账号和服务申请步骤:进入阿里云官网,申请阿里云账号。若已有阿里云账号,请忽略之。到“智能语音交互服务”页面,点击后『立即开通』。在跳转后的页面,点击『立即购买』,购买语音服务。注意目前公测服务
2、是0折,您试用的话并不收费。在数加-AccessKey页面获取您的AccessKey和AccessSecret。“智能语音交互服务”调用过程包括以下3个步骤:-Step1:账号和服务申请-Step2:确定需要调用的服务类别(ASR、TTS、NLP),根据具体的语音使用场景和领域(社交聊天、家庭娱乐、电商购物、智能客服等)选择对应app_key。-Step3:下载不同开发平台下的SDK和DEMO(Java、Android、iOS、RESTfulAPI、Python等),按照API文档步骤,在DEMO工程中填写对应参数,开始进行服务调用。下面以最常用的”一句话识别”服
3、务给大家做一个入门级的示例,为您介绍如何快速使用“智能语音交互”的各种服务。1.账号和服务申请,获取AccessKeyID和AccessKeySecret两个数加认证参数。2.语音识别服务下的”一句话识别”服务支持的app_key如下表,选择“社交领域”的1智能语音交互快速开始app_key为nls-service。一句话识别app_key语音数据格式结果返回方式领域16kHz采样16bit音频nls-service非流式社交聊天流nls-service-16kHz采样16bit音频流式社交聊天streaming流16kHz采样16bit音频nls-service
4、-tv非流式家庭娱乐流16kHz采样16bit音频nls-service-shopping非流式电商购物领域流16kHz采样16bit音频nls-service-care非流式智能客服服务领域流注:(1)“支持的结果返回方式”式包括“非流式”和“流式”两种模式,“非流式”简单来说就是用户整句话说完后返回识别结果,“流式”模式下用户一边说话一边返回识别结果。(2)“一句话识别”支持的领域包括:社交聊天、家庭娱乐、电商购物、智能客服等。用户可针对具体的使用场景选择对应领域的app_key。3.下载JAVASDK和DEMO,开始语音识别。3.1运行demo来测试语音服务
5、到“一句话识别”服务的JavaSDK页面下载对应的下载包,包括JAVASDK和DEMO工程。打开JavaDEMO工程中的AsrDemo.java方法,将其中的app_key、AccessKeyID、AccessKeySecret替换成自己的账号信息,然后直接run->javaapplication即可。NlsRequestreq=newNlsRequest();req.setApp_key("app_key");//替换为选定的app_keyreq.setAsr_sc("pcm");//这里为测试准备的语音文件是pcm语音文件。req.authorize("Acc
6、essKeyID","AccessKeySecret");//替换为在数加平台申请到的"AccessKeyID"和"AccessKeySecret"若执行成功,将会输出中【”result”:“你好小云”】的log信息,至此,您已成功完成了一次语音识别服务的调用。3.2DEMO工程的简要介绍3.2.1发送语音请求由AsrDemo.java的方法startAsr()进行处理,首先提取语音数据,然后创建语音识别请求,将提取的语音分批发送至服务端。分批发送的好处是可以在您进行语音收集的同时,服务器就开始处理识别,这样当语音结束的时候可以最快地2智能语音交互快速开始得到识别
7、结果并返回。3.2.2接收语音识别结果由AsrDemo.java的回调方法onMessageReceived()进行处理,用于监听服务器的返回,在这个demo中,服务端返回的识别结果json字段参数如下:{"status":"1",//服务器状态,0为失败,非零为成功"id":"","finish":"1",//0为未结束,非零为结束,识别是否已经结束"results":{"asr_out":{"result":"你好小云",//语音识别结果"status":1,"finish":1,"version":"4.0"},"out":{}//保留字段},"bstrea
8、m_att
此文档下载收益归作者所有