资源描述:
《基于流媒体的在线语音合成系统》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第24卷第11期小型微型计算机系统Vol124No.112003年11月MINI-MICROSYSTEMSNov.2003基于流媒体的在线语音合成系统122杨鸿武,陶建华,蔡莲红1(西北师范大学物理与电子工程学院,甘肃兰州730070)2(清华大学计算机系媒体所,北京100084)摘 要:利用流媒体技术实现了一个在线语音合成系统,能在InternetöIntranet上提供实时的在线语音合成服务.系统采用了自适应技术适应网络状况的变化,并利用动态带宽分配技术管理客户端连接,保证了客户端连接的合成语音质量.系统可应用于语音邮件、语音校对、远程教学等领域.关键词
2、:TTS;语音合成;流媒体;网络带宽中图分类号:TP393.02文献标识码:A文章编号:100021220(2003)1122000204AnOnlineTTSSystembyUsingStreamingTechnology122YANGHong2wu,TAOJian2hua,CAILian2hong1(SchoolofPhysicsandElectronicsEngineering,NorthwestNormalUniversity,Lanzhou730070,China)2(DepartmentofComputerScience&Technology,T
3、singhuaUniversity,Beijing100084,China)Abstract:Byusingstreamingtechnology,anonlineTTSsystemthatcanproviderealtimeonlineTTSserviceonInter2netöIntranetarerealizedinthepaper.ForGuaranteethequalityofsynthesizedvoice,thesystemcanadaptthechangeofnetworkstatus,andmanageclientlinkbyusingdy
4、namicbandwidthallocationtechnology.Thesystemcanbeusedinvoicemail,voicerevisionandremoteeducationsystem.Keywords:TTS;streammedia;multimedia;networkbandwidth1 引 言务器继续下载.这不仅使启动时间大为缩短,而且不需要太大的缓存容量.流式媒体传输避免了用户必须等待整个文件全计算机语音合成系统中,一般都带有一个几百兆的语音部下载完才能观看的缺点,并且能适应多种网络带宽.利用流库,以获得自然度较高的合成语音.一个
5、部门可能有好几台计媒体技术,我们实现了一个InternetöIntranet上的在线语音算机需要用到TTS系统,如果在每一台计算机中都安装一套合成系统,客户端将待合成的文本提交给服务器端,由服务器TTS系统,必然要占用大量的系统资源.可以考虑利用客户ö完成文本的语音合成,并将合成语音以语音流的形式实时传服务器或浏览器ö服务器结构实现分布式的语音合成系统.虽送给客户端,解决了在线语音合成中音频文件的下载及数据然目前有很多技术均可以实现客户ö服务器或浏览器ö服务器量大的问题,可以于分布式的语音邮件、语音网页、语音校对、结构的语音合成系统,但它们通常均要求终端用户
6、将合成的人机对话、远程教学等方面.音频文件下载到本地的计算机,然后再利用浏览器中的播放2TTS系统原理器插件或专门的媒体播放器来播放.这种方法带来了两个突出的问题.首先,由于必须下载音频文件,而音频文件的数据TTS系统的主要功能是将计算机中任意出现的文字,转量通常都很大,在目前Internet普通用户接入速率较低的情换成自然流畅的语音输出.它使得计算机不仅能够处理数据,况下,一句很短的合成文本的音频文件可能都需要很长的下显示图像和文字,还能像人一样的说话,从而使得计算机变得载时间.其次,由于必须将音频文件下载到本地计算机后才能更为亲切、自然.计算机语音合成技
7、术经历了一个飞速发展的播放,这必然占用本地计算机的存储资源,而且不能实现实时过程,目前,已经较为成熟并已大量应用在不同场合,如主页语音播放.尤为重要的是,这样的方式往往导致音频文件的泄和电子邮件的阅读、文稿校对、人机对话、信息查询等等.漏,难以控制资源的流失.一般认为,语音合成系统包括三个主要的组成部份:文本目前出现的流式媒体传输技术实现了声音、影像等多媒分析模块、韵律生成模块和声学模块.文本分析的主要功能是体信息的连续、实时传送,用户不必等到整个文件全部下载完使计算机从这些文本中能够认识文字,从而知道要发什么音、毕,而只需经过几秒或数十秒的启动延时即可进行
8、观看.当多怎么发音,并将发音的方式告诉计算机,另外还