研究性课题检索方案及实操报告[3]

研究性课题检索方案及实操报告[3]

ID:1307567

大小:353.50 KB

页数:5页

时间:2017-11-10

研究性课题检索方案及实操报告[3]_第1页
研究性课题检索方案及实操报告[3]_第2页
研究性课题检索方案及实操报告[3]_第3页
研究性课题检索方案及实操报告[3]_第4页
研究性课题检索方案及实操报告[3]_第5页
资源描述:

《研究性课题检索方案及实操报告[3]》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、语音识别系统的应用情况研究一、课题研究的目的和意义语音合成的目的是合成高可懂度、高自然度的语音。经过十几年的研究,现阶段合成语音的可懂度已经达到相当高的水平,但自然度还不够高,缺陷之一就是韵律层次预测的不准确。本课题就是要通过信息检索,检索大量文献并进行研究分析,找到更合适的方法进行停顿预测,提高停顿识别的准确率。自动识别方法方便快捷、省时省力,且能够克服人工标注大规模语料的困难。研究汉语句子中短语间停顿的自动识别问题,对于语音合成中语料库的韵律标注以及语音识别中韵律单元的自动划分都有重要意义。二、国内外研究现状国内外众多学者

2、针对短语间停顿的自动预测已经提出过一些方法:如使用语法信息来预测韵律短语的边界;通过直接统计韵律短语切分点的边界模式的概率进行边界预测等等;这些方法的提出都提高停顿识别的正确率,取得了比较满意的效果,但是也存在一些不足,如上文第一种方法具有规则驱动系统难以移植和难以扩展的通病等等。总之,现阶段合成语音研究仍然存在一些问题,尤其是由于语音合成系统中韵律短语边界预测的水平不高,严重阻碍了合成语音自然度的进一步提高,所以在提高韵律短语边界预测水平是今后一个发展方向。三、研究目标形成一个基于最大熵模型的汉语韵律停顿识别系统。四、研究内

3、容汉语韵律短语间停顿的识别。五、研究方法通过合理检索,获取有效信息,快速、正确地找到解决问题的渠道。详细见表(3)。1、界定问题(1)分析研究问题表1研究问题分析——语音识别系统的应用情况研究研究问题语音识别系统的应用情况研究研究目标形成一个基于最大熵模型的汉语韵律停顿识别系统时间范围近五年地域范围国内、国外背景/事件语音合成中输出的语音可懂度、自然度不够高(2)建立背景知识表2语音识别系统包含的主题概念信息问题语音识别包含的主题概念韵律短语、韵律词、边界、中文信息处理、短语间停顿、最大熵、语音识别、文语转换(TTS)(3)拟

4、定主题概念详细见表(3)。2、选择信息源针对本研究课题相关领域,我选择电子期刊,如表(4)中列出了领域常用的权威期刊和核心期刊,因为电子期刊的时效性相对性较强,研究对象和视角新颖、详细且探讨方式具有理论架构,能帮助我们更好地把握研究前沿,很符合自己所学专业的特色;另外,也常用一些权威文献数据库,如CNKI中国知网、维普、万方,为了研究地更透彻、更新颖,也常使用EI、SCI等外文数据库。上述三个中文数据库资源都比较齐全,而且检索结果也比较专业,而外文数据库则可以很好的补充中文数据库的不足,比如有的文献可能中文数据库没有收录,或者

5、想查找某篇文章的原作者,众所周知,在计算机领域外国比我国起步早,所以好多文献的原创都是外国学者,因此检索外文数据库是很必要的。4表3主题概念分析——语音识别系统的应用情况研究研究问题语音识别系统应用情况研究主题概念语音识别上位词中文信息处理同义词停顿识别相关词计算机应用表4常用期刊权威期刊计算机学报、软件学报、模式识别与人工智能、计算机研究与发展、自动化学报核心期刊计算机应用与软件、计算机科学、计算机工程、计算机技术、中文信息学报但是具体到本课题,应该对以上信息源进行优先选择,比如“中文信息学报”更适合于本课题,这样搜索出的结

6、果会比较专业。CNKI中国期刊全文数据库,收录的信息很全面,也可以作为检索的信息源。另外,由于计算机行业发展更新比较快,与国内研究状况相比,国外的研究更先进,更新颖,所以选择国外期刊进行检索也是很好的选择,如EI、SCI等,中外结合可能会收到更好的效果。3、制定策略并实施检索(1)检索用词的选定(扩检/缩减)虽然主题概念是“语音识别”,但是百度搜索引擎中搜到的结果都与中文信息处理无关,也就是说如果将“语音识别”作为检索词,搜到的结果太宽泛,如图(1)所示,涉及到的领域太多,不是很专业,因此需要缩检;而当我们把它的下位词“韵律停

7、顿”作为检索词时,因为“韵律”已经算是设置了一个搜索限制条件,将内容限定在“中文信息处理方面”,这样搜索结果就比较符合要求,如图(2)所示,更贴近研究内容,也不需要扩检,因此可以将“韵律停顿”作为检索词。图(1)百度检索界面及检索结果图(2)百度检索界面及检索结果(2)根据选好的信息源的优先顺序进行检索;中文信息学报:比较专业,结果是“全文搜索”的结果,检索界面如图(3)所示。(3)合理使用逻辑运算符为了检索到更多的文献,用运算符OR将相关词“计算机应用”加到检索词中。speechrecognition和computerapp

8、lication作为检索词,用OR连接,时间范围限定在2007到2011年之间,如图(4)所示;搜索结果如图(5)所示。4图(3)中文信息学报检索界面图(4)EI检索界面图(5)EI检索结果(4)精确搜索和模糊搜索相结合;图(6)CNKI中国知网检索界面4搜索结果如图(7)所

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。