欢迎来到天天文库
浏览记录
ID:25556702
大小:59.50 KB
页数:9页
时间:2018-11-21
《基于diva模型之汉语元音声调和英语音节重音发音机制研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、基于DIVA模型之汉语元音声调和英语音节重音发音机制研究-->第一章绪论1.1课题研究背景及意义将人大脑里的思维过程“阅读出来”,然后将其转换为正常的语言进行表述,这样一种新型仪器已经由波士顿大学弗朗克•冈瑟(FrankGuenther)教授带领的科研小组研制成功,这种被称为“神经分析系统”的仪器由两部分组成:脑-机接口(BCI)。为言语障碍患者提供实时语音输出。语音合成系统DIVA(DrectionsIntoVelocitiesofArticulators)模型。DIVA模型通过学习控制模拟声道的运动来模拟大脑中涉
2、及语音生成和语音理解的相关区域及功能[1],是一种具有真正生物学意义的关于语音生成和获取的神经网络模型。DIVA是一个综合语音生成和语音感知交互作用的复杂模型,对模型组件与大脑皮层的对应关系在MNI(MontrealNeurologicalInstitute)标准框架上进行了具体描述,并且对运动前区、运动、听觉、体觉等皮层所涉及的模块作了精确的定义。因此,DIVA模型可以模拟大脑神经信号的产生,显示与语音生成和获取相关的大脑运作机制。Max还利用DIVA模型产生不连续的讲话动作,模拟临床言语障碍疾病-结巴,将临床研究所得的产生结
3、巴的原因用DIVA模型来解释[2]。Callan利用DIVA模型研究了儿童的声道发育对发音的影响[3]。因此,基于解剖学和神经生理学的DIVA模型,对于语音的生成、讲话的神经关联性和一些言语障碍机制都有较好的模拟能力。但是DIVA模型所依赖的语言背景是英文发音的29个因素,并且没有涉及对语音韵律特征的表述。本文以DIVA模型为基础,通过构造新的神经网络模型,使语音生成和获取过程符合中英文语音发音的韵律规律,具体包括汉语元音声调和英语音节重音规律,为研究大脑中涉及语音生成和理解区域的相关功能奠定了基础。………1.2国内外研究现状以
4、类神经网络为基本架构并具有学习能力的DIVA模型最早由Guenther教授年在1994年提出,经模拟仿真证实了DIVA模型具有自我补偿的能力,当模型在干扰状态下产生已经学习过的语音时,模型可以产生自我动作上的补偿,完成原本要产生的语音[4]。基于这一结论,Guenther教授使用DIVA模型进一步探讨了人类的发音机制:第一个实验中使模型以相似但不相同的构音结构来产生相同的语音,发现相似的构音结构可以产生听起来相同的语音,这就是等效操作机制;第二个实验中使模型模拟产生以相同子音配上不同的母音组成的半音节,发现在产生半音节中的子音时
5、,构音位置会受到后面的母音影响,产生的子音的构音结构会不一样。例如在/ki/和/ka/中,/i/为前高母音而/a/为后低母音,/ki/在产生子音/k/的时候舌头摆动的位置比/ka/的高,但是产生的子音是相同的,这就叫做协同构音[5]。1996年Guenther提出了改良后的DIVA模型,新模型增加了声学特征(F1、F2、F3)转构音结构的能力,这个功能的加入使得DIVA模型具有了预知动作的能力,在确定听到或是产生语音的时候,可以由这个语音的声学特征来获得模拟声道的动作和模拟声道的变化。基于DIVA模型可以由产生的语音来预知构音动
6、作这一功能,Guenther和Nieto-Castanon在使用DIVA模型模拟产生子音/r/时,发现舌头的形状会影响到语音的第三共振峰的值[6]。……….第二章类神经网络与DIVA模型2.1类神经网络类神经网络是基于大脑和神经的研究而衍生出的信息处理技术,是利用电脑计算来模拟大脑神经的人工智慧系统,主要用于辨识、决策和控制等。类神经网络是一种计算系统,最小的元件叫做处理单元PE(processingelement),以乘以权重的方式将许多处理单元联结起来,用以处理信息并用动态网络来响应外部的输入。类神经网络系统一般可以分为三层
7、:输入层,隐藏层,输出层。输入层:接受外面的信号,并将信号输入神经网络。隐藏层:接受输入层的信号,对信号做处理。输出层:接受处理过后的信号,将结果传到网络外面。由FrankRosenblatt于1957年提出的感知器(Perceptron),是最早也是最简单的类神经网络。感知器是具有单层计算神经元的类神经网络,且是具有连续可调整修正权重值特点的神经元模型,经过训练,可以对线性可分的输入进行分类和辨别。如图2.3所示,单层的感知器是由一组输入向量P,经过权重向量aeda)[20]。最早使用多节管声学模型来模拟人的声道,经过不同的改
8、良,产生了各种不同的模型。Maeda在1990年发表的前田几何声道(Maeda)模型,是通过研究法国成人的声道而得出的的通用模型,可以模拟大部分人的声道。模型最主要有七个可调参数:(1)上颚的高低,(2)舌头的位置,(3)舌头的形狀,(4)舌尖的高低,(5)嘴唇
此文档下载收益归作者所有