基于汉语协同发音模型的文本驱动三维口型动画合成研究

ID：26289921

大小：57.50 KB

页数：8页

时间：2018-11-26

资源描述：

《基于汉语协同发音模型的文本驱动三维口型动画合成研究》由会员上传分享，免费在线阅读，更多相关内容在学术论文-天天文库。

1、基于汉语协同发音模型的文本驱动三维口型动画合成研究----动漫设计论文-->第1章绪论1.1研究背景及意义在社会公共服务领域，越来越多的智能虚拟人物可以代替真人实现与用户的智能问答及娱乐游戏等，这无疑是一场人机交互的重大变革。试想一下，当你在外出旅游时为找不到附近的景点而苦恼时，一位智能虚拟人物出现在你面前，如同真人一样配合口型、表情以及手势的变化，为你耐心解答问题。这不但节省了人工咨询的成本，而且增强了人机交互的智能性和趣味性，让你在问题得到解决的同时，一解旅途的疲劳和乏味。2010年南非世界杯期间，央视体育频道的《豪门盛宴》栏目就利用增强现实（

2、AugmentedReality，简称AR）技术，将3D虚拟球场和各国当家足球明星的虚拟3D形象搬到了演播大厅，在增加了节目立体感的同时大大提高了交互的趣味性。总之，通过使虚拟人能够理解人类自然语言，同时通过表情动画、口型动画以及手势动作等方式形象生动地进行情感表达，并伴随与虚拟表情和口型同步匹配的语音，从而使人机交互达到真实、生动、自然、流畅的更高境界，是未来人机交互的主流，同时也将引导人与人交流方式的变革，在增强了真实感和趣味性的同时，也将虚拟现实与可视的智能化推向了一个新的高度。1.2国内外研究现状与参数法相比，基于物理的人脸建模方法更多的是

3、关注人脸的皮肤组织、脂肪组织、骨骼以及附着在骨骼上的肌肉等人脸生理特性，细分又可以分为基于肌肉模型的方法和基于物理模型的方法，其中，基于肌肉模型的方法又可以分为向量肌肉模型以及伪肌肉模型等；基于物理模型的方法又可以分为弹性网格模型以及分层弹性网格模型等。下面将对基于物理的人脸建模方法做简要介绍。………第2章相关理论基础2.1MPEG-4人脸动画标准其中，序号为1的FAP参数为视位（Viseme）和表情（Expression），FAP个数为2，代表这一个FAP分组中有2个FAP参数。在这10组FAP参数中，第1组中的2个FAP参数为高级参数，其余9组

4、的66个参数为低级参数。低级参数是具体参数，它们具体地描述了人脸面部各部位（如眼睛、面颊、鼻子、嘴唇、下巴、耳朵、舌头等）的运动；与低级参数不同，高级参数是抽象参数，它们抽象地描述了人脸面部各部位的运动，每一个高级参数由若干子参数构成，例如，FAP参数中的高级参数“表情（Expression）”包含6个子参数，这6个子参数分别描述了6中人脸面部的表情，它们分别是“喜悦、悲伤、愤怒、恐惧、厌恶以及惊讶”。高级参数“视位（Viseme）”，是一组预先定义好的基本视位，利用这些基本视位，可以插值形成其他视位。2.2面向对象的图形渲染引擎OGRE虽然使用O

5、gre开发3D程序变得十分便捷，然而Ogre的内部结构确是非常复杂的。它基于面向对象的思想进行设计，由若干模块组合而成。Ogre极好的抽象性和封装性，使得它隐藏了大量复杂的结构细节，对开发者完全透明，可以简化开发过程。例如，开发人员可以通过函数调用直接对场景中的节点和实体进行平移、旋转、放缩等的操作，只需为函数赋予适当的参数就可以实现，而不需关心其具体的内部工作原理。场景节点和场景内容是密不可分的，场景内容是可以被渲染到屏幕上且与用户直观接触的；场景节点是抽象的存在，它用来描述场景中实体的位置坐标等信息。传统的三维图形渲染引擎往往将场景节点和场景内

6、容作为一体，或将场景内容作为场景节点的子类进行设计。这种设计看似符合三维渲染的逻辑结构，但却给三维场景的后期维护带来了很大的不便。而Ogre对这种传统的设计进行了改进，实现了场景节点和场景内容的分离，使得编程人员对三维场景的维护变得十分简单。Ogre首先引入了实体（Entity）的概念，它可以在窗口中渲染，但却不能单独使用。要使用实体，必须先定义一个场景节点（SceneNode），然后将这个场景节点与实体绑定。另外，场景节点也无法直接在场景中显示，它必须绑定一个实体。场景中所有的节点都隶属于“根节点”，每一个节点下还可以派生其他的节点，如图2-3所

7、示。…………第3章汉语协同发音建模与三维唇部模型建立..................213.1可视化协同发音建模..................................213.1.1协调发音与视位...........................213.1.2汉语可视发音基元的选择......................223.1.3声母与韵母的重新聚类..............233.1.4建立可视协同发音模型.......................273.2三维唇部模型建立................34第4

8、章基于汉语协同发音模型的口型合成..................384.1计算当前发音音素的影响因子.........

当前文档最多预览五页，下载文档查看全文

侵权申诉



1 1 2 3 4 5 / 8



此文档下载收益归作者所有

当前文档最多预览五页，下载文档查看全文

温馨提示：
1. 部分包含数学公式或PPT动画的文件，查看预览时可能会显示错乱或异常，文件下载后无此问题，请放心下载。
2. 本文档由用户上传，版权归属用户，天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容，确认文档内容符合您的需求后进行下载，若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误，付费完成后未能成功下载的用户请联系客服处理。

基于汉语协同发音模型的文本驱动三维口型动画合成研究

基于汉语协同发音模型的文本驱动三维口型动画合成研究

相关文章

相关标签