欢迎来到天天文库
浏览记录
ID:35052213
大小:6.26 MB
页数:59页
时间:2019-03-17
《唇读识别研究与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、?翊J;3..'=哨学校代码:10004密级:公开乂攀BEIJINGJIAOTONGUNIVERSITY硕:t专业学位论文唇读识别研究与实现'别邏作者姓名盈广明省.^王程领域电子与通信王程祠指导教师阮秋埼教授培养院系计算机与信息技术学院—二零-六年五月MB如义道乂攀硕±专业学位论文唇读识别研究与实现searcementat-RehandImlionofLipreadinReconitionpgg作者;盈广明导师:阮秋埼北京交通大学20
2、16年5月学位论文版巧使用授权书本学位论文作者完全了解北京交通大学有关保留、使用学位论文的规定。特授权北京交通大学可W将学位论文的全部或部分内容编入有关数据库进行检索,、、。提供阅览服务,并采用影印缩印或扫描等复制手段保存汇编W供査阅和借阅同意学校向国家有关部口或机构送交论文的复印件和渡盘。学校可W为存在馆际合作关系的兄弟商校用户提供文献传递服务和交换服务。(保密的学位论文在解密后适用本授权说明)学位论文作者签名了导师签名:签字曰期签字曰期::7^4年/月v/曰>4年6月曰^1学校代码:0004密级:公开
3、北京交通大学硕±专业学位论文唇读识别研究与实现Research-andImplementationofLireadinReconitionpgg作者姓名;盈广明学号:14125162导师姓名:阮秋埼职称;教授专业学位类别:电子与通信工程学位级别:硕±北京交通大学2016年5月致谢本论文是对我研究生期间完成工作的总结与汇报,是在导师阮秋巧教授的悉必指导下完成的。本文从选题、撰写到最终顺利完成,老师都给予了大虽的指导和帮助。他广博的学识、严谨的治学态度、对事业的执着精神和乐观、豁达的人
4、生观,令我钦佩,也始终是我学习的榜样。在此向阮老师表达我的感谢和敬意。感谢袁保宗、、唐晓芳安高云、符蕴芳等老师,他们为实验室营造更好的科研环境和学习氛围做出了很大的贡献,在此表示对他们的谢意。同时还要感谢实验室常春云、刘洋、李飘月、李倩等同学,他们无私的协助我进行数据库的录制,并在我研究生学习和生活中都提供了热情的帮助,在此向他们表达我的感巧之情。最后,十分感谢我的家人和朋友,他们的支持和理解让我能专必在学校完成学业。不论在前进的道路上遇到什么样的挫折,他们永远是我坚强的后盾和前行的动力。北京交通大学硕±专业学
5、位论文摘要;摘要"""’’唇读是指通过观察说话人在发音过程中唇部的变化,读出或者部分读出其所说的内容。而计算机唇读是指通过建立唇读模型和分析发音过程中唇部运动参数,定量地处理唇动信息从而对视频中的序列图像进行分类和识别,或者辅助语音识别来提商语音识别率。对唇读的研究将对耳聋患者、执法机构W及咱杂环境中的工作者具有实际应用意义。本文主要研究单视觉通道下基于孤立字的唇读系统,在暦部分割、特征参数选择和提取W及唇读识别H个方面展开研究;,论文的主要工作如下(1)唇部分割是唇读的核也部分。本文基于BP神经网络和基于La
6、b色彩空、间两种方法进行唇部分割,并对两种方法在分割时间分割效果、分割方法复杂,,基于Lab空间的唇部分割不仅方法简单度方面做出比较实验结果表明,处理。速度快而且分割效果也较好,适合曆读系统对视频处理时实时性的要求(2)在盾部特征参数选择时,本文选擇外唇商度、巧角间距离、张开嘴面积为特征参数。在曆部跟踪过程中提取出H个特征参数值,通过研究特征参数曲线变化,提取出发音过程中的有效部分,进而提取出10顿关键巾贞,从而解决了由于一说话速度不均匀造成时间长度不致的问题。(3)盾读识别模块,本文采用基于神经网络及基于相关系数的相
7、关匹配法两种方法进行唇读的识别,二者的识别率分别为拍.5%和81.25%。经对比分析识别结果一,后者不仅方法简单、易操作而且在识别过程中不需要像神经网络样需要太多训练样本,只巧将输入数据与数据库中数据分别作相关,求取最大相关系数即可。(4)唇读巧据库是盾读研究的基础。由于国内可共孚的汉巧巧据库非常少,本文自建小型数据库。在语料的选择上根据韵母单独成音,声母只能辅助韵母发音的特点,采用在24个韵巧基础上相应加上声母的方法构成语料表。同时本文设计了一个盾读识别系统,该系统的不仅可W实现对人脸及巧部定位而且可W展示唇部巧
8、踪效果,在识别阶段可W检測并输出视频中多个孤立字。关键词:唇读;巧部分巧;盾部巧踪!巧部特征:巧读识别
此文档下载收益归作者所有