欢迎来到天天文库
浏览记录
ID:35057170
大小:3.01 MB
页数:52页
时间:2019-03-17
《基于hsv变换模型的静态口型识别算法的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、分类号;TP39:1.41单位代码:10183研究生学号:201巧12027密级;公开馨吉林大学硕女学位论文学术樂tt()基于HSV变换模型的静态口型识别算法的硏究TheResearchofStaticLipRecogn出onbasedonHSVTransformation作者姓名;郡黎专业:电路与系统研究方向:图像处理指导教师:张振国副教授合作教师:常玉春教授培养单位:电子科学与工程学院2016年6月未经本论文作者的书面授枚,依法收存和保管本论文书
2、面版本、电子版本的任何单位和个人,均不得对本论文的全部或部分内容进行任何形式的复制、修改、发行、出租、改编等有碍作者著作权的商业性使用(但纯学术性使用不在此限)。否则,应承担侵权的法律责任。吉林大学博±(或硕±)学位论文原创性声明本人郑重声明:所呈交学位论文,是本人在指导教师的指导下。,独立进行研究工作所取得的成果除文中己经注明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的作品成果。对本文的研究做出重要贡献的个人和集体,均已在文中明确方式标明。本人完全意识到本声明的法律结果由本人承担。
3、学位论文作者签名:惡曰期:扣4年占月/曰基于HSV变换模型的静态口型识别算法的研究TheResearchofStaticLipRecognitionbasedonHSVTransformation作者姓名:鄢黎专业名称:电路与系统指导教师:张振国副教授学位类别:工学硕士论文答辩日期:2016年6月1日基于HSV变换模型的静态口型识别算法的研究摘要在日常的交流和学习生活中,人类对于语言的感知是从多个通道汇合而成的。既可以通过声音通道获取相应的语音信息,也可以通过视觉观察唇动信息来辅助对于语音信息的理解。因此,通过对唇动信息的捕获来
4、研究口型识别是非常重要的,不仅可以改善在噪声和干扰环境下语音识别准确率低的缺点,解决聋哑人交流中无法发出声音的问题,还可以应用于多媒体系统、人机智能交互和身份识别等多个领域。最近几年里,随着人机交互这个领域的火热,许多科研人员提出了基于唇读技术的人机交互方式,发展成为一个新的研究方向。大部分研究学者的研究内容都是将语音识别和口型识别相结合,以期望达到更高的识别率和准确率。并且,在过去的研究中,语音识别相关领域突飞猛进发展迅速,已远远超过口型识别技术的研究。所以,这篇文章的目的是对口型识别过程中的关键算法进行研究同时建立一个对单个单词进行识别
5、的口型识别模块,为后续与手势识别相结合共同辅助聋哑人交流作准备。为了实现口型识别,首要条件是对嘴唇进行准确的定位,唇部定位的精确程度直接决定了整个系统的识别率,因此是具有重要意义的一步。本文通过对图像中的目标进行人脸识别,眼球定位从而获取嘴唇区域的完整像素,进而对唇部特征进行提取和处理,最后达到孤立词识别的目的。在人脸识别阶段,采用肤色分割方法同时对各种常用颜色模型的优缺点进行了对比,发现了RGB和HSV颜色模型对红色区域较为敏感以及YCbCr颜色模型的边缘检测效果较弱,易将肤色像素判断为非肤色区域的缺点,而将HSV和YCbCr颜色模型结合
6、起来进行肤色分割则可以得到较好的结果并且避免红色区域以及光照强度的影响。在人眼定位阶段,首先采用像素值灰度积分法快速地将人眼候选区域从人脸范围内截取出来,然后利用眼睛瞳孔是圆形这一特征,对人眼候选区域进行Hough圆扫描检测,定位到几何特征为圆形的眼球部位。在嘴唇提取阶段,对传统的HSV颜色空间进行了改进和变换,增强了嘴唇区域像素与周围像素点的对比度,使得嘴唇分割效果更为理想。在口型识别阶段,首先需要提取唇形的几何特征,对各个特征函数进行测试和加权处理,然后采用动态时间规整算法(DTW)将加权后的特征与模板库进行匹配从而达到口型识别的目的。
7、本文详细讨论了口型识别过程中各个模块所应用到的算法和技术,提出了一种静态识别算法,在现有算法的基础上进行了优化和改进,较大的提高了系统的识别率和效率。实验结果表明,文中所构建的口型识别模块在进行单个单词的识别时能够实现83%的识别率。但是与动态口型识别技术相比还有一定的距离,未来我们仍需为更好的实现人机交互而不断努力。关键词:口型识别,HSV,人脸识别,Hough变换,DTW,模板匹配TheResearchofLipReadingbasedonHSVTransformationABSTRACTIndailylife,communicatin
8、gandlearning,humanperceptionoflanguageismadeofapluralityofchannelsfromtheconfluence.Eithe
此文档下载收益归作者所有