资源描述:
《用于说话人识别的实时唇线提取方法》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、用于说话人识别的实时唇线提取方法第32卷VoL32第5期№s计算机工程ComputerEngineering2006年3月March2O06?人工智能及识别技术?文章鳙号z1000----3428(2006)05--0202--03文献标识码,A中圈分类号ITP391.41用于说话人识别的实时唇线提取方法周晔.刘万春.朱玉文(北京理工大学视觉与模式识别实验室,北京100081)擅要:实现了+种用于说话人识别的实时唇线提取方法.该方法首先将原始图像变换到CIELAB颜色空间,然后对所得阻像的L和a分量分别进行直方图统计.根据图像特性,L和a坐标轴的意义等先验知识,直接快
2、速地计算出用于分割出唇区域和嘴内区域的阈值,达到较准确的唇定位.然后采用新的能量函数指导变形模板法提取出唇线.实验表明,该方法简单快速,能够在一定程度上适应光照变化,以及由于不同人所带来的肤色,唇色不同的影响.关t词:CIELAB;唇线定位;图像分割;变形模板;直方图RealTimeLipContourExtractionforSpeakerIdentificationZH0UYe'LIUWanchun,ZHUYuwen(ComputerVisionandPatternRecognitionLab,BeijingInstituteofTechnology,Beijin
3、g100081)[Abstract]Thispaperpresentsflnewmethodofrealtimelipcontourextractionformultimodalspeakeridentification.Firstly,ittumstheoriginalimageintoCIELABcolorspace,thencomputeshistogramsofLandaseparately.AccordingtothecharacteristicoftheoriginalimageandthemeaningofLandacoordinates,thepape
4、rcanworkoutthethresholdforsegmentinginnerlipareaandliparea.Thenlipcontourisextractedusingimproveddeformabletemplate.Thismethodissimpleandfast.ItturnsouttoberobusttOilluminationandspeakerindependentasexperimentsshow.[KeywordslCIELAB;Lipcontourlocation;Imagesegmentation;Deformabletemplate
5、;Histogram历年来在语音识别和说话者识别技术研究中,人们往往只利用语言感知的听觉特性,而忽略了视觉特性,使得在噪声环境或多说话者环境中得不到理想的识别效果.近年来,在多模态识别思想的指导下,人们开始在单纯对语音信息处理的基础上融入视觉信息.初步研究结果表明,将唇读与语音进行融合,能有效改善识别率….也有研究已经证实了利用盾动视觉特征进行身份识别的可行性J.人说话的过程中,主要运动局限在嘴部及其以下的脸部区域,而嘴部的变化包含了最重要的信息,所以如何快速,精确地提取唇线是后续工作的重要一步.目前已有的唇定位方法主要有:(1)模板匹配方法,这种传统的方法通过训练已
6、有图像来得到定位脸部各位置的模板,此方法精度高,但计算复杂;(2)脸部灰度图像投影法,这种方法只利用了灰度信息,抗光线变化的能力差.(3)用分类的方法确定每一个像素是否是唇上点.(4)对彩色图像进行颜色空间变换或颜色处理的方法,这些方法较为简单和快速.奉系统实现了一种用于说话人识别的赏时唇线提取方法.该方法首先将原始图像变换到CIELAB牢问,然后对L和a分量图像进行直方图统计,根据直方图的分布特征来确定用于分割唇区域的阈值,然后对二值化后的图像采用改进后的变形模板法定位出唇线.该方法简单直接,计算速度快,能够适应光照,唇色等条件的变化.1基于LAB颜色空间的闽值确定
7、由于要尽量提取更多的嘴部动态特征,因此本系统中,将拍摄的图像控制在人脸下半部分.图像规格为320×240像素.由于只摄取了人脸的下半部分,因此没有相对位置信息可以利用,只能通过区分人脸的肤色与唇色来定位唇区域.但图像具有如下特点:半部分人脸主要是皮肤,唇,胡须,一202一牙齿,以及舌,其中皮肤区域最大.1.1CIELAB颜色空间CIELAB颜色空间¨J,也称ClE1976La(简写为CIELab)颜色空间,它的三基色值是用CIE定义的光,物体和观察者的数据进行计算得到的.突出特点是:对颜色描述更加符合视觉感知而且,它是目前最为均匀的颜色空间之一,即两