语音情感识别中主动学习和半监督学习方法研究

语音情感识别中主动学习和半监督学习方法研究

ID:24598751

大小:2.52 MB

页数:79页

时间:2018-11-15

语音情感识别中主动学习和半监督学习方法研究_第1页
语音情感识别中主动学习和半监督学习方法研究_第2页
语音情感识别中主动学习和半监督学习方法研究_第3页
语音情感识别中主动学习和半监督学习方法研究_第4页
语音情感识别中主动学习和半监督学习方法研究_第5页
资源描述:

《语音情感识别中主动学习和半监督学习方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、硕士学位论文语音情感识别中主动学习和半监督学习方法研究RESEARCHONACTIVELEARNINGANDSEMI-SUPERVISEDLEARNINGMETHODSINSPEECHEMOTIONRECOGNITION张晓鹏哈尔滨工业大学2013年6月国内图书分类号:TP391.4学校代码:10213 国际图书分类号:681.39密级:公开硕士学位论文语音情感识别中主动学习和半监督学习方法研究硕士研究生:张晓鹏导师:李海峰教授申请学位:工程硕士学科:计算机技术所在单位:计算机科学与技术学院答辩

2、日期:2013年6月授予学位单位:哈尔滨工业大学ClassifiedIndex:TP391.4U.D.C.:681.39DissertationfortheMasterDegreeRESEARCHONACTIVELEARNINGANDSEMI-SUPERVISEDLEARNINGMETHODSINSPEECHEMOTIONRECOGNITIONCandidate:ZhangXiaopengSupervisor:Prof.LiHaifengAcademicDegreeAppliedfor:Mast

3、erofEngineering Speciality:ComputerTechnologyAffiliation:SchoolofComputerScienceandTechnologyDateofDefence:June,2013Degree-Conferring-Institution:HarbinInstituteofTechnology摘要摘要语音情感识别,特别是大规模的情感识别需要标注大量的情感语料。人 们可以很容易获取大量未标注的自然语音,而对自然语音进行情感标注的代 价高,特别对维

4、度情感的标注。本文研究离散和维度情感模型下,通过主动 学习选择信息含量高的语料交给人工标注,以及通过半监督学习对语料自动 标注,用较小的标注代价得到较高的性能。针对如何选择情感语音中信息含量最多的语料交给人工标注,从而有效 减少人工标注成本,研究了语音情感识别中的主动学习方法。离散情感模型 下,考虑到输出概率是模型对识别结果确定性程度的度量,探究了根据输出 概率估计信息含量的最小置信度、边界采样和信息熵方法;此外,构造一组表示变型空间中不同区域的委员会模型,探究了基于投票熵和KL距离度量 成员模

5、型识别结果分歧度的委员会查询方法,分歧度越大的语料包含的信息 量越大。维度情感模型下,对维度情感语音建模的回归模型无法直接估计输 出概率,本文探究了将连续情感标注值离散化,通过离散分类模型的输出概 率来近似表示语料信息量的最小置信度方法;类似地,探究了构造一组回归 预测委员会模型,利用成员模型预测方差来估计分歧度的委员会查询方法。 针对如何利用未标注情感语音中的信息来提高语音情感识别性能,研究 了语音情感识别中的半监督学习方法。在离散情感模型下,认为输出概率高 的语料是当前模型的识别结果中最确定

6、的,探究了基于置信度阈值的自学习 方法,以及利用不同特征集合表示不同视图的协同训练方法;考虑利用图来 表示情感数据间的相似性,标注按照相似度向周围传播的标注传播算法。维 度情感模型下,探究了基于流形假设的图正则化方法在语音情感识别中的效 果。考虑预测函数在标注数据上的平方损失和希尔伯特空间上模型复杂度范 数,探究了结合拉普拉斯矩阵表示图中流形结构信息作为正则化项的LapRLS,以及结合定义在不同数据集上两个视图预测的不一致性作为正则 化项的CoRLS。最后,探究了主动学习方法和半监督学习结合对方

7、法,选择输出置信度 最低的语料交给人工标注和置信度最高的模型标注结果加入到训练集中,应 用于离散情感模型的语料标注中。关键词:语音情感识别;主动学习;半监督学习;维度情感;图正则化IAbstractAbstractSpeechemotionrecognition,especiallylarge-scaleemotionrecognitionrequiresalotofemotionalspeechannotation.Numerousunlabelednaturalspeechescanbeea

8、silycollected,whiletheannotationishighcost,especiallyforthedimensionallabeling.Thispaperstudiedactivelearningandsemi-supervisedlearninginbothdiscreteemotionmodelanddimensionalemotionmodel.Activelearningfocusesonhowtochoosethemostinformativedataforhum

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。