欢迎来到天天文库
浏览记录
ID:34535498
大小:1.31 MB
页数:85页
时间:2019-03-07
《与文本无关的语种识别技术研究.pdf》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、分类号密级注1UDC学位论文与文本无关的语种识别技术研究(题名和副题名)刘芮杉(作者姓名)指导教师贺知明教授电子科技大学成都(姓名、职称、单位名称)申请学位级别工程硕士专业学位类别电子与通信工程提交论文日期2013.04论文答辩日期2013.05学位授予单位和日期电子科技大学2013年6月答辩委员会主席钟洪声评阅人王刚熊金涛注1:注明《国际十进分类法UDC》的类号。万方数据STUDYONTHETECHNOLOGIESOFTEXT-INDEPENDENTLANGUAGERECOGNITIONAMasterThesisSubmittedtoUniversityofElectronicScienc
2、eandTechnologyofChinaMajor:ElectronicandCommunicationEngineeringAuthor:LiuRuiShanAdvisor:HeZhiMingProfessorSchool:SchoolofElectronicEngineering万方数据电子科技大学硕士学位论文独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得电子科技大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何
3、贡献均已在论文中作了明确的说明并表示谢意。作者签名:日期:年月日论文使用授权本学位论文作者完全了解电子科技大学有关保留、使用学位论文的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权电子科技大学可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。(保密的学位论文在解密后应遵守此规定)作者签名:导师签名:日期:年月日-3-万方数据摘要摘要随着人与人之间交流方式的多样化,不同语种间的沟通也出现的越来越频繁。语种识别技术作为语音信号处理技术的一个分支,在近几年也受到越来越多的关注和研究。主流的与文本无
4、关的语种识别技术主要从基于声学模型和基于音素序列模型的角度出发,并建立与之匹配的识别模型,主要有PRLM,GMM,SVM。传统的研究方向也主要集中在对这些识别模型的核函数进行优化和改进。本文的研究重点主要放在尝试将流形学习的算法引入到语种识别的研究中,以解决降低特征参数维数,优化特征参数向量,消除冗余信息,节省计算时间和抑制文本信息对语种识别的影响,并使用支持向量机做基准识别模型进行对比。本课题的主要贡献在以下几个方面:1.本论文的第一个研究工作主要放在语种语音特征的分析上,针对不同语种之间的特点,提取出能代表语种信息的特征参数向量。2.本论文的第二个研究工作主要在主成分分析(PCA)的全局
5、最优降维算法在语种识别邻域中的应用。PCA算法是一种保证均方误差最小的前提下能对特征参数向量做最优降维处理的方法。通过将原始特征参数向量向低维空间的投影达到去除向量相关性和降维的目的。本论文通过实验也证明了主成分分析法运用到语种识别技术的可行性。3.本论文的第三个研究工作主要在局部保距投影(LPP)的保持局部邻近关系的算法在语种识别技术中的应用。并在LPP算法的基础上,考虑到PCA没有描述数据的局部信息和LPP算法没有考虑类别信息的缺陷,提出了一种改进的基于语种类别属性约束的局部保距投影(LAC-LPP)算法。LAC-LPP算法通过对特征参数在其分布空间中建立与之相邻近的关联包,根据类内集聚
6、、类间远离的原则,设计个特征参数数据点的局部几何结构。在实验中,将提取出的语音特征参数运用到这三种流形学习算法进行特征降维处理,选用最近邻分类器做分类识别后,也验证了LAC-LPP算法的较好的分类效果。关键词:语种识别技术,流形学习,主成分分析,局部保距投影,基于语种类别属性约束的局部保距投影I万方数据ABSTRACTABSTRACTLanguagerecognitiontechnologyasabranchofthespeechsignalprocessingtechnologyinrecentyearshasalsobeenmoreandmoreattentionandstudy.Ins
7、piteofsomesimilaritiesbetweenlanguageidentificationandtraditionspeechrecognition,therearestilldiscrepancies.ThemainstreamLanguagerecognitiontechnologyismainlybasedonacousticmodelandbasedphonemesequencemodel
此文档下载收益归作者所有