欢迎来到天天文库
浏览记录
ID:35096061
大小:4.54 MB
页数:72页
时间:2019-03-17
《自动语种识别的研究与应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、iii.ifII4各种成I^专业学位硕±学位论文ORPROFESSIONALDEGREEMASTERTHESISF*>?■:*iJmj,一喊资论文题目自动语种识别的研究与应用?-.-专业学位类别工程硕±学号201322020727,作者姓名蔡超指导教师陈章蠢副教授....V..独剑性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,除了文中特别加W标注和致谢的地方夕h论文
2、中不包含其他人已经发表或撰写过的研究成果,也不包含为获得电子科技大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。:^20作者签名;日期*^年^月蘇鞍;2日论文使用授权本学位论文作者完全了解电子科技大学有关保留、使用学位论文的规定,有权保留并向国家有关部口或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权电子科技大学可将学位论文的全部或部分内容编入有关数据库进行检索,可采用影印、缩印或扫描等复制手段
3、保存、汇编学位论文。X保密的学位论文在解密后应遵守此规定)作者签名;家搬导师签名:巧,亏备'日期;义占年>月八日分类号密级注1UDC学位论文自动语种识别的研究与应用(题名和副题名)蔡超(作者姓名)指导教师陈章鑫副教授电子科技大学成都(姓名、职称、单位名称)申请学位级别硕士专业学位类别工程硕士工程领域名称电子与通信工程提交论文日期2016.03.31论文答辩日期2016.05.24学位授予单位和日期电子科技大学2016年6月答辩委员会主席评阅人注1:注明《国际十进分类法UDC》的类号。ResearchonA
4、utomaticLanguageIdentificationandItsApplicationAMasterThesisSubmittedtoUniversityofElectronicScienceandTechnologyofChinaMajor:MasterofEngineeringAuthor:ChaoCaiAdvisor:Dr.zhangxinchenSchool:SchoolofElectronicEngineering摘要摘要随着我国经济的迅速发展,国人的活动范围不断变大,不同语种之间的交流和碰撞愈加频繁。人们
5、迫切地希望能有一种突破语种障碍的交流系统,因而作为重要前端的自动语种识别技术的重要性也与日俱增。除此之外,自动语种识别在信息安全、军事安全领域也有着广泛的应用前景。相较于英语、法语、汉语等大语种,语种识别在我国少数民族语言方面的研究发展较为缓慢,目前还没有一个能比较全面地涵盖我国少数民族语言的语种识别系统。针对这种状况,本文在研究中尝试建立一个基于matlab的包括汉语、白语、藏语、苗语、纳西语、维吾尔族语、彝族语和壮族语在内的语种识别系统。为此,本文主要做了以下几个方面的工作:第一,特征提取方面的研究。对原始语音信号进行预
6、处理和特征提取是建立一个有效语种识别系统的基础。预处理的方法和特征的选取直接关系到语种识别系统最终所能达到识别率的上限。本文在实践中总结出了多种针对少数民族语言具有高区分度的特征,并对其原理和提取过程做了介绍。不仅如此,本文还运用了预加重,倒谱均值相减等技术,并对其实现过程进行了简单介绍。第二,基于高斯混合模型(GaussianMixtureModel,GMM)识别方法的研究。本文对高斯混合模型的原理及其参数估计算法进行了研究,并完成了基于GMM的语种识别系统,该系统的平均检测代价达到了0.2214。在此基础上,本文还探讨了
7、GMM模型延展出来的全局背景无关模型(universalbackgroundmodel,UBM),建立了一个基于GMM-UBM的语种识别系统,其性能略优于GMM系统,平均检测代价为0.2143。第三,基于支持向量机模型(Supportvectormachine,SVM)的识别方法研究。本文对支持向量机的理论做了简单介绍后,建立了一个基于SVM的语种识别系统。该系统在识别率在略低于GMM系统,平均检测代价为0.2514。第四,为了验证不同特征参数选取对系统识别率的影响,本文在不同输入特征下对GMM系统、GMM-UBM系统和SV
8、M系统进行了识别率的对比实验,可供后续研究借鉴。关键词:语种识别,少数民族语言,高斯混合模型,支持向量机IABSTRACTABSTRACTWiththerapiddevelopmentofChineseeconomy,communicationbetweenpeopleofdifferen
此文档下载收益归作者所有