欢迎来到天天文库
浏览记录
ID:43876564
大小:409.79 KB
页数:61页
时间:2019-10-16
《硕士论文题目》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、基于内容的声音检索方法研究及多媒体数据库eBase3.1系统实现作者姓名L:胡导师姓名:李磊教授专业名称:应用数学答辩委员会委员(签名)主席:委员:摘要4ABSTRACT5第一章前言6论文贡献和内容6第二章语音数字处理方法82.1前言82.1.1语音识别的意义82.1.2语音识别模型92.1.3语音识别的类型和问题92.2语咅信号处理方法研究102.2.1语咅信号处理基础102.2.2语音分析152.2.3特征匹配及识别212.3语音识别系统现状27第三章语音识别策略293.1策略概要293.2特征抽取方法293.2.I概述293.2.2线性预测编码LPC293.2.3倒谱Cepstru
2、m313.2.4Gabor滤波333.3索引333.3.1概述333.3.2基于SOM和统计检验的索引算法343.3.3分段索引393.3.4二重索引403.3.5小结403.4实验结果与分析413.4.1AudioHouse系统413.4.2测试配置413.4.3测试结果42第四章多媒体数据库EBASE3.1464.1多媒体数据库eBase简介462.2多媒体数据库的系统实现472.2.1数据建模472.2.2逻辑框架482.2.3功能框架532.2.4eBase的特点532.3小结55第五章前景展望56第六章总结58致谢59参考文献60声音的机器识别成为一个科研课题已有四十年之久。尽
3、管设计可以识別语音并能辨别其含义的智能机器有不可抗拒的魅力,尽管已经投入了大量的力量去研制这样的机器,但是可以在任何环境下识别任意讲演者关于任何话题的讲演仍未实现。从语咅信号中以高效的、稳健的方式抽取相关信息是语咅识别的第一步。木文介绍了三种语咅特征抽取方法:线性预测编码(LPC)、侄谱(Cepstrum)及Gabor滤波法,并根据实验结果分析了不同特征抽取方法反映的不同的语音特征。如何判定语音样本的相似性是语音识别的关键问题乙一。对于不同的识别系统,样木比较的方法千差万别。木文给HITS于SOM和统计检验的索引、分段索引以及二重索引的方法。该方法弥补了传统的多维索引方法和基于SOM索引
4、方法的不足,适应语音特征,有效地将语音特征动态索引。观察实验结果可以清楚地看出,索引方法的査询效率要远远优于顺序查找,基木达到了特征索引的要求。我们改造了多媒体数据库引擎eBase3.()以扩展其多媒体功能。新的数据库引擎eBase3.1可以处理声音信号,并识别简单的单词。它采用了基于SOM和统计检验的索引、分段索引以及二重索引的方法获取相似样本集。它的开放性框架使它具有媒体独立性和特征扩充性。这两个特性使eBase3.1具有广泛的适应性。基于内容声音检索分段索引二重索引多媒体数据库多维索引神经网络特征影射网媒体独立性特征扩充性AbstractAutomaticrecognitionof
5、speechbymachinehasbeenagoalofresearchformorethanfourdecades・However,inspiteoftheglamourofdesigninganintelligentmachinethatcanrecognizethespokenwordandcomprehenditsmeaning,andinspiteoftheenormousresearcheffortsspentintryingtocreatesuchamachine,wearefarfromachievingthedesiredgoalofamachinethatcanun
6、derstandspokendiscourseonanysubjectbyallspeakersinallenvironments.Thefirststepofspeechrecognitionisextractingrelevantinformationfromthespeechsignalinanefficient,robustmanner.Inthisarticlewepresentthethreefundamentalfeature-extractingapproachestospeechspectralanalysis:linearpredictive,cepstrumandG
7、aborfiltermethods・Wespecializethepresentationofthesethreefundamentaltechniquestoaspectsrelatedtospeechanalysisandcompareandcontrastthethreemethodsintermsofrobustnesstospeechsoundsandrequiredcomputation.Akeyquestioninsp
此文档下载收益归作者所有