欢迎来到天天文库
浏览记录
ID:35633280
大小:3.30 MB
页数:43页
时间:2019-04-04
《毕业设计(论文)-基于机器学习的数字音频分类方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、基于机器学习的数字音频分类方法研究摘要:让计算机能听懂人类的语言,是人类自计算机诞生以来梦寐以求的想法。随着经济的发展,人们越来越迫切要求摆脱键盘的束缚而代之以语音输入这样便于使用的、自然的、人性化的输入方式。这就使语音信号分析成为社会生活中越来越重要的一部分。其中语音识别是语音信号分析的重要领域,而语音特征信号识别又是语音识别研究领域的一个重要方面.语音特征信号识别一般采用模式匹配的方法解。首先通过预处理提取语音特征,作为该语音片段的模型。将该模型与已知的参考模型相比较,获得最佳匹配的参考模式作
2、为识别结果,在论文中研究的是基于传统的BP神经网络的音频分类与SVM技术音频分类的仿真实验结果进行比较,对比两者各自优缺点,从而熟悉这两种技术的基本工作原理和算法。通过实验对其性能进行了主观评价和客观数据分析,对于所选语音信号BP网络具有较快的训练速度,但是SVM技术具有较高的识别率。BP网络的学习和记忆具有不稳定性。也就是说,如果增加了学习样本,训练好的网络就需要从头开始训练,对于以前的权值和阈值是没有记忆的。但是可以将预测、分类或聚类做的比较好的权值保存。关键词:语音识别,特征提取,梅尔倒谱系
3、数,BP网络,SVM(支持向量机)Researchondigitalaudioclassificationbaseonmachine-learningAbstract:Sincethebirthofthecomputerpeoplewanttoletthecomputercanunderstandhuman'slanguage.Peoplearebecomingmoreandmoreurgenttogetridofkeyboardandreplaceitbyvoiceinputthatispers
4、onalized、convenientandnaturaltobeused.SothatAnalysisofspeechsignalbecomeamoreandmoreimportantpartinsociallife.ThespeechrecognitionisanimportantpartofAnalysisofspeechsignal,andthevoicesignalrecognitionisoneofthemostimportantaspectsofspeechrecognition.S
5、peechfeaturesignalsrecognitionusetousepatternmatchingmethod.Firstly,throughpretreatmentofphoneticfeatureextractionmakeasthemodel.Themodeliscomparedwithknownreferencemodel,getthebestmatchesthereferencepatternasaresultofrecognition.Inthispaperresearchis
6、basedonthetraditionalBPneuralnetworkaudioclassificationandtechnologyofSupportvectormachineaudioclassificationtheexperimentalresultswerecomparedtofindeachofadvantagesanddisadvantages,sotounderstandwiththetwotechnicalbasicprincipleandalgorithm.Throughth
7、eexperimentsontheperformanceofthesubjectiveevaluationandobjectivedataanalysis,forselectedspeechsignalBPnetworkhasfastertrainingspeed,buttheSVMtechnologyhashigherrecognitionrate.BPnetworklearningandmemoryhaveinstability.Thatistosaythatiftheincreaseofle
8、arningsamples,thetrainednetworkisneededtostarttraining,forthepreviousweightsandthresholdsisnomemory.Butitcankeepthesebetterweightthatdowellinpredict,classificationorclustering.KEYWORDS:SpeechrecognitionfeatureextractionMelfrequencycepstrumcoef
此文档下载收益归作者所有