神经网络与话者识别

神经网络与话者识别

ID:39773037

大小:681.00 KB

页数:28页

时间:2019-07-11

神经网络与话者识别_第1页
神经网络与话者识别_第2页
神经网络与话者识别_第3页
神经网络与话者识别_第4页
神经网络与话者识别_第5页
资源描述:

《神经网络与话者识别》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、神经网络建模与话者识别话者识别人工神经网络BP网络RBF网络TextTextText话者识别话者识别属于生物特征识别技术的一种,是一项根据语音信号中反映说话人生理和行为特征的语音参数,自动识别说话人身份的技术。与语音识别不同的是,声纹识别利用的是语音信号中的说话人信息,而不考虑语音中的字词意思,它强调说话人的个性;而语音识别的目的是识别出语音信号中的言语内容,并不考虑说话人是谁,它强调共性。话者识别系统主要包括两部分,即特征检测和模式匹配。特征检测的任务是选取唯一表现说话人身份的有效且稳定可靠的

2、特征,模式匹配的任务是对训练和识别时的特征模式做相似性匹配。话者识别分类话者识别话者辨认话者确认固定文本系统自由文本系统话者辨认语音特征提取相似度参考模型(话者#1)最大选择辨识结果(话者ID)相似度参考模型(话者#2)相似度参考模型(话者#N)话者确认语音特征提取相似度参考模型(话者#M)相似度阈值话者ID(#M)确认结果(接受或拒绝)模式匹配welcometousethesePowerPointtemplates,NewContentdesign,10yearsexperience模式匹配的

3、方法目前说话人识别技术主流方法大致有:1)基于模板模型的方法(动态时间归正法DTW和矢量量化法VQ);2)基于概率模型的方法(隐马尔可夫模型法HMM和高斯混合模型法GMM);3)基于人工神经网络(ArtificialNeuralNetwork,ANN)的方法;4)基于支持向量机(SupportVectorMachine,SVM)的方法;5)融合方法(利用各种方法的优点进行融合)。人工神经网络基于ANN的语音识别系统通常由神经元、训练算法及网络结构等三大要素构成。ANN采用了并行处理机制、非线性信

4、息处理机制和信息分布存贮机制等多方面的现代信息技术成果,因此,具有高速的信息处理能力,并且有着较强的适应和自动调节能力,在训练过程中能不断调整自身的参数权值和拓扑结构,以适应环境的和系统性能优化的需求,在模式识别中有着速度快、识别率高等显著特点,人工神经网络的发展人工神经网络的研究始于40年代初。半个世纪以来,经历了兴起、高潮与萧条、高潮及稳步发展的远为曲折的道路。1943年,心理学家W.S.Mcculloch和数理逻辑学家W.Pitts提出了M—P模型。1949年,心理学家D.O.Hebb提出

5、突触联系可变的假设,根据这一假设提出的学习规律为神经网络的学习算法奠定了基础。1957年,计算机科学家Rosenblatt提出了著名的感知机模型。1960年,B.Windrow和E.Hoff提出了自适应线性单元,它可用于自适应滤波、预测和模式识别。1968年一本名为《感知机》的著作中指出线性感知机功能是有限的,它不能解决如异或这样的基本问题,而且多层网络还不能找到有效的计算方法。60年代末期,人工神经网络的研究进入了低潮。80年代初期,模拟与数字混合的超大规模集成电路制作技术提高到新的水平,完全

6、付诸实用化,美国的物理学家Hopfield于1982年、1984年在美国科学院院刊上发表了两篇关于人工神经网络研究的论文,引起了巨大的反响。人们重新认识到神经网络的威力以及付诸应用的现实性。神经网络模型神经元神经元是神经网络的基本计算单元,一般是一种多个输入和一个输出的非线性单元,可以有反馈输入和闭值参数神经网络连接方式前馈型网络反馈性网络神经网络的连接方式在前馈型网络中,各神经元接受前一层的输入,并输出给下一层,没有反馈。连接点分为两类,即输入单元和计算单元。每一个计算单元可以有任意n个输入但

7、只有一个输出,它可祸合到任意多个其它结点作为输入。通常前馈网络分为不同的层,第l层的输入只与第卜l层的输出相连,输入和输出结点与外界相连,而其它中间层则称之为隐层。根据隐层的层数,还可以再分为单层连接方式、多层连接方式。神经网络的连接方式在反馈型网络中,可以看成包含一个单层的神经元,所有神经元结点都是计算单元,同时也可接受输入,并向外界输出。这种网络可以画成一个无向图,其中每条连接线都是双向的。反馈型网络的输出由当前输入和先前的输出,以及网络参数和结构决定,因此显示出短期一记忆的性质。HoPfi

8、eld网络就是反馈型网络的代表。典型神经网络模型1)感知机2)线性神经网络3)BP网络4)径向基函数网络5)自组织网络6)反馈网络BP神经网络BP(BackPropagation)网络是1986年由Rumelhart和McCelland为首的科学家小组提出,是一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一。多层BP神经网络模型的拓扑结构如图所示。由图可见,它由输入层、中间层和输出层组成。其中,中间层也叫隐含层,它可以是一层或多层。。BP网络标准学习算法网络结构:输入层

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。