隐马尔科夫模型-孤立字语音识别课件.ppt

隐马尔科夫模型-孤立字语音识别课件.ppt

ID:57186741

大小:158.00 KB

页数:18页

时间:2020-08-02

隐马尔科夫模型-孤立字语音识别课件.ppt_第1页
隐马尔科夫模型-孤立字语音识别课件.ppt_第2页
隐马尔科夫模型-孤立字语音识别课件.ppt_第3页
隐马尔科夫模型-孤立字语音识别课件.ppt_第4页
隐马尔科夫模型-孤立字语音识别课件.ppt_第5页
资源描述:

《隐马尔科夫模型-孤立字语音识别课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、1.马尔科夫链设S是一个由有限个状态组成的集合。S={1,2,3,…,n-1,n}可以把马尔科夫链看做小球随时间在n种状态跳动的过程。TS123n......0123t............由小球的跳动产生的状态序列X如果序列X在t时刻处在状态,若有则随机序列X构成一个一阶马尔科夫链。(MarkovChain)2.马尔科夫模型一阶马尔科夫模型可以描述为一个二元组(S,A),S是状态的集合,而A是所有状态转移概率组成的一个n行n列的矩阵,其中每一个元素为从状态i转移到状态j的概率。一个马尔科夫模型的应用天气预测:我们假设天气只有3个状态{1(阴天),2(多云

2、),3(晴天)}对以往天气的观察我们已经统计出了状态转移矩阵。阴天晴天多云0.30.20.60.40.30.10.20.80.1假设我们今天是晴天,那么我们怎样预测明天的天气呢?因为晴天是3状态,多以我们只要找出矩阵A中第三行的转移概率最大的那一列即可。因为A的第三行第三列最大,也就是或如果今天是晴天则有0.8的概率明天仍然是晴天。3.隐马尔科夫模型坛子与小球问题......12n坛子和小球的问题n个坛子代表马尔科夫模型的n个状态的,某人按照马尔科夫模型在n个坛子中选择,这是一个马尔科夫过程,当他选择到一个坛子他就从坛子中取出一个小球,记录小球的颜色。假设坛

3、子中各种颜色的球的个数是不一样的,所以他拿到每种颜色球的概率也是一个随机过程。这种双随机过程就是隐马尔科夫模型。隐马尔可夫模型可以表示为一个五元组(S,V,A,B,)S是一组状态的集合。S={1,2,3,…,N}(状态n对应坛子n)V是一组输出符号组成的集合。V={}(对应红色小球)A是状态转移矩阵,N行N列。A=[]=,1≤i,j≤NB是输出符号的概率分布。B={}表示在状态j时输出符号的概率=P(

4、j),1≤k≤M,1≤j≤N是初始状态概率分布={}=P(=i)表示时刻1选择某个状态的概率。隐马尔可夫过程是一个双重随机过程,其中一重随机过程不能直接观察到

5、,通过状态转移概率矩阵描述。另一重随机过程输出可以观察的观察符号,这由输出概率来定义。可以把隐马尔可夫模型看做符号序列的生成装置,按照一定的步骤,隐马尔可夫模型可以生成下面的符号序列:O=()抛掷硬币问题三枚硬币,随机选择一枚,进行抛掷,记录抛掷结果。可以描述为一个三个状态的隐马尔科夫模型。=(S,V,A,B,),其中S={1,2,3}V={H,T}={1/3,1/3,1/3}A12310.90.050.0520.450.10.4530.450.450.1B123H0.50.750.25T0.50.250.75问题一:给定上述模型,观察到下列抛掷结果的概率是

6、多少?O=(HHHHTHTTTT)(估算问题)(另一种语言模型)问题二:给定上述模型,若观察到上述抛掷结果,最可能的硬币选择序列(状态转换序列)是什么?(解码问题)问题三:若上述模型中的状态转移矩阵A、状态输出概率B和初始状态分布π均未知,如何根据观察序列得到它们?(学习问题或训练问题)隐马尔科夫模型的三大问题第1帧4.孤立字语音识别4.1特征提取第2帧第3帧第4帧第5帧每一帧我们可以取24维特征矢量来表示,这相当于隐马尔科夫模型中的观察序列。但唯一的问题是拿小球坛子问题来说就是它的小球种类是无数种,因为是24维矢量。所以我们要把这些无数种的矢量归类,这就是

7、矢量量化过程。举例:以二维矢量为例所有可能的二维矢量就构成了一个平面。第i个二维矢量记为:Xi={xi1,xi2}。先把这个平面划分成J块互不相交的子区域,从每个子区域中找出一个代表矢量。如J=7。矢量量化的基本原理矢量空间的划分Y1Y2Y3Y4Y5Y6Y7x1x2码本Y={Y1,Y2,…,YJ}码本长度J=7码字Yj={xj1,xj2},j=1,2,…J矢量量化的基本原理矢量空间的划分按照上面的原理把24维的语音特征归类到码本中,语音识别的码本一般选64,128,或256。观察序列就产生了这里的T就是孤立字语音分割出来的帧数,O是码本中的码字构造隐马尔科夫

8、模型(S,V,A,B,)其中A的状态数N一般选在3-8之间效果最好,V的大小就是码本长度,它的值就是码字。4.2形成隐马尔科夫模型设=(A,B,),构造好模型训练的值使P(O

9、)最大。储存每个孤立字训练出来的和该对应的字4.3训练每个孤立字语音的参数4.4语音识别某人说一个字,这个字要求已经被训练过,把这个字的音频通过码本转化成观察序列。根据这个序列去找储存好的使P(O

10、)最大,通过找到这个对应的字。THEEND!

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。