清华大学论文

清华大学论文

ID:46256724

大小:381.00 KB

页数:36页

时间:2019-11-22

清华大学论文_第1页
清华大学论文_第2页
清华大学论文_第3页
清华大学论文_第4页
清华大学论文_第5页
资源描述:

《清华大学论文》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、國立清華大學碩士論文題目:應用於哼唱式檢索之連續性隱藏式馬可夫模型及其強化方法ContinuousHMManditsenhancementforsinging/Hummingqueryretrieval系別資訊工程學系組別學號姓名924304許肇凌(Chao-LingHsu)指導教授張智星博士(Jyh-ShingRogerJang)中華民國九十四年六月摘要在過去數十年間,隱藏式馬可夫模型(HiddenMarkovModels,HMM)已經被成功的應用於語音辨識方面的各種研究。然而,將連續性隱藏式馬可夫模型(ContinuousHMM,CHMM)應用於聲音輸入的

2、旋律辨識(MelodyRecognitionviaAcousticInput,MRAI咸是稱作哼唱式檢索的研究卻相當少見,一部分的原因可能是基於語音和哼唱的聽覺特徵的不同。這篇論文將會探討對於以音框(frame)為基礎之哼唱式檢索的連續性隱藏式馬可夫模型訓練的方法,並更進一步地說明其加強連續性隱藏式馬可夫模型的方式,再以實驗方式與動態時間伸縮(DynamicTimewarping,DTW)比較其效率及正確率。AbstractTheuseofHMM(HiddenMarkovModels)forspeechrecognitionhasbeensuccessfulf

3、orvariousapplicationsinthepastdecades-However,theuseofcontinuousHMM(CHMM)formelodyrecognitionofacousticinput(MRAIforshort),ortheso-calledquerybysinging/humming,hasseldombeenreported,partlyduetothedifferenceinacousticcharacteristicsbetweenspeechandsinging/humminginputs.Thispaperwilld

4、erivetheformulaofCHMMtrainingforframe-basedMRAC.Inparticular,weshallproposeenhancementtoCHMManddemonstratethatwiththeenhancementscheme,CHMMcancomparefavourablywithDTWinbothefficiencyandeffectiveness.目錄第1章序論61.1簡介61.2哼唱式音樂檢索相關研究71.2.1利用音符距離檢索71.2.2動態時間伸縮71.2.3藏式馬可夫模型124三種方法的比較1.3本論文主

5、要成果91.4章節概要第2章使用於哼唱式檢索的連續性隱藏式馬可夫筷型122.1連續性隱藏式馬可夫模型結構112.2連續性隱藏式馬可夫模型估算142.3連續性隱藏式馬可夫模型訓練15231以樂譜為基礎的訓練152.3.2以語料為基礎的訓練16第3章其他哼唱式查詢的方法213.1線性縮放203.2動態時間伸縮21第4章其他哼唱式查詢相關議題244.1音咼追蹤234.2音調轉換234.3休止符的處理264.4狀態轉移機率值的權重係數27第5章實驗結果28歌曲資料庫以及歌聲語料275.2連續性隱藏式馬可夫模型及其加強方法285.3休止符的處理以及狀態轉移機率權重的調整

6、305.4資料庫的大小對於辨識率的影響313433第6章結論及未來工作參考文獻圖表目錄圖1•「十個印地安人」的連續性隱藏式馬可夫模型圖2.狀態轉移機率限制示意圖14圖3.—個典型的模型估算例子,此歌曲為十個印地安人。(a)原始的觀測音高(實線)和其算出的相對應標準音高(虛線)。(b)HMM表格以3D表面方式表♦♦♦♦♦♦♦♦♦♦1圖4•一個典型的線性縮放例子。輸入音高線性縮放了5次,而最佳的長度為原輸入音咼的1.5倍長時♦♦♦♦♦♦♦♦<21♦♦♦♦♦♦♦♦圖5.—個典型的音高平移範例,只畫出兩個重複過程圖6.資料庫中每一首歌曲所包含的錄音資料個數28圖7.(

7、a)—個典型連續性隱藏式馬可夫模型對應的音高(虛線)沒有產生辨識正確的結果。(b)用了線性縮放後,對應音高(虛線)變得合理且辨識結果也正確30圖&各種方法的第一名的辨識率及其平均計算時間31圖9.對於不同設定值的LS+HMM2第一名辨識率32圖10.各種方法在不同資料庫大小時第一名的辨識率。(CHMM1是CHMM使用樂譜訓練,CHMM2是CHMM使用歌聲語料訓練,DTW:動態時間伸縮,33LS:線性縮放)第1章序論1.1簡介眾所皆知隱藏式馬可夫模型(HMM)過去數十年來在語音辨識方面的研究及實際開發上相當成功,幾乎已經成為了一種標準作業。尤其是連續性隱藏式馬可

8、夫模型,非常成功地被實際應用於大詞彙語

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。