欢迎来到天天文库
浏览记录
ID:21619030
大小:72.00 KB
页数:20页
时间:2018-10-19
《一个简单的htk应用例子》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、HTK使用方法簡介(一)使用全字聲音單位(不含間隔音)李立民目標:設計及製作連續數字語音辨認系統進行語音辨認實驗系統性能評估分析Step1:FeatureExtraction將實驗所需的訓練音及測試音波形檔(*.wav)轉換成特徵檔(*.mfcc)建立一個設定檔fea_extract.cfg來指定轉換之輸入與輸出格式。建立一個輸入與輸出檔路徑表檔案io_filelist.txt執行HCopy-Cfea_extract.cfg-Sio_filelist.txt#CodingparametersSOURCEKIND=WAVEFO
2、RMSOURCEFORMAT=WAVSOURCERATE=1000#10KHzTARGETKIND=MFCC_E_A_DTARGETRATE=100000.0#(10ms)WINDOWSIZE=250000.0#(25ms)ZMEANSOURCE=FUSEHAMMING=TPREEMCOEF=0.97NUMCHANS=26CEPLIFTER=22NUMCEPS=12ENORMALISE=F輸入及輸出格式設定檔fea_extract.cfg輸入及輸出檔路徑表io_filelist.txt輸入檔案路徑輸出檔案路徑wavS5
3、0_00.wavmfccS5 0_00.mfccwavS5 0_01.wavmfccS5 0_01.mfccwavS5 0_02.wavmfccS5 0_02.mfccwavS5 0_03.wavmfccS5 0_03.mfccwavS5 0_04.wavmfccS5 0_04.mfccwavS5 0_05.wavmfccS5 0_05.mfccwavS5 0_06.wavmfccS5 0_06.mfccwavS5 0_07.wavmfccS5 0_07.mfccw
4、avS5 0_08.wavmfccS5 0_08.mfccwavS5 0_09.wavmfccS5 0_09.mfccwavS5 0_10.wavmfccS5 0_10.mfcc…使用Hlist觀察特徵向量檔內容執行Hlist-h-omfccS1 0_00.mfcc>temp.txt觀察temp.txt內容------------------------------Source:mfccS1 0_00.mfcc------------------------------SampleBytes:
5、156SampleKind:MFCC_E_D_A_KNumComps:39SamplePeriod:10000.0usNumSamples:57FileFormat:HTK--------------------------------ObservationStructure---------------------------------x:MFCC-1MFCC-2MFCC-3MFCC-4MFCC-5MFCC-6MFCC-7MFCC-8MFCC-9MFCC-10MFCC-11MFCC-12EDel-1Del-2Del-3D
6、el-4Del-5Del-6Del-7Del-8Del-9Del-10Del-11Del-12DelEAcc-1Acc-2Acc-3Acc-4Acc-5Acc-6Acc-7Acc-8Acc-9Acc-10Acc-11Acc-12AccE------------------------------------Samples:0->-1------------------------------------0:-5.6284.1741.699-3.216-4.589-9.9423.245-7.5144.315-6.942-1.7
7、28-4.51310.1090.2240.1281.1190.0650.7700.565-0.357-0.866-0.081-0.5870.995-2.2560.5110.7640.7420.2430.194-0.059-0.754-0.393-0.419-0.6400.0930.0250.3430.3671:-5.8504.0870.675-4.400-3.026-11.0161.422-12.226-1.280-15.1146.278-15.36710.5931.6541.7371.9570.5051.100-0.416
8、-1.794-2.036-1.792-0.4350.252-1.7841.4790.8640.8520.1120.372-0.293-1.1670.028-0.225-0.4530.274-0.1511.0240.394Step2:音檔標音並蒐集會用到的聲音單位d0lingd1id2erd
此文档下载收益归作者所有