说话人分割与聚类技术与研究

说话人分割与聚类技术与研究

ID:46222646

大小:517.99 KB

页数:57页

时间:2019-11-21

说话人分割与聚类技术与研究_第1页
说话人分割与聚类技术与研究_第2页
说话人分割与聚类技术与研究_第3页
说话人分割与聚类技术与研究_第4页
说话人分割与聚类技术与研究_第5页
资源描述:

《说话人分割与聚类技术与研究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、图书分类号:TP39U.D.C.:681.3工学硕士学位论文说话人分割与聚类技术研究硕士研究生:刘先导师:李海峰教授屮请学位:工学硕士学科、专业:计算机科学与技术所在单位:计算机科学与技术学院答辩日期:2006年6月授予学位单位:哈尔滨工业大学ClassifiedIndex:TP39U.D.C.:681.3ADissertationfortheDegreeofM.Eng.RESEARCHONSPEAKERSEGMENTATIONANDCLUSTERINGTECHNIQUECandidate:Supervisor:AcademicDegreeAppliedfor:

2、Specialty:DateofDefence:Degree-Conferring-Institution:LiuXianProf.LiHaifengMasterofEngineeringComputerScienceandTechnologyJune,2006HarbinInstituteofTechnology摘要本文所研究的说话人分割与聚类技术是语音识别领域中一个较为新兴的研究方向。该技术主要是针对含有多个说话人的对话型语咅,例如含有两个人的电话录咅、包含多个人的会议录咅、电视新闻节目等。按照说话人的不同将对话型语咅进行分割,而后将相同说话人的语咅片段聚类

3、在一起,实现说话人识别这样一个任务,即“whospokewhen"。它是语音技术走向实用化的一个重要环节,是说话人识别技术、说话人检索技术以及多门其他语音技术发展所共同要求的一个新兴研究重点。木文探讨了说话人分割和说话人聚类的理论和实现技术,实现了一个说话人分割与聚类系统,并在此基础上进行了一些相关实验。主要研究内容包括:通过对目前说话人分割技术中使用得最广泛的基于贝叶斯信息准则(BayesianInformationCriterion)的分割方法进行理论分析和实验,发现原始的基于bic的说话人分割方法其计算量过大。针对这-情况木文提dr了一种基于预分割的说话人

4、分割方法,通过先预分割再对分割点验证的方法,以少量的性能损失为代价,将说话人分割过程屮的判别次数(计算©B/C的次数)由0(7?2)次减少到0(川)次。对于说话人聚类,rtr丁事先无法确知说话人数目,木文使用了与分类数无关的层次聚类法。在样本间相似性度量方面,采用了高斯混合模型(GMM)间的距离来量化样本Z间的相似性,并比较了两种不同的GMM模型间的距离在聚类效果上的差杲,以及GMM混合数对聚类性能的影响。并再次利用BIC准则推导出一个聚类停止准则。此外,为了更好地从咅频中得到纯语咅信号,在特征提取阶段使用了一种利用动态能量阈值以及平滑处理來去除静咅帧的方法。关

5、键词说话人分割;说话人聚类;话者识别;说话人检索AbstractSpeakersegmentationandclusteringisanewresearchdirectionofspeechprocessingtechnique.Itfocusesonconversationalspeeches,suchastelephoneconversations,meetingrecordsandbroadcastnewsaudios.Speakersegmentationandclusteringisachievedbycuttingtheconversationals

6、peechesintohomospeakersegments,andthen,classifyingthosesegmentsintodifferentclustersaccordingtothespeakers.Itisknownasakeysteptomakethespeechtechniquemorepractical.Inthispaper,thetheoriesandimplementationtechniquesofspeakersegmentationandclusteringarediscussed.Andsomeexperimentsarec

7、arriedoutbaseonanimplementedsystem.Themainworksareasfollowings.Firstly,basedonthetheoreticalanalysisandexperimentstoBIC(BayesianInformationCriterion),whichisamostpopularmethodofspeakersegmentation,thehugecomputationcostisrealized.Thenanimprovedmethodisproposed・Insteadofsegmentingther

8、ecordsdirect

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。