06第六讲 汉字识别

06第六讲 汉字识别

ID:36174800

大小:100.00 KB

页数:38页

时间:2019-05-06

06第六讲 汉字识别_第1页
06第六讲 汉字识别_第2页
06第六讲 汉字识别_第3页
06第六讲 汉字识别_第4页
06第六讲 汉字识别_第5页
资源描述:

《06第六讲 汉字识别》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、中文信息处理基础AnIntroductiontoChineseInformationProcessing第六讲汉字识别技术一、汉字识别概述二、语音识别三、字符识别中文信息处理基础AnIntroductiontoChineseInformationProcessing一、汉字识别概述汉字已有数千年的历史,也是世界上使用人数最多的文字,对于中华民族灿烂文化的形成和发展有着不可磨灭的功勋,并将继续发挥重要的、其它文字形式难以取代的作用。中文信息处理基础AnIntroductiontoChineseInformationProcessing然而,汉字是非字母化、非拼音化

2、的文字,在当今高度信息化的社会里,如何快速高效地将汉字输入计算机,已成为影响人机接口效率的一个重要瓶颈,也关系到计算机能否真正在我国得到普及应用。围绕这一问题,人们提出了各种解决方案。中文信息处理基础AnIntroductiontoChineseInformationProcessing目前,汉字输入主要分为人工键盘输入和机器自动识别输入两种。人工键盘输入把汉字输入到计算机,目前已有数百种键入方案。但是,人们需要经过一定时间的学习训练才能掌握某种键入方法,更为严重的是:对于大量已有的文档资料,采用人工键入方法将要花费大量的人力和时间。为此,机器自动识别输入就成为

3、了必须研究的课题。中文信息处理基础AnIntroductiontoChineseInformationProcessing自动识别输入分为语音识别和字符识别两种。汉字识别是模式识别的一个重要分支,也是文字识别领域最为困难的问题,它涉及模式识别、图象处理、数字信号处理、自然语言理解、人工智能、模糊数学、信息论、计算机、中文信息处理等学科,是一门综合性技术,在中文信息处理、办公室自动化、机器翻译、人工智能等高技术领域,都有着重要的实用价值和理论意义。中文信息处理基础AnIntroductiontoChineseInformationProcessing二、语音识别技

4、术简述声学特征的提取与选择是语音识别的一个重要环节。声学特征的提取既是一个信息大幅度压缩的过程,也是一个信号解卷过程,目的是使模式划分器能更好地划分。中文信息处理基础AnIntroductiontoChineseInformationProcessing由于语音信号的时变特性,特征提取必须在一小段语音信号上进行,也即进行短时分析。这一段被认为是平稳的分析区间称之为帧,帧与帧之间的偏移通常取帧长的1/2或1/3。通常要对信号进行预加重以提升高频,对信号加窗以避免短时语音段边缘的影响。中文信息处理基础AnIntroductiontoChineseInformatio

5、nProcessing下面介绍常用的一些声学特征线性预测系数LPC:线性预测分析从人的发声机理入手,通过对声道的短管级联模型的研究,认为系统的传递函数符合全极点数字滤波器的形式,从而n时刻的信号可以用前若干时刻的信号的线性组合来估计。中文信息处理基础AnIntroductiontoChineseInformationProcessing通过使实际语音的采样值和线性预测采样值之间达到均方差最小LMS,即可得到线性预测系数LPC。对LPC的计算方法有自相关法(德宾Durbin法)、协方差法、格型法等等。计算上的快速有效保证了这一声学特征的广泛使用。与LPC这种预测参

6、数模型类似的声学特征还有线谱对LSP、反射系数等等。中文信息处理基础AnIntroductiontoChineseInformationProcessing倒谱系数CEP:利用同态处理方法,对语音信号求离散傅立叶变换DFT后取对数,再求反变换iDFT就可得到倒谱系数。对LPC倒谱(LPCCEP),在获得滤波器的线性预测系数后,可以用一个递推公式计算得出。实验表明,使用倒谱可以提高特征参数的稳定性。中文信息处理基础AnIntroductiontoChineseInformationProcessingMel倒谱系数MFCC和感知线性预测PLP:不同于LPC等通过对

7、人的发声机理的研究而得到的声学特征,Mel倒谱系数MFCC和感知线性预测PLP是受人的听觉系统研究成果推动而导出的声学特征。对人的听觉机理的研究发现,当两个频率相近的音调同时发出时,人只能听到一个音调。中文信息处理基础AnIntroductiontoChineseInformationProcessing临界带宽指的就是这样一种令人的主观感觉发生突变的带宽边界,当两个音调的频率差小于临界带宽时,人就会把两个音调听成一个,这称之为屏蔽效应。Mel刻度是对这一临界带宽的度量方法之一。中文信息处理基础AnIntroductiontoChineseInformation

8、ProcessingMF

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。