认知模式识别理论及其在无字库智能造字应用研究

认知模式识别理论及其在无字库智能造字应用研究

ID:42419212

大小:1.91 MB

页数:26页

时间:2019-09-14

认知模式识别理论及其在无字库智能造字应用研究_第1页
认知模式识别理论及其在无字库智能造字应用研究_第2页
认知模式识别理论及其在无字库智能造字应用研究_第3页
认知模式识别理论及其在无字库智能造字应用研究_第4页
认知模式识别理论及其在无字库智能造字应用研究_第5页
资源描述:

《认知模式识别理论及其在无字库智能造字应用研究》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、博士学位论文开题报告认知模式识别理论及其在无字库智能造字应用研究研究生:刘明友指导教师:皮佑国教授Outline背景研究内容和创新点研究基础进度计划背景—模式识别模式识别尚存在两个主要问题需要解决:小样本问题迄今为止的模式识别主要是基于被识别事物的区分机理,而不是基于认知机理,在“识”方面,即对事物认识(学习)方面与人类的认知过程差异较大而且学习能力不足背景—智能造字字库方式存在的弊端:难于形成规模适度和长期稳定的汉字信息化标准不符合汉字的造字规律,无法传承汉字文化不符合汉字认知规律,与汉字教学脱节不能满足整

2、个社会的应用需求信息熵高,是效率最低语言文字信息系统之一研究内容和创新点提出了基于原型匹配的认知模式识别理论提出了拟人的计算机无字库智能造字完善了汉字原型及结构提取理论和方法提出了汉字基元映射知识获取方法提出了汉字知识组织与表示方法原型匹配的认知模式识别理论研究恒常性与拓扑不变性模式的组成原型与成分的关系恒常性与拓扑不变性视知觉恒常性表述为:在对象图像信息足够确定其模式的条件下,图像的大小变化和形状变化不影响人对对象的知觉。用几何拓扑学的相关理论,建立物体对象的数学模型,从大小和形状恒常性两个角度加以证明。模

3、式的组成从成分识别理论出发,研究现实世界中物体的组成法则。比如,世界上的物质种类多得数不清,但组成物质的化学元素却只有一百多种。又如,可以通过红、绿、蓝三种颜色来构成五彩缤纷的颜色。Biederman的成分识别理论揭示了客观世界的构成模式:客观世界中的所有物体都是由一些成分构成的,也就是说,客观世界中物体都可以分解成一定的组成成分,各个成分之间的组合关系我们称之为结构。我们用集合理论来对物体的构建进行描述。原型与成分的关系原型是这一类客体所有的个体的概括表征。物体是由一些成分按照其结构所组成的,这里的成分是具

4、体的、确定的。因此原型和组成物体的成分之间就存在一个由概括到确定,由抽象到具体的过程。我们用拓扑空间相关理论,研究原型与具体的组成成分之间的拓扑映射。从拓扑学的理论加以证明:原型匹配过程就是用原型集合中的一个或数个元素的拓扑变换对模式中的组成成分进行覆盖的过程。拟人的计算机无字库智能造字研究汉字是用象形和指事及其符号按照一定的规则造出来的,传统的汉字造字理论包括:象形,指事,会意,形声。从认知心理学的知觉理论出发,研究人对汉字的认知机理,包括汉字的认读和书写过程。无字库智能造字的结构框架:拟人的计算机无字库智

5、能造字研究将计算机比作人脑,建立包括基元库,汉字结构以及基元在结构中映射知识的知识库来模拟人的长时记忆;用推理机、解释机制、智能造字单元来模拟人在汉字认读和书写过程中脑的控制功能。汉字识别对应于认读过程,智能造字对应于书写过程。这样就将人的汉字认读和书写过程外延到计算机中了。汉字原型及结构研究原型论即原型匹配理论,原型论的突出特点是它认为在记忆中储存的不是与外部模式有一对一关系的模板,而是原型(prototype)。原型不是某一个特定模式的内部复本,它被看作一类客体的内部表征,即一个类别或范畴的所有个体的概括

6、表征。构成汉字的原型是汉字基元,汉字基元是智能造字中按照汉字结构组成汉字的基本单元;汉字的组成成分是汉字基元的拓扑变换,变换保持汉字基元的拓扑不变性;同一汉字基元在不同汉字中拓扑变换是同胚映射。汉字成分之间的拓扑关系构成了汉字的结构。汉字原型及结构研究通过初始原型集合→汉字编码→造字实验→原型使用频率等统计→修改原型集合的流程,反复实验,最终获得汉字的原型知识。研究汉字的拆分规律,分析和总结汉字原型的形成规律。从图形符号的角度分析汉字原型之间组合规律,在传统汉字结构和实验室研究的基础上,进一步完善汉字结构。旨

7、在用现代科学实验的方法来解决文字文化问题探讨。汉字基元映射研究基于区域的仿射变换系数自动获取基于特征提取的仿射变换系数自动获取基于区域的仿射变换系数自动获取该方法包括一个变换模型(参考图像坐标到对应的目标图像空间坐标),图像相似性度量(衡量两图像空间内对应特征的相似性),和优化算法(通过改变变换系数最优化图像相似性)。基于区域的仿射变换系数自动获取变换模型设W表示基元图像,x表示该图像中的一个点。定义基元图像的一个几何变换为:对于某一线性变换A,其位置系数t表示为:由上式知,线性变换系数可以看成是输入,而计算

8、得到的平移系数看成是输出。基于区域的仿射变换系数自动获取图像相似性度量归一化相关系数(NCC)I表示子图像,T表示模板图像,R表示图像相关系数基于区域的仿射变换系数自动获取优化算法利用粒子群算法来优化仿射变换系数。粒子群算法因其简单性和有效性得到了广泛的应用,成为研究的热点。粒子群算法用于仿射变换系数寻优的过程为:随机产生m组仿射变换系数中的线性变换系数组成初始群体,分别对基元图像进行变换(模板图像

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。