欢迎来到天天文库
浏览记录
ID:14079882
大小:413.36 KB
页数:31页
时间:2018-07-25
《基于matlab的数字识别系统设计》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、数字识别系统1.绪论1.1研究背景1.1.1索书号的简介索书号是图书馆赋予每一种馆藏图书的号码,这种号码具有一定结构并带有特定的意义。在馆藏系中,每种书的索书号是唯一的,可准确地确定馆藏图书在书架上的排列位置,它是读者查找图书必要的代码信息。索书号通常是根据中国图书资料分类法编排的【1】——简称《中图法》。《中图法》采拉丁字母和阿拉伯数字相结合的混合标记符号。根据图书的学科主题,以拉丁字母标记并顺序展列出22个基本大类,其中没有L、M和Y开头的——参考附录1中图法简表。由于“T工业技术”的大类范围广泛、内容繁多,故又在该类基础上采用双位拉丁字母标记出16个二级类目,如TK、T
2、L、TM和TN等。字母之后再用阿拉伯数字对大类进行细分。如B表示哲学、宗教一大类;B020则表示宗教理论。有的图书馆如清华大学还在图书分类号码后添加按照图书作者姓名所编排的著者号码,或者是按照图书进馆时间的先后所取用的顺序号码。不同索书号确定排列先后顺序的步骤是,先比较分类号码:如分类号码相同再比较著者号码或顺序号码。最后按照字母表和数字大小的顺序排列。1.1.2书库中图书查找存在的问题随着电子计算机和网络技术的发展,现代图书馆都已经广泛建立电子数据库图书管理系统,方便用户查找、阅览书籍。读者借图书的流程如图2所示,一般利用书目查询系统,根据图书的书名,出版社,作者以及书的内
3、容等在电子数据库中检索自己需要的图书,记录图书相关信息。最后,根据图书的索书号,快速方便地在书库中找到相应的图书。但是,经常会遇到下列问题:电子数据库系统显示图书状态为“归还”,利用检索到号,却无法在书库找到此书。出现这种情况主要有两个原因:(1)图书错位放置,即图书在书库中摆放的位置与索书号不一致。(2)图书已经丢失,即虽然电子数据库中显示图书状态为“归还”,但实质图书已经丢失,并不在书库中。随着图书馆藏书数目的不断增加,每天借阅的人数增多,而且有的图书馆发展成拥有几个分馆,上述问题越来越严重。这一方面严重降低了图书馆的资源的利用率;另一方面,浪费了读者的时间,造成了很大麻
4、烦。目前,图书馆主要通过定期的人工检查发现书库中错位和丢失的图书。但是,由丁馆藏图书多达上万,甚至几十万,而且每天又都有大量图书的借出和还入,人工检查工作量很大,单调、30重复的工作容易使工作员疲劳,检查速度比较慢,无法满足实际的需要。因此,迫切希望开发索书号自动识别系统,实现对书库中图书放置位置的自动检查,并通过索书号识别结果与电子数据库中图书信息的比较,找出已经丢失的图书。确保电子数据库中的图书状态与书库中的一致,以及书库中的图书准确排放,从而有效解决上述“用索书号找不到图书”的问题。1.2.索书号自动识别系统近年来,随着电子计算机技术、图像处理技术和摄像技术的迅速发展,
5、图像中的文字信息提取系统已经成功地应用于各个领域。因此,借助其经验,本文研究采用图像处理和识别技术实现索书号的自动识别。1.2.1索书号自动识别系统概述系统的硬件由彩色CCD摄像头,8位图像采集卡和计算机组成,拍摄的图像为8位RGB彩色数字图像。如图1-1所示CCD摄像索书号文字图像分割文字图像二值化单个字符切分索书号识别图书排放位置判断CCD摄像机拍摄排放在书架上的图书图像,图书的图像出索书号外还有其他内容,如出版社的标志,其他文字甚至大块的污渍等,必须从中分割出仅包含索书号的文字图像。灰度的文字图像难以直接用于识别,所以讲灰度的文字图像装换为二值图像。由于噪声和五点的干扰
6、,以及光照不均匀的影响,二值化后的文字会发生粘连,严重改变文字的自营。字符切分成单个字符后才进行文字识别。按照上述流程,具体介绍索书号识别的整个过程。1.2.2索书号识别存在的问题及关键技术索书号识别所涉及的摄像技术,无线通讯技术,电子数据库图书管理技术,AGV自动导引技术和图像处理技术都已经在其他领域有成功应用的实例。图像处理技术是索书号识别的核心技术,而与相类似的应用相比,索书号图像处理与识别又有其自身显著的特点和难点。图书馆收集了近几十年的藏书,不同时代的索书号编写风格大不相同。本论文选取图书馆的主要类别图书——印刷体索书号,从图书馆的书架上随即抽取样本进行研究。如图7
7、所示,CCD30摄像头拍摄的索书号图像,由于光照不均匀、退色、污迹、噪声以及其他非索书号文字的存在,大大增加了索书号识别的困难。为了能够解决上述问题,索书号图像识别主要由以下4个模块组成:索书号定位,索书号提取,索书号字符切分和索书号单字识别。第一阶段:索书号定位是在图像中找到包含索书号的图像区域,要求该区域尽可能包含完整的索书号,同时尽量排除非索书号的图像区域。由于该阶段是解决索书号的区域查找问题,而没有涉及单字切分,因此图像区域的估计允许有一定误差。为了包含完整的索书号以及避免索书号漏检,往往是定位
此文档下载收益归作者所有