相似表格图像档案的表格提取与压缩存储方法分析

相似表格图像档案的表格提取与压缩存储方法分析

ID:33100885

大小:7.63 MB

页数:50页

时间:2019-02-20

相似表格图像档案的表格提取与压缩存储方法分析_第1页
相似表格图像档案的表格提取与压缩存储方法分析_第2页
相似表格图像档案的表格提取与压缩存储方法分析_第3页
相似表格图像档案的表格提取与压缩存储方法分析_第4页
相似表格图像档案的表格提取与压缩存储方法分析_第5页
资源描述:

《相似表格图像档案的表格提取与压缩存储方法分析》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、山东师范大学硕。}:学位论文部门根本达不到这种要求。这主要表现在ll】:第一,档案信息化建设面临着传统观念认识的制约。我国以往的档案工作一直处于一种封闭半封闭的管理模式之下,档案一度被藏置密室,蒙上一层神秘的面纱。档案工作中存在以“被动保管”为主,馆藏结构单一,档案信息利用率相对较低等问题;存在“重藏轻用"与“重为政治服务,轻为经济文化服务”两种倾向。由于历史的、政治的原因,一些人在思想上还受着诸多传统因素的影响,没有真正认识到档案信息化建设的重大意义,没有认识到档案信息化建设将带来的社会效益和经济效益,对档案信息化建设还不是十分重视,还存

2、在坐等观望的态度,因此投资力度不强,人员、技术力量配备薄弱,在硬件建设上流于走形式,档案信息化建设步子迈得不大,发展速度缓慢。第二,档案信息网络化建设面临着法律规定滞后的困境。1)网络档案信息内容范围缺乏相关的法律规定。怎样的档案信息可以通过网络发布,怎样的档案信息不能通过网络发布,怎样的档案信息可以在因特网范围内发布,怎样的档案信息只能在局域网范围内发布,根据已有的法律来看,对这些内容还没有具体、明确、可执行的法律规定。这使得档案机构对档案信息的网络发布持慎之又慎的态度,影响了他们的工作效率。2)网络档案信息凭证价值缺乏相关的法律认定。“

3、档案是确凿的历史记录,它足以成为查考、研究、争辩和处理问题的依凭,认定法律权利、义务与责任的证据,以及政治斗争、外交斗争和教育人民的工具”。“档案的凭证价值,是档案不同于和优于其它各种资料的最基本的特点"。网络档案信息的来源主要包括两个部分:第一部分是传统档案经过数字化处理得来的网络档案信息,这部分信息有档案原件作保证。但对于第二部分电子文件来说,在我国的法律条文中,还没有明确规定其证据能力。证据的客观真实性是证据是否有证明力的决定性因素,电子文件最难确定的就是其真实性。电子文件本身固有的原始信息的可变性和不稳定性及人们对其可靠程度的不信任

4、和矛盾心理,使其难以成为合法的证据。为了实现电子文件的凭证价值,不得不将电子文件和同一内容的物质文件同时归档,这又大大增加了库房面积,加大了经济负担,有悖于档案信息网络化建设的初衷。纸质档案数码化现状的其它方面还包括:档案信息化建设受技术力量(人员)滞后的制约;档案信息数字化的巨大工作量与档案部门人力、物力、财力和技术力量相对缺乏的困境;档案网络和网络档案信息缺乏规范和组织管理。1.2.2档案图像处理2由于本文研究对象的明确性,本文涉及到的图像处理包括档案图像的表格提山东师范人学硕士学位论文取、档案图像倾斜校正、档案图像增强和档案图像二值化

5、,与此相关的还包括档案图像压缩,以下从这几个方面予以阐述。表格作为一种特殊的文本,其最大的特点为结构化,即直线和明确的空白分隔符将文字分隔成独立的表格单元。表格线基本上由水平线和竖直线组成,目前大多数表格识别也正是运用这一特点得到各个单元。依表格线检测方法不同,目前常用的方法有侧向投影法【2.3】、轮廓提取法【41、表格线交叉点分析法【51、Hou曲变换法【6】等几种。侧向投影法简单、速度快,但较容易受到表格倾斜和字符粘连表格线的影响;轮廓提取法也很容易因表格线断裂或字符粘连表格线而产生错误;表格线交叉点分析法则通过对相邻交叉点进行分类和匹

6、配来迭代地构建出表格中的所有单元格,但该方法比较耗时,且容易受断裂表格线的影响;Hou曲变换是一种效果较好的方法,能有效检测出断裂表格线、虚线等不同类型的表格线。在图像档案扫描输入的过程中,无论是手工扫描,还是机器自动扫描,或多或少会出现某种程度上的倾斜,这种图像的倾斜会给图像档案的识别和压缩存储造成很大影响,因此有必要对档案图像进行倾斜校正。档案图像纠偏的一种主要方法是基于投影的方法【71,它首先通过黑色像素沿着若干指定的方向投影而得到若干投影图,再根据这些投影图的方差求得文本的倾斜角,但这种方法由于投影的方向较多,所以存在计算量大的缺点

7、。档案图像纠偏的另外一种主要方法是Hou豇变换【8】,其基本思想是首先提取文本行中的一些点,然后利用Hou豇变换将这些点拟合成若干直线段,同时可以得到这些直线段对应的角度,再根据这些角度的分布情况估算文本的倾斜角度。Hough变换适合在图像中检测线条和曲线。除此之外,还有邻域(nearest—neighbor)方法、BAG(BlockA由acentGrapllic)算法、Fo谢er谱分析法、地图分析法和神经网络法等【91。图像增强是为了改善视觉效果或便于人或机器对图像的分析理解,根据图像的特点或存在的问题,以及应用目的所采取的简单改善图像质

8、量的方法或加强图像某些特征的措施。一般来讲,图像增强的通用理论是不存在的,而且图像增强是面向特定应用的。根据图像处理的方法不一样,可将图像增强分为空域方法和频域方法,而空域方法可

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。