欢迎来到天天文库
浏览记录
ID:21080701
大小:49.50 KB
页数:3页
时间:2018-10-19
《档案数字化加工流程中的质量保障与对策》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、档案数字化加工流程中的质量保障与对策案数字化加工流程中出现的许多质量控制问题进行归纳,提出相应的对策与建议。 1档案数字化流程 1.1档案整理。纸质档案归档过程中,对采用手书,字迹潦草,包含简化字、繁体字、口语字等难以识别和录入的文档,要通过请教老同志以及上X查询等方法科学提取文件题名、责任者等检索信息,确保相关信息的准确性、完整性。 1.2条目录入。目录数据库一般应包括全宗号、目录号、件号、文件编号、责任者、文件题名、机构或问题、文件时间、保管期限、页数、盒号、录入人、录入时间、密级、原文数量等项目。条目录入的完整与否,直接关系
2、到利用的方便与效果。 1.3档案扫描和图像处理。在使用高速扫描仪前,应拆除装订物。扫描工作完成后,拆除过装订物的档案应按档案保管的要求重新装订。恢复装订时,应注意保持档案的排列顺序不变,做到安全、准确、无遗漏。破损严重、无法直接进行扫描的档案,应先进行技术修复,折皱不平影响扫描质量的原件,应先进行相应处理(压平或烫平等)后再进行数字化加工。 档案扫描过程中的质量指标控制。文本扫描:TIF格式,应保存为黑白页面,并采用CCITT4压缩。双层PDF格式,重要的用彩色,普通的用黑白。 亮度设置:纸张明暗和亮度成反比,纸越暗亮度要越高,纸
3、越白亮度要越低。有些字迹比较模糊的文档,亮度可以调低点,扫出的字迹会更清晰。 噪点控制:噪点的产生随着亮度的变化而改变,亮度越低,噪点越多,亮度越高,噪点越少。 分辨率设置:黑白二值、灰度、彩色几种模式均选择大于或等于100dpi。需要进行OCR汉字识别的档案,分辨率建议选择“大于”或“等于”200dpi。 1.4数据挂接。原文挂接前,要检查原文件号与目录件号是否一致,文件名是否正确。 1.5数据验收。数据验收要把好四关:一是目录录入项目是否完整、正确。二是原文分辨率是否符合要求。三是原文处理是否符合要求。四是挂接的原文与目录是
4、否一致。 1.6数据备份。在数据库中,把目录和原文打包刻录成光盘,一份移交档案馆电子文档中心,一份留在本单位,做到双重备份。 2档案数字化加工中的常见问题与对策 2.1条目录入常见问题 2.1.1责任者简略不规范。如,白沙镇政府或白沙镇党委只简写为“白沙镇”。 2.1.2责任者不带地区标识。如,县档案局,只填写“档案局”,分不清是市档案局还是县档案局。 2.1.3题名太长,打印时不能完整显示,在遇到题名太长时,要适当略写,尽量控制在50个字以内。 2.1.4题名太简,如只有“通知”二字,要根据内容重新拟写题名,使题名能反映
5、出文件内容。 2.2文档扫描常见问题 2.2.1把纯文本文件扫成彩色TIF格式,生成的文件太大,有的单页面数据就达10MB左右。 2.2.2扫描时出现漏扫页面,这种情况一旦出现,校对起来真如“大海捞针”。笔者推荐使用带超声波检测的扫描仪,可以自动检测重张,不会产生漏扫情况。 2.2.3页面噪点太多,后期处理将会十分麻烦。 2.2.4红色硬皮目标责任书类扫描为纯黑色页面。对这类文件扫描时,亮度要调到50~70之间。 2.3原文挂接常见问题 2.3.1挂接的原文张冠李戴。检查目录号与原文件号是否一致并进行调整。 2.3.2黑
6、边、歪斜、噪点、方向没有处理,要返工重新处理。档案数字化加工要认真落实三重校验制度,确保数字化加工准确无误。第一重校验——对数据库目录进行检查,检查目录著录项是否完整,著录项内容是否正确,发现问题,返回重录。第二重校验——对图像偏斜度、清晰度、失真度等进行检查,核对文件内的页数是否与纸质档案页数相符,并按图像上的页号进行检查,如次序不对进行调整,以确保电子影像的顺序与实际纸张资料的顺序完全相符。第三重校验——对数据库中目录和原文的年度、保管期限、件号进行检查,确保挂接后的原文和目录对应。 (单位:中牟县文化馆来稿日期:2012-06-
7、20)
此文档下载收益归作者所有