欢迎来到天天文库
浏览记录
ID:12545233
大小:1.24 MB
页数:20页
时间:2018-07-17
《尚书七号使用方法》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、尚书七号使用方法(技巧)在工作中常需要识别文字,感觉尚书七号效果不错的.虽然使用方法很简单,但是工作量较大的时候,注意一点技巧,工作效率还是会提高的,我自己走了不少弯路,写出来和大家分享.个人表达能力有限,偏差之处,还望海涵。 基本使用方法: 1、打开尚书七号,选择打开图象。(我用的版本可以识别的格式有bmp、tif、jpg) 2、选择开始识别或按F8。识别结果将显示在窗口上部,下部显示版面分析结果。其中红线为可识别部分,绿线为不可识别。 3、选择输出--到指定格式文件,将识别结果保存为需要的格式。 识别前应注意的问题: 1、图片质量。批量
2、识别时,首先应确保要识别的图片质量。如不能识别还需要重新处理,甚至会导致软件死掉,浪费时间。我本人就曾深受其苦。图片分辨率应稍高,肉眼看感觉偏大,因为识别工具是有点近视的,文字和底色对比要求不高,通常来说,肉眼能看清楚即可,底色发灰或发黑基本不会影响识别结果。 2、避免有不规则形状(图片)出现。识别工具在进行版面分析时,只能采用方形切割,当图片中存在文字环绕不规则形状时,则无法将文字和该形状划分开,则将出现错误或无法识别。此时,较快的办法是在PS中,吸取该图片附近的页面底色,用粗画笔将该区域涂上,不必讲求效果,颜色没有太大差别即可,重新保存图片。 3、避免图象倾
3、斜。尚书七号中也有自动倾斜校正和手动倾斜校正工具,但即使经过校正,识别率还是低很多。如果是拍摄的书本,可能会产生一定弧度,此时保证行的两端对齐即可。另外在拍摄时应避免高光等会使图象各部分亮度反差大的情况。 书本转换(扫描、拍摄)技巧 1、可以将书摊平,一次将两边都扫描或拍摄下来,节省时间。处理图片时不必剪开,这时要用到尚书七号的分栏工具了。直接用鼠标在打开的图象上拖拽,可出现选框,分成左右两个分栏,分栏左上角的编号就是识别结果的排列顺序。它会将自动按照编号顺序将所有分栏的内容连接在一起。 2、手动分栏可解决部分图象无法识别的问题。在进行识别后,可以看到版面
4、分析结果,有时候由于图象质量原因,自动分析出的有效版面只是很小的一部分。此时可以按ctrl+del取消版面分析结果,用鼠标拖拽,划定需要识别的范围,重新进行识别。当图片质量问题不大时,这个办法有效。 有时候(尤其是拍摄所得图片),文字扭曲严重,即使用PS也无法调整好。可尝试手动分栏,多划分几栏,每一栏包含一行或少数几行文字,这样对于每个分栏来说,它所包含的范围内误差度相对减小,可提高识别率。 3、使用批量识别功能。尚书七号可以一次性识别大量图片。但在实际应用中,依次识别不宜过多,便于随时检查识别结果,发现错误及时修正。 4、批量识别图象时,保存文件也要花费
5、大量时间。事实上,尚书七号在识别文件的同时,会在图片所在文件夹生成文本文档,名称与图片名称相同。因此,如果不是特别需要,可以不必再保存输出结果。 如所识别内容属于一部分,可以将左侧的图象列表全选(ctrl+A),再选择“输出--到指定格式文件”,则当前所有识别内容按照图片排列顺序保存在一个文件中。 我使用的尚书七号不能记忆保存路径,每次选择保存时,都会默认打开程序安装目录下的“outout”文件夹,不必每次都选择路径,可以先保存在这里,然后一起转移文件。 5、如果想保留文件中的图片,在输出结果时选用RTF格式,再用word打开,可以看到格式完全正确的文字和
6、图片了。 6、用书本的页码给文件命名是明智的选择。我曾经用内容摘要命名,自以为清晰明了,结果在最后修正错误字符时悔恨交加。 7、当一个图象完全无法识别时,可稍稍增加亮度或对比度,有时候只差那么一点点,它也不给你工作。 8、分栏的几个类型。当单击一个分栏时,工具栏中会相应分栏类型的按纽会按下。分栏有横栏(横排文字)、竖栏(竖排文字)、图片、表格等几个类型,一般情况下可以自动识别类型,但手动分栏时一定要选择相应的类型,以提高识别率。 以上问题针对拍摄情况而言,扫描的话相信会减少问题,如果能拆书的话,最好还是拆吧。王(尚书七号)OCR使用方法示例一因为不断
7、有用户来电咨询尚书7号软件的使用,为此我们这里特别写了一份关于尚书7号软件的使用方法的实际例子,来帮助用户使用好尚书7号OCR软件。其中,很多是我们自己在使用尚书软件的心得,请用户尽量按照示例来操作。一、扫描仪驱动程序请切换到高级控制面板状态为了得到较好的OCR使用效果,建议用户将扫描仪的驱动SCANWIZARD5软件,由初始安装的标准控制面板,切换到高级控制面板状态。其切换的方法,如下图所示。二、第一次使用尚书OCR7号软件1.尚书7号OCR软件是MICROTEK中晶科技公司,向汉王科技购买授权,赠送给用户使用的
此文档下载收益归作者所有