利用msoffice工具提取图片中的文字

利用msoffice工具提取图片中的文字

ID:8999447

大小:494.00 KB

页数:7页

时间:2018-04-14

利用msoffice工具提取图片中的文字_第1页
利用msoffice工具提取图片中的文字_第2页
利用msoffice工具提取图片中的文字_第3页
利用msoffice工具提取图片中的文字_第4页
利用msoffice工具提取图片中的文字_第5页
资源描述:

《利用msoffice工具提取图片中的文字》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、利用MSOffice工具提取图片中的文字 如果你手头有一份试卷的图片版,或者自己用扫描仪、摄像头拍摄的试卷图片,那么就请按照下面的步骤,将它们中的文字部分提取到word中进行编辑。(要求office 2003)    1、开始-程序-Microsoft Office-Microsoft Office 工具-Microsoft Office Document scanning。该工具是MS office 2003自带的,但是默认却没有安装,所以此时很可能会弹出对话框,要求放入office 2003的安装光盘,乖乖,按照要求去做就行;    2、安

2、装完毕后,会自动启动该工具,在出现的对话框中,点击“扫描”。如果此时弹出提示,不要理会,一路确定即可;    3、很快会出现一个预览框,觉得从摄像头出来的图像满足要求,点击“捕捉”按钮即可;    4、再点击“发送”-“完成”,然后会打开MS的Document Image工具,打开刚才捕捉到的图片;    5、在Document Image工具的工具栏上,点击“页面”左侧的按钮“将图片发送到word”;    6、word会自动打开,出现的就是已经提取的文字段落了;    如果是现成的图片,可以这样处理:    7、选择该图片,右键-打开方式-

3、windows图片和传真查看器;    8、打印,一路回车,一直到出现打印机选项;    9、在出现的打印对话框中,选择打印机类型为“Microsoft Office Document image writer”,选择适当路径存放;    10、双击被保存的文件;    11、重复第5~6点;图片文字提取方法集锦阅读(53)评论(0)发表时间:2008年09月17日10:05本文地址:http://qzone.qq.com/blog/332664981-1221617149方法一:利用Office2003从图片中提取文字Office在2003版

4、中增加了DocumentImaging工具,用它可以把文字给“抠”出来。(1)打开传真图片,用抓图软件SnagIt对相关的内容进行抓取,然后在“文件”菜单中选择“复制到剪贴板”命令(也可以用其他抓图软件,当然最简单的是Windows中自带的PrintScreen键来抓取整个屏幕,然后在“画图”程序中对不要的部分进行裁剪并保存,然后复制)。(2)在“开始”菜单的“MicrosoftOffice工具”中打开MicrosoftOfficeDocumentImaging,在左侧窗口中单击鼠标右键,选择“粘贴页面”,把复制的图片粘贴到DocumentIm

5、aging中,在“工具”中选择“使用OCR识别文本”,DocumentImaging的OCR识别程序就会对图片进行识别,完成后选择“工具”中的“将文本发送到Word”,程序会自动打开Word文档,展现在你面前的就是从图片中“抠”出来的文字。提示:一般而言,识别的准确率可以达到95%以上,但对英文和数字的识别不是太好。(将图片中的文字识别出来,所有的OCR(OpticalCharacterRecognition的简称,指光学字符识别技术,是自动识别技术研究和应用中的一个重要领域)软件都可以做到,例如清华紫光OCR等,一般购买扫描仪的用户大多安装有

6、此类软件。但需要注意,通常OCR软件只能够识别比较规范的印刷体,手写文本目前在识别上仍有困难。            而在大部分用户都有安装的Office2003套件中,也附带有OCR功能的组件MicrosoftOfficeDocumentImaging。如果您有安装Office2003,那么可以单击“开始”按钮指向程序组“MicrosoftOffice”中的“MicrosoftOffice工具”选择“MicrosoftOfficeDocumentImaging”,即可打开。但MicrosoftOfficeDocumentImaging不是Of

7、fice2003默认的安装选项,所以在初次启用时如果该组件仍未安装,则需要插入Office的安装光盘进行安装,但整个安装过程将自动完成,您只需要按提示信息操作即可。            安装并打开MicrosoftOfficeDocumentImaging之后,只需通过“文件”菜单打开需要识别的图片,或者选择“扫描新文档”利用扫描仪将印刷品的文字扫描到电脑上,再选择“工具”菜单中的“使用OCR识别文本”或者“将文本发送到Word”,就可以将该图片上规范的印刷体文字识别出来。如果图片中的文字是“宋体”等比较常见的字体,并且版面比较整齐,基本上所

8、有的文字都可以正确的识别出来。            另外,由于MicrosoftOfficeDocumentImaging只支持MDI、TIF等图片

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。