热点推荐:
您现在的位置: 电脑学习网 >> 软件专区 >> 正文

OCR软件无法识别图像

2013-09-12 17:23:07  来源: 软件专区 
问:我经常会对图片进行一些压缩处理,但有个问题,在使用某些扫描仪时,扫描仪自带的OCR软件有时不能识别我压缩过的图像文件,这该怎么办?

  答:这主要是你制作的图片格式有问题,可以利用ACDSee转换这些图像文件的格式(转化为Uncompressed TIF)即可。启动ACDSee后,用鼠标右击所选图像,在出现的菜单中点击“Convert”(转换)命令,在弹出的“Format Conversion”(格式转换)对话框里选择“TIFF”格式,然后再点击右下角的“Format Settings”(格式设置)按钮,注意选中对话框中“Compress”(压缩)一栏的“None”(无),确定后即可。这样处理过的图片,OCR软件就能轻易识别它了。

 
MSOCache文件夹是什么 问:我安装了Office 2003以后,发现硬盘上多出一个叫做MSOCache的文件夹,有几百MB大,请问这个文件夹是做什么用的,能不能删除呢?

  答:MSOCache里面存放的是Office 2003解包以后的临时文件,安装完Office 2003以后可以删除这个文件夹。如果要求以后安装时都不生成这个文件夹,可以打开安装光盘里FILES\SETUP\SETUP.INI文件,把[Cache]那个小节下面的CDCAC

  HE=AUTO修改为CDCACHE=0,保存,然后重新刻盘即可。

 
提高OCR软件工作效率两法 OCR软件就是光学输入识别软件,它可以把图片中的文字转换为字符,使用OCR处理印刷文档可以提高录入工作效率。但处理的长达几十页,甚至几千页的文档也是一件非常累人的活儿。笔者这里就和大家分享一些使用OCR软件的经验。

一、减少时间等待,提高扫描识别工效

使用OCR软件必经的程序一般是先用OCR自带的扫描功能扫描图片,再进行识别。而当处理较长的文档时等待扫描的时间会很长,如果要充分利用好时间我们可以利用Windows的多任务特性,用一个软件专门负责扫描,同时用一个OCR软件进行识别。

扫描软件推荐使用《丹青中英文辨识系统》4.0以上或ACDSEE4.0以上版本,它们的特点是能自动按编号存储图片,换稿后只需按“扫描”按纽继续扫描。OCR软件推荐使用《尚书六号》,它能支持包括JPG图片的多种图片格式,用灰度级和真彩图片时还能自动调节对比度,或者手动调节对比度来提高识别率。尚书六号还能准确识别中文引号、用软回车存档、支持追加存档,可以有效的减少了后续排版处理的工作量。

二、弥补软件的不足,快速进行后续排版处理

要快速进行后续的文档处理,选择合适的OCR软件十分重要,前面也提到,《尚书六号》还能准确识别中文引号、用软回车存档、支持追加存档,有效的减少了后续的工作量。但不管什么软件都有其缺陷,就如《尚书六号》,它在识别“加”字时经常会识别成“力口”,追加存档时,括号、冒号、分号被识别为半角标点,跨页段落中会多出一个硬回车。

因此,当熟悉使用一个OCR软件之后,可针对其缺陷,用排版软件的功能来弥补其不足,就像“加”字识别为“力口”。因“力口”在文档中出现的几率极小,可以在排版时直接批量替换掉。半角标点则可全部替换为全角标点,对于跨页段落中间的硬回车,可在碰到跨页段落时时,在追加存档时在页间插入一个特殊记号,在排版处理时连同硬回车一并替换为空。

 
From:http://www.itcomputer.com.cn/Article/Software/201309/3425.html
    Copyright © 2005-2013 电脑知识网 Computer Knowledge   All rights reserved.