OCR光学字符识别技术是一项重要的扫描仪日常应用,它以能快捷、省时、省力地高速输入已经成形的文字为主要特点,极大地提高了传统书刊、报纸杂志等平面媒体文字材料转化成数字电子媒体的工作效率。一般地当你购买扫描仪时,都会发现其附赠软件中的中英文OCR识别软件,但是当你使用这些OCR软件时,是否发现其OCR识别能力低下,于是许多人都抱怨OCR软件太“弱智”,需要手动更改的文稿内容过多,既影响工作效率又心生对扫描仪的不满,甚至彻底地抛弃了扫描仪和OCR软件,大家工作起来也枯燥无味了。其实只要我们稍加注意,从硬件和软件方面认真调整一下扫描仪,即可让它慧眼独具,轻松识别任何中文或英文,甚至法文、俄文等。
扫描仪硬件摆放和调试
1. 清洁扫描仪镜面
首先一定要保持好扫描仪内部的整洁,使用整洁的桌布认真擦拭扫描镜面,不要用桌布沾水来清洁,这样会留下水渍,影响光线折射;如果已经用着水的桌布擦拭了镜面,要在通风干燥处将其晾干再用干桌布擦拭,保证镜面上没有明显的手印或灰尘,墨迹等,为扫描到优良高质的图像做好准备。
2. 扫描仪放置很重要
对于许多单位来说,扫描仪并不是经常用到,所以大家用到扫描仪时,往往是将其从存放处取出,而后用扫描仪时图一时方便,将扫描仪随意放置,机身固定不牢或者让扫描仪倾斜甚至半垂直机身扫描,这时就会影响到内部的的步进电机了,步进电机上携带着扫描光头面板,步进电机的不同步运行直接关系到最终扫描出来的图片的垂直分辨率,所以扫描仪的放置万不可轻敌,一定要将其放置在一个稳固的水平平面上。
3 选用黑白扫描模式
扫描仪快速扫描的图片有黑白和彩色之分,扫描仪会根据你的操作要求自动生成相应的图片,OCR软件是个标准的“色肓”,它是不会区分黑白与彩色的,所以对它来说,识别的图像是什么颜色的完全不重要,为提高扫描速度我们就可以直接在扫描仪中设置“黑白二色”扫描模式,彩色模式还是不选为妙。如果你的扫描仪并未在扫描面板上提供模式选择,你可以在扫描仪随机附带的软件中选择合适的扫描模式。
4.分辨率不是越大越好
众所周知,扫描仪使用的分辨率越高则图像质量越好,需要的扫描时间越长,同时图像质量越好。于是许多人都产生这样的想法,用OCR软件识别的图片文字的扫描率越高,图像质量越好,则被成功OCR识别的的机率越大,其实这种认识是错误的,分辨率过高,不仅会扫描到文字部分,还会扫描到纸张上的细小的麻点,污渍等,还会需要更长的扫描时间,另外得到的图像文件体积也更大,这些非必要的麻点、污渍、网纹等纸张“细节”还是不要的好,所以我们在扫描之前先要大致估计一下被扫描对象上字号大小,根据字号大小选择合适的分辨率。对于6号或7号字体大小的文字使用400~600dpi的扫描分辨率,一般的普通5号,字体使用250~300dpi,对于大一点的文字如4号以上的使用150~200dpi足矣。不过,也有例外,如果要扫描的文稿上的文字的笔画都比较多,这时就应当适当提高扫描的分辨率了。
[1] [2] 下一页