概述

众所周知,Leadtools OCR可以很好的应用在图像文字识别处理方面。我们在不断优化和评估leadtools ocr(图像文字识别处理)功能时,为提高文字识别效果,总结了如下操作可供大家参考。

以下教程参考的开发包中演示程序路径为:C:\LEADTOOLS 20\Shortcuts\OCR - MICR - ICR - OMR\.NET Framework Class Libraries\Main OCR Demos\OCR Multi-Engine 32-bit Demo.exe

选用OmniPage引擎识别中文

Leadtools同时提供了Lead引擎和OmniPage引擎,在中文识别方面,OmniPage引擎的识别效果更佳。

手动框选识别区域

Leadtools提供了两种识别区域选择的方式,自动和手动,在某些比较复杂的场景,自动区域选择并不准确,导致识别结果较差,这个时候可以手动选择识别区域后再进行识别(或者执行自动选择区域后,再对其进行修改)。

对所选的区域按照场景设置具体属性

右键点击所选区域的边框,选择属性(Properteis)打开属性对话框

  1. 如果区域中的内容是表格的话,可以设置为table类型来进行识别

  1. 可以设置区域内的字符类型进行过滤,数字,大小写,符号等

对图片进行预处理以提升识别效果

此项可以参考我们之前的博客,LeadTools OCR 文字识别进阶——使用LEADTOOLS对OCR识别图片进行预处理