LEADTOOLS OCR文字识别教程(三)开始文字识别

发布时间:2015/04/30 00:04 发布者:AvoCaDolol

返回博客中心

在前面的教程中,我们教会大家如何追加页面和在页面上追加删除区域,这一次我们正式开始文字识别。

1. 打开Visual Studio,然后打开上一讲中我们创建的项目OCRTurorial2。

2. 从工具箱中拖拽一个Button到Form1中,保持Button的名字为“button6”,然后将Button的Text文本改为:识别并保存

image

3. 双击button6,然后在Click事件中添加如下代码:

private void button6_Click(object sender, EventArgs e)
{
	// 这里启动识别所有页面
	// 注意,我们并没有使用自动识别区域这个方法,识别引擎会检查当前页面
	// 是否已经标示过识别区域了,如果没有的话引擎会自动帮我们标示识别区域
	_ocrDocument.Pages.Recognize(null);
	// 弹出保存为PDF对话框
	string fileName = null;
	using (SaveFileDialog dlg = new SaveFileDialog())
	{
		dlg.Filter = "PDF files|*.pdf|All files|*.*";
		dlg.DefaultExt = "pdf";
		if (dlg.ShowDialog(this) == DialogResult.OK)
			fileName = dlg.FileName;
	}
	if (fileName == null)
		return;
	// 将识别结果保存为PDF文件
	_ocrDocument.Save(fileName, DocumentFormat.Pdf, null);
	// 调用系统命令打开保存的PDF文件
	System.Diagnostics.Process.Start(fileName);
}

4. 编译并运行。

image

识别结果:

image

源码下载:


关于葡萄城

赋能开发者!葡萄城是专业的集开发工具、商业智能解决方案、低代码开发平台于一身的软件和服务提供商,为超过 75% 的全球财富 500 强企业提供服务。葡萄城专注控件软件领域30年,希望通过模块化的开发控件、灵活的低代码应用开发平台等一系列开发工具、解决方案和服务,帮助开发者快速响应复杂多变的业务需求,最大程度地发挥开发者的才智和潜能,让开发者的 IT 人生更从容更美好。

了解详情,请访问葡萄城官网