如何使用LEADTOOLS来创建web应用以识别文档并转换为PDF:25天25个项目

发布时间:2016/12/26 00:12 发布者:Richard.Ma

返回博客中心

 

作为LEAD Technologies 25周年纪念的一部分,我们正在搞一个“25天收集25个项目来展示LEAD功能强度和易用性”的活动。今天要展示的项目来自于达乌德的分享。

选择源文件

clip_image002[7]_thumb[1]

开始扫描

clip_image004[7]_thumb[1]

保存OCRed为PDF

clip_image006[11]_thumb[1]

 

它是做什么的

使用LEADTOOLS第19版,该Web应用程序可以用OCR来扫描文档,并将它们转换成可检索的PDF文件。

 

所使用的功能

· OCR

· Web Scanning

 

 

开发进程日志

大家好,我是达乌德。我要更新我们的HTML5 REST服务,以便在从我们的Web扫描演示程序中所扫描的图像上使用OCR,并将OCR结果保存到一个图像超文本的PDF文件中。

我要使用的是LEADTOOLS文档成像套件SDK V19,并在.NET4环境下用VS2010来进行开发。

我要对我们的Leadtools.RESTServices项目中UploadService.cs文件的EndDocument 函数进行更新。REST服务的源代码在Leadtools.RESTServices项目中,它是与LEADTOOLS SDK中我们的HTML5演示程序的源代码一起装载的。至于原项目的源代码,您可以在这里找到:

[LEADTOOLS 19]\Examples\REST\Leadtools.RESTServices

该函数EndDocument 可以将所扫描的图像添加到一个单一的文件中;且,如果用户选择PDF作为输出格式,该服务将会在所扫描的图像上执行OCR。

我用IOcrEngine 接口来初始化OCR引擎的实例,并处理OCR引擎。

Documentation: IOcrEngine

我用IOcrDocument 接口来处理OCR操作的输入和输出:

Documentation: IOcrDocument

所扫描的图像会被加载到RasterImage 对象:

Documentation: RasterImage

我用PdfDocumentOptions 类来设置所生成的PDF文件的PDF选项:

Documentation: PdfDocumentOptions

当客户在我们的HTML5扫描演示中点击“保存到文件”按钮时,所扫描的图像将从客户端向服务器端发送,而服务器端会使用UploadService来创建输出文件。如果用户在点击“保存到文件”按钮时选择了PDF格式,那么,该服务会将页面添加到IOcrDocument对象,并执行OCR,然后,会将结果保存为图像超文本的PDF文件,并将其发送回客户端侧。

该应用程序终于完成啦!这总共花了我2小时的时间来更新我们的服务,其中包括测试和调试。如果没有LEADTOOLS文档成像套件SDK,我甚至无法想象像这样的任务要花多长时间才能完成。

 

 

下载该项目

该示例项目的源代码您可以点击这里进行下载。

09 Integrate OCR into Web Scanning.zip (62.67 kb)

 

支持

关于其他产品的更多信息,请访问我们的官方网站

欢迎下载免费的全功能评估版SDK,全功能试用版中有这个例子的全部源代码。

同时欢迎您使用评估版期间的免费技术支持


关于葡萄城

赋能开发者!葡萄城是专业的集开发工具、商业智能解决方案、低代码开发平台于一身的软件和服务提供商,为超过 75% 的全球财富 500 强企业提供服务。葡萄城专注控件软件领域30年,希望通过模块化的开发控件、灵活的低代码应用开发平台等一系列开发工具、解决方案和服务,帮助开发者快速响应复杂多变的业务需求,最大程度地发挥开发者的才智和潜能,让开发者的 IT 人生更从容更美好。

了解详情,请访问葡萄城官网