作为LEAD Technologies 25周年纪念的一部分，我们正在搞一个“25天收集25个项目来展示LEAD功能强度和易用性”的活动。今天要展示的项目来自于达乌德的分享。

选择源文件

开始扫描

保存OCRed为PDF

它是做什么的

使用LEADTOOLS第19版，该Web应用程序可以用OCR来扫描文档，并将它们转换成可检索的PDF文件。

所使用的功能

· OCR

· Web Scanning

开发进程日志

大家好，我是达乌德。我要更新我们的HTML5 REST服务，以便在从我们的Web扫描演示程序中所扫描的图像上使用OCR，并将OCR结果保存到一个图像超文本的PDF文件中。

我要使用的是LEADTOOLS文档成像套件SDK V19，并在.NET4环境下用VS2010来进行开发。

我要对我们的Leadtools.RESTServices项目中UploadService.cs文件的EndDocument 函数进行更新。REST服务的源代码在Leadtools.RESTServices项目中，它是与LEADTOOLS SDK中我们的HTML5演示程序的源代码一起装载的。至于原项目的源代码，您可以在这里找到：

[LEADTOOLS 19]\Examples\REST\Leadtools.RESTServices

该函数EndDocument 可以将所扫描的图像添加到一个单一的文件中；且，如果用户选择PDF作为输出格式，该服务将会在所扫描的图像上执行OCR。

我用IOcrEngine 接口来初始化OCR引擎的实例，并处理OCR引擎。

Documentation: IOcrEngine

我用IOcrDocument 接口来处理OCR操作的输入和输出：

Documentation: IOcrDocument

所扫描的图像会被加载到RasterImage 对象：

Documentation: RasterImage

我用PdfDocumentOptions 类来设置所生成的PDF文件的PDF选项：

Documentation: PdfDocumentOptions

当客户在我们的HTML5扫描演示中点击“保存到文件”按钮时，所扫描的图像将从客户端向服务器端发送，而服务器端会使用UploadService来创建输出文件。如果用户在点击“保存到文件”按钮时选择了PDF格式，那么，该服务会将页面添加到IOcrDocument对象，并执行OCR，然后，会将结果保存为图像超文本的PDF文件，并将其发送回客户端侧。

该应用程序终于完成啦！这总共花了我2小时的时间来更新我们的服务，其中包括测试和调试。如果没有LEADTOOLS文档成像套件SDK，我甚至无法想象像这样的任务要花多长时间才能完成。

下载该项目

该示例项目的源代码您可以点击这里进行下载。

09 Integrate OCR into Web Scanning.zip (62.67 kb)

支持

关于其他产品的更多信息，请访问我们的官方网站，

欢迎下载免费的全功能评估版SDK，全功能试用版中有这个例子的全部源代码。

同时欢迎您使用评估版期间的免费技术支持。

如何使用LEADTOOLS来创建web应用以识别文档并转换为PDF：25天25个项目

它是做什么的

所使用的功能

开发进程日志

下载该项目

支持

关于葡萄城

博客搜索

关注微信

联系我们

如何使用LEADTOOLS来创建web应用以识别文档并转换为PDF：25天25个项目

它是做什么的

所使用的功能

开发进程日志

下载该项目

支持

关于葡萄城

博客搜索

博客分类

关注微信

联系我们