作为LEAD Technologies 25周年纪念的一部分，我们正在搞一个“25天收集25个项目来展示LEAD功能强度和易用性”的活动。今天要展示的项目来自于达乌德的分享。

选择源文件

开始扫描

保存OCRed为PDF

它是做什么的

使用LEADTOOLS第19版，该Web应用程序可以用OCR来扫描文档，并将它们转换成可检索的PDF文件。

所使用的功能

· OCR

· Web Scanning

开发进程日志

大家好，我是达乌德。我要更新我们的HTML5 REST服务，以便在从我们的Web扫描演示程序中所扫描的图像上使用OCR，并将OCR结果保存到一个图像超文本的PDF文件中。

我要使用的是LEADTOOLS文档成像套件SDK V19，并在.NET4环境下用VS2010来进行开发。

我要对我们的Leadtools.RESTServices项目中UploadService.cs文件的EndDocument 函数进行更新。REST服务的源代码在Leadtools.RESTServices项目中，它是与LEADTOOLS SDK中我们的HTML5演示程序的源代码一起装载的。至于原项目的源代码，您可以在这里找到：

[LEADTOOLS 19]\Examples\REST\Leadtools.RESTServices

该函数EndDocument 可以将所扫描的图像添加到一个单一的文件中；且，如果用户选择PDF作为输出格式，该服务将会在所扫描的图像上执行OCR。

我用IOcrEngine 接口来初始化OCR引擎的实例，并处理OCR引擎；

我用IOcrDocument 接口来处理OCR操作的输入和输出；

所扫描的图像会被加载到RasterImage 对象；

我用PdfDocumentOptions 类来设置所生成的PDF文件的PDF选项。

当客户在我们的HTML5扫描演示中点击“保存到文件”按钮时，所扫描的图像将从客户端向服务器端发送，而服务器端会使用UploadService来创建输出文件。如果用户在点击“保存到文件”按钮时选择了PDF格式，那么，该服务会将页面添加到IOcrDocument对象，并执行OCR，然后，会将结果保存为图像超文本的PDF文件，并将其发送回客户端侧。

该应用程序终于完成啦！这总共花了我2小时的时间来更新我们的服务，其中包括测试和调试。如果没有LEADTOOLS文档成像套件SDK，我甚至无法想象像这样的任务要花多长时间才能完成。

下载该项目

该示例项目的源代码您可以点击这里进行下载。

09 Integrate OCR into Web Scanning.zip (62.67 kb)

支持

关于其他产品的更多信息，请访问我们的官方网站，

欢迎下载免费的全功能评估版SDK，全功能试用版中有这个例子的全部源代码。

同时欢迎您使用评估版期间的免费技术支持。

关于葡萄城

葡萄城是专业的软件开发技术和低代码平台提供商，以“赋能开发者”为使命，致力于通过表格控件、低代码和BI等各类软件开发工具和服务，一站式满足开发者需求，帮助企业提升开发效率并创新开发模式。葡萄城开发技术始于1980年，40余年来始终聚焦软件开发技术，有深厚的技术积累和丰富的产品线。是业界能够同时赋能软件开发和低代码开发的企业。凭借过硬的产品能力、活跃的开发者社区和丰富的伙伴生态，与超过3000家合作伙伴紧密合作，产品广泛应用于信息和软件服务、制造、交通运输、建筑、金融、能源、教育、公共管理等支柱产业。