如何使用LEADTOOLS来创建web应用以识别文档并转换为PDF:25天25个项目

使用LEADTOOLS第19版,该Web应用程序可以用OCR来扫描文档,并将它们转换成可检索的PDF文件

发布于 2016/12/26 00:00

行业动态

作为LEAD Technologies 25周年纪念的一部分,我们正在搞一个“25天收集25个项目来展示LEAD功能强度和易用性”的活动。今天要展示的项目来自于达乌德的分享。

选择源文件

clip_image002[7]_thumb[1]

开始扫描

clip_image004[7]_thumb[1]

保存OCRed为PDF

clip_image006[11]_thumb[1]

它是做什么的

使用LEADTOOLS第19版,该Web应用程序可以用OCR来扫描文档,并将它们转换成可检索的PDF文件。

所使用的功能

· OCR

· Web Scanning

开发进程日志

大家好,我是达乌德。我要更新我们的HTML5 REST服务,以便在从我们的Web扫描演示程序中所扫描的图像上使用OCR,并将OCR结果保存到一个图像超文本的PDF文件中。

我要使用的是LEADTOOLS文档成像套件SDK V19,并在.NET4环境下用VS2010来进行开发。

我要对我们的Leadtools.RESTServices项目中UploadService.cs文件的EndDocument 函数进行更新。REST服务的源代码在Leadtools.RESTServices项目中,它是与LEADTOOLS SDK中我们的HTML5演示程序的源代码一起装载的。至于原项目的源代码,您可以在这里找到:

[LEADTOOLS 19]\Examples\REST\Leadtools.RESTServices

该函数EndDocument 可以将所扫描的图像添加到一个单一的文件中;且,如果用户选择PDF作为输出格式,该服务将会在所扫描的图像上执行OCR。

我用IOcrEngine 接口来初始化OCR引擎的实例,并处理OCR引擎。

Documentation: IOcrEngine

我用IOcrDocument 接口来处理OCR操作的输入和输出:

Documentation: IOcrDocument

所扫描的图像会被加载到RasterImage 对象:

Documentation: RasterImage

我用PdfDocumentOptions 类来设置所生成的PDF文件的PDF选项:

Documentation: PdfDocumentOptions

当客户在我们的HTML5扫描演示中点击“保存到文件”按钮时,所扫描的图像将从客户端向服务器端发送,而服务器端会使用UploadService来创建输出文件。如果用户在点击“保存到文件”按钮时选择了PDF格式,那么,该服务会将页面添加到IOcrDocument对象,并执行OCR,然后,会将结果保存为图像超文本的PDF文件,并将其发送回客户端侧。

该应用程序终于完成啦!这总共花了我2小时的时间来更新我们的服务,其中包括测试和调试。如果没有LEADTOOLS文档成像套件SDK,我甚至无法想象像这样的任务要花多长时间才能完成。

下载该项目

该示例项目的源代码您可以点击这里进行下载。

09 Integrate OCR into Web Scanning.zip (62.67 kb)

支持

关于其他产品的更多信息,请访问我们的官方网站,

欢迎下载免费的全功能评估版SDK,全功能试用版中有这个例子的全部源代码。

同时欢迎您使用评估版期间的免费技术支持。

关于葡萄城

葡萄城是专业的软件开发技术和低代码平台提供商,以“赋能开发者”为使命,致力于通过表格控件、低代码和BI等各类软件开发工具和服务,一站式满足开发者需求,帮助企业提升开发效率并创新开发模式。葡萄城开发技术始于1980年,40余年来始终聚焦软件开发技术,有深厚的技术积累和丰富的产品线。是业界能够同时赋能软件开发和低代码开发的企业。凭借过硬的产品能力、活跃的用户社区和丰富的伙伴生态,与超过3000家合作伙伴紧密合作,产品广泛应用于信息和软件服务、制造、交通运输、建筑、金融、能源、教育、公共管理等支柱产业。

推荐相关资源
关注微信
葡萄城社区二维码

关注“葡萄城社区”

加微信获取技术资讯

加微信获取技术资讯

想了解更多信息,请联系我们, 随时掌握技术资源和产品动态