作为LEAD Technologies 25周年纪念的一部分,我们正在搞一个“25天收集25个项目来展示LEAD功能强度和易用性”的活动。今天要展示的项目来自于达乌德的分享。
选择源文件
开始扫描
保存OCRed为PDF
它是做什么的
使用LEADTOOLS第19版,该Web应用程序可以用OCR来扫描文档,并将它们转换成可检索的PDF文件。
所使用的功能
· OCR
开发进程日志
大家好,我是达乌德。我要更新我们的HTML5 REST服务,以便在从我们的Web扫描演示程序中所扫描的图像上使用OCR,并将OCR结果保存到一个图像超文本的PDF文件中。
我要使用的是LEADTOOLS文档成像套件SDK V19,并在.NET4环境下用VS2010来进行开发。
我要对我们的Leadtools.RESTServices
项目中UploadService.cs文件的EndDocument
函数进行更新。REST服务的源代码在Leadtools.RESTServices
项目中,它是与LEADTOOLS SDK中我们的HTML5演示程序的源代码一起装载的。至于原项目的源代码,您可以在这里找到:
[LEADTOOLS 19]\Examples\REST\Leadtools.RESTServices
该函数EndDocument
可以将所扫描的图像添加到一个单一的文件中;且,如果用户选择PDF作为输出格式,该服务将会在所扫描的图像上执行OCR。
我用IOcrEngine
接口来初始化OCR引擎的实例,并处理OCR引擎。
我用IOcrDocument
接口来处理OCR操作的输入和输出:
所扫描的图像会被加载到RasterImage
对象:
我用PdfDocumentOptions
类来设置所生成的PDF文件的PDF选项:
Documentation: PdfDocumentOptions
当客户在我们的HTML5扫描演示中点击“保存到文件”按钮时,所扫描的图像将从客户端向服务器端发送,而服务器端会使用UploadService
来创建输出文件。如果用户在点击“保存到文件”按钮时选择了PDF格式,那么,该服务会将页面添加到IOcrDocument
对象,并执行OCR,然后,会将结果保存为图像超文本的PDF文件,并将其发送回客户端侧。
该应用程序终于完成啦!这总共花了我2小时的时间来更新我们的服务,其中包括测试和调试。如果没有LEADTOOLS文档成像套件SDK,我甚至无法想象像这样的任务要花多长时间才能完成。
下载该项目
该示例项目的源代码您可以点击这里进行下载。
09 Integrate OCR into Web Scanning.zip (62.67 kb)
支持
关于其他产品的更多信息,请访问我们的官方网站,
欢迎下载免费的全功能评估版SDK,全功能试用版中有这个例子的全部源代码。
同时欢迎您使用评估版期间的免费技术支持。
关于葡萄城
葡萄城是专业的软件开发技术和低代码平台提供商,以“赋能开发者”为使命,致力于通过表格控件、低代码和BI等各类软件开发工具和服务,一站式满足开发者需求,帮助企业提升开发效率并创新开发模式。葡萄城开发技术始于1980年,40余年来始终聚焦软件开发技术,有深厚的技术积累和丰富的产品线。是业界能够同时赋能软件开发和低代码开发的企业。凭借过硬的产品能力、活跃的用户社区和丰富的伙伴生态,与超过3000家合作伙伴紧密合作,产品广泛应用于信息和软件服务、制造、交通运输、建筑、金融、能源、教育、公共管理等支柱产业。
葡萄城热门产品


