使用LEADTOOLS监控文件夹和转换文件为可检索的PDF:25天25个项目

发布时间:2016/12/26 00:12 发布者:Richard.Ma

返回博客中心

这是LEADTOOLS技术支持团队所创建的一系列实例中的第一个项目。作为LEAD Technologies 25周年纪念的一部分,我们正在搞一个“25天收集25个项目来展示LEAD功能强度和易用性”的活动。今天要展示的项目来自于艾伦的分享。

 

它是做什么的

使用LEADTOOLS第19版,该C#编写的控制台应用程序可以对一个目录实施监控,并将所有粘贴或拖放进该目录的文件转换为可检索的PDF文件格式。

 

所使用的功能

· Document Converter

· OCR (高级识别引擎)

 

开发进程日志

大家好,我是艾伦。我要用C#语言编写一个示例控制台应用程序。使用LEADTOOLS的文档转换器工具包,该程序可以不间断地对一个目录实施监视,并将粘贴或拖放入该目录的所有文件转换为可检索的PDF文件格式。

仔细考虑过应该如何编写该应用程序之后,我决定将其作为一个用来显示该应用程序如何通过Windows服务来运行的很好的附加功能。我要使用我们自己的OCR高级识别引擎的来识别文档,这样,我可以将它保存为可检索的PDF文件。

Documentation: IOcrEngine

我已经完成对该应用程序的设置,使得它可以对应用程序启动所时创建的某个目录不间断地实施监控。这个部分花了我大约半小时的时间。

现在我要开始使用OCR高级识别引擎,并将所输入的文件加载到OCR文档。

Documentation: IOcrDocument

虽然我已经实现了这些功能,但对在这些功能进行一些测试的同时,我意识到自己还是缺少了某些文件的一些必需的编解码器。所以,我需要添加所需的编解码器到该项目。这花了我大约一个小时的时间。

Documentation: Files to be Included With Your Application

我现在要开始执行OCR文档识别,并将OCR文档保存为一个可检索的PDF文件。这个过程花了大约十五分钟的时间。

我花了十五分钟左右来实现识别和保存。然后,该应用程序已经基本完成。我开始做一些完善测试,并确保已经在自己的代码中添加了所有必要的注解。这个过程花了大约半小时的时间。

我花了大约半小时时间来进行完善测试,为我的代码添加了注解。现在,该主要的应用程序(文件夹监控器)已经基本完成。我要通过将该应用程序插入到Windows Service来开始对该应用程序的设置。我原本打算将整个应用程序置于一个Windows Service中,但是,由于需要花一段时间才能加载完应用程序,貌似需要修改注册表来增加加载Windows Service的超时时间值,所以我只是简单地将FolderMonitor.exe打包到Windows Service。

我已经完成了对该应用程序的Windows Service的设置。如果你想用Windows Service来测试该应用程序的话,我已经在其自述文件中讲述了应该如何对它进行设置。

我的应用程序已经做好了进行部署的准备。这花了我总共4个小时的时间。但是,如果没有LEADTOOLS的帮助,只是将文件转换成可检索的PDF文件这一步就要花费我几个星期的时间。

 

下载该项目

该示例项目的源代码您可以点击这里进行下载。

18 Folder Monitor.zip (64.09 kb)

要运行该项目,请将其解压缩到该目录下:C:\LEADTOOLS 19\Examples\DotNet\CS directory。

 

支持

关于其他产品的更多信息,请访问我们的官方网站

欢迎下载免费的全功能评估版SDK,全功能试用版中有这个例子的全部源代码。

同时欢迎您使用评估版期间的免费技术支持


关于葡萄城

赋能开发者!葡萄城是专业的集开发工具、商业智能解决方案、低代码开发平台于一身的软件和服务提供商,为超过 75% 的全球财富 500 强企业提供服务。葡萄城专注控件软件领域30年,希望通过模块化的开发控件、灵活的低代码应用开发平台等一系列开发工具、解决方案和服务,帮助开发者快速响应复杂多变的业务需求,最大程度地发挥开发者的才智和潜能,让开发者的 IT 人生更从容更美好。

了解详情,请访问葡萄城官网