使用LEADTOOLS将图像转换为包含文本、元数据的可检索PDF文件:25天25个项目

发布时间:2016/03/02 00:03 发布者:AvoCaDolol

返回博客中心

作为LEAD Technologies 25周年纪念的一部分,我们正在搞一个“25天收集25个项目来展示LEAD功能强度和易用性”的活动。今天要展示的项目来自于艾伦的分享。

默认的转换窗体

clip_image001

填充转换窗体

clip_image002

元数据对话框

clip_image003

填充元数据对话框

clip_image004

它是做什么的

该项目将利用LEADTOOLS第19版来实现从图像到可检索的、图像超文本的、包含元数据的PDF文件的转换。

所使用的功能

· PDF

· OCR

 

开发进程日志

大家好,我是艾伦。我要写这样一个C#的WinForms应用程序,该程序可以将所有类型的文件都转换成可搜索的PDF文件。该应用程序将包括可以使用图像超文本属性,以及可以添加元数据到输出的PDF文件的功能。

创建应用程序的主用户界面这一部分我已经完成。这大约花了我一个小时的时间。

现在我要开始使用我们的优势OCR引擎来识别文档,这样,我就可以将它保存为可检索的PDF文件。

Documentation: IOcrEngine

使用了优势OCR引擎以后,现在,无需所添加的各种功能,该应用程序就可以将文件转换为可检索的PDF文件。这个部分花了我大约一个小时时间才完成,包括调试过程。

现在,我要开始实现将其保存为具有图像超文本属性的PDF文件的功能。

Documentation: Image Over Text

现在我已经实现了具有图像超文本特征的保存功能。这只需花十五分钟左右即可完成。

现在,我要开始实现将元数据添加到输出的PDF文件的功能。

Documentation: PdfDocumentOptions

现在,我已经实现了将元数据添加到输出的PDF文件的功能。这花了我大约一个小时的时间才完成,包括为获取用户所需的元数据而创建弹出窗体的时间。

至今为止,这一共花了我三个半小时的时间。而我,现在要开始做一些测试。

现在,我已经修复了在我的应用程序中发现的一些漏洞,并且添加了一些可以使代码更容易阅读的注解。这大约花了我一个小时左右的时间。这样,我的应用程序已经准备好进行部署了。

从开始到结束,我一共花了五个半小时的时间来完成该应用程序的开发。如果没有LEADTOOLS的帮助,这可能需要花费我几个星期,甚至几个月的时间。

下载该项目

该示例项目的源代码您可以点击进行下载。

要运行这个程序,请将文件解压缩至:C:\LEADTOOLS 19\Examples\DotNet\CS 目录下。

 

支持

关于其他产品的更多信息,请访问我们的官方网站

欢迎下载免费的全功能评估版SDK,全功能试用版中有这个例子的全部源代码。

同时欢迎您使用评估版期间的免费技术支持


关于葡萄城

赋能开发者!葡萄城是专业的集开发工具、商业智能解决方案、低代码开发平台于一身的软件和服务提供商,为超过 75% 的全球财富 500 强企业提供服务。葡萄城专注控件软件领域30年,希望通过模块化的开发控件、灵活的低代码应用开发平台等一系列开发工具、解决方案和服务,帮助开发者快速响应复杂多变的业务需求,最大程度地发挥开发者的才智和潜能,让开发者的 IT 人生更从容更美好。

了解详情,请访问葡萄城官网