Java PDF读写器/文本提取库/组件/API
轻松创建、操作(读取和写入)、反汇编 PDF 文件。
Asprise 提供 PDF 编写器和阅读器库(具有文本提取功能)作为我们旗舰产品 Asprise OCR 和 JTwain 的重要附加组件。便携式文档格式 (PDF) 是一种广泛用于各种文档的文件格式。使用 Asprise Java PDF 库,您可以轻松地创建、操作(读取和写入)、反汇编 PDF 文件。您还可以使用它来提取文本,然后对提取的文本进行索引以进行搜索。通过使用这个库和 Asprise OCR 引擎,现在您也可以OCR 图像存储在 PDF 文件中。
图像转PDF
使用 Asprise Java PDF Reader (带有文本提取)/Writer Library 从图像创建 PDF 文件
示例代码:
import com.asprise.util.pdf.PDFImageWriter;
import com.asprise.util.pdf.PDFImageWriter; PDFImageWriter writer = new PDFImageWriter(new FileOutputStream("new.pdf")); writer.open(); writer.addImage("C:\\1.jpg"); writer.addImage("C:\\2.png"); writer.close();
演示
比如两张JPEG格式的图片:
girl.jpg [108 Kb]
sky.jpg [199 Kb]
可以写入单个 PDF 文件,如下所示:
从 PDF 中提取文本
使用Asprise Java PDF Reader (with Text Extract)/Writer Library 提取 PDF 文件的文本
示例代码:
使用 Java In Action 提取 PDF 文件的文本:
例如,以下 PDF 文件:
结果是以下提取的文本
Java PDF Read Write Extract Text: Reader/Writer/Extract Text Library...
http://localhost/web/Asprise.COM/product/javapdf/index.php
1 of 1 3/30/2007 5:22 PM
Java PDF Reader/Writer/Text Extract Library/Component/API
Asprise offers PDF writer and reader library (with text extact function) as valued add-on to our
flagship products – Asprise OCR & JTwain. Portable Document Format (PDF) is a file format widely
used for all kinds of documents. With Asprise Java PDF library, you can easily create, manipulate
(read and write), disassemble PDF files easily. You can also use it to extract text and then index
the text extracted for search. By using this library and Asprise OCR engine, now you can OCR
images stored in PDF files.
Download Asprise Java PDF Library Trial For FREE
Asprise PDF Library for ALL
PLATFORMS
Developer's Guide to Asprise PDF Library
PDF 上的 OCR
带有 Asprise Java PDF Reader(带文本提取)/Writer 库和 Asprise OCR 引擎的 OCR PDF 文件
示例代码:
订购Java PDF Reader (with Text Extract)/Writer Library
最低的软件拥有成本。LAB Asprise 在以下灵活的许可方案下提供 PDF 编写器和阅读器库:
许可证类型 |
条款 |
Java PDF Reader with Text Extract |
· 用于读取 PDF 文件的二进制类; · 用于从 PDF 文件中提取文本和图像的二进制类 · 免版税分发(分发给无限数量的计算机) · 每个开发人员一个许可证 |
Java PDF Writer only |
· 用于将图像写入 PDF 文件的二进制类 · 免版税分发(分发给无限数量的计算机) · 每个开发人员一个许可证 |
Java PDF Reader with Text Extract + Writer |
· 用于读取 PDF 文件的二进制类; · 用于从 PDF 文件中提取文本和图像的二进制类 · 用于将图像写入 PDF 文件的二进制类 · 免版税分发(分发给无限数量的计算机) · 每个开发人员一个许可证 |
Java PDF Reader with Text Extract + Writer |
· 用于读取 PDF 文件的二进制类; · 用于从 PDF 文件中提取文本和图像的二进制类 · 用于将图像写入 PDF 文件的二进制类 · 免版税分发(分发给无限数量的计算机) · 一个许可证可用于您公司中无限数量的开发人员 |
支持+ 软件更新 12个月的单一开发者许可证
|
· 高优先级电子邮件支持 · 软件更新 · 紧急情况下的电话支持。 |
支持 + |
· 高优先级电子邮件支持 · 软件更新 · 紧急情况下的电话支持。 |
京ICP备09015132号-996 | 网络文化经营许可证京网文[2017]4225-497号 | 违法和不良信息举报电话:4006561155
© Copyright 2000-2023 北京哲想软件有限公司版权所有 | 地址:北京市海淀区西三环北路50号豪柏大厦C2座11层1105室