- 从 Microsoft Office(Word、Excel 和 PowerPoint,版本 97-2007)和 PDF 文档中提取文本、元数据和隐藏信息
- 识别、报告、(可选)删除或修改 40 多种元数据和隐藏数据元素
- 对来自多个 PowerPoint 演示文稿的幻灯片进行分页和重组
- 提供准确的文本偏移信息,以便自动进行 Adobe Reader 中对 PDF 的原始搜索突出显示。
- 为大多数性能敏感环境所需的高文档吞吐量而设计
- 可通过一个 Java API 轻松集成以用于 Java 环境或任何 Java 兼容环境(如 JSP 和 J2EE),或通过一个 C/C++ 或 .NET API 与传统语言集成
- 任何 Microsoft Office 相关性都不会消除自动化 Office 应用程序以处理大量文件时出现的可靠性、可伸缩性和平台相关性问题
- 可通过 Java、C/C++、.NET 接口在 Windows 上使用,通过 Java 和 C/C++ 接口在 Linux x86 上使用,还可通过 Java 接口在 Solaris SPARC 上使用。在任何 Java 1.5 或更高版本的兼容 JVM 上均受支持
|