产品和服务
解决方案
下载
商店
技术支持
培训
合作伙伴
关于
Oracle 技术网
开发人员利用这个 SDK 可以从 Microsoft Office 和 PDF 文档中提取和清理文本、元数据和隐藏信息,并分页和重组 PowerPoint 演示文稿。提供了 Java、C/C++ 和 .NET 版本的 API。Clean Content 是原生 Java 技术,因此其 Java API 可用于支持 Java 1.5 或更高版本的兼容 Java 运行时环境的任何操作系统。其 C/C++ API 可用于 Windows(x86-32 和 x86-64)和 Linux(x86-32 和 x86-64)上。其 .NET API 可用于 Windows(x86-32 和 x86-64)上。这个下载包括了对所有这些平台的支持。
该 SDK 提供对支持的文件类型的文本和元数据的编程访问。它针对性能进行了优化,在处理输入文件时,以交互方式向主机应用程序内存提供数据。可通过一个 C 语言 API 对其进行访问。
该 SDK 通过检查文件的内容来识别文件类型,而不必依赖文件的扩展名。可通过一个 C 语言 API 对其进行访问。
该 SDK 将支持的文件类型转换成 HTML,将嵌入的图形呈现为 GIF、JPEG 或 PNG。它使用一个复杂的模板架构以及一组丰富的选项,允许对 HTML 输出进行高度定制。可通过一个 C 语言 API 对其进行访问。
该 SDK 将支持的文件类型转换成 TIFF、JPEG、JPEG2000、BMP、GIF 或 PNG。它提供了众多选项,包括能够将图像输出的大小从缩略图调整到实际大小,以及控制图像分辨率。可通过一个 C 语言 API 对其进行访问。
该 SDK 将支持的文件类型转换成 PDF 或 PDF/A,无需原生应用程序或第三方库。
该 SDK 将支持的文件类型的文本和元数据转换成针对搜索应用程序、轻型 HTML 或文本优化的 XML。可通过一个 C 语言 API 对其进行访问。
该 SDK 提供了一个可以运行 Outside In 导出技术的框架。它符合 Web 服务模型,提供额外的 API(C、SOAP、Java 版本的),并将导出托管在一个单独的进程池中。
该 SDK 将支持的文件类型的高保真表示呈现在一个视图窗口中,不依赖于原生应用程序。它提供文件查看、打印、复制/粘贴以及批注功能。可通过一个 C 语言 API 对其进行访问。
该 SDK 将支持的文件类型的内容转换和标准化为 Outside In 的“FlexionDoc”模式定义的 XML。该模式使用 XML 标记描述文档内容、属性、结构和格式。可通过一个 C 语言 API 对其进行访问。