OCI Document Understanding utiliza el reconocimiento óptico de caracteres (OCR) y otros modelos avanzados para extraer automáticamente el texto de una gran variedad de archivos de documentos, como documentos rotados, inclinados o sombreados, para dar soporte a problemas de calidad que suelen darse en el procesamiento de gastos y la incorporación de clientes.
Identifica y extrae automáticamente la estructura de las tablas de los documentos, incluidas las relaciones entre filas y columnas dentro de la tabla. En documentos de gastos e identidad, OCI Document Understanding puede identificar y extraer pares clave-valor de facturas, recibos, pasaportes, licencias de conducir y tarjetas de identificación de seguros médicos.
Identifica y clasifica los documentos en categorías comunes, como factura, recibo y currículum. Entre las aplicaciones comunes se incluyen el procesamiento de gastos y la búsqueda y recuperación mejoradas de documentos.
Los modelos preentrenados de OCI Document Understanding para el reconocimiento óptico de caracteres y pares clave-valor son compatibles con varios idiomas, como alemán, árabe, chino, español, francés, holandés, inglés, hebreo, japonés, portugués, ruso y ucraniano.
Crea modelos personalizados para pares clave-valor y clasificación de documentos. Con OCI Document Understanding, los clientes pueden entrenar, evaluar, implementar y analizar modelos con sus propios datos.
OCI Document Understanding mantiene la privacidad del cliente con modelos que no almacenan ningún dato para el entrenamiento, la depuración u otros fines.
OCI Document Understanding es un servicio versátil que puede ser llamado a través de API REST, múltiples SDK (incluyendo Python y Java), o la línea de comandos de OCI. Los desarrolladores pueden desplegar fácilmente un servicio de documentos escalable sin tener experiencia en ciencia de datos o aprendizaje automático.
Proporciona puntos finales específicos para un mayor control y la capacidad de satisfacer los requisitos de alto rendimiento de los flujos de trabajo de OCI Document Understanding.