OCI Speech es un servicio de inteligencia artificial que aplica tecnología de reconocimiento automático de voz para transformar contenido basado en audio en texto. Los desarrolladores pueden realizar llamadas de API fácilmente para integrar los modelos entrenados previamente de OCI Speech en sus aplicaciones. OCI Speech se puede utilizar para transcripción precisa, normalizada en texto y con marcas de tiempo a través de la consola y las API REST, así como interfaces de línea de comandos o SDK. También puedes usar OCI Speech en una sesión de cuaderno de OCI Data Science. Con OCI Speech, puedes filtrar las palabras, obtener puntuaciones de confianza para palabras solas, transcripciones completas y mucho más.
OCI Speech utiliza el reconocimiento automático de voz, un proceso de aprendizaje profundo, para obtener una transcripción precisa de las conversaciones naturales. Empieza a utilizar fácilmente modelos de lenguaje y acústicos incorporados que no requieren que los usuarios tengan experiencia en ciencia de datos.
Busca, indexa y descifra los datos escondidos en tus archivos de audio. Convierte conversaciones grabadas en audio a datos textuales para su análisis por medio de servicios de IA. Por ejemplo, puedes utilizar OCI Language para extraer la percepción y las capacidades de detección de anomalías de OCI Speech para identificar oportunidades de rotación de clientes.
Los modelos de reconocimiento automático de voz (ASR) de OCI Speech admiten varios idiomas, como inglés, español y portugués, para que puedas transcribir tus archivos de audio en los idiomas que prefieras.
No dependas de soluciones de transcripción de terceros y logra un mayor control de los datos con cumplimiento normativo y seguridad integrales.
OCI Speech es un servicio versátil al que se puede llamar mediante API de REST, diferentes SDK y Oracle CLI. Los desarrolladores pueden desplegar fácilmente un servicio de voz escalable sin tener experiencia en ciencia de datos o aprendizaje automático.
Oracle Cloud Infrastructure Speech protege la privacidad de nuestros clientes. Una serie de modelos de reconocimiento automático del habla predefinidos transcriben tu contenido, pero no almacenan datos con fines de formación o de depuración de errores.
OCI Speech utiliza modelos y arquitectura propios que permiten una rápida conversión de voz a texto.
Hemos agregado una puntuación de confianza por palabra para que identifiques palabras que podrían haberse transcrito incorrectamente. Utiliza la puntuación de confianza de palabras para determinar en qué aspectos debes centrarte a la hora de desarrollar una aplicación.
Hemos agregado filtros de palabras predefinidos que utilizan una lista organizada de palabras obscenas. Puedes ocultar, eliminar o etiquetar las palabras obscenas.
Proporciona automáticamente subtítulos integrados al flujo de trabajo en OCI Platform para todo el contenido creado y revisado por el servicio de medios digitales. Indexa el contenido con OCI Speech para facilitar la búsqueda en el contenido.
OCI Speech puede transcribir las llamadas de los clientes para buscar y recuperar la información de forma sencilla. Utiliza conjuntamente OCI Language y Anomaly Detection para detectar opiniones e identificar las oportunidades de captación de clientes y formación del personal.
Guy Michaeli, director sénior de productos
Hoy, tenemos el agrado de anunciar tres prestaciones nuevas para el servicio de voz sin costo adicional: compatibilidad nativa para archivos de audio de 8 kHz, compatibilidad de salida en el SRT (un formato de archivo de subtítulos) y puntuación automática del texto. Estas nuevas prestaciones están ahora disponibles en todas las regiones comerciales de OCI y forman parte de nuestro compromiso de proporcionar una transcripción asequible y de alta calidad para nuestros clientes.
Lee el artículo completoCrea, comprueba e implementa aplicaciones en Oracle Cloud de forma gratuita.