OCI Speech is an AI service that both transcribes speech to text and synthesizes speech from text. Get accurate, text-normalized, time-stamped transcriptions and synthetized voice via the OCI Console, OCI Data Science notebooks, and REST APIs, as well as CLIs or SDKs.
La transcripción en tiempo real está ahora en versión de disponibilidad limitada. Descubre cómo recibir una transcripción precisa de forma instantánea.
Descubre cómo interactúan los componentes de un sistema típico para permitir que OCI Speech transcriba el lenguaje natural.
Crea, prueba e implementa aplicaciones en Oracle Cloud de forma gratuita con un crédito en la nube de 300 dólares.
OCI Speech utiliza el reconocimiento automático de voz, un proceso de aprendizaje profundo, para obtener una transcripción precisa de las conversaciones naturales. Empieza a utilizar fácilmente modelos de lenguaje y acústicos incorporados que no requieren que los usuarios tengan experiencia en ciencia de datos.
Busca, indexa y descifra los datos escondidos en tus archivos de audio. Convierte conversaciones grabadas en audio a datos textuales para su análisis por medio de servicios de IA. Por ejemplo, puedes utilizar OCI Language para extraer la percepción y las capacidades de detección de anomalías de OCI Speech para identificar oportunidades de rotación de clientes.
Ahora con disponibilidad limitada, la función de transcripción en tiempo real de OCI Speech te permite enviar streams de audio y recibir transcripciones precisas en cuestión de segundos.
Ahora con disponibilidad limitada, la función de texto a voz de OCI Speech permite a los desarrolladores sintetizar voz similar a la humana a partir de texto en todas las aplicaciones. Permite mantener conversaciones con los clientes, traducir varios idiomas con voz, mejorar la accesibilidad y realizar otras tareas.
Los modelos de reconocimiento automático de voz (ASR) de OCI Speech admiten varios idiomas, como inglés, español y portugués, para que puedas transcribir tus archivos de audio en los idiomas que prefieras.
OCI Speech admite la diarización para organizar, analizar y extraer información significativa de las interacciones habladas.
No dependas de soluciones de transcripción de terceros y logra un mayor control de los datos con cumplimiento normativo y seguridad integrales.
OCI Speech es un servicio versátil al que se puede llamar mediante API de REST, diferentes SDK y Oracle CLI. Los desarrolladores pueden desplegar fácilmente un servicio de voz escalable sin tener experiencia en ciencia de datos o aprendizaje automático.
Oracle Cloud Infrastructure Speech protege la privacidad de nuestros clientes. Una serie de modelos de reconocimiento automático del habla predefinidos transcriben tu contenido, pero no almacenan datos con fines de formación o de depuración de errores.
OCI Speech utiliza modelos y arquitectura propios que permiten una rápida conversión de voz a texto.
Hemos agregado una puntuación de confianza por palabra para que identifiques palabras que podrían haberse transcrito incorrectamente. Utiliza la puntuación de confianza de palabras para determinar en qué aspectos debes centrarte a la hora de desarrollar una aplicación.
Hemos agregado filtros de palabras predefinidos que utilizan una lista organizada de palabras obscenas. Puedes ocultar, eliminar o etiquetar las palabras obscenas.
Nuestra función de reconocimiento de voz en tiempo real ayuda a garantizar que su voz se transcriba con precisión mientras hablas de forma natural, lo que permite una comunicación fluida e ininterrumpida.
Proporciona automáticamente subtítulos integrados al flujo de trabajo en OCI Platform para todo el contenido creado y revisado por los servicios de medios digitales. Indexa el contenido con OCI Speech para facilitar la búsqueda en todo tu contenido.
Transcribe las llamadas de los clientes para buscar y recuperar la información de forma sencilla. Utiliza OCI Language para detectar opiniones y ayudar a identificar las oportunidades de captación de clientes y formación del personal.
La transcripción en tiempo real permite a los médicos y enfermeras capturar las notas del paciente sobre la marcha, lo que ayuda a aumentar la eficiencia y mejorar la atención y los resultados.
La conversión neuronal de texto a voz proporciona una voz de alta precisión, similar a la humana con entonaciones, proporcionando más opciones para las funciones de accesibilidad.
Crea, comprueba e implementa aplicaciones en Oracle Cloud de forma gratuita.