Speech to text (STT) and text to speech (TTS)

OCI Speech is an AI service that both transcribes speech to text and synthesizes speech from text. Get accurate, text-normalized, time-stamped transcriptions and synthetized voice via the OCI Console, OCI Data Science notebooks, and REST APIs, as well as CLIs or SDKs.

Fonctionnalités d'OCI Speech

Audio prédéfini et modèles linguistiques

OCI Speech utilise la reconnaissance automatique de la parole (un processus de deep learning) pour proposer une transcription précise des conversations naturelles. Démarrez facilement grâce à des modèles audio et linguistiques prédéfinis qui ne nécessitent pas que les utilisateurs aient une expérience en data science.

Analyse des données présentes dans des fichiers audio et vidéo

Recherchez, indexez et déchiffrez les données que recèlent vos fichiers audio. Convertissez des conversations audios enregistrées en données textuelles afin de les analyser à l'aide de services d'IA. Par exemple, vous pouvez utiliser OCI Language pour extraire les sentiments ou les fonctionnalités de détection d'anomalies d'OCI Speech afin d'identifier les risques d'attrition des clients.

Transcription en temps réel

Désormais en disponibilité limitée, la fonction de transcription en temps réel d'OCI Speech vous permet d'envoyer des flux audio et de recevoir une transcription précise en quelques secondes.

Texte neuronal au discours (TTS)

Désormais disponible de manière limitée, la fonctionnalité de conversion de texte en discours d'OCI Speech permet aux développeurs de synthétiser la parole semblables à celles d'un humain à partir d'un texte dans toutes les applications. Favorisez les conversations avec les clients, traduisez plusieurs langues à l'aide de la voix, améliorez l'accessibilité et effectuez d'autres tâches.

Prise en charge multilingue native

Les modèles ASR d'OCI Speech prennent en charge l'anglais, l'espagnol et le portugais afin que vous puissiez retranscrire vos fichiers audios dans vos langues préférées.

Diarisation pour une meilleure lisibilité et compréhension

OCI Speech prend en charge la diarisation pour l'organisation, l'analyse et l'extraction d'informations pertinentes à partir d' interactions orales.


Service de transcription intégré

Ne dépendez plus d'offres de transcription tierces et renforcez le contrôle sur vos données grâce à une conformité et une sécurité d'un bout à l'autre.

Faciles à intégrer

OCI Speech est un service polyvalent qui peut être appelé via des API REST, différents kits SDK et l'interface de ligne de commande Oracle CLI. Les développeurs peuvent facilement déployer un service vocal évolutif sans avoir nécessairement être experts en data science ou en machine learning.

Conçu spécialement pour la sécurité et la confidentialité

Oracle Cloud Infrastructure Speech protège la confidentialité de vos clients. Les modèles prédéfinis de reconnaissance vocale automatique transcrivent vos contenus mais ne stockent aucune donnée pour l'entraînement, le débogage ou d'autres fins.


Service de transcription intégré

OCI Speech utilise des modèles et une architecture propriétaires qui permettent une conversion rapide de la parole en texte.

Note de confiance par mot

Nous avons ajouté une note de confiance par mot afin de pouvoir identifier les mots qui ont potentiellement été mal retranscrits. Utilisez la note de confiance par mot pour déterminer où se concentrer lors de la création d'une application.

Filtres de grossièretés

Nous avons ajouté un filtre de mots prédéfinis grâce à une liste de grossièretés. Vous pouvez soit masquer, supprimer ou étiqueter les grossièretés.


Notre fonction de reconnaissance vocale en temps réel permet de s'assurer que votre discours est correctement transcrit au fur et à mesure que vous parlez naturellement, ce qui permet une communication fluide et ininterrompue.
Michael Zhang, Responsable de produit principal senior chez Oracle

Cas d'usage pour OCI Speech

Recherche de contenu multimédia numérique et sous-titrage

Fournissez automatiquement des sous-titres dans le workflow sur la plateforme OCI pour tout le contenu créé et géré par les services de médias numériques. Indexez votre contenu en utilisant OCI Speech pour effectuer facilement des recherches dans votre contenu.

Analyses des commentaires clients et des appels

Transcrivez les appels des clients pour faciliter la recherche et l'extraction d'informations. Utilisez OCI Language pour détecter les sentiments et vous aider à identifier l'attrition de clients et les opportunités de formation du personnel.

Dictée médicale

La transcription en temps réel permet aux médecins et aux infirmières de saisir les notes des patients lorsqu'ils sont en déplacement, ce qui contribue à accroître l'efficacité et à améliorer les soins et les résultats.

Amélioration de l'accessibilité

La synthèse vocale neuronale fournit une voix semblable à l'humain avec des intonations, offrant plus d'options pour les fonctionnalités d'accessibilité.

Ressources relatives à OCI Speech

Lancez-vous avec OCI Speech


Oracle Cloud Free Tier

Créez, testez et déployez vos applications sur Oracle Cloud, gratuitement.