Transcription par l'IA

OCI Speech est un service d'IA qui applique la technologie de reconnaissance automatique de la parole pour transformer du contenu vocal en texte. Les développeurs peuvent facilement passer des appels d'API pour intégrer les modèles pré-entraînés d'OCI Speech dans leurs applications. OCI Speech peut être utilisé pour une transcription précise, normalisée en texte et horodatée grâce à la console, les API REST ainsi que les interfaces en ligne de commande ou les SDK. Vous pouvez également utiliser OCI Speech dans une session de bloc-notes d'OCI Data Science. Grâce à OCI Speech, vous pouvez filtrer des grossièretés, obtenir des notes de confiance à la fois pour des mots isolés ou des transcriptions complètes, et bien plus encore.

Fonctionnalités d'OCI Speech

Audio prédéfini et modèles linguistiques

OCI Speech utilise la reconnaissance automatique de la parole (un processus de deep learning) pour proposer une transcription précise des conversations naturelles. Démarrez facilement grâce à des modèles audio et linguistiques prédéfinis qui ne nécessitent pas que les utilisateurs aient une expérience en data science.

Analyse des données présentes dans des fichiers audio et vidéo

Recherchez, indexez et déchiffrez les données que recèlent vos fichiers audio. Convertissez des conversations audios enregistrées en données textuelles afin de les analyser à l'aide de services d'IA. Par exemple, vous pouvez utiliser OCI Language pour extraire les sentiments ou les fonctionnalités de détection d'anomalies d'OCI Speech afin d'identifier les risques d'attrition des clients.

Prise en charge multilingue native

Les modèles ASR d'OCI Speech prennent en charge l'anglais, l'espagnol et le portugais afin que vous puissiez retranscrire vos fichiers audios dans vos langues préférées.

Diarisation pour une meilleure lisibilité et compréhension

OCI Speech prend en charge la diarisation pour l'organisation, l'analyse et l'extraction d'informations pertinentes à partir d' interactions orales.


Service de transcription intégré

Ne dépendez plus d'offres de transcription tierces et renforcez le contrôle sur vos données grâce à une conformité et une sécurité d'un bout à l'autre.

Faciles à intégrer

OCI Speech est un service polyvalent qui peut être appelé via des API REST, différents kits SDK et l'interface de ligne de commande Oracle CLI. Les développeurs peuvent facilement déployer un service vocal évolutif sans avoir nécessairement être experts en data science ou en machine learning.

Conçu spécialement pour la sécurité et la confidentialité

Oracle Cloud Infrastructure Speech protège la confidentialité de vos clients. Les modèles prédéfinis de reconnaissance vocale automatique transcrivent vos contenus mais ne stockent aucune donnée pour l'entraînement, le débogage ou d'autres fins.


Service de transcription intégré

OCI Speech utilise des modèles et une architecture propriétaires qui permettent une conversion rapide de la parole en texte.

Note de confiance par mot

Nous avons ajouté une note de confiance par mot afin de pouvoir identifier les mots qui ont potentiellement été mal retranscrits. Utilisez la note de confiance par mot pour déterminer où se concentrer lors de la création d'une application.

Filtres de grossièretés

Nous avons ajouté un filtre de mots prédéfinis grâce à une liste de grossièretés. Vous pouvez soit masquer, supprimer ou étiqueter les grossièretés.


Cas d'utilisation d'OCI Speech

  • Analyses des commentaires clients

  • Recherche de contenu multimédia numérique et sous-titrage

    Fournissez automatiquement des sous-titres dans le workflow sur la plate-forme OCI pour tout le contenu créé et géré par le service de médias numériques. Indexez votre contenu en utilisant OCI Speech pour effectuer facilement des recherches dans votre contenu.

  • Centre d'appel et analyse des appels

    OCI Speech peut fournir une transcription des appels des clients pour faciliter la recherche et l'extraction d'informations. Combinez OCI Language et Anomaly Detection pour déterminer l'état d'esprit des clients et détecter les risques d'attrition et les opportunités de formation pour votre personnel.

Ressources relatives à OCI Speech

27 avril 2022

La ponctuation, les légendes fermées et les modèles à 8 kHz sont désormais disponibles pour OCI Speech.

Guy Michaeli, Senior Principal Product Manager

Aujourd'hui, nous sommes heureux d'annoncer trois nouvelles fonctionnalités pour le service Speech sans frais supplémentaires : prise en charge native des fichiers audio 8kHz, prise en charge de la sortie dans le format SRT (format de fichier de légende fermée) et ponctuation automatique du texte de sortie. Ces nouvelles fonctionnalités sont désormais disponibles dans toutes les régions commerciales d'OCI et font partie de notre engagement à fournir une transcription de qualité et abordable à nos clients.

Lire l'article complet

Lancez-vous avec OCI Speech


Oracle Cloud Free Tier

Créez, testez et déployez vos applications sur Oracle Cloud, gratuitement.