OCI Speech est un service d'IA qui applique la technologie de reconnaissance automatique de la parole pour transformer du contenu vocal en texte. Les développeurs peuvent facilement passer des appels d'API pour intégrer les modèles pré-entraînés d'OCI Speech dans leurs applications. OCI Speech peut être utilisé pour une transcription précise, normalisée en texte et horodatée grâce à la console, les API REST ainsi que les interfaces en ligne de commande ou les SDK. Vous pouvez également utiliser OCI Speech dans une session de bloc-notes d'OCI Data Science. Grâce à OCI Speech, vous pouvez filtrer des grossièretés, obtenir des notes de confiance à la fois pour des mots isolés ou des transcriptions complètes, et bien plus encore.
OCI Speech utilise la reconnaissance automatique de la parole (un processus de deep learning) pour proposer une transcription précise des conversations naturelles. Démarrez facilement grâce à des modèles audio et linguistiques prédéfinis qui ne nécessitent pas que les utilisateurs aient une expérience en data science.
Recherchez, indexez et déchiffrez les données que recèlent vos fichiers audio. Convertissez des conversations audios enregistrées en données textuelles afin de les analyser à l'aide de services d'IA. Par exemple, vous pouvez utiliser OCI Language pour extraire les sentiments ou les fonctionnalités de détection d'anomalies d'OCI Speech afin d'identifier les risques d'attrition des clients.
Les modèles ASR d'OCI Speech prennent en charge l'anglais, l'espagnol et le portugais afin que vous puissiez retranscrire vos fichiers audios dans vos langues préférées.
Ne dépendez plus d'offres de transcription tierces et renforcez le contrôle sur vos données grâce à une conformité et une sécurité d'un bout à l'autre.
OCI Speech est un service polyvalent qui peut être appelé via des API REST, différents kits SDK et l'interface de ligne de commande Oracle CLI. Les développeurs peuvent facilement déployer un service vocal évolutif sans avoir nécessairement être experts en data science ou en machine learning.
Oracle Cloud Infrastructure Speech protège la confidentialité de vos clients. Les modèles prédéfinis de reconnaissance vocale automatique transcrivent vos contenus mais ne stockent aucune donnée pour l'entraînement, le débogage ou d'autres fins.
OCI Speech utilise des modèles et une architecture propriétaires qui permettent une conversion rapide de la parole en texte.
Nous avons ajouté une note de confiance par mot afin de pouvoir identifier les mots qui ont potentiellement été mal retranscrits. Utilisez la note de confiance par mot pour déterminer où se concentrer lors de la création d'une application.
Nous avons ajouté un filtre de mots prédéfinis grâce à une liste de grossièretés. Vous pouvez soit masquer, supprimer ou étiqueter les grossièretés.
Fournissez automatiquement des sous-titres dans le workflow sur la plate-forme OCI pour tout le contenu créé et géré par le service de médias numériques. Indexez votre contenu en utilisant OCI Speech pour effectuer facilement des recherches dans votre contenu.
OCI Speech peut fournir une transcription des appels des clients pour faciliter la recherche et l'extraction d'informations. Combinez OCI Language et Anomaly Detection pour déterminer l'état d'esprit des clients et détecter les risques d'attrition et les opportunités de formation pour votre personnel.
Guy Michaeli, Senior Principal Product Manager
Aujourd'hui, nous sommes heureux d'annoncer trois nouvelles fonctionnalités pour le service Speech sans frais supplémentaires : prise en charge native des fichiers audio 8kHz, prise en charge de la sortie dans le format SRT (format de fichier de légende fermée) et ponctuation automatique du texte de sortie. Ces nouvelles fonctionnalités sont désormais disponibles dans toutes les régions commerciales d'OCI et font partie de notre engagement à fournir une transcription de qualité et abordable à nos clients.
Lire l'article completCréez, testez et déployez vos applications sur Oracle Cloud, gratuitement.