OCI Speech is an AI service that both transcribes speech to text and synthesizes speech from text. Get accurate, text-normalized, time-stamped transcriptions and synthetized voice via the OCI Console, OCI Data Science notebooks, and REST APIs, as well as CLIs or SDKs.
Die Echtzeit-Transkription ist jetzt in begrenztem Umfang verfügbar. Erfahren Sie, wie Sie sofort eine genaue Transkription erhalten.
Erfahren Sie, wie die Komponenten eines typischen Systems zusammenwirken, um natürliche Sprache mit OCI Speech zu transkribieren.
Erstellen, testen und implementieren Sie Anwendungen in der Oracle Cloud kostenlos mit einem Cloud-Guthaben von 300 US-Dollar.
OCI Speech verwendet die automatische Spracherkennung, einen Deep Learning-Prozess, um eine genaue Transkription aus natürlichen Unterhaltungen abzuleiten. Einfacher Einstieg durch die Verwendung vordefinierter akustischer und sprachlicher Modelle, die keine Data Science-Erfahrung erfordern.
Suchen, Indexieren und Entschlüsseln von in Ihren Audiodateien versteckten Daten. Konvertieren aufgezeichneter Audiounterhaltungen in Textdaten zur Analyse mit KI-Services. Beispiel: Mit OCI Language können Sie die Funktionen zur Erkennung von Sentimenten und Anomalien bei OCI Speech abrufen, um die Risiken einer Kundenabwanderung zu identifizieren.
Die nun in begrenzter Verfügbarkeit erhältliche Echtzeit-Transkriptionsfunktion von OCI Speech ermöglicht es Ihnen, Audiostreams zu senden und innerhalb von Sekunden eine genaue Transkription zu erhalten.
Die Text-to-Speech-Funktion in OCI Speech ist jetzt in begrenzter Verfügbarkeit erhältlich und ermöglicht es Entwicklern, aus Text in verschiedenen Anwendungen eine menschenähnliche Sprache zu synthetisieren. Ermöglichen Sie Gespräche mit Kunden, übersetzen Sie mehrere Sprachen per Spracherkennung, verbessern Sie die Barrierefreiheit und führen Sie weitere Aufgaben aus.
OCI Speech ASR-Modelle unterstützen Englisch, Spanisch und Portugiesisch, sodass Sie Ihre Audiodateien in Ihren bevorzugten Sprachen transkribieren können.
OCI Speech unterstützt die Diarisierung zum Organisieren, Analysieren und Extrahieren aussagekräftiger Informationen aus gesprochenen Interaktionen.
Schaffen Sie die Abhängigkeit von Transkriptionsangeboten von Drittanbietern ab und üben Sie mehr Kontrolle über Ihre Daten durch End-to-End-Sicherheit und -Compliance aus.
OCI Speech ist ein vielseitiger Service, der über REST-APIs, verschiedene SDKs und die Oracle CLI aufgerufen werden kann. Entwickler können einfach einen skalierbaren Sprachservice bereitstellen, ohne Data Science oder ML-Kenntnisse besitzen zu müssen.
Oracle Cloud Infrastructure Speech schützt die Privatsphäre unserer Kunden. Vordefinierte automatische Spracherkennungsmodelle übertragen Ihre Inhalte, speichern jedoch keine Daten für Schulungen, Debugging oder andere Zwecke.
OCI Speech verwendet proprietäre Modelle und Architektur, die eine schnelle Konvertierung von Sprache in Text ermöglichen.
Wir haben einen Konfidenzscore auf Wortebene hinzugefügt, um Wörter zu identifizieren, die möglicherweise falsch transkribiert wurden. Mit dem Wortkonfidenzscore können Sie bestimmen, wo beim Erstellen einer Anwendung der Fokus liegt.
Wir haben eine vorkonfigurierte Wortfilterung mit einer kuratierten Liste von Obszönitäten hinzugefügt. Sie können Obszönitäten maskieren, entfernen oder taggen.
Unsere Echtzeit-Spracherkennung sorgt dafür, dass Ihre Worte genau transkribiert werden, während Sie ganz natürlich sprechen, und ermöglicht so eine nahtlose und unterbrechungsfreie Kommunikation.
Automatische Bereitstellung von Untertiteln während des Workflows auf der OCI-Plattform für alle Inhalte, die von digitalen Mediendiensten erstellt und kuratiert werden. Indexieren Ihrer Inhalte mit OCI Speech, um Ihre Inhalte problemlos zu durchsuchen.
Transkribieren Sie Kundenanrufe, um Informationen leichter suchen und abrufen zu können. Verwenden Sie OCI Language, um die Stimmung zu erkennen sowie Kundenabwanderung und Schulungsmöglichkeiten für Mitarbeiter zu ermitteln.
Durch die Echtzeit-Transkription können Ärzte und Krankenschwestern Patientendaten unterwegs erfassen, was zu einer höheren Effizienz und besseren Behandlungsergebnissen führt.
Neuronale Text-to-Speech-Technologie bietet eine menschliche Stimme mit hoher Genauigkeit und Intonation und damit mehr Optionen für barrierefreie Funktionen.
Erstellen, testen und implementieren Sie Anwendungen in Oracle Cloud – und das kostenlos.
Antworten auf alle Ihre Fragen zu OCI Speech.