Es tut uns leid. Wir konnten keine Übereinstimmung für Ihre Suche finden.

Beachten Sie die folgenden Tipps, um das Gesuchte zu finden:

  • Prüfen Sie die Schreibweise des Suchbegriffs.
  • Verwenden Sie Synonyme für das eingegebene Stichwort, z. B. „Anwendung“ statt „Software“.
  • Beginnen Sie eine neue Suche.
Kontaktieren Sie uns Bei Oracle Cloud anmelden

KI – Sprache zu Text

OCI Speech ist ein KI-Service, der automatische Spracherkennungstechnologie nutzt, um audiobasierte Inhalte in Text umzuwandeln. Entwickler können ganz einfach API-Aufrufe durchführen, um die vordefinierten Modelle von OCI Speech in ihre Anwendungen zu integrieren. OCI Speech kann über die Konsole und die REST-APIs sowie über Befehlszeilenschnittstellen oder SDKs für eine genaue, textnormierte und mit Zeitstempel versehene Transkription verwendet werden. Sie können OCI Speech auch in einer OCI Data Science-Notebook-Session verwenden. Mit OCI Speech können Sie Obszönitäten filtern, Konfidenzscores für einzelne Wörter und vollständige Transkriptionen usw. abrufen.

OCI Speech-Funktionen

Vorkonfigurierte akustische und sprachliche Modelle

OCI Speech verwendet die automatische Spracherkennung, einen Deep Learning-Prozess, um eine genaue Transkription aus natürlichen Unterhaltungen abzuleiten. Einfacher Einstieg durch die Verwendung vordefinierter akustischer und sprachlicher Modelle, die keine Data Science-Erfahrung erfordern.

Analysieren von Daten aus Audio- und Videodateien

Suchen, Indexieren und Entschlüsseln von in Ihren Audiodateien versteckten Daten. Konvertieren aufgezeichneter Audiounterhaltungen in Textdaten zur Analyse mit KI-Services. Beispiel: Mit OCI Language können Sie die Funktionen zur Erkennung von Sentimenten und Anomalien bei OCI Speech abrufen, um die Risiken einer Kundenabwanderung zu identifizieren.

Nativer mehrsprachiger Support

OCI Speech ASR-Modelle unterstützen Englisch, Spanisch und Portugiesisch, sodass Sie Ihre Audiodateien in Ihren bevorzugten Sprachen transkribieren können.


Integrierter Transkriptions-Service

Schaffen Sie die Abhängigkeit von Transkriptionsangeboten von Drittanbietern ab und üben Sie mehr Kontrolle über Ihre Daten durch End-to-End-Sicherheit und -Compliance aus.

Einfach zu integrieren

OCI Speech ist ein vielseitiger Service, der über REST-APIs, verschiedene SDKs und die Oracle CLI aufgerufen werden kann. Entwickler können einfach einen skalierbaren Sprachservice bereitstellen, ohne Data Science oder ML-Kenntnisse besitzen zu müssen.

Speziell entwickelt für Sicherheit und Datenschutz

Oracle Cloud Infrastructure Speech schützt die Privatsphäre unserer Kunden. Vordefinierte automatische Spracherkennungsmodelle übertragen Ihre Inhalte, speichern jedoch keine Daten für Schulungen, Debugging oder andere Zwecke.


Integrierter Transkriptions-Service

OCI Speech verwendet proprietäre Modelle und Architektur, die eine schnelle Konvertierung von Sprache in Text ermöglichen.

Konfidenzscore pro Wort

Wir haben einen Konfidenzscore auf Wortebene hinzugefügt, um Wörter zu identifizieren, die möglicherweise falsch transkribiert wurden. Mit dem Wortkonfidenzscore können Sie bestimmen, wo beim Erstellen einer Anwendung der Fokus liegt.

Obszönitätsfilter

Wir haben eine vorkonfigurierte Wortfilterung mit einer kuratierten Liste von Obszönitäten hinzugefügt. Sie können Obszönitäten maskieren, entfernen oder taggen.


Anwendungsfälle für OCI Speech

  • Analyse von Kundenfeedback

  • Inhaltssuche und Untertitel in den digitalen Medien

    Bereitstellen automatisch geschlossener In-Workflows in der OCI-Plattform für alle vom Digital Media Service erstellten und kuratierten Inhalte. Indexieren Ihrer Inhalte mit OCI Speech, um Ihre Inhalte problemlos zu durchsuchen.

  • Callcenter, Anrufanalysen

    OCI Speech kann Kundenanrufe zur einfachen Suche und zum Abrufen von Informationen transkribieren. Mithilfe von OCI Language und Anomaly Detection können Sie die Stimmung erkennen und mögliche Kundenabwanderung und Schulungsbedarf von Mitarbeitern identifizieren.

OCI Speech-Ressourcen

Dokumentation

Dokumentation

Wir bieten eine breite Palette an Dokumentation für den OCI Speech-Service. Erfahren Sie, wie Sie Transkriptionsjobs erstellen, Entwicklertools verwenden und vieles mehr.

Häufig gestellte Fragen

Häufig gestellte Fragen

Hier erhalten Sie Fragen zum OCI Speech-Service, die über den folgenden Link beantwortet wurden.

27. April 2022

Interpunktion, Untertitel und 8 kHz-Modelle sind jetzt für OCI Speech verfügbar.

Guy Michaeli, Senior Principal Product Manager

Heute freuen wir uns, drei neue Features für den Speech-Service ohne zusätzliche Kosten bekannt zu geben: native Unterstützung für 8 kHz-Audiodateien, Unterstützung für die Ausgabe im SRT (ein Untertitel-Datenformat) und automatische Interpunktion von Ausgabetext. Diese neuen Features sind jetzt in allen kommerziellen Regionen von OCI verfügbar und sind Teil unseres Engagements, unseren Kunden qualitativ hochwertige und erschwingliche Transkriptionen zu bieten.

Vollständigen Artikel lesen

Erste Schritte mit OCI Speech


Oracle Cloud Free Tier

Erstellen, testen und implementieren Sie Anwendungen in Oracle Cloud – und das kostenlos.


Häufig gestellte Fragen

Antworten auf alle Ihre Fragen zu OCI Speech.