Spraak naar tekst (STT) en tekst naar spraak (TTS)

OCI Speech is een AI-service die zowel spraak naar tekst transcribeert als spraak uit tekst synthetiseert. Verkrijg nauwkeurige, tekstgenormaliseerde transcripties met tijdstempel en gesynthetiseerde spraak via de OCI Console, OCI Data Science notebooks en REST API's, evenals CLI's of SDK's.

Functies van OCI Speech

Vooraf gebouwde modellen voor geluid en taal

OCI Speech maakt gebruik van automatische spraakherkenning (ASR, Automatic Speech Recognition), een deep-learning proces waarmee nauwkeurige transcripties kunnen worden gemaakt van natuurlijke gesprekken. Ga eenvoudig aan de slag met vooraf gebouwde modellen voor geluid en taal, waarvoor geen bestaande ervaring met data science nodig is.

Analyse van data uit audio- en videobestanden

Zoek, indexeer en ontcijfer data uit audiobestanden. Converteer opgenomen audiogesprekken naar tekstuele data en analyseer deze met AI-services. Gebruik bijvoorbeeld OCI Language om het sentiment op te halen en de anomaliedetectiemogelijkheden van OCI Speech om de kans op klantverloop te identificeren.

Realtime transcriptie

Met de realtime transcriptiefunctie van OCI Speech, die nu beperkt beschikbaar is, kunt u audiostreams verzenden en binnen enkele seconden een nauwkeurige transcriptie ontvangen.

Neurale tekst-naar-spraak (TTS)

Dankzij de tekst-naar-spraakfunctie in OCI Speech, die nu beperkt beschikbaar is, kunt u spraak op basis van tekst in verschillende applicaties synthetiseren. Deze functie maakt gesprekken met klanten, meertalige spraakvertalingen en een verbeterde toegankelijkheid mogelijk. Kies uit verschillende stemmen om de interactie te verbeteren.

Native ondersteuning voor meerdere talen

OCI Speech ASR-modellen ondersteunen Engels, Spaans, Portugees, Duits, Frans, Italiaans en Hindi, zodat u uw audiobestanden in de taal van uw voorkeur kunt transcriberen. Daarnaast ondersteunt OCI Speech ook het OpenAI Whisper-model, dat meer dan 57 talen out of the box ondersteunt. Meer informatie over OCI en het Whisper-model.

Diarisatie voor meer leesbaarheid en begrip

OCI Speech ondersteunt dagboeken voor het organiseren, analyseren en extraheren van zinvolle informatie van meerdere sprekers.


Geïntegreerde transcriptieservice

Wees niet langer afhankelijk van transcriptieservices van derden en krijg meer controle over uw data met end-to-end beveiliging en compliance.

Gemakkelijk te integreren

OCI Speech is een veelzijdige service die kan worden aangeroepen via REST-API's, verschillende SDK's en Oracle CLI. Ontwikkelaars kunnen eenvoudig een schaalbare spraakservice implementeren zonder expert te zijn op het gebied van data science of ML.

Speciaal ontwikkeld voor veiligheid en privacy

Oracle Cloud Infrastructure Speech beschermt de privacy van onze klanten. Vooraf gebouwde modellen voor automatische spraakherkenning zetten uw content om, maar slaan geen data op voor training, foutopsporing of andere doeleinden.


Geïntegreerde transcriptieservice

OCI Speech maakt gebruik van eigen modellen en een eigen architectuur die een snelle conversie van spraak naar tekst mogelijk maken.

Betrouwbaarheidsscore per woord

We hebben een betrouwbaarheidsscore op woordniveau toegevoegd om u te helpen woorden te identificeren die mogelijk onjuist zijn getranscribeerd. Gebruik de woordbetrouwbaarheidsscore om te bepalen waar u zich op moet concentreren bij het ontwikkelen van een applicatie.

Filters voor grof taalgebruik

We hebben vooraf gebouwde woordfilters toegevoegd met behulp van een lijst met grove woorden. U kunt deze woorden maskeren, verwijderen of taggen.


27 april 2022

Interpunctie, ondertiteling en 8kHz-modellen zijn nu beschikbaar voor OCI Speech.

Guy Michaeli, Senior Principal Product Manager

Vandaag kondigen we graag drie nieuwe mogelijkheden aan voor de spraakservice zonder extra kosten: native ondersteuning voor 8kHz-audiobestanden, ondersteuning voor output in de SRT (bestandsformaat voor ondertiteling) en automatische interpunctie van uitgaande tekst. Deze nieuwe mogelijkheden zijn nu beschikbaar in alle handelsregio's van OCI en maken deel uit van onze betrokkenheid om de klanten kwalitatief goede en betaalbare transcripties te bieden.

Lees het volledige artikel

Toepassingen van OCI Speech

  • Analyse van klantenfeedback

  • Zoeken in digitale mediacontent en ondertiteling

    Bied via het OCI-platform automatisch ondertiteling voor alle content die wordt gemaakt en beheerd door digitale mediaservices. Indexeer uw content met OCI Speech zodat u eenvoudig hierin kunt zoeken.

  • Callcenters en gespreksanalyse

    Gebruik OCI Speech om transcripties te maken van gesprekken met klanten zodat u gemakkelijk informatie kunt zoeken en ophalen. Gebruik OCI Language en Anomaly Detection samen om het sentiment te ontdekken en te identificeren of een klant een terugkerende klant kan worden. Ook bieden deze services trainingsmogelijkheden voor medewerkers.

OCI-spraakresources

Aan de slag met OCI Speech


Oracle Cloud Free Tier

Bouw, test en implementeer applicaties in Oracle Cloud - helemaal gratis.