Land

Spraak naar tekst (STT) en tekst naar spraak (TTS)

OCI Speech is een AI-service die zowel spraak naar tekst transcribeert als spraak uit tekst synthetiseert. Verkrijg nauwkeurige, tekstgenormaliseerde transcripties met tijdstempel en gesynthetiseerde spraak via de OCI Console, OCI Data Science notebooks en REST API's, evenals CLI's of SDK's.

Praat met een AI-expert

Tekst naar spraak en realtime transcriptie
Tekst-naar-spraak en realtime transcriptiefuncties zijn nu beperkt beschikbaar. Ontdek hoe u een gesynthetiseerde stem kunt maken op basis van tekst en ontvang direct een nauwkeurige transcriptie.

Lees het blog
Zie hoe het werkt
Lees hoe de componenten in een algemeen systeem samenwerken om natuurlijke taal te laten transcriberen door OCI Speech.

Bekijk de referentiearchitectuur
Probeer OCI Speech gratis uit
Bouw, test en implementeer applicaties in Oracle Cloud gratis met een cloudtegoed van USD 300.

Probeer Oracle Cloud Free Tier uit

Functies van OCI Speech

Vooraf gebouwde modellen voor geluid en taal

OCI Speech maakt gebruik van automatische spraakherkenning (ASR, Automatic Speech Recognition), een deep-learning proces waarmee nauwkeurige transcripties kunnen worden gemaakt van natuurlijke gesprekken. Ga eenvoudig aan de slag met vooraf gebouwde modellen voor geluid en taal, waarvoor geen bestaande ervaring met data science nodig is.

Analyse van data uit audio- en videobestanden

Zoek, indexeer en ontcijfer data uit audiobestanden. Converteer opgenomen audiogesprekken naar tekstuele data en analyseer deze met AI-services. Gebruik bijvoorbeeld OCI Language om het sentiment op te halen en de anomaliedetectiemogelijkheden van OCI Speech om de kans op klantverloop te identificeren.

Realtime transcriptie

Met de realtime transcriptiefunctie van OCI Speech, die nu beperkt beschikbaar is, kunt u audiostreams verzenden en binnen enkele seconden een nauwkeurige transcriptie ontvangen.

Neurale tekst-naar-spraak (TTS)

Dankzij de tekst-naar-spraakfunctie in OCI Speech, die nu beperkt beschikbaar is, kunt u spraak op basis van tekst in verschillende applicaties synthetiseren. Deze functie maakt gesprekken met klanten, meertalige spraakvertalingen en een verbeterde toegankelijkheid mogelijk. Kies uit verschillende stemmen om de interactie te verbeteren.

Native ondersteuning voor meerdere talen

OCI Speech ASR-modellen ondersteunen Engels, Spaans, Portugees, Duits, Frans, Italiaans en Hindi, zodat u uw audiobestanden in de taal van uw voorkeur kunt transcriberen. Daarnaast ondersteunt OCI Speech ook het OpenAI Whisper-model, dat meer dan 57 talen out of the box ondersteunt. Meer informatie over OCI en het Whisper-model.

Diarisatie voor meer leesbaarheid en begrip

OCI Speech ondersteunt dagboeken voor het organiseren, analyseren en extraheren van zinvolle informatie van meerdere sprekers.

Geïntegreerde transcriptieservice

Wees niet langer afhankelijk van transcriptieservices van derden en krijg meer controle over uw data met end-to-end beveiliging en compliance.

Gemakkelijk te integreren

OCI Speech is een veelzijdige service die kan worden aangeroepen via REST-API's, verschillende SDK's en Oracle CLI. Ontwikkelaars kunnen eenvoudig een schaalbare spraakservice implementeren zonder expert te zijn op het gebied van data science of ML.

Speciaal ontwikkeld voor veiligheid en privacy

Oracle Cloud Infrastructure Speech beschermt de privacy van onze klanten. Vooraf gebouwde modellen voor automatische spraakherkenning zetten uw content om, maar slaan geen data op voor training, foutopsporing of andere doeleinden.

Geïntegreerde transcriptieservice

OCI Speech maakt gebruik van eigen modellen en een eigen architectuur die een snelle conversie van spraak naar tekst mogelijk maken.

Betrouwbaarheidsscore per woord

We hebben een betrouwbaarheidsscore op woordniveau toegevoegd om u te helpen woorden te identificeren die mogelijk onjuist zijn getranscribeerd. Gebruik de woordbetrouwbaarheidsscore om te bepalen waar u zich op moet concentreren bij het ontwikkelen van een applicatie.

Filters voor grof taalgebruik

We hebben vooraf gebouwde woordfilters toegevoegd met behulp van een lijst met grove woorden. U kunt deze woorden maskeren, verwijderen of taggen.

27 april 2022

Interpunctie, ondertiteling en 8kHz-modellen zijn nu beschikbaar voor OCI Speech.

Guy Michaeli, Senior Principal Product Manager

Vandaag kondigen we graag drie nieuwe mogelijkheden aan voor de spraakservice zonder extra kosten: native ondersteuning voor 8kHz-audiobestanden, ondersteuning voor output in de SRT (bestandsformaat voor ondertiteling) en automatische interpunctie van uitgaande tekst. Deze nieuwe mogelijkheden zijn nu beschikbaar in alle handelsregio's van OCI en maken deel uit van onze betrokkenheid om de klanten kwalitatief goede en betaalbare transcripties te bieden.

Lees het volledige artikel

Uitgelichte OCI Speech-blogs

12 maart, 2022 Aankondiging van Oracle Cloud Infrastructure Speech GA
3 november 2021 Voeg eenvoudig automatische spraakherkenning toe aan uw apps

Alles bekijken

Toepassingen van OCI Speech

Analyse van klantenfeedback
Zoeken in digitale mediacontent en ondertiteling

Bied via het OCI-platform automatisch ondertiteling voor alle content die wordt gemaakt en beheerd door digitale mediaservices. Indexeer uw content met OCI Speech zodat u eenvoudig hierin kunt zoeken.
Callcenters en gespreksanalyse

Gebruik OCI Speech om transcripties te maken van gesprekken met klanten zodat u gemakkelijk informatie kunt zoeken en ophalen. Gebruik OCI Language en Anomaly Detection samen om het sentiment te ontdekken en te identificeren of een klant een terugkerende klant kan worden. Ook bieden deze services trainingsmogelijkheden voor medewerkers.

OCI-spraakresources

Documentatie
- Documentatie over OCI Speech
- OCI Speech referentiearchitectuur
Gerelateerde producten
- OCI Language
  Kunstmatige intelligentie en machine learning om talen te detecteren en een sentimentanalyse uit te voeren op uw ongestructureerde tekst.
- OCI Anomaly Detection
  Implementeer aangepaste, bedrijfsspecifieke modellen in applicaties om afwijkingen te detecteren.
- Oracle Digital Assistant
  Bouw gespreksinterfaces voor uw applicaties.

Aan de slag met OCI Speech

Oracle Cloud Free Tier

Bouw, test en implementeer applicaties in Oracle Cloud - helemaal gratis.

Probeer Oracle Cloud Free Tier uit

Spraak naar tekst (STT) en tekst naar spraak (TTS)

Vooraf gebouwde modellen voor geluid en taal

Analyse van data uit audio- en videobestanden

Realtime transcriptie

Neurale tekst-naar-spraak (TTS)

Native ondersteuning voor meerdere talen

Diarisatie voor meer leesbaarheid en begrip

Geïntegreerde transcriptieservice

Gemakkelijk te integreren

Speciaal ontwikkeld voor veiligheid en privacy

Geïntegreerde transcriptieservice

Betrouwbaarheidsscore per woord

Filters voor grof taalgebruik

Interpunctie, ondertiteling en 8kHz-modellen zijn nu beschikbaar voor OCI Speech.

Uitgelichte OCI Speech-blogs

Toepassingen van OCI Speech

Analyse van klantenfeedback

Zoeken in digitale mediacontent en ondertiteling

Callcenters en gespreksanalyse

Aan de slag met OCI Speech

Oracle Cloud Free Tier