Oracle Cloud Infrastructure (OCI) Speech è un servizio AI che applica la tecnologia ASR (Automatic Speech Recognition) per trasformare in testo i contenuti audio. Gli sviluppatori possono effettuare chiamate API per integrare nelle proprie applicazioni i modelli predefiniti di OCI Speech. OCI Speech può essere utilizzato per avere una trascrizione accurata, adattata agli standard testuali e con timestamp tramite Console, API REST, CLI o SDK. Puoi inoltre utilizzare OCI Speech in una sessione notebook di Data Science. Con OCI Speech , puoi filtrare le volgarità, ottenere punteggi di affidabilità sia per le singole parole che per le trascrizioni complete, e molto altro ancora.
OCI Speech utilizza il riconoscimento vocale automatico, un processo di deep learning, per ricavare una trascrizione accurata da conversazioni naturali. Inizia agilmente utilizzando modelli di linguaggio e acustici predefiniti che non richiedono agli utenti alcuna esperienza di data science.
Cerca, indicizza e decifra i dati sepolti nei file audio. Converti le conversazioni audio registrate in dati di testo da analizzare con i servizi AI. Ad esempio, puoi utilizzare OCI Language per carpire il sentiment e le funzionalità di rilevamento delle anomalie di OCI Speech per identificare le probabilità di abbandono dei clienti.
I modelli ASR OCI Speech supportano l'inglese, lo spagnolo e il portoghese, per fare in modo che gli utenti possano trascrivere i file audio nelle loro lingue preferite.
Elimina la necessità di affidarsi ad offerte di trascrizione di terze parti ed esercita un maggiore controllo sui tuoi dati con sicurezza e compliance end-to-end.
OCI Speech è un servizio versatile che può essere attivato tramite API REST, diversi SDK e Oracle CLI. Gli sviluppatori possono distribuire facilmente un servizio vocale scalabile senza ricorrere a competenze di data science o ML.
Oracle Cloud Infrastructure Speech protegge la privacy dei clienti. I modelli di riconoscimento vocale automatico predefiniti trascrivono i contenuti ma non archiviano dati per la formazione, il debug o altri scopi.
OCI Speech utilizza modelli proprietari e architetture che consentono una rapida conversione della voce in testo.
Abbiamo aggiunto un punteggio di affidabilità a livello di parola per aiutarti a identificare le parole che potrebbero essere state trascritte in modo errato. Usa il punteggio di affidabilità per determinare dove concentrarti durante la creazione di un'applicazione.
Abbiamo aggiunto un filtro predefinito per le parole utilizzando una lista di volgarità. Puoi mascherare, rimuovere o etichettare le volgarità.
Fornisci automaticamente didascalie nel flusso di lavoro sulla piattaforma OCI per tutti i contenuti creati e curati dal servizio di contenuti multimediali digitali. Indicizza i tuoi contenuti utilizzando OCI speech per semplificare la ricerca fra i contenuti.
OCI Speech è in grado di trascrivere le chiamate dei clienti per semplificare la ricerca e il recupero delle informazioni. Utilizza OCI Language ed Anomaly Detection per rilevare le opinioni e identificare le possibilità di abbandono del cliente e di formazione del personale.
Offriamo una vasta gamma di documentazione per i servizi vocali OCI. Scopri come creare lavori di trascrizione, utilizzare gli strumenti di sviluppo e altro ancora.
Ricevi una risposta alle tue domande sul servizio vocale OCI tramite il link sottostante.
Guy Michaeli, Senior Principal Product Manager
Oggi, siamo lieti di annunciare tre nuove funzionalità per il servizio vocale senza costi aggiuntivi: supporto nativo per i file audio a 8 kHz, supporto per l'output nell'SRT (formato di file con didascalia chiusa) e punteggiatura automatica del testo di output. Queste nuove funzionalità sono ora disponibili in tutte le region commerciali di OCI e fanno parte del nostro impegno per fornire la trascrizione di qualità e conveniente per i nostri clienti.
Leggi l'articolo completoSviluppa, testa e implementa applicazioni su Oracle Cloud, gratuitamente.
Risposte a tutte le domande su OCI Speech.