OCI Speech este un serviciu AI care aplică tehnologia de recunoaștere automată a vorbirii pentru a transforma conținutul audio în text. Dezvoltatorii pot crea cu ușurință apelări API pentru a integra modelele pre-instruite ale OCI Speech în aplicațiile lor. OCI Speech poate fi utilizat pentru transcrierea precisă, cu text normalizat și cu marcaj temporal prin intermediul consolei și al API-urilor REST, precum și prin interfețe cu linii de comandă sau SDK-uri. De asemenea, puteți utiliza OCI Speech în cadrul sesiunilor OCI Data Science pe notebook. Cu OCI Speech, puteți filtra oportunitățile, obține punctaje de încredere pentru cuvintele unice, transcrierile complete și multe altele.
OCI Speech utilizează recunoașterea automată a vocii, un proces de învățare aprofundată, pentru a transcrie precis conversațiile naturale. Începeți ușor utilizând modele acustice și lingvistice preintegrate, care nu necesită ca utilizatorii să aibă experiență în știința datelor.
Căutați, indexați și descifrați datele din fișierele audio. Transformați conversațiile audio înregistrate în date text pentru a le analiza folosind serviciile AI. De exemplu, puteți utiliza OCI Language pentru a prelua sentimentul și funcționalitățile de detectare a anomaliilor OCI Speech pentru a identifica șansele de pierdere a clienților.
Modelele OCI Speech ASR funcționează cu mai multe limbi, precum engleză, spaniolă și portugheză, astfel încât să puteți transcrie fișierele audio în limba dvs. preferată.
Nu vă mai bazați pe ofertele de transcriere ale terților și exercitați mai mult control asupra datelor folosind securitatea integrală și conformitatea.
OCI Speech este un serviciu flexibil, ce poate fi apelat prin API-uri REST, SDK-uri diferite și Oracle CLI. Dezvoltatorii pot implementa cu ușurință un serviciu pentru discursuri scalabil fără a avea experiență în știința datelor sau în ML.
Oracle Cloud Infrastructure Speech protejează confidențialitatea clienților. Modelele ASR integrate transcriu conținutul, dar nu stochează datele pentru instruire, remedierea eroilor sau alte motive.
OCI Speech utilizează modele și arhitectură proprietară, care permite conversia rapidă a vorbirii în text.
Am adăugat un punctaj de încredere la nivel de cuvânt pentru a vă ajuta să identificați cuvinte care ar fi putut fi transcrise incorect. Utilizați punctajul de încredere pentru cuvinte și stabiliți unde să vă concentrați atenția la crearea unei aplicații.
Am adăugat funcționalități integrate de filtrare a limbajului obscen, utilizând o listă organizată de termeni. Puteți masca, elimina sau eticheta expresiile vulgare.
Introduceți automat o subtitrare în fluxul de lucru pe platforma OCI pentru tot conținutul creat și organizat de către serviciul media digital. Indexați conținutul utilizând OCI Speech pentru o căutare rapidă în conținutul dvs.
OCI Speech poate să transcrie apelurile clienților pentru o căutare mai rapidă și pentru recuperarea informațiilor. Utilizați împreună OCI Language și OCI Anomaly Detection pentru a detecta emoția și a identifica rata de pierdere a clienților și șansele de instruire a personalului.
Guy Michaeli, Manager Senior principal de produs
Suntem încântați să vă anunțăm trei noi funcționalități pentru serviciul Speech, fără costuri suplimentare: suport nativ pentru fișiere audio de 8 kHz, suport pentru ieșire în SRT (un format de fișier cu subtitrări) și punctuație automată a textului de ieșire. Aceste noi funcționalități sunt disponibile acum în toate regiunile comerciale ale OCI și fac parte din angajamentul nostru de a oferi transcriere de înaltă calitate și accesibilă clienților noștri.
Citiți articolul integralCreați, testați și implementați gratuit aplicații în Oracle Cloud.