OCI Speech is an AI service that both transcribes speech to text and synthesizes speech from text. Get accurate, text-normalized, time-stamped transcriptions and synthetized voice via the OCI Console, OCI Data Science notebooks, and REST APIs, as well as CLIs or SDKs.
În acest moment, transcrierea în timp real este disponibilă în mod limitat. Descoperiți cum puteți obține o transcriere precisă instantaneu.
Aflați cum interacționează componentele unui sistem tipic pentru a permite OCI Speech să transcrie limbajul natural.
Creați, testați și implementați aplicații pe Oracle Cloud gratuit cu un credit cloud de 300 USD.
OCI Speech utilizează recunoașterea automată a vocii, un proces de învățare aprofundată, pentru a transcrie precis conversațiile naturale. Începeți ușor utilizând modele acustice și lingvistice preintegrate, care nu necesită ca utilizatorii să aibă experiență în știința datelor.
Căutați, indexați și descifrați datele din fișierele audio. Transformați conversațiile audio înregistrate în date text pentru a le analiza folosind serviciile AI. De exemplu, puteți utiliza OCI Language pentru a prelua sentimentul și funcționalitățile de detectare a anomaliilor OCI Speech pentru a identifica șansele de pierdere a clienților.
În prezent disponibilă în mod limitat, funcția de transcriere în timp real a OCI Speech vă permite să trimiteți fluxuri audio și să primiți o transcriere exactă în câteva secunde.
În prezent disponibilă în mod limitat, funcția text-to-speech din OCI Speech le permite dezvoltatorilor să sintetizeze vorbirea asemănătoare cu cea umană din text în cadrul aplicațiilor. Permiteți conversații cu clienții, traduceți mai multe limbi cu ajutorul vocii, îmbunătățiți accesibilitatea și îndepliniți alte sarcini.
Modelele OCI Speech ASR funcționează cu mai multe limbi, precum engleză, spaniolă și portugheză, astfel încât să puteți transcrie fișierele audio în limba dvs. preferată.
OCI Speech acceptă diarizarea pentru organizarea, analizarea și extragerea de informații pertinente din interacțiunile vorbite.
Nu vă mai bazați pe ofertele de transcriere ale terților și exercitați mai mult control asupra datelor folosind securitatea integrală și conformitatea.
OCI Speech este un serviciu flexibil, ce poate fi apelat prin API-uri REST, SDK-uri diferite și Oracle CLI. Dezvoltatorii pot implementa cu ușurință un serviciu pentru discursuri scalabil fără a avea experiență în știința datelor sau în ML.
Oracle Cloud Infrastructure Speech protejează confidențialitatea clienților. Modelele ASR integrate transcriu conținutul, dar nu stochează datele pentru instruire, remedierea eroilor sau alte motive.
OCI Speech utilizează modele și arhitectură proprietară, care permite conversia rapidă a vorbirii în text.
Am adăugat un punctaj de încredere la nivel de cuvânt pentru a vă ajuta să identificați cuvinte care ar fi putut fi transcrise incorect. Utilizați punctajul de încredere pentru cuvinte și stabiliți unde să vă concentrați atenția la crearea unei aplicații.
Am adăugat funcționalități integrate de filtrare a limbajului obscen, utilizând o listă organizată de termeni. Puteți masca, elimina sau eticheta expresiile vulgare.
Funcția noastră de recunoaștere vocală în timp real vă ajută să vă asigurați că discursul dvs. este transcris cu acuratețe în timp ce vorbiți în mod natural, permițând o comunicare fără întreruperi și fără probleme.
Asigurați automat subtitrarea în flux a subtitrărilor pe platforma OCI pentru tot conținutul creat și administrat de către serviciile media digitale. Indexați conținutul dvs. cu ajutorul OCI Speech pentru o căutare ușoară în tot conținutul dvs.
Transcrieți apelurile clienților pentru a facilita căutarea și recuperarea informațiilor. Utilizați OCI Language pentru a detecta sentimentele și pentru a ajuta la identificarea pierderilor de clienți și a oportunităților de formare a personalului.
Transcrierea în timp real le permite medicilor și asistentelor medicale să captureze notele pacienților din mers, contribuind la creșterea eficienței și la îmbunătățirea îngrijirii și a rezultatelor.
Text-to-speech neuronal oferă o voce de înaltă precizie, asemănătoare celei umane, cu intonații, furnizând mai multe opțiuni pentru funcțiile de accesibilitate.
Creați, testați și implementați gratuit aplicații în Oracle Cloud.