A OCI Speech é um serviço de IA que usa tecnologia de reconhecimento automático de fala para transformar conteúdo de áudio em texto. Os desenvolvedores podem chamar APIs facilmente para integrar os modelos já treinados da OCI Speech em seus aplicativos. A OCI Speech pode ser usada em transcrições precisas, com as padrões de escrita e registro de dadta e hora através do painel REST APIs, bem como SDKs ou interfaces de linha de comando. Também é possível usar a OCI Speech em uma sessão padrão do OCI Data Science. A OCI Speech ajuda você a filtrar conteúdos impróprios, obter pontuações de confiabilidade para palavras ou sentenças completas, e muito mais.
A OCI Speech utiliza reconhecimento automático de fala, isto é, um processo de aprendizado profundo, para derivar transcrições precisas de conversas naturais. Comece a usar facilmente modelos acústicos e de linguagem predefinidos que não exigem de experiência prévia com ciência de dados.
Pesquise, crie índices, e decifre dados escondidos em seus arquivos de áudio. Converta os diálogos de áudio em dados textuais para analisá-los com a ajuda de serviços de IA. Por exemplo, você pode usar a OCI Language para recuperar as nuances da fala e os recursos de detecção de anomalias da OCI Speech para identificar as chances de desistência de clientes.
Os modelos ASR da OCI Speech trabalham com inglês, espanhol e português. Dessa forma, você consegue fazer a transcrição usando o idioma de sua preferência.
Você não precisa depender de serviços de transcrição de terceiros. Tenha mais controle sobre os seus dados com segurança e conformidade de ponta a ponta.
O OCI Speech é um serviço versátil que pode ser ativado por meio de REST APIs, diferentes SDKs, e pelo Oracle CLI. Os desenvolvedores podem facilmente desenvolver um serviço de reconhecimento de fala escalável, mesmo sem nenhuma experiência com ciência de dados ou ML.
A Oracle Cloud Infrastructure Speech protege a privacidade dos nossos clientes. Os modelos pré-desenvolvidos do ASR transcrevem o seu conteúdo,porém nenhum dado é armazenado para fins de treinamento, depuração, ou outros propósitos.
A OCI Speech utiliza modelos proprietários e arquitetura que permitem converter fala em texto rapidamente.
Adicionamos uma classificação de confiança ao nível de palavra para ajudá-lo a identificar palavras que possam ter sido transcritas incorretamente. Utilize essa classificação para concentrar os seus esforços durante o desenvolvimento da aplicação.
Incluímos um filtro predefinido de uma lista cuidadosamente criada com conteúdo palavrões e outros conteúdos impróprios. Você pode remover, ocultar ou destacar esses teores.
Fornece fluxo de legendas automáticas na plataforma OCI para todos os conteúdos criados e selecionados pelo serviço de mídias digitais. Indexe o conteúdo com o reconhecimento de fala da OCI para facilitar a busca dentro do conteúdo.
O OCI Speech pode transcrever as chamadas dos usuários para facilitar a busca e recuperação de informações. Utilize a OCI Language e Anomaly Detection em conjunto para detectar a percepção de uso e identificar tanto a rotatividade de clientes, quanto as oportunidades de treinamento da equipe.
Guy Michaeli, gerente de produto sênior
Hoje, temos o prazer de anunciar três novos recursos para o serviço Speech sem custo adicional: compatibilidade nativa com arquivos de áudio de 8 kHz, compatibilidade com saída em SRT (um formato de arquivo de legenda) e pontuação automática do texto de saída. Esses recursos novos agora estão disponíveis em todas as regiões comerciais da OCI e fazem parte do nosso compromisso de oferecer para nossos clientes transcrições de alta qualidade e acessíveis.
Leia o artigo completoCrie, teste e implemente aplicações na Oracle Cloud gratuitamente.