IA de fala para texto

A OCI Speech é um serviço de IA que usa tecnologia de reconhecimento automático de fala para transformar conteúdo de áudio em texto. Os desenvolvedores podem chamar APIs facilmente para integrar os modelos já treinados da OCI Speech em seus aplicativos. A OCI Speech pode ser usada em transcrições precisas, com as padrões de escrita e registro de dadta e hora através do painel REST APIs, bem como SDKs ou interfaces de linha de comando. Também é possível usar a OCI Speech em uma sessão padrão do OCI Data Science. A OCI Speech ajuda você a filtrar conteúdos impróprios, obter pontuações de confiabilidade para palavras ou sentenças completas, e muito mais.

Recursos do OCI Speech

Modelos acústicos e de linguagem predefinidos

A OCI Speech utiliza reconhecimento automático de fala, isto é, um processo de aprendizado profundo, para derivar transcrições precisas de conversas naturais. Comece a usar facilmente modelos acústicos e de linguagem predefinidos que não exigem de experiência prévia com ciência de dados.

Analise os dados a partir de arquivos de áudio e vídeo

Pesquise, crie índices, e decifre dados escondidos em seus arquivos de áudio. Converta os diálogos de áudio em dados textuais para analisá-los com a ajuda de serviços de IA. Por exemplo, você pode usar a OCI Language para recuperar as nuances da fala e os recursos de detecção de anomalias da OCI Speech para identificar as chances de desistência de clientes.

Suporte multilíngue nativo

Os modelos ASR da OCI Speech trabalham com inglês, espanhol e português. Dessa forma, você consegue fazer a transcrição usando o idioma de sua preferência.

Diarização para maior legibilidade e compreensão

O OCI Speech suporta diarização para organizar, analisar e extrair informações relevantes de interações faladas.


Serviço integrado de transcrição

Você não precisa depender de serviços de transcrição de terceiros. Tenha mais controle sobre os seus dados com segurança e conformidade de ponta a ponta.

Fácil de integrar

O OCI Speech é um serviço versátil que pode ser ativado por meio de REST APIs, diferentes SDKs, e pelo Oracle CLI. Os desenvolvedores podem facilmente desenvolver um serviço de reconhecimento de fala escalável, mesmo sem nenhuma experiência com ciência de dados ou ML.

Criado especificamente para segurança e privacidade

A Oracle Cloud Infrastructure Speech protege a privacidade dos nossos clientes. Os modelos pré-desenvolvidos do ASR transcrevem o seu conteúdo,porém nenhum dado é armazenado para fins de treinamento, depuração, ou outros propósitos.


Serviço integrado de transcrição

A OCI Speech utiliza modelos proprietários e arquitetura que permitem converter fala em texto rapidamente.

Classificação de confiança por palavra

Adicionamos uma classificação de confiança ao nível de palavra para ajudá-lo a identificar palavras que possam ter sido transcritas incorretamente. Utilize essa classificação para concentrar os seus esforços durante o desenvolvimento da aplicação.

Filtros para conteúdo impróprio

Incluímos um filtro predefinido de uma lista cuidadosamente criada com conteúdo palavrões e outros conteúdos impróprios. Você pode remover, ocultar ou destacar esses teores.


Casos de Uso do OCI Speech

  • Análise de feedback do cliente

  • Pesquisa de conteúdo e legendas de mídia digital

    Fornece fluxo de legendas automáticas na plataforma OCI para todos os conteúdos criados e selecionados pelo serviço de mídias digitais. Indexe o conteúdo com o reconhecimento de fala da OCI para facilitar a busca dentro do conteúdo.

  • Call centers, dados das chamadas

    O OCI Speech pode transcrever as chamadas dos usuários para facilitar a busca e recuperação de informações. Utilize a OCI Language e Anomaly Detection em conjunto para detectar a percepção de uso e identificar tanto a rotatividade de clientes, quanto as oportunidades de treinamento da equipe.

Recursos do OCI Speech

27 de abril de 2022

Modelos de 8kHz, legendas e pontuação agora estão disponíveis para o OCI Speech.

Guy Michaeli, gerente de produto sênior

Hoje, temos o prazer de anunciar três novos recursos para o serviço Speech sem custo adicional: compatibilidade nativa com arquivos de áudio de 8 kHz, compatibilidade com saída em SRT (um formato de arquivo de legenda) e pontuação automática do texto de saída. Esses recursos novos agora estão disponíveis em todas as regiões comerciais da OCI e fazem parte do nosso compromisso de oferecer para nossos clientes transcrições de alta qualidade e acessíveis.

Leia o artigo completo

Comece a utilizar o OCI Speech


Modo Gratuito da Oracle Cloud

Crie, teste e implemente aplicações na Oracle Cloud gratuitamente.