Michael Chen | Estratégico de Conteúdo | 17 de julho de 2024
O aprendizado supervisionado é uma forma de machine learning que usa conjuntos de dados rotulados para treinar algoritmos. Com o aprendizado supervisionado, os conjuntos de dados rotulados permitem que o algoritmo determine as relações entre entradas e saídas. À medida que o algoritmo trabalha com seus dados de treinamento, ele identifica padrões que, eventualmente, podem refinar modelos preditivos ou informar decisões durante fluxos de trabalho automatizados. Em essência, os conjuntos de dados rotulados funcionam como exemplos para o algoritmo aprender, como um aluno em uma sala de aula.
O aprendizado supervisionado é a escolha ideal para uma série de missões e circunstâncias. Se um projeto tiver uma meta bem definida, o aprendizado supervisionado poderá ajudar as equipes a concluir o projeto mais rápido em comparação com o uso do aprendizado não supervisionado, em que o algoritmo ingere um conjunto de dados não rotulados sem parâmetros ou metas e determina padrões e relacionamentos nos dados por conta própria. Na aprendizagem supervisionada, os conjuntos de dados rotulados atuam como guias para treinamento de algoritmos.
Além disso, em comparação com outras formas de machine learning, o treinamento de um algoritmo de aprendizado supervisionado tem a vantagem de lidar com quantidades conhecidas, como recursos e resultados. Isso pode acelerar o processo de revisão, pois as métricas padrão permitem que os instrutores obtenham uma compreensão tangível do status atual de um projeto.
Com o aprendizado supervisionado, as organizações podem obter vários benefícios. Ao integrar a capacidade de processar o big data de forma eficiente, as organizações podem identificar padrões e insights muito mais rápido para informar decisões mais oportunas. Além disso, os algoritmos de aprendizado supervisionado podem potencializar os esforços de automação de tarefas, potencialmente melhorando e acelerando os fluxos de trabalho. Por exemplo, um algoritmo de machine learning em uma operação de manufatura pode treinar usando conjuntos de dados históricos para identificar ciclos de manutenção típicos de vários equipamentos. Em seguida, o sistema poderia aplicar esse conhecimento a dados em tempo real de sensores que rastreiam o uso e o desempenho de uma ferramenta. O algoritmo pode alertar sobre sinais de desgaste ou exibir um aviso sobre o fim da vida útil de peças críticas, para que substituições possam ser solicitadas antes que uma falha no dispositivo desligue a linha de produção.
O machine learning supervisionado começa com a curadoria de conjuntos de dados de treinamento rotulados, com entradas e saídas identificadas de forma clara e consistente. O algoritmo absorve esses dados para aprender relacionamentos; esse aprendizado leva a um modelo matemático para previsão. O processo de treinamento é iterativo e se repete para refinar o algoritmo até que o modelo atinja o nível desejado de precisão. Nesse ponto, diferentes conjuntos de dados podem ser usados para avaliar e confirmar se o modelo está pronto para trabalhar com dados ativos.
Os algoritmos de aprendizado supervisionado geralmente se enquadram em uma das duas categorias a seguir.
Classificação: os algoritmos transformam dados e alimentam entradas em saídas categorizadas. Por exemplo, um algoritmo financeiro para detecção de fraude analisará o histórico de compras de um cliente de cartão de crédito e usará esses dados para decidir se uma nova transação provavelmente é legítima ou deve ser sinalizada para posterior análise de fraude.
Regressão: os algoritmos de regressão usam conjuntos de dados de treinamento rotulados para identificar um relacionamento mais adequado entre entradas e saídas para que previsões matemáticas possam ser feitas para novas entradas. Por exemplo, um algoritmo meteorológico pode usar variáveis como estação do ano, tendências recentes, padrões históricos e métricas ambientais atuais para gerar um resultado de previsão.
Embora o aprendizado supervisionado seja uma abordagem de machine learning comprovada e eficaz, ele traz vários desafios. As equipes devem revisar as seguintes questões antes de decidir se devem prosseguir com o aprendizado supervisionado.
Seleção de modelos: os algoritmos de aprendizado supervisionado variam em complexidade e intensidade de recursos. Por exemplo, uma árvore de decisão – basicamente um fluxograma de pontos de decisão e resultados possíveis – pode operar com uma pegada leve, mas não possui os recursos para uma precisão rigorosa em uma área complexa. Por outro lado, uma rede neural profunda exigirá muito mais recursos para treinamento e produção, mas poderá fazer previsões precisas e muito mais. Encontrar o equilíbrio certo é fundamental para um projeto bem-sucedido.
Qualidade dos dados de treinamento: qualquer projeto de machine learning requer dados limpos de fontes de qualidade. Para dados de treinamento supervisionado, isso significa especificamente dados com rotulagem precisa e consistente, compatíveis com outras fontes usadas para treinamento. Se os conjuntos de dados de treinamento não estiverem em formatos compatíveis, as técnicas de integração e transformação de dados devem ser aplicadas antes do treinamento, o que aumentará o tempo e as despesas.
Compreensão das restrições do projeto: fatores como orçamento, recursos do ambiente de treinamento e prazos podem criar restrições práticas que ditarão as realidades de um projeto de machine learning. Como essas restrições podem afetar a seleção do algoritmo, as equipes devem identificar parâmetros antes de iniciar.
A conclusão é que o aprendizado supervisionado pode ser a abordagem de machine learning correta para projetos em que conjuntos de dados rotulados estão disponíveis. Além disso, as equipes devem entender que o aprendizado supervisionado funciona melhor quando o objetivo é fazer previsões ou decisões precisas com base em padrões reconhecidos — como detecção de fraude ou spam, onde o algoritmo pode ser treinado em exemplos de resultados corretos e incorretos. Finalmente, a compreensão de diferentes tipos de modelos de aprendizado supervisionado, como árvores de decisão e regressão linear, informará se essa é a abordagem certa para um projeto específico.
Qual caso de uso de IA é o mais adequado para o aprendizado supervisionado? Descubra neste ebook.
O que seria um exemplo de algoritmo de aprendizado supervisionado?
Um exemplo de algoritmo de aprendizado supervisionado é a criação de um modelo que prevê a probabilidade de uma condição médica com base no prontuário eletrônico de um paciente. O modelo é treinado em um conjunto rotulado de dados do paciente, usando fatores como sintomas, idade, resultados de exames, condições pré-existentes, entre outros fatores. Isso permite que o sistema insira os dados de um paciente e identifique o que, se houver, pode se enquadrar em uma condição médica não diagnosticada e solicitar uma análise mais detalhada.
O que seria um exemplo de aprendizado não supervisionado?
Ao contrário do aprendizado supervisionado, os algoritmos de aprendizado não supervisionado são treinados usando conjuntos de dados não rotulados. O objetivo do aprendizado não supervisionado é permitir que o algoritmo explore dados e identifique padrões por conta própria. Esse modelo resultante pode ser aplicado aos dados de entrada. Um exemplo de aprendizado não supervisionado é um modelo de segmentação de clientes, que pode usar padrões em grandes conjuntos de dados de uso do cliente e histórico de compras para agrupar clientes em grupos para fins de marketing.
A CNN é supervisionada ou não?
Uma rede neural convolucional (CNN) é uma técnica de aprendizagem supervisionada treinada em conjuntos de dados rotulados para fins de análise de imagem ou vídeo, além de aplicações com modelos semelhantes, como processamento de linguagem natural. As CNNs usam várias camadas para separar tarefas, como identificar recursos/específicos ou aplicar classificação, e otimizar recursos computacionais.