logo

Aprendizado de máquina supervisionado

Aprendizado supervisionado é o tipo de aprendizado de máquina em que as máquinas são treinadas usando dados de treinamento bem “rotulados” e, com base nesses dados, as máquinas prevêem o resultado. Os dados rotulados significam que alguns dados de entrada já estão marcados com a saída correta.

Na aprendizagem supervisionada, os dados de treinamento fornecidos às máquinas funcionam como o supervisor que ensina as máquinas a prever a saída corretamente. Aplica o mesmo conceito que um aluno aprende sob a supervisão do professor.

O aprendizado supervisionado é um processo de fornecimento de dados de entrada, bem como dados de saída corretos, ao modelo de aprendizado de máquina. O objetivo de um algoritmo de aprendizagem supervisionada é encontre uma função de mapeamento para mapear a variável de entrada (x) com a variável de saída (y) .

No mundo real, a aprendizagem supervisionada pode ser usada para Avaliação de riscos, classificação de imagens, detecção de fraude, filtragem de spam , etc.

Como funciona a aprendizagem supervisionada?

Na aprendizagem supervisionada, os modelos são treinados usando conjuntos de dados rotulados, onde o modelo aprende sobre cada tipo de dados. Assim que o processo de treinamento for concluído, o modelo é testado com base nos dados de teste (um subconjunto do conjunto de treinamento) e, em seguida, prevê a saída.

O funcionamento da aprendizagem supervisionada pode ser facilmente compreendido pelo exemplo e diagrama abaixo:

variável tipo java
Aprendizado de máquina supervisionado

Suponha que temos um conjunto de dados de diferentes tipos de formas que inclui quadrado, retângulo, triângulo e polígono. Agora, o primeiro passo é treinar o modelo para cada forma.

  • Se a forma dada tiver quatro lados e todos os lados forem iguais, ela será rotulada como Quadrado .
  • Se a forma dada tiver três lados, ela será rotulada como um triângulo .
  • Se a forma dada tiver seis lados iguais, ela será rotulada como hexágono .

Agora, após o treinamento, testamos nosso modelo usando o conjunto de testes, e a tarefa do modelo é identificar a forma.

A máquina já está treinada em todos os tipos de formatos e, quando encontra um novo formato, classifica-o com base em vários lados e prevê a saída.

Etapas envolvidas na aprendizagem supervisionada:

  • Primeiro determine o tipo de conjunto de dados de treinamento
  • Colete/reúna os dados de treinamento rotulados.
  • Divida o conjunto de dados de treinamento em treinamento conjunto de dados, conjunto de dados de teste e conjunto de dados de validação .
  • Determine os recursos de entrada do conjunto de dados de treinamento, que devem ter conhecimento suficiente para que o modelo possa prever com precisão a saída.
  • Determine o algoritmo adequado para o modelo, como máquina de vetores de suporte, árvore de decisão, etc.
  • Execute o algoritmo no conjunto de dados de treinamento. Às vezes, precisamos de conjuntos de validação como parâmetros de controle, que são o subconjunto de conjuntos de dados de treinamento.
  • Avalie a precisão do modelo fornecendo o conjunto de teste. Se o modelo prevê a saída correta, o que significa que nosso modelo é preciso.

Tipos de algoritmos de aprendizado de máquina supervisionados:

A aprendizagem supervisionada pode ser dividida em dois tipos de problemas:

Aprendizado de máquina supervisionado

1. Regressão

Algoritmos de regressão são usados ​​se houver um relacionamento entre a variável de entrada e a variável de saída. É usado para a previsão de variáveis ​​contínuas, como previsão do tempo, tendências de mercado, etc. Abaixo estão alguns algoritmos de regressão populares que estão sob aprendizagem supervisionada:

  • Regressão linear
  • Árvores de regressão
  • Regressão Não Linear
  • Regressão Linear Bayesiana
  • Regressão Polinomial

2. Classificação

Algoritmos de classificação são usados ​​quando a variável de saída é categórica, o que significa que existem duas classes, como Sim-Não, Masculino-Feminino, Verdadeiro-falso, etc.

Filtragem de Spam,

  • Floresta Aleatória
  • Árvores de decisão
  • Regressão Logística
  • Máquinas de vetor de suporte

Nota: Discutiremos esses algoritmos em detalhes em capítulos posteriores.

Vantagens da aprendizagem supervisionada:

  • Com a ajuda da aprendizagem supervisionada, o modelo pode prever o resultado com base em experiências anteriores.
  • Na aprendizagem supervisionada podemos ter uma ideia exata sobre as classes dos objetos.
  • O modelo de aprendizagem supervisionada nos ajuda a resolver vários problemas do mundo real, como detecção de fraude, filtragem de spam , etc.

Desvantagens da aprendizagem supervisionada:

  • Os modelos de aprendizagem supervisionada não são adequados para lidar com tarefas complexas.
  • O aprendizado supervisionado não pode prever o resultado correto se os dados de teste forem diferentes do conjunto de dados de treinamento.
  • O treinamento exigia muitos tempos de computação.
  • Na aprendizagem supervisionada, precisamos de conhecimento suficiente sobre as classes de objetos.