logo

Aprendizado de máquina não supervisionado

No tópico anterior, aprendemos aprendizado de máquina supervisionado, no qual modelos são treinados usando dados rotulados sob a supervisão de dados de treinamento. Mas pode haver muitos casos em que não temos dados rotulados e precisamos encontrar os padrões ocultos em um determinado conjunto de dados. Portanto, para resolver esses tipos de casos de aprendizado de máquina, precisamos de técnicas de aprendizado não supervisionado.

O que é aprendizagem não supervisionada?

Como o nome sugere, o aprendizado não supervisionado é uma técnica de aprendizado de máquina na qual os modelos não são supervisionados usando um conjunto de dados de treinamento. Em vez disso, os próprios modelos encontram os padrões e insights ocultos dos dados fornecidos. Pode ser comparado ao aprendizado que ocorre no cérebro humano enquanto aprende coisas novas. Pode ser definido como:

python __nome__
O aprendizado não supervisionado é um tipo de aprendizado de máquina no qual os modelos são treinados usando um conjunto de dados não rotulado e podem agir com base nesses dados sem qualquer supervisão.

A aprendizagem não supervisionada não pode ser aplicada diretamente a um problema de regressão ou classificação porque, diferentemente da aprendizagem supervisionada, temos os dados de entrada, mas nenhum dado de saída correspondente. O objetivo da aprendizagem não supervisionada é encontre a estrutura subjacente do conjunto de dados, agrupe esses dados de acordo com semelhanças e represente esse conjunto de dados em um formato compactado .

Exemplo: Suponha que o algoritmo de aprendizagem não supervisionado receba um conjunto de dados de entrada contendo imagens de diferentes tipos de cães e gatos. O algoritmo nunca é treinado em um determinado conjunto de dados, o que significa que ele não tem nenhuma ideia sobre os recursos do conjunto de dados. A tarefa do algoritmo de aprendizagem não supervisionada é identificar as características da imagem por conta própria. O algoritmo de aprendizagem não supervisionado executará esta tarefa agrupando o conjunto de dados de imagens em grupos de acordo com as semelhanças entre as imagens.

Aprendizado de máquina supervisionado

Por que usar a aprendizagem não supervisionada?

Abaixo estão alguns motivos principais que descrevem a importância da aprendizagem não supervisionada:

  • A aprendizagem não supervisionada é útil para encontrar insights úteis a partir dos dados.
  • A aprendizagem não supervisionada é muito semelhante à medida que um ser humano aprende a pensar por meio de suas próprias experiências, o que o torna mais próximo da IA ​​real.
  • A aprendizagem não supervisionada funciona com dados não rotulados e não categorizados, o que torna a aprendizagem não supervisionada mais importante.
  • No mundo real, nem sempre temos dados de entrada com a saída correspondente, portanto, para resolver tais casos, precisamos de aprendizagem não supervisionada.

Trabalho de aprendizagem não supervisionada

O funcionamento da aprendizagem não supervisionada pode ser entendido pelo diagrama abaixo:

Aprendizado de máquina supervisionado

Aqui, pegamos dados de entrada não rotulados, o que significa que eles não são categorizados e as saídas correspondentes também não são fornecidas. Agora, esses dados de entrada não rotulados são alimentados no modelo de aprendizado de máquina para treiná-lo. Em primeiro lugar, ele interpretará os dados brutos para encontrar os padrões ocultos dos dados e, em seguida, aplicará algoritmos adequados, como agrupamento k-means, árvore de decisão, etc.

Depois de aplicar o algoritmo adequado, o algoritmo divide os objetos de dados em grupos de acordo com as semelhanças e diferenças entre os objetos.

Tipos de algoritmo de aprendizagem não supervisionado:

O algoritmo de aprendizagem não supervisionado pode ser categorizado em dois tipos de problemas:

Aprendizado de máquina supervisionado
    Agrupamento: Clustering é um método de agrupar os objetos em clusters de forma que os objetos com mais semelhanças permaneçam em um grupo e tenham menos ou nenhuma semelhança com os objetos de outro grupo. A análise de cluster encontra os pontos em comum entre os objetos de dados e os categoriza de acordo com a presença e ausência desses pontos em comum.Associação: Uma regra de associação é um método de aprendizagem não supervisionado usado para encontrar as relações entre variáveis ​​em um grande banco de dados. Determina o conjunto de itens que ocorrem juntos no conjunto de dados. A regra de associação torna a estratégia de marketing mais eficaz. Assim como as pessoas que compram o item X (suponha um pão) também tendem a comprar o item Y (Manteiga/Geléia). Um exemplo típico de regra de associação é a análise de cesta de compras.

Nota: Aprenderemos esses algoritmos em capítulos posteriores.

Algoritmos de aprendizagem não supervisionada:

Abaixo está a lista de alguns algoritmos populares de aprendizagem não supervisionada:

convertendo string em objeto json
    Agrupamento K-means KNN (k-vizinhos mais próximos) Cluster hierárquico Detecção de anomalia Redes neurais Análise de componentes principais Análise de Componentes Independentes Algoritmo a priori Decomposição de valor singular

Vantagens da aprendizagem não supervisionada

  • A aprendizagem não supervisionada é usada para tarefas mais complexas em comparação com a aprendizagem supervisionada porque, na aprendizagem não supervisionada, não temos dados de entrada rotulados.
  • A aprendizagem não supervisionada é preferível porque é fácil obter dados não rotulados em comparação com dados rotulados.

Desvantagens da aprendizagem não supervisionada

  • A aprendizagem não supervisionada é intrinsecamente mais difícil do que a aprendizagem supervisionada, pois não possui resultados correspondentes.
  • O resultado do algoritmo de aprendizagem não supervisionado pode ser menos preciso, pois os dados de entrada não são rotulados e os algoritmos não sabem antecipadamente a saída exata.