No tópico anterior, aprendemos aprendizado de máquina supervisionado, no qual modelos são treinados usando dados rotulados sob a supervisão de dados de treinamento. Mas pode haver muitos casos em que não temos dados rotulados e precisamos encontrar os padrões ocultos em um determinado conjunto de dados. Portanto, para resolver esses tipos de casos de aprendizado de máquina, precisamos de técnicas de aprendizado não supervisionado.
O que é aprendizagem não supervisionada?
Como o nome sugere, o aprendizado não supervisionado é uma técnica de aprendizado de máquina na qual os modelos não são supervisionados usando um conjunto de dados de treinamento. Em vez disso, os próprios modelos encontram os padrões e insights ocultos dos dados fornecidos. Pode ser comparado ao aprendizado que ocorre no cérebro humano enquanto aprende coisas novas. Pode ser definido como:
python __nome__
O aprendizado não supervisionado é um tipo de aprendizado de máquina no qual os modelos são treinados usando um conjunto de dados não rotulado e podem agir com base nesses dados sem qualquer supervisão.
A aprendizagem não supervisionada não pode ser aplicada diretamente a um problema de regressão ou classificação porque, diferentemente da aprendizagem supervisionada, temos os dados de entrada, mas nenhum dado de saída correspondente. O objetivo da aprendizagem não supervisionada é encontre a estrutura subjacente do conjunto de dados, agrupe esses dados de acordo com semelhanças e represente esse conjunto de dados em um formato compactado .
Exemplo: Suponha que o algoritmo de aprendizagem não supervisionado receba um conjunto de dados de entrada contendo imagens de diferentes tipos de cães e gatos. O algoritmo nunca é treinado em um determinado conjunto de dados, o que significa que ele não tem nenhuma ideia sobre os recursos do conjunto de dados. A tarefa do algoritmo de aprendizagem não supervisionada é identificar as características da imagem por conta própria. O algoritmo de aprendizagem não supervisionado executará esta tarefa agrupando o conjunto de dados de imagens em grupos de acordo com as semelhanças entre as imagens.
Por que usar a aprendizagem não supervisionada?
Abaixo estão alguns motivos principais que descrevem a importância da aprendizagem não supervisionada:
- A aprendizagem não supervisionada é útil para encontrar insights úteis a partir dos dados.
- A aprendizagem não supervisionada é muito semelhante à medida que um ser humano aprende a pensar por meio de suas próprias experiências, o que o torna mais próximo da IA real.
- A aprendizagem não supervisionada funciona com dados não rotulados e não categorizados, o que torna a aprendizagem não supervisionada mais importante.
- No mundo real, nem sempre temos dados de entrada com a saída correspondente, portanto, para resolver tais casos, precisamos de aprendizagem não supervisionada.
Trabalho de aprendizagem não supervisionada
O funcionamento da aprendizagem não supervisionada pode ser entendido pelo diagrama abaixo:
Aqui, pegamos dados de entrada não rotulados, o que significa que eles não são categorizados e as saídas correspondentes também não são fornecidas. Agora, esses dados de entrada não rotulados são alimentados no modelo de aprendizado de máquina para treiná-lo. Em primeiro lugar, ele interpretará os dados brutos para encontrar os padrões ocultos dos dados e, em seguida, aplicará algoritmos adequados, como agrupamento k-means, árvore de decisão, etc.
Depois de aplicar o algoritmo adequado, o algoritmo divide os objetos de dados em grupos de acordo com as semelhanças e diferenças entre os objetos.
Tipos de algoritmo de aprendizagem não supervisionado:
O algoritmo de aprendizagem não supervisionado pode ser categorizado em dois tipos de problemas:
Nota: Aprenderemos esses algoritmos em capítulos posteriores.
Algoritmos de aprendizagem não supervisionada:
Abaixo está a lista de alguns algoritmos populares de aprendizagem não supervisionada:
convertendo string em objeto json
Vantagens da aprendizagem não supervisionada
- A aprendizagem não supervisionada é usada para tarefas mais complexas em comparação com a aprendizagem supervisionada porque, na aprendizagem não supervisionada, não temos dados de entrada rotulados.
- A aprendizagem não supervisionada é preferível porque é fácil obter dados não rotulados em comparação com dados rotulados.
Desvantagens da aprendizagem não supervisionada
- A aprendizagem não supervisionada é intrinsecamente mais difícil do que a aprendizagem supervisionada, pois não possui resultados correspondentes.
- O resultado do algoritmo de aprendizagem não supervisionado pode ser menos preciso, pois os dados de entrada não são rotulados e os algoritmos não sabem antecipadamente a saída exata.