logo

Modelos de aprendizado de máquina

Um modelo de aprendizado de máquina é definido como uma representação matemática do resultado do processo de treinamento. O aprendizado de máquina é o estudo de diferentes algoritmos que podem melhorar automaticamente por meio da experiência e de dados antigos e construir o modelo. Um modelo de aprendizado de máquina é semelhante a um software de computador projetado para reconhecer padrões ou comportamentos com base em experiências ou dados anteriores. O algoritmo de aprendizagem descobre padrões nos dados de treinamento e gera um modelo de ML que captura esses padrões e faz previsões sobre novos dados.

Modelos de aprendizado de máquina

Vamos entender um exemplo de modelo de ML onde estamos criando um aplicativo para reconhecer as emoções do usuário com base em expressões faciais. Portanto, a criação de tal aplicativo é possível por meio de modelos de aprendizado de máquina, onde treinaremos um modelo alimentando imagens de rostos com várias emoções rotuladas neles. Sempre que este aplicativo é usado para determinar o humor do usuário, ele lê todos os dados alimentados e determina o humor de qualquer usuário.

Portanto, em palavras simples, podemos dizer que um modelo de aprendizado de máquina é uma representação simplificada de algo ou processo. Neste tópico, discutiremos diferentes modelos de aprendizado de máquina e suas técnicas e algoritmos .

O que é modelo de aprendizado de máquina?

Os modelos de aprendizado de máquina podem ser entendidos como um programa que foi treinado para encontrar padrões em novos dados e fazer previsões. Esses modelos são representados como uma função matemática que recebe solicitações na forma de dados de entrada, faz previsões sobre os dados de entrada e, em seguida, fornece uma saída em resposta. Primeiro, esses modelos são treinados em um conjunto de dados e, em seguida, recebem um algoritmo para raciocinar sobre os dados, extrair o padrão dos dados de feed e aprender com esses dados. Depois que esses modelos forem treinados, eles poderão ser usados ​​para prever o conjunto de dados invisível.

Existem vários tipos de modelos de aprendizado de máquina disponíveis com base em diferentes objetivos de negócios e conjuntos de dados.

Classificação de modelos de aprendizado de máquina:

Com base em diferentes objetivos de negócios e conjuntos de dados, existem três modelos de aprendizagem para algoritmos. Cada algoritmo de aprendizado de máquina se enquadra em um dos três modelos:

  • Aprendizagem Supervisionada
  • Aprendizagem não supervisionada
  • Aprendizagem por Reforço
Modelos de aprendizado de máquina

A aprendizagem supervisionada é dividida em duas categorias:

  • Classificação
  • Regressão

A aprendizagem não supervisionada também é dividida nas categorias abaixo:

  • Agrupamento
  • Regra de Associação
  • Redução de dimensionalidade

1. Modelos de aprendizado de máquina supervisionados

Aprendizado supervisionado é o modelo de aprendizado de máquina mais simples de entender em que dados de entrada são chamados de dados de treinamento e têm um rótulo ou resultado conhecido como saída. Portanto, funciona segundo o princípio dos pares entrada-saída. Requer a criação de uma função que pode ser treinada usando um conjunto de dados de treinamento e, em seguida, aplicada a dados desconhecidos e fazendo algum desempenho preditivo. A aprendizagem supervisionada é baseada em tarefas e testada em conjuntos de dados rotulados.

Podemos implementar um modelo de aprendizagem supervisionada em problemas simples da vida real. Por exemplo, temos um conjunto de dados composto por idade e altura; então, podemos construir um modelo de aprendizagem supervisionada para prever a altura da pessoa com base na sua idade.

Os modelos de aprendizagem supervisionada são ainda classificados em duas categorias:

Regressão

Em problemas de regressão, a saída é uma variável contínua. Alguns modelos de regressão comumente usados ​​são os seguintes:

a) Regressão Linear

A regressão linear é o modelo de aprendizado de máquina mais simples no qual tentamos prever uma variável de saída usando uma ou mais variáveis ​​de entrada. A representação da regressão linear é uma equação linear, que combina um conjunto de valores de entrada (x) e saída prevista (y) para o conjunto desses valores de entrada. É representado na forma de uma linha:

Y = bx + c.

Modelos de aprendizado de máquina

O principal objetivo do modelo de regressão linear é encontrar a linha de melhor ajuste que melhor se ajusta aos pontos de dados.

A regressão linear é estendida à regressão linear múltipla (encontre um plano de melhor ajuste) e à regressão polinomial (encontre a curva de melhor ajuste).

b) Árvore de Decisão

alterar adicionar coluna oracle

As árvores de decisão são modelos populares de aprendizado de máquina que podem ser usados ​​tanto para problemas de regressão quanto de classificação.

Uma árvore de decisão usa uma estrutura de decisões semelhante a uma árvore, juntamente com suas possíveis consequências e resultados. Neste, cada nó interno é usado para representar um teste em um atributo; cada ramo é usado para representar o resultado do teste. Quanto mais nós uma árvore de decisão tiver, mais preciso será o resultado.

A vantagem das árvores de decisão é que elas são intuitivas e fáceis de implementar, mas carecem de precisão.

As árvores de decisão são amplamente utilizadas em pesquisa operacional, especificamente em análise de decisão, planejamento estratégico e principalmente em aprendizado de máquina.

c) Floresta Aleatória

Random Forest é o método de aprendizagem em conjunto, que consiste em um grande número de árvores de decisão. Cada árvore de decisão em uma floresta aleatória prevê um resultado, e a previsão com a maioria dos votos é considerada o resultado.

Um modelo de floresta aleatório pode ser usado tanto para problemas de regressão quanto para problemas de classificação.

Para a tarefa de classificação, o resultado da floresta aleatória é obtido a partir da maioria dos votos. Já na tarefa de regressão, o resultado é obtido da média ou média das previsões geradas por cada árvore.

d) Redes Neurais

As redes neurais são o subconjunto do aprendizado de máquina e também são conhecidas como redes neurais artificiais. As redes neurais são compostas de neurônios artificiais e projetadas de uma forma que se assemelha à estrutura e ao funcionamento do cérebro humano. Cada neurônio artificial se conecta com muitos outros neurônios em uma rede neural, e esses milhões de neurônios conectados criam uma estrutura cognitiva sofisticada.

Modelos de aprendizado de máquina

As redes neurais consistem em uma estrutura multicamadas, contendo uma camada de entrada, uma ou mais camadas ocultas e uma camada de saída. À medida que cada neurônio está conectado a outro neurônio, ele transfere dados de uma camada para outro neurônio das camadas seguintes. Finalmente, os dados atingem a última camada ou camada de saída da rede neural e geram saída.

As redes neurais dependem de dados de treinamento para aprender e melhorar sua precisão. No entanto, uma rede neural perfeitamente treinada e precisa pode agrupar dados rapidamente e se tornar uma ferramenta poderosa de aprendizado de máquina e IA. Uma das redes neurais mais conhecidas é Algoritmo de busca do Google.

Classificação

Os modelos de classificação são o segundo tipo de técnicas de Aprendizagem Supervisionada, que são usadas para gerar conclusões a partir de valores observados na forma categórica. Por exemplo, o modelo de classificação pode identificar se o email é spam ou não; um comprador comprará o produto ou não, etc. Algoritmos de classificação são usados ​​para prever duas classes e categorizar a produção em grupos diferentes.

Na classificação, é projetado um modelo classificador que classifica o conjunto de dados em diferentes categorias, e cada categoria recebe um rótulo.

Existem dois tipos de classificações em aprendizado de máquina:

    Classificação binária: se o problema tiver apenas duas classes possíveis, chamadas de classificador binário. Por exemplo, gato ou cachorro, Sim ou Não,Classificação multiclasse: Se o problema tiver mais de duas classes possíveis, é um classificador multiclasse.

Alguns algoritmos de classificação populares são os seguintes:

a) Regressão Logística

A regressão logística é usada para resolver os problemas de classificação no aprendizado de máquina. Eles são semelhantes à regressão linear, mas usados ​​para prever as variáveis ​​categóricas. Ele pode prever a saída em Sim ou Não, 0 ou 1, Verdadeiro ou Falso, etc. No entanto, em vez de fornecer os valores exatos, ele fornece os valores probabilísticos entre 0 e 1.

b) Máquina de vetores de suporte

Máquina de vetores de suporte ou SVM é o algoritmo popular de aprendizado de máquina, amplamente utilizado para tarefas de classificação e regressão. Porém, especificamente, é usado para resolver problemas de classificação. O principal objetivo do SVM é encontrar os melhores limites de decisão em um espaço N-dimensional, que possa segregar os pontos de dados em classes, e o melhor limite de decisão é conhecido como Hiperplano. O SVM seleciona o vetor extremo para encontrar o hiperplano, e esses vetores são conhecidos como vetores de suporte.

Modelos de aprendizado de máquina

c) Naïf Bayes

Naïve Bayes é outro algoritmo de classificação popular usado em aprendizado de máquina. É chamado assim porque é baseado no teorema de Bayes e segue a suposição ingênua (independente) entre as características que é dada como:

Modelos de aprendizado de máquina

Cada classificador Bayes ingênuo assume que o valor de uma variável específica é independente de qualquer outra variável/recurso. Por exemplo, se uma fruta precisa ser classificada com base na cor, formato e sabor. Portanto, amarelo, oval e doce serão reconhecidos como manga. Aqui cada recurso é independente de outros recursos.

2. Modelos de aprendizado de máquina não supervisionados

Os modelos de aprendizado de máquina não supervisionado implementam o processo de aprendizagem oposto ao aprendizado supervisionado, o que significa que permite que o modelo aprenda com o conjunto de dados de treinamento não rotulado. Com base no conjunto de dados não rotulado, o modelo prevê a saída. Usando aprendizado não supervisionado, o modelo aprende padrões ocultos do conjunto de dados por si só, sem qualquer supervisão.

Os modelos de aprendizagem não supervisionados são usados ​​principalmente para realizar três tarefas, que são as seguintes:

    Agrupamento
    Clustering é uma técnica de aprendizagem não supervisionada que envolve agrupar ou agrupar os pontos de dados em diferentes clusters com base em semelhanças e diferenças. Os objetos com mais semelhanças permanecem no mesmo grupo e têm nenhuma ou muito poucas semelhanças com outros grupos.
    Algoritmos de clustering podem ser amplamente utilizados em diferentes tarefas, como Segmentação de imagens, Análise estatística de dados, Segmentação de mercado , etc.
    Alguns algoritmos de cluster comumente usados ​​são Clustering K-means, cluster hierárquico, DBSCAN , etc.
    Modelos de aprendizado de máquina Aprendizagem de regras de associação
    O aprendizado de regras de associação é uma técnica de aprendizado não supervisionado, que encontra relações interessantes entre variáveis ​​dentro de um grande conjunto de dados. O principal objetivo deste algoritmo de aprendizagem é encontrar a dependência de um item de dados em outro item de dados e mapear essas variáveis ​​de acordo para que possa gerar o lucro máximo. Este algoritmo é aplicado principalmente em Análise de cesta de compras, mineração de uso da Web, produção contínua , etc.
    Alguns algoritmos populares de aprendizagem de regras de associação são Algoritmo Apriori, Eclat, algoritmo de crescimento FP. Redução de dimensionalidade
    O número de características/variáveis ​​presentes em um conjunto de dados é conhecido como dimensionalidade do conjunto de dados, e a técnica usada para reduzir a dimensionalidade é conhecida como técnica de redução de dimensionalidade.
    Embora mais dados forneçam resultados mais precisos, eles também podem afetar o desempenho do modelo/algoritmo, como problemas de sobreajuste. Nesses casos, são utilizadas técnicas de redução de dimensionalidade.
    ' É um processo de conversão do conjunto de dados de dimensões superiores em conjunto de dados de dimensões menores, garantindo que ele forneça informações semelhantes .'
    Diferentes métodos de redução de dimensionalidade, como como PCA (Análise de Componentes Principais), Decomposição de Valor Singular, etc.

Aprendizagem por Reforço

Na aprendizagem por reforço, o algoritmo aprende ações para um determinado conjunto de estados que levam a um estado objetivo. É um modelo de aprendizagem baseado em feedback que recebe sinais de feedback após cada estado ou ação, interagindo com o ambiente. Esse feedback funciona como uma recompensa (positiva para cada boa ação e negativa para cada má ação), e o objetivo do agente é maximizar as recompensas positivas para melhorar seu desempenho.

O comportamento do modelo na aprendizagem por reforço é semelhante ao aprendizado humano, pois os humanos aprendem coisas por meio de experiências como feedback e interagem com o ambiente.

Abaixo estão alguns algoritmos populares que se enquadram no aprendizado por reforço:

    Q-aprendizagem:Q-learning é um dos algoritmos populares de aprendizagem por reforço sem modelo, baseado na equação de Bellman.

O objetivo é aprender a política que pode ajudar o agente de IA a tomar as melhores medidas para maximizar a recompensa em uma circunstância específica. Ele incorpora valores Q para cada par estado-ação que indicam a recompensa por seguir um determinado caminho de estado e tenta maximizar o valor Q.

    Estado-Ação-Recompensa-Estado-Ação (SARSA):SARSA é um algoritmo On-policy baseado no processo de decisão de Markov. Ele usa a ação executada pela política atual para aprender o valor Q. O algoritmo SARSA permanece para State Action Reward State Action, que simboliza a tupla (s, a, r, s', a'). Rede Q Profunda:DQN ou rede neural Deep Q é Q-learning dentro da rede neural. É basicamente empregado em um grande ambiente de espaço de estados onde definir uma tabela Q seria uma tarefa complexa. Portanto, nesse caso, em vez de usar a tabela Q, a rede neural usa valores Q para cada ação com base no estado.

Treinamento de modelos de aprendizado de máquina

Depois que o modelo de aprendizado de máquina é construído, ele é treinado para obter os resultados adequados. Para treinar um modelo de aprendizado de máquina, é necessária uma grande quantidade de dados pré-processados. Aqui, dados pré-processados ​​significam dados em formato estruturado com valores nulos reduzidos, etc. Se não fornecermos dados pré-processados, há grandes chances de que nosso modelo tenha um desempenho péssimo.

Como escolher o melhor modelo?

Na seção acima, discutimos diferentes modelos e algoritmos de aprendizado de máquina. Mas uma questão muito confusa que pode surgir para qualquer iniciante é 'qual modelo devo escolher?'. Portanto, a resposta é que depende principalmente dos requisitos do negócio ou do projeto. Além disso, depende também dos atributos associados, do volume do conjunto de dados disponível, do número de características, da complexidade, etc. Porém, na prática, é recomendável que sempre comecemos com o modelo mais simples que pode ser aplicado ao determinado problema e, em seguida, aumentar gradualmente a complexidade e testar a precisão com a ajuda de ajuste de parâmetros e validação cruzada.

Diferença entre modelo de aprendizado de máquina e algoritmos

Uma das questões mais confusas entre os iniciantes é: os modelos de aprendizado de máquina e os algoritmos são iguais? Porque em vários casos de aprendizado de máquina e ciência de dados, esses dois termos são usados ​​de forma intercambiável.

A resposta a esta pergunta é Não, e o modelo de aprendizado de máquina não é o mesmo que um algoritmo. De forma simples, um O algoritmo de ML é como um procedimento ou método executado em dados para descobrir padrões a partir deles e gerar o modelo. Ao mesmo tempo, um modelo de aprendizado de máquina é como um programa de computador que gera resultados ou faz previsões . Mais especificamente, quando treinamos um algoritmo com dados, ele se torna um modelo.

 Machine Learning Model = Model Data + Prediction Algorithm