COMO COMBINAR DOIS DATAFRAME EM PYTHON - PANDAS

Pandas

Pandas é uma biblioteca embutida em Python que é usada para trabalhar com dados relacionais na linguagem de programação Python. Possui diversas funções e estruturas de dados que auxiliam nas operações de dados relacionais.

Se os dados são armazenados na forma de linhas e colunas ou dados bidimensionais, geralmente são chamados de dataframes no pandas.

Se tivermos dois dataframes, então com a ajuda do pandas podemos combiná-los ou mesclá-los em um único dataframe. Pandas fornece a lógica definida para combinar os dados de dois dataframes diferentes, bem como a lógica para compará-los.

1. Usando a função concat()

Em python, podemos concatenar os dois dataframes com a ajuda da função concat() do Pandas. Podemos concatenar os dados em linhas ou colunas. Esta função mescla os dados de um eixo (linha ou coluna) e executa a lógica definida em outro eixo (outro índice).

Exemplo:

 import pandas as pd from IPython.display import display # First DataFrame dataFrame1 = pd.DataFrame({&apos;id&apos;: [&apos;A1&apos;, &apos;A2&apos;, &apos;A3&apos;, &apos;A4&apos;], &apos;Name&apos;: [&apos;ABC&apos;, &apos;PQR&apos;, &apos;DEF&apos;, &apos;GHI&apos;], &apos;Marks&apos;:[65,69,96,89]}) # Second DataFrame dataFrame2 = pd.DataFrame({&apos;id&apos;: [&apos;B1&apos;, &apos;B2&apos;, &apos;B3&apos;, &apos;B4&apos;], &apos;Name&apos;: [&apos;XYZ&apos;, &apos;TUV&apos;, &apos;MNO&apos;, &apos;JKL&apos;], &apos;Marks&apos;:[56,96,69,98]}) frames = [dataFrame1, dataFrame2] result = pd.concat(frames) display(result)

Saída:

Como combinar dois dataframe em Python - Pandas

Explicação:

No código acima, primeiro importamos a biblioteca Pandas no arquivo. Em seguida, criamos os dois dataframes onde cada dataframe contém três colunas e quatro linhas. Em seguida, usamos a função concat, que concatena esses dois dataframes linha a linha, e com a função display, imprimimos isso na tela.

2. Usando junções em pandas

Compreendemos o conceito de junções no banco de dados onde unimos as duas tabelas com base em algum atributo comum. O mesmo método é aplicável na concatenação de dataframes. No método concat() simples, mesclamos todas as linhas umas nas outras e criamos o novo dataframe. No join, definimos qual tipo de join queremos realizar na tabela, se é um inner join ou um outer join. Qualquer tipo de junção, seja junção interna (interseção) ou junção externa (união), será definida no atributo de junção.

Exemplo:

converter char para int java

 import pandas as pd from IPython.display import display dataFrame1 = pd.DataFrame({&apos;id&apos;: [&apos;A1&apos;, &apos;A2&apos;, &apos;A3&apos;, &apos;A4&apos;], &apos;Name&apos;: [&apos;ABC&apos;, &apos;PQR&apos;, &apos;TUV&apos;, &apos;JKL&apos;]}) dataFrame2 = pd.DataFrame({&apos;City&apos;: [&apos;NOIDA&apos;, &apos;JAIPUR&apos;, &apos;MANALI&apos;, &apos;DELHI&apos;], &apos;Age&apos;: [&apos;11&apos;, &apos;10&apos;, &apos;12&apos;, &apos;17&apos;]}) # the default behaviour is join=&apos;outer&apos; # inner join result = pd.concat([dataFrame1, dataFrame2], axis=1, join=&apos;inner&apos;) display(result)

Saída:

Explicação:

No código acima, temos dois daraframes que contêm duas colunas e quatro linhas. Ambos os dataframes têm nomes de colunas diferentes e, na função concat(), usamos a junção interna, que ocupa a parte da interseção.

No atributo axis, inicializamos o valor um, então obtivemos todos os dados.

Exemplo:

 import pandas as pd from IPython.display import display dataFrame1 = pd.DataFrame({&apos;id&apos;: [&apos;A1&apos;, &apos;A2&apos;, &apos;A3&apos;, &apos;A4&apos;], &apos;Name&apos;: [&apos;ABC&apos;, &apos;PQR&apos;, &apos;TUV&apos;, &apos;JKL&apos;]}) dataFrame2 = pd.DataFrame({&apos;id&apos;: [&apos;A1&apos;, &apos;A2&apos;, &apos;A3&apos;, &apos;A4&apos;],&apos;City&apos;: [&apos;NOIDA&apos;, &apos;JAIPUR&apos;, &apos;MANALI&apos;, &apos;DELHI&apos;], &apos;Age&apos;: [&apos;11&apos;, &apos;10&apos;, &apos;12&apos;, &apos;17&apos;]}) # the default behaviour is join=&apos;outer&apos; # inner join result = pd.concat([dataFrame1, dataFrame2], axis=0, join=&apos;inner&apos;) display(result)

Saída:

Arquitetura de 32 bits versus 64 bits

Como não há nenhum atributo comum e a junção interna foi aplicada, obtivemos um dataframe vazio como saída. Se houver um atributo comum em ambos os dataframes:

Exemplo:

 import pandas as pd from IPython.display import display dataFrame1 = pd.DataFrame({&apos;id&apos;: [&apos;A1&apos;, &apos;A2&apos;, &apos;A3&apos;, &apos;A4&apos;], &apos;Name&apos;: [&apos;ABC&apos;, &apos;PQR&apos;, &apos;TUV&apos;, &apos;JKL&apos;]}) dataFrame2 = pd.DataFrame({&apos;id&apos;: [&apos;B1&apos;, &apos;B2&apos;, &apos;B3&apos;, &apos;B4&apos;], &apos;City&apos;: [&apos;NOIDA&apos;, &apos;JAIPUR&apos;, &apos;MANALI&apos;, &apos;DELHI&apos;], &apos;Age&apos;: [&apos;11&apos;, &apos;10&apos;, &apos;12&apos;, &apos;17&apos;]}) # the default behaviour is join=&apos;outer&apos; # inner join result = pd.concat([dataFrame1, dataFrame2], axis=0, join=&apos;inner&apos;) display(result)

Saída:

Explicação:

No código acima, temos um atributo, 'id', que é comum, portanto o dataframe é criado com base apenas em atributos comuns.

3. Usando o método anexar()

Em vez do método concat(), podemos usar o método append(). Este método append() é aplicado a um dos dataframes.

Exemplo:

 import pandas as pd from IPython.display import display # First DataFrame dataFrame1 = pd.DataFrame({&apos;id&apos;: [&apos;A1&apos;, &apos;A2&apos;, &apos;A3&apos;, &apos;A4&apos;], &apos;City&apos;: [&apos;JAIPUR&apos;, &apos;MANALI&apos;, &apos;NOIDA&apos;, &apos;LUCKNOW&apos;]}) # Second DataFrame dataFrame2 = pd.DataFrame({&apos;id&apos;: [&apos;B1&apos;, &apos;B2&apos;, &apos;B3&apos;, &apos;B4&apos;], &apos;City&apos;: [&apos;MUMBAI&apos;, &apos;UDAIPUR&apos;, &apos;RISHIKESH&apos;, &apos;KASHMIR&apos;]}) # append method result = dataFrame1.append(dataFrame2) display(result)

Saída:

Explicação:

No código acima, mesclamos dois dataframes usando o método append.

Como combinar dois dataframe em Python - Pandas

Pandas

1. Usando a função concat()

2. Usando junções em pandas

3. Usando o método anexar()