logo

Concatenação de Pandas

Pandas é capaz de combinar objetos Series, DataFrame e Panel por meio de diferentes tipos de lógica de conjunto para os índices e a funcionalidade de álgebra relacional.

O concat() A função é responsável por realizar a operação de concatenação ao longo de um eixo no DataFrame.

Sintaxe:

 pd.concat(objs,axis=0,join='outer',join_axes=None, ignore_index=False) 

Parâmetros:

    objetos:É uma sequência ou mapeamento de séries ou objetos DataFrame.
    Se passarmos um dict no DataFrame, as chaves classificadas serão usadas como argumento de chaves, e os valores serão selecionados nesse caso. Se algum não-objeto estiver presente, ele será descartado, a menos que todos sejam nenhum e, neste caso, um Erro de valor será levantado.eixo:É um eixo para concatenar.juntar:Responsável por tratar índices em outro eixo.join_axes:Uma lista de objetos de índice. Em vez de executar a lógica do conjunto interno ou externo, índices específicos são usados ​​para o outro eixo (n-1).ignorar_index:bool, valor padrão falso
    Não utiliza os valores de índice no eixo de concatenação, se for verdade. O eixo resultante será rotulado como 0, ..., n - 1.

Devoluções

Uma série é retornada quando concatenamos todas as séries ao longo do eixo (eixo=0). Caso se objetos contém pelo menos um DataFrame, ele retorna um DataFrame.

vlc baixar youtube

Exemplo 1:

 import pandas as pd a_data = pd.Series(['p', 'q']) b_data = pd.Series(['r', 's']) pd.concat([a_data, b_data]) 

Saída

 0 p 1 q 0 r 1 s dtype: object 

Exemplo2: No exemplo acima, podemos redefinir o índice existente usando o ignorar_index parâmetro. O código abaixo demonstra o funcionamento de ignorar_index .

 import pandas as pd a_data = pd.Series(['p', 'q']) b_data = pd.Series(['r', 's']) pd.concat([a_data, b_data], ignore_index=True) 

Saída

 0 p 1 q 2 r 3 s dtype: object 

Exemplo 3: Podemos adicionar um índice hierárquico no nível mais externo dos dados usando o método chaves parâmetro.

 import pandas as pd a_data = pd.Series(['p', 'q']) b_data = pd.Series(['r', 's']) pd.concat([a_data, b_data], keys=['a_data', 'b_data']) 

Saída

 a_data 0 p 1 q b_data 0 r 1 s dtype: object 

Exemplo 4: Podemos rotular as chaves de índice usando o nomes parâmetro. O código abaixo mostra o funcionamento do parâmetro de nomes.

 import pandas as pd a_data = pd.Series(['p', 'q']) b_data = pd.Series(['r', 's']) pd.concat([a_data, b_data], keys=['a_data', 'b_data']) pd.concat([a_data, b_data], keys=['a_data', 'b_data'], names=['Series name', 'Row ID']) 

Saída

Educação de Cassidy Hutchinson
 Series name Row ID a_data 0 p 1 q b_data 0 r 1 s dtype: object 

Concatenação usando acréscimo

O método append é definido como um atalho útil para concatenar Series e DataFrame.

Exemplo:

 import pandas as pd one = pd.DataFrame({ 'Name': ['Parker', 'Smith', 'Allen', 'John', 'Parker'], 'subject_id':['sub1','sub2','sub4','sub6','sub5'], 'Marks_scored':[98,90,87,69,78]}, index=[1,2,3,4,5]) two = pd.DataFrame({ 'Name': ['Billy', 'Brian', 'Bran', 'Bryce', 'Betty'], 'subject_id':['sub2','sub4','sub3','sub6','sub5'], 'Marks_scored':[89,80,79,97,88]}, index=[1,2,3,4,5]) print (one.append(two)) 

Saída

 Name subject_id Marks_scored 1 Parker sub1 98 2 Smith sub2 90 3 Allen sub4 87 4 John sub6 69 5 Parker sub5 78 1 Billy sub2 89 2 Brian sub4 80 3 Bran sub3 79 4 Bryce sub6 97 5 Betty sub5 88