Pandas er i stand til å kombinere serie-, dataframe- og panelobjekter gjennom forskjellige typer settlogikk for indeksene og relasjonsalgebrafunksjonaliteten.
De concat() funksjonen er ansvarlig for å utføre sammenkoblingsoperasjon langs en akse i DataFrame.
Syntaks:
pd.concat(objs,axis=0,join='outer',join_axes=None, ignore_index=False)
Parametere:
Hvis vi sender en diktat i DataFrame, vil de sorterte nøklene bli brukt som keys-argumentet, og verdiene velges i så fall. Hvis noen ikke-objekter er tilstede, vil den bli slettet med mindre de alle er ingen, og i dette tilfellet, en ValueError vil bli hevet.
Den bruker ikke indeksverdiene på sammenkoblingsaksen, hvis den er sann. Den resulterende aksen vil bli merket som 0, ..., n - 1.
Returnerer
En serie returneres når vi setter sammen alle seriene langs aksen (akse=0). I tilfelle hvis objs inneholder minst én DataFrame, returnerer den en DataFrame.
Eksempel 1:
import pandas as pd a_data = pd.Series(['p', 'q']) b_data = pd.Series(['r', 's']) pd.concat([a_data, b_data])
Produksjon
0 p 1 q 0 r 1 s dtype: object
Eksempel 2: I eksemplet ovenfor kan vi tilbakestille den eksisterende indeksen ved å bruke ignore_index parameter. Koden nedenfor viser hvordan ignore_index .
import pandas as pd a_data = pd.Series(['p', 'q']) b_data = pd.Series(['r', 's']) pd.concat([a_data, b_data], ignore_index=True)
Produksjon
0 p 1 q 2 r 3 s dtype: object
Eksempel 3: Vi kan legge til en hierarkisk indeks på det ytterste nivået av dataene ved å bruke nøkler parameter.
import pandas as pd a_data = pd.Series(['p', 'q']) b_data = pd.Series(['r', 's']) pd.concat([a_data, b_data], keys=['a_data', 'b_data'])
Produksjon
a_data 0 p 1 q b_data 0 r 1 s dtype: object
Eksempel 4: Vi kan merke indeksnøklene ved å bruke navn parameter. Koden nedenfor viser hvordan navnene fungerer.
import pandas as pd a_data = pd.Series(['p', 'q']) b_data = pd.Series(['r', 's']) pd.concat([a_data, b_data], keys=['a_data', 'b_data']) pd.concat([a_data, b_data], keys=['a_data', 'b_data'], names=['Series name', 'Row ID'])
Produksjon
Series name Row ID a_data 0 p 1 q b_data 0 r 1 s dtype: object
Sammenkobling ved hjelp av append
Append-metoden er definert som en nyttig snarvei for å koble sammen Series og DataFrame.
Eksempel:
import pandas as pd one = pd.DataFrame({ 'Name': ['Parker', 'Smith', 'Allen', 'John', 'Parker'], 'subject_id':['sub1','sub2','sub4','sub6','sub5'], 'Marks_scored':[98,90,87,69,78]}, index=[1,2,3,4,5]) two = pd.DataFrame({ 'Name': ['Billy', 'Brian', 'Bran', 'Bryce', 'Betty'], 'subject_id':['sub2','sub4','sub3','sub6','sub5'], 'Marks_scored':[89,80,79,97,88]}, index=[1,2,3,4,5]) print (one.append(two))
Produksjon
Name subject_id Marks_scored 1 Parker sub1 98 2 Smith sub2 90 3 Allen sub4 87 4 John sub6 69 5 Parker sub5 78 1 Billy sub2 89 2 Brian sub4 80 3 Bran sub3 79 4 Bryce sub6 97 5 Betty sub5 88