Sammenkobling av to eller flere datarammer kan gjøres ved å bruke pandas.concat()-metoden. concat() i Pandas fungerer ved å kombinere datarammer på tvers av rader eller kolonner. Vi kan koble sammen to eller flere datarammer enten langs rader (akse=0) eller langs kolonner (akse=1). I denne artikkelen vil vi se hvordan vi kan sette sammen eller legge til to eller flere Pandas dataramme .
Sammenknytt to eller flere Pandas DataFrames Python
Det er forskjellige metoder for å koble sammen datarammer vertikalt eller horisontalt. Her diskuterer vi noen generelt brukte metoder for å sammenkoble datarammer vertikalt eller horisontalt. disse er følgende.
- Sammenknytting av to pandaer DataFrame
Using>pd.merge()>å koble sammen to datarammer-
pd.DataFrame.reindex()>for vertikal sammenkobling med indeksjustering Using pd.concat()>medsort=False>for raskere sammenkobling- Bruke pandas.concat() for å koble sammen to datarammer
- Slå sammen flere datarammer ved å bruke pandas.concat()
- Ved hjelp av pandas.join() å bli med i to datarammer
- Ved hjelp av DataFrame.append() å koble sammen to datarammer
Lag en prøvedataramme
Lag to datarammer som vi skal sette sammen nå. For å lage datarammer skal vi bruke Numpy og pandaer.
Python3
print array i java
import> pandas as pd> import> numpy as np> df>=> pd.DataFrame({>'Courses'>: [>'GFG'>,>'JS'>,>'Python'>,>'Numpy'>],> >'Fee'>: [>20000>,>25000>,>22000>,>24000>]})> df1>=> pd.DataFrame({>'Courses'>: [>'Matplotlib'>,>'SSC'>,>'CHSL'>,>'Java'>],> >'Fee'>: [>25000>,>25200>,>24500>,>24900>]})> df2>=> pd.DataFrame({>'Duration'>: [>'30day'>,>'40days'>,>'35days'>,>'60days'>],> >'Discount'>: [>1000>,>2300>,>2500>,>2000>]})> print>(>'DataFrame 1:'>)> print>(df)> print>(>'DataFrame 2:'>)> print>(df1)> print>(>'DataFrame 3:'>)> print>(df2)> |
>
>
Produksjon:
DataFrame 1: Courses Fee 0 GFG 20000 1 JS 25000 2 Python 22000 3 Numpy 24000 DataFrame 2: Courses Fee 0 Matplotlib 25000 1 SSC 25200 2 CHSL 24500 3 Java 24900 DataFrame 3: Duration Discount 0 30day 1000 1 40days 2300 2 35days 2500 3 60days 2000>
Sammenknytt to Pandas DataFrame vertikalt og horisontalt
Vi sender to datarammer til pd.concat() metode i form av en liste og nevner i hvilken akse du ønsker å konkatere, dvs. akse=0 å samle langs rader, akse=1 å samle sammen kolonner.
Python3
# concatenating df1 and df2 along rows> vertical_concat>=> pd.concat([df, df1], axis>=>0>)> # concatenating df3 and df4 along columns> horizontal_concat>=> pd.concat([df1, df2], axis>=>1>)> print>(>'Vertical:'>)> print>(vertical_concat)> print>(>'Horizontal:'>)> print>(horizontal_concat)> |
>
>
Produksjon:
Vertical: Courses Fee 0 GFG 20000 1 JS 25000 2 Python 22000 3 Numpy 24000 0 Matplotlib 25000 1 SSC 25200 2 CHSL 24500 3 Java 24900 Horizontal: Courses Fee Duration Discount 0 Matplotlib 25000 30day 1000 1 SSC 25200 40days 2300 2 CHSL 24500 35days 2500 3 Java 24900 60days 2000>
Sammenknytting av datarammer ved hjelp av pd.merge() til sammenknytting av to datarammer
The method> 'pd.merge()'> in pandas is used to concatenate DataFrames either vertically or horizontally. It combines two DataFrames based on common columns using a merge operation. The 'how' parameter in pd.merge() specifies the type of merge (inner, outer, left, or right), determining how the DataFrames are combined.>
Python3
result>=> pd.merge(df, df1, on>=>'Courses'>, how>=>'outer'>, suffixes>=>(>'_df1'>,>'_df2'>)).fillna(>0>)> result[>'Fee'>]>=> result[>'Fee_df1'>]>+> result[>'Fee_df2'>]> result>=> result[[>'Courses'>,>'Fee'>]]> print>(result)> |
>
>
Utgang:
Courses Fee 0 GFG 20000.0 1 JS 25000.0 2 Python 22000.0 3 Numpy 24000.0 4 Matplotlib 25000.0 5 SSC 25200.0 6 CHSL 24500.0 7 Java 24900.0>
Using pd.DataFrame.reindex()>for vertikal sammenkobling med indeksjustering
Metoden pd.DataFrame.reindex() brukes til vertikal sammenkobling av DataFrames i pandaer. Den justerer indeksene til DataFrames, og sikrer riktig stabling. Det er et avgjørende skritt når du kombinerer DataFrames vertikalt ved å bruke sammenkobling i pandaer.
Eksempel: I dette eksempelet setter koden sammen to pandaer DataFrames,df1>ogdf>, ignorerer de opprinnelige indeksene, og lagrer resultatet i variabelenresult>. Den tilbakestiller deretter indeksen til den sammenkoblede DataFrame
Python3
java samlinger
result>=> pd.concat([df1, df], ignore_index>=>True>)># Concatenate and reset index> result>=> result.reindex(>range>(>8>))> print>(result)> |
>
>
Utgang:
Courses Fee 0 Matplotlib 25000 1 SSC 25200 2 CHSL 24500 3 Java 24900 4 GFG 20000 5 JS 25000 6 Python 22000 7 Numpy 24000>
Using pd.concat()>medsort=False>for raskere sammenkobling
Metoden ` pd.concat() ` i Pythons pandas-bibliotek brukes til å kombinere DataFrames enten vertikalt (langs rader) eller horisontalt (langs kolonner). Parameteren `sort=False` brukes for å øke sammenkoblingshastigheten ved å deaktivere sorteringen av den resulterende DataFrame.
Eksempel: I dette eksempelet bruker koden pandas-biblioteket til å sette sammen to DataFrames, df1 og df, langs deres rader (akse=0). Sort=False-parameteren forhindrer sortering av den resulterende DataFrame etter kolonnenavn.
Python3
result>=> pd.concat([df1, df], sort>=>False>)> print>(result)> |
>
>
Utgang:
Courses Fee 0 Matplotlib 25000 1 SSC 25200 2 CHSL 24500 3 Java 24900 0 GFG 20000 1 JS 25000 2 Python 22000 3 Numpy 24000>
Sammenknytt to eller flere Pandas DataFrames i Python ved hjelp av pandas.concat()
`pandas.concat()` kombinerer to DataFrames enten vertikalt eller horisontalt, stabler dem oppå hverandre eller side ved side, og gir en fleksibel måte å sammenkoble data langs spesifiserte akser.
Eksempel :I dette eksemplet erpd.concat()>funksjonen brukes til å sammenkoble disse datarammene vertikalt, og produsere en ny dataramme kaltresult>, ogignore_index=True>brukes til å tilbakestille indeksen. Det endelige resultatet skrives ut.
Python3
result>=> pd.concat([df, df1], ignore_index>=>True>)> print>(result)> |
>
>
Produksjon:
Courses Fee 0 GFG 20000 1 JS 25000 2 Python 22000 3 Numpy 24000 4 Matplotlib 25000 5 SSC 25200 6 CHSL 24500 7 Java 24900>
Sammenslå flere datarammer i Python ved hjelp av pandas.concat()
Metoden pandas.concat() brukes til å kombinere DataFrames enten vertikalt (langs rader) eller horisontalt (langs kolonner). Den tar en liste over DataFrames som input og setter dem sammen basert på den angitte aksen (0 for vertikal, 1 for horisontal).
Eksempel: Dette eksemplet bruker pandaer til å lage tre datarammer (df>,df1>, ogdf2>) som representerer informasjon om kurs, avgifter, varighet og rabatter. Den kobler deretter disse datarammene sammen vertikalt ved hjelp avpd.concat()>, oppretter en ny dataramme kaltresult>med en tilbakestillingsindeks, og den resulterende datarammen skrives ut.
Python3
result>=> pd.concat([df, df1, df2], ignore_index>=>True>)> print>(result)> |
>
usignert int c-programmering
>
Produksjon:
Courses Fee Duration Discount 0 GFG 20000 NaN NaN 1 JS 25000 NaN NaN 2 Python 22000 NaN NaN 3 Numpy 24000 NaN NaN 4 Matplotlib 25000 NaN NaN 5 SSC 25200 NaN NaN 6 CHSL 24500 NaN NaN 7 Java 24900 NaN NaN 8 NaN NaN 30day 1000.0 9 NaN NaN 40days 2300.0 10 NaN NaN 35days 2500.0 11 NaN NaN 60days 2000.0>
Pandas Concat Two DataFrames ved hjelp av pandas.join() for å slå sammen to DataFrames
Depandas.join()>metoden brukes til å sette sammen DataFrames vertikalt eller horisontalt basert på spesifiserte kolonner, og utfører en sammenføyning i SQL-stil. Den kombinerer rader eller kolonner fra to DataFrames basert på vanlige kolonneverdier, noe som gir mulighet for indre, ytre, venstre eller høyre sammenføyninger.
Eksempel: I dette eksemplet erjoin>metoden brukes til å kombinere disse datarammene basert på deres indekser, noe som resulterer i en ny dataramme kaltresult>, som er trykt.
Python3
result>=> df.join(df1)> print>(result)> |
>
>
Produksjon:
Courses Fee Duration Discount 0 GFG 20000 30day 1000 1 JS 25000 40days 2300 2 Python 22000 35days 2500 3 Numpy 24000 60days 2000>
Kombiner to datarammer i Python ved å bruke DataFrame.append()
Den ` DataFrame.append() `-metoden i pandas brukes til å sette sammen to DataFrames vertikalt, og legge til radene til en DataFrame under den andre. Den returnerer en ny DataFrame med de kombinerte dataene. Sørg for at begge DataFrames har samme kolonner.
Eksempel : I dette eksemplet bruker viappend()>metode, noe som resulterer i en ny dataramme kaltresult>med en tilbakestillingsindeks, som skrives ut.
Python3
result>=> df.append(df1, ignore_index>=>True>)> print>(result)> |
>
>
Produksjon:
Courses Fee 0 GFG 20000 1 JS 25000 2 Python 22000 3 Numpy 24000 4 Matplotlib 25000 5 SSC 25200 6 CHSL 24500 7 Java 24900>