logo

Hvordan sortere Pandas DataFrame?

Vi kan utføre sortering i Pandas Dataframe. Denne artikkelen vil diskutere hvordan du sorterer Pandas DataFrame ved hjelp av ulike metoder i Python .

Sortering av datarammer i pandaer

Opprette en Pandas dataramme for demonstrasjon, Her har vi laget en dataramme der vi skal utføre ulike sorteringsfunksjoner.

Python3






tegn til int i java

# importing pandas library> import> pandas as pd> # creating and initializing a nested list> age_list>=> [[>'Afghanistan'>,>1952>,>8425333>,>'Asia'>],> >[>'Australia'>,>1957>,>9712569>,>'Oceania'>],> >[>'Brazil'>,>1962>,>76039390>,>'Americas'>],> >[>'China'>,>1957>,>637408000>,>'Asia'>],> >[>'France'>,>1957>,>44310863>,>'Europe'>],> >[>'India'>,>1952>,>3.72e>+>08>,>'Asia'>],> >[>'United States'>,>1957>,>171984000>,>'Americas'>]]> # creating a pandas dataframe> df>=> pd.DataFrame(age_list, columns>=>[>'Country'>,>'Year'>,> >'Population'>,>'Continent'>])> df>

>

>

Produksjon

Sorter Pandas DataFrame

Sorter Pandas DataFrame

Sortering av Pandas dataramme

For å sortere datarammen i pandaer, funksjonen sort_verdier() benyttes. Pandaer sort_values() kan sortere datarammen i stigende eller synkende rekkefølge.

Pandas DataFrame-sortering i stigende rekkefølge

Kodebiten sorterer DataFrame df i stigende rekkefølge basert på 'Country'-kolonnen. Den lagrer eller viser imidlertid ikke den sorterte datarammen.

Python3




# Sorting by column 'Country'> df.sort_values(by>=>[>'Country'>])>

>

>

Produksjon:

Sorter Pandas DataFrame

Sorter Pandas DataFrame

pd sammenslåing

Sortering av Pandas DataFrame i synkende rekkefølge

DataFrame df vil bli sortert i synkende rekkefølge basert på Populasjon-kolonnen, med landet som har den høyeste befolkningen vises øverst i DataFrame.

Python3




# Sorting by column 'Population'> df.sort_values(by>=>[>'Population'>], ascending>=>False>)>

>

>

Produksjon:

Sorter Pandas DataFrame

Sorter Pandas DataFrame

Sorter Pandas DataFrame Basert på Sampling

Her sorterer vi en DataFrame (df>) basert på «Population»-kolonnen, og ordne rader med manglende verdier i «Population» for å vises først. Desort_values()>metode medna_position='first'>argument oppnår dette, og prioriterer rader med manglende verdier i begynnelsen av den sorterte DataFrame.

Python3




# Sorting by column 'Population'> # by putting missing values first> df.sort_values(by>=>[>'Population'>], na_position>=>'first'>)>

>

>

Produksjon:

Sorter Pandas DataFrame

Sorter Pandas DataFrame

Sortering av datarammer etter flere kolonner

I dette eksemplet sorterer vi en DataFrame (df>) primært etter «Land»-kolonnen i stigende rekkefølge og, innenfor hver landgruppe, etter «Kontinent»-kolonnen. Den resulterende DataFrame sorteres basert på den angitte kolonnerekkefølgen, og skaper et sortert datasett.

Python3




# Sorting by columns 'Country' and then 'Continent'> df.sort_values(by>=>[>'Country'>,>'Continent'>])>

>

>

Produksjon:

Sorter Pandas DataFrame

Sorter Pandas DataFrame

Sortering av datarammer etter kolonner, men i en annen rekkefølge

I dette eksemplet sorterer vi en DataFrame (df>) først ved «Land»-kolonnen i synkende rekkefølge og, innenfor hver landgruppe, etter «Kontinent»-kolonnen i stigende rekkefølge. Den resulterende DataFrame er organisert basert på de angitte kolonnesorteringskriteriene.

Python3


fordeler og ulemper med teknologi



# Sorting by columns 'Country' in descending> # order and then 'Continent' in ascending order> df.sort_values(by>=>[>'Country'>,>'Continent'>],> >ascending>=>[>False>,>True>])>

>

>

Produksjon:

Sorter Pandas DataFrame

Sorter Pandas DataFrame