logo

Måter å filtrere Pandas DataFrame etter kolonneverdier

Filtrering av en Pandas DataFrame ved hjelp av kolonneverdier er en vanlig operasjon mens du kjører med informasjon i Python. Du kan bruke ulike metoder og teknikker for å oppnå dette. Her er mange måter å filtrere ut en Pandas DataFrame gjennom kolonneverdier.

I dette innlegget vil vi se forskjellige måter å filtrere Pandas Dataframe etter kolonneverdier. Først, la oss lage en dataramme:



Python3








# importing pandas> import> pandas as pd> > # declare a dictionary> record>=> {> >'Name'> : [>'Ankit'>,>'Swapnil'>,>'Aishwarya'>,> >'Priyanka'>,>'Shivangi'>,>'Shaurya'> ],> > >'Age'> : [>22>,>20>,>21>,>19>,>18>,>22>],> > >'Stream'> : [>'Math'>,>'Commerce'>,>'Science'>,> >'Math'>,>'Math'>,>'Science'>],> > >'Percentage'> : [>90>,>90>,>96>,>75>,>70>,>80>] }> > # create a dataframe> dataframe>=> pd.DataFrame(record,> >columns>=> [>'Name'>,>'Age'>,> >'Stream'>,>'Percentage'>])> # show the Dataframe> print>(>'Given Dataframe : '>, dataframe)>

>

>

Produksjon:

Dataramme

Velge rader med Pandas Dataframe basert på en bestemt kolonneverdi ved å bruke '>', '=', '=', '<=', '!=' operator.

Eksempel 1: Velge alle radene fra den gitte datarammen der 'Prosentandel' er større enn 75 ved å bruke [ ] .

Python3




# selecting rows based on condition> rslt_df>=> dataframe[dataframe[>'Percentage'>]>>70>]> > print>(>' Result dataframe : '>, rslt_df)>

>

>

Produksjon:

utdataramme

Eksempel 2: Velge alle radene fra den gitte datarammen der 'Prosentandel' er større enn 70 ved å bruke plass [ ] .

Python3




# selecting rows based on condition> rslt_df>=> dataframe.loc[dataframe[>'Percentage'>]>>70>]> > print>(>' Result dataframe : '>,> >rslt_df)>

>

>

Produksjon:

utdataramme-1

Velge de radene med Pandas Dataframe hvis kolonneverdi er til stede i listen ved hjelp av du() metoden for datarammen.

Eksempel 1: Velge alle radene fra den gitte datarammen der 'Stream' er til stede i alternativlisten ved å bruke [ ] .

Python3




options>=> [>'Science'>,>'Commerce'>]> > # selecting rows based on condition> rslt_df>=> dataframe[dataframe[>'Stream'>].isin(options)]> > print>(>' Result dataframe : '>,> >rslt_df)>

>

>

Produksjon:

utdataramme-2

Eksempel 2: Velge alle radene fra den gitte datarammen der 'Stream' er til stede i alternativlisten ved å bruke plass [ ] .

Python




options>=> [>'Science'>,>'Commerce'>]> > # selecting rows based on condition> rslt_df>=> dataframe.loc[dataframe[>'Stream'>].isin(options)]> > print>(>' Result dataframe : '>,> >rslt_df)>

>

>

Produksjon:

utdataramme-3

Velge rader med Pandas Dataframe basert på flere kolonneforhold ved å bruke '&'-operatoren.

Eksempel 1: Å velge alle radene fra den gitte datarammen der 'Alder' er lik 22 og 'Strøm' er til stede i alternativlisten ved å bruke [ ] .

Python3




options>=> [>'Commerce'> ,>'Science'>]> > # selecting rows based on condition> rslt_df>=> dataframe[(dataframe[>'Age'>]>=>=> 22>) &> >dataframe[>'Stream'>].isin(options)]> > print>(>' Result dataframe : '>,> >rslt_df)>

>

>

Produksjon:

utdataramme-4

Eksempel 2: Å velge alle radene fra den gitte datarammen der 'Alder' er lik 22 og 'Strøm' er til stede i alternativlisten ved å bruke plass [ ] .

Python3




string konvertere til int i java

options>=> [>'Commerce'>,>'Science'>]> > # selecting rows based on condition> rslt_df>=> dataframe.loc[(dataframe[>'Age'>]>=>=> 22>) &> >dataframe[>'Stream'>].isin(options)]> > print>(>' Result dataframe : '>,> >rslt_df)>

>

>

Produksjon:

utdataramme-5