Pandas DataFrame er en 2-dimensjonal merket datastruktur som en tabell med rader og kolonner. Størrelsen og verdiene til DataFrame kan endres, dvs. kan endres.
DataFrame brukes mest i dataanalyse og datamanipulering. Den lar deg lagre data i tabellform som SQL-database, MS Excel eller Google Sheets, noe som gjør det enklere å utføre aritmetiske operasjoner på dataene.
Det er det mest brukte Panda-objektet. De DataFrame() funksjon brukes til å lage en DataFrame i Pandas. Du kan også lage Pandas DataFrame på flere måter.
Pandas Dataframe()-syntaks
pandas.DataFrame(data, indeks, kolonner)
8 til 1 multiplekser
Parametere:
- data : Det er et datasett som en DataFrame skal lages fra. Det kan være en liste, ordbok, skalarverdi, serier og matriser, etc.
- indeks : Det er valgfritt, som standard starter indeksen til DataFrame fra 0 og slutter ved siste dataverdi (n-1). Den definerer radetiketten eksplisitt.
- kolonner : Denne parameteren brukes til å gi kolonnenavn i DataFrame. Hvis kolonnenavnet ikke er definert som standard, vil det ha en verdi fra 0 til n-1.
Returnerer:
- DataFrame-objekt
Nå som vi har diskutert om DataFrame()-funksjonen, la oss se på forskjellige måter å lage en DataFrame på:
Ulike måter å lage dataramme i Python
Det er flere måter å lage en Pandas dataramme i Python . Du kan opprette en DataFrame med følgende metoder:
- Lag Pandas DataFrame ved hjelp av DataFrame()-funksjonen
- Lag Pandas DataFrame fra listen over lister
- Lag Pandas DataFrame fra ordboken til ndarray/list
- Lag Pandas DataFrame fra listen over ordbøker
- Lag Pandas DataFrame fra en ordbok over serier
- Opprette DataFrame ved hjelp av zip()-funksjonen
- Opprette en DataFrame ved å bevise indeksetiketten eksplisitt
Opprett en tom DataFrame ved hjelp av DataFrame()-metoden
DataFrame i Python kan opprettes av DataFrame()-funksjonen til Pandas bibliotek . Bare kall opp funksjonen med DataFrame-konstruktøren for å lage en DataFrame.
Eksempel : Opprette en tom DataFrame ved hjelp av DataFrame()-funksjonen i Python
Python3
# Importing Pandas to create DataFrame> import> pandas as pd> # Creating Empty DataFrame and Storing it in variable df> df> => pd.DataFrame()> # Printing Empty DataFrame> print> (df)> |
>
>
Produksjon:
Empty DataFrame Columns: [] Index: []>
Lag DataFrame fra lister over lister
For å lage en Pandas DataFrame fra en liste av lister, kan du bruke pd.DataFrame()-funksjonen. Denne funksjonen tar en liste over lister som input og lager en DataFrame med samme antall rader og kolonner som inputlisten.
Eksempel : Opprette DataFrame fra lister med lister ved hjelp av DataFrame()-metoden
Python3
# Import pandas library> import> pandas as pd> # initialize list of lists> data> => [[> 'tom'> ,> 10> ], [> 'nick'> ,> 15> ], [> 'juli'> ,> 14> ]]> # Create the pandas DataFrame> df> => pd.DataFrame(data, columns> => [> 'Name'> ,> 'Age'> ])> # print dataframe.> print> (df)> |
>
>
windows kommando arp
Produksjon:
Name Age 0 tom 10 1 nick 15 2 juli 14>
Lag DataFrame fra Dictionary of ndArray/Lists
For å lage DataFrame fra en ordbok av ndarrays /lists, må alle arrayene være av samme lengde. Hvis en indeks passeres, skal lengdeindeksen være lik lengden på arrayene.
Hvis ingen indeks passeres, vil indeksen som standard være range(n) der n er matriselengden.
Eksempel : Opprette DataFrame fra en ordbok med ndarray/lister
Python3
# Python code demonstrate creating> # DataFrame from dict narray / lists> # By default addresses.> import> pandas as pd> # initialize data of lists.> data> => {> 'Name'> : [> 'Tom'> ,> 'nick'> ,> 'krish'> ,> 'jack'> ],> > 'Age'> : [> 20> ,> 21> ,> 19> ,> 18> ]}> # Create DataFrame> df> => pd.DataFrame(data)> # Print the output.> print> (df)> |
>
>
Produksjon:
Name Age 0 Tom 20 1 nick 21 2 krish 19 3 jack 18>
Merk: Når du oppretter DataFrame ved hjelp av en ordbok, vil nøklene til ordboken være kolonnenavn som standard. Vi kan også gi kolonnenavn eksplisitt ved å bruke kolonneparameter.
Lag DataFrame fra List of Dictionaries
Pandas DataFrame kan opprettes ved å bestå lister over ordbøker som inndata. Som standard tas ordboknøkler som kolonner.
Python3
# Python code demonstrate how to create> # Pandas DataFrame by lists of dicts.> import> pandas as pd> # Initialize data to lists.> data> => [{> 'a'> :> 1> ,> 'b'> :> 2> ,> 'c'> :> 3> },> > {> 'a'> :> 10> ,> 'b'> :> 20> ,> 'c'> :> 30> }]> # Creates DataFrame.> df> => pd.DataFrame(data)> # Print the data> print> (df)> |
>
>
Produksjon:
a b c 0 1 2 3 1 10 20 30>
Et annet eksempel er å lage en Pandas DataFrame ved å sende lister over ordbøker og radindekser .
Python3
abstrakt klasse
# Python code demonstrate to create> # Pandas DataFrame by passing lists of> # Dictionaries and row indices.> import> pandas as pd> # Initialize data of lists> data> => [{> 'b'> :> 2> ,> 'c'> :> 3> }, {> 'a'> :> 10> ,> 'b'> :> 20> ,> 'c'> :> 30> }]> # Creates pandas DataFrame by passing> # Lists of dictionaries and row index.> df> => pd.DataFrame(data, index> => [> 'first'> ,> 'second'> ])> # Print the data> print> (df)> |
>
>
Produksjon:
b c a first 2 3 NaN second 20 30 10.0>
Lag DataFrame fra en ordbok over serier
For å lage en DataFrame fra en ordbok av serie , kan en ordbok sendes for å danne en DataFrame. Den resulterende indeksen er foreningen av alle seriene med bestått indeksert.
Eksempel: Opprette en DataFrame fra en ordbok med serier.
Python3
konverter strin til int
# Python code demonstrate creating> # Pandas Dataframe from Dicts of series.> import> pandas as pd> # Initialize data to Dicts of series.> d> => {> 'one'> : pd.Series([> 10> ,> 20> ,> 30> ,> 40> ],> > index> => [> 'a'> ,> 'b'> ,> 'c'> ,> 'd'> ]),> > 'two'> : pd.Series([> 10> ,> 20> ,> 30> ,> 40> ],> > index> => [> 'a'> ,> 'b'> ,> 'c'> ,> 'd'> ])}> # creates Dataframe.> df> => pd.DataFrame(d)> # print the data.> print> (df)> |
>
>
Produksjon:
one two a 10 10 b 20 20 c 30 30 d 40 40>
Lag DataFrame ved å bruke zip()-funksjonen
To lister kan slås sammen ved å bruke zip() funksjon . Lag nå Pandas DataFrame ved å kalle pd.DataFrame()-funksjonen.
Eksempel: Opprette DataFrame ved hjelp av zip()-funksjonen.
Python3
riv kart
# Python program to demonstrate creating> # pandas Dataframe from lists using zip.> import> pandas as pd> # List1> Name> => [> 'tom'> ,> 'krish'> ,> 'nick'> ,> 'juli'> ]> # List2> Age> => [> 25> ,> 30> ,> 26> ,> 22> ]> # get the list of tuples from two lists.> # and merge them by using zip().> list_of_tuples> => list> (> zip> (Name, Age))> # Assign data to tuples.> list_of_tuples> # Converting lists of tuples into> # pandas Dataframe.> df> => pd.DataFrame(list_of_tuples,> > columns> => [> 'Name'> ,> 'Age'> ])> # Print data.> print> (df)> |
>
>
Produksjon:
Name Age 0 tom 25 1 krish 30 2 nick 26 3 juli 22>
Opprett en DataFrame ved å bevise indeksetiketten eksplisitt
For å lage en DataFrame ved å oppgi indeksetiketten eksplisitt, kan du bruke indeksparameteren til pd.DataFrame()-konstruktøren. Indeksparameteren tar en liste over indeksetiketter som input, og DataFrame vil bruke disse etikettene for radene i DataFrame.
Eksempel: Opprette en DataFrame ved å bevise indeksetiketten eksplisitt
Python3
# Python code demonstrate creating> # pandas DataFrame with indexed by> # DataFrame using arrays.> import> pandas as pd> # initialize data of lists.> data> => {> 'Name'> : [> 'Tom'> ,> 'Jack'> ,> 'nick'> ,> 'juli'> ],> > 'marks'> : [> 99> ,> 98> ,> 95> ,> 90> ]}> # Creates pandas DataFrame.> df> => pd.DataFrame(data, index> => [> 'rank1'> ,> > 'rank2'> ,> > 'rank3'> ,> > 'rank4'> ])> # print the data> print> (df)> |
>
>
Produksjon:
Name marks rank1 Tom 99 rank2 Jack 98 rank3 nick 95 rank4 juli 90>
Konklusjon
Python Pandas DataFrame ligner på en tabell med rader og kolonner. Det er en todimensjonal datastruktur og er svært nyttig for dataanalyse og datamanipulering.
I denne opplæringen har vi diskutert flere måter å lage en Pandas DataFrame på. Med denne opplæringen vil du være i stand til å håndtere alle komplekse krav for å lage DataFrame.