logo

Python Pandas-serien

Pandas-serien kan defineres som en endimensjonal matrise som er i stand til å lagre ulike datatyper. Vi kan enkelt konvertere listen, tuppelen og ordboken til serier ved å bruke ' serie ' metode. Radetikettene til serier kalles indeksen. En serie kan ikke inneholde flere kolonner. Den har følgende parameter:

    data:Det kan være en hvilken som helst liste, ordbok eller skalarverdi.indeks:Verdien av indeksen skal være unik og hashbar. Den må ha samme lengde som data. Hvis vi ikke passerer noen indeks, standard np.arrange(n) vil bli brukt.dtype:Det refererer til datatypen for serier.kopiere:Den brukes til å kopiere dataene.

Opprette en serie:

Vi kan lage en serie på to måter:

  1. Lag en tom serie
  2. Lag en serie ved å bruke innganger.

Lag en tom serie:

Vi kan enkelt lage en tom serie i Pandas, noe som betyr at den ikke vil ha noen verdi.

Syntaksen som brukes for å lage en tom serie:

 = pandas.Series() 

Eksempelet nedenfor oppretter et objekt av typen Empty Series som ikke har noen verdier og som har standard datatype, dvs. flyte64 .

Eksempel

 import pandas as pd x = pd.Series() print (x) 

Produksjon

 Series([], dtype: float64) 

Opprette en serie ved å bruke innganger:

Vi kan lage serier ved å bruke ulike innganger:

  • Array
  • Dict
  • Skalarverdi

Opprette serier fra Array:

Før vi oppretter en serie, må vi først importere nusset modul og bruk deretter array()-funksjonen i programmet. Hvis dataene er ndarray, må den beståtte indeksen være av samme lengde.

Hvis vi ikke passerer en indeks, så som standard indeks på område(n) sendes der n definerer lengden på en matrise, dvs. [0,1,2,.... range(len(array))-1 ].

Eksempel

 import pandas as pd import numpy as np info = np.array(['P','a','n','d','a','s']) a = pd.Series(info) print(a) 

Produksjon

 0 P 1 a 2 n 3 d 4 a 5 s dtype: object 

Lag en serie fra dict

Vi kan også lage en serie fra dict. Hvis ordbokobjektet sendes som en inngang og indeksen ikke er spesifisert, blir ordboknøklene tatt i sortert rekkefølge for å konstruere indeksen .

Hvis indeksen er bestått, vil verdiene som tilsvarer en bestemt etikett i indeksen trekkes ut fra ordbok .

 #import the pandas library import pandas as pd import numpy as np info = {'x' : 0., 'y' : 1., 'z' : 2.} a = pd.Series(info) print (a) 

Produksjon

konverter et java-objekt til json
 x 0.0 y 1.0 z 2.0 dtype: float64 

Lag en serie ved hjelp av skalar:

les fra csv-fil i java

Hvis vi tar skalarverdiene, må indeksen oppgis. Skalarverdien vil bli gjentatt for å matche lengden på indeksen.

 #import pandas library import pandas as pd import numpy as np x = pd.Series(4, index=[0, 1, 2, 3]) print (x) 

Produksjon

 0 4 1 4 2 4 3 4 dtype: int64 

Tilgang til data fra serier med posisjon:

Når du har opprettet serieobjektet, kan du få tilgang til indeksene, dataene og til og med individuelle elementer.

Dataene i serien kan nås på samme måte som i ndarrayen.

 import pandas as pd x = pd.Series([1,2,3],index = ['a','b','c']) #retrieve the first element print (x[0]) 

Produksjon

 1 

Serieobjektattributter

Series-attributtet er definert som all informasjon relatert til Series-objektet, for eksempel størrelse, datatype. osv. Nedenfor er noen av attributtene du kan bruke for å få informasjon om Series-objektet:

Attributter Beskrivelse
Series.index Definerer indeksen for serien.
Serieform Det returnerer en tuppel av formen til dataene.
Series.dtype Den returnerer datatypen til dataene.
Serie.størrelse Den returnerer størrelsen på dataene.
Serie.tom Det returnerer True hvis Series-objektet er tomt, ellers returnerer det usant.
Series.hasnans Den returnerer True hvis det er noen NaN-verdier, ellers returnerer den usann.
Series.nbytes Den returnerer antall byte i dataene.
Serien er jeg Den returnerer antall dimensjoner i dataene.
Serie.varestørrelse Den returnerer størrelsen på varens datatype.

Henter indeksmatrise og datamatrise for et serieobjekt

Vi kan hente indeksmatrisen og datamatrisen til et eksisterende serieobjekt ved å bruke attributtene indeks og verdier.

 import numpy as np import pandas as pd x=pd.Series(data=[2,4,6,8]) y=pd.Series(data=[11.2,18.6,22.5], index=['a','b','c']) print(x.index) print(x.values) print(y.index) print(y.values) 

Produksjon

 RangeIndex(start=0, stop=4, step=1) [2 4 6 8] Index(['a', 'b', 'c'], dtype='object') [11.2 18.6 22.5] 

Henter typer (dtype) og størrelse på type (varestørrelse)

Du kan bruke attributtet dtype med Series-objekt som dtype for å hente datatypen til et individuelt element i et serieobjekt, du kan bruke elementstørrelse attributt for å vise antall byte som er tildelt hvert dataelement.

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.dtype) print(a.itemsize) print(b.dtype) print(b.itemsize) 

Produksjon

 int64 8 float64 8 

Henter Shape

Formen til Series-objektet definerer totalt antall elementer inkludert manglende eller tomme verdier (NaN).

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) print(a.shape) print(b.shape) 

Produksjon

 (4,) (3,) 

Henter dimensjon, størrelse og antall byte:

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.ndim, b.ndim) print(a.size, b.size) print(a.nbytes, b.nbytes) 

Produksjon

 1 1 4 3 32 24 

Kontrollere tomhet og tilstedeværelse av NaN

For å sjekke at serieobjektet er tomt, kan du bruke tomt attributt . På samme måte, for å sjekke om et serieobjekt inneholder noen NaN-verdier eller ikke, kan du bruke hassan Egenskap.

Eksempel

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,np.NaN]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) c=pd.Series() print(a.empty,b.empty,c.empty) print(a.hasnans,b.hasnans,c.hasnans) print(len(a),len(b)) print(a.count( ),b.count( )) 

Produksjon

 False False True True False False 4 3 3 3 

Seriefunksjoner

Det er noen funksjoner som brukes i serier som er som følger:

Funksjoner Beskrivelse
Pandas Series.map() Kartlegg verdiene fra to serier som har en felles kolonne.
Pandas Series.std() Beregn standardavviket til det gitte settet med tall, DataFrame, kolonne og rader.
Pandas Series.to_frame() Konverter serieobjektet til datarammen.
Pandas Series.value_counts() Returnerer en serie som inneholder antall unike verdier.