Pandas-serien kan defineres som en endimensjonal matrise som er i stand til å lagre ulike datatyper. Vi kan enkelt konvertere listen, tuppelen og ordboken til serier ved å bruke ' serie ' metode. Radetikettene til serier kalles indeksen. En serie kan ikke inneholde flere kolonner. Den har følgende parameter:
Opprette en serie:
Vi kan lage en serie på to måter:
- Lag en tom serie
- Lag en serie ved å bruke innganger.
Lag en tom serie:
Vi kan enkelt lage en tom serie i Pandas, noe som betyr at den ikke vil ha noen verdi.
Syntaksen som brukes for å lage en tom serie:
= pandas.Series()
Eksempelet nedenfor oppretter et objekt av typen Empty Series som ikke har noen verdier og som har standard datatype, dvs. flyte64 .
Eksempel
import pandas as pd x = pd.Series() print (x)
Produksjon
Series([], dtype: float64)
Opprette en serie ved å bruke innganger:
Vi kan lage serier ved å bruke ulike innganger:
- Array
- Dict
- Skalarverdi
Opprette serier fra Array:
Før vi oppretter en serie, må vi først importere nusset modul og bruk deretter array()-funksjonen i programmet. Hvis dataene er ndarray, må den beståtte indeksen være av samme lengde.
Hvis vi ikke passerer en indeks, så som standard indeks på område(n) sendes der n definerer lengden på en matrise, dvs. [0,1,2,.... range(len(array))-1 ].
Eksempel
import pandas as pd import numpy as np info = np.array(['P','a','n','d','a','s']) a = pd.Series(info) print(a)
Produksjon
0 P 1 a 2 n 3 d 4 a 5 s dtype: object
Lag en serie fra dict
Vi kan også lage en serie fra dict. Hvis ordbokobjektet sendes som en inngang og indeksen ikke er spesifisert, blir ordboknøklene tatt i sortert rekkefølge for å konstruere indeksen .
Hvis indeksen er bestått, vil verdiene som tilsvarer en bestemt etikett i indeksen trekkes ut fra ordbok .
#import the pandas library import pandas as pd import numpy as np info = {'x' : 0., 'y' : 1., 'z' : 2.} a = pd.Series(info) print (a)
Produksjon
konverter et java-objekt til json
x 0.0 y 1.0 z 2.0 dtype: float64
Lag en serie ved hjelp av skalar:
les fra csv-fil i java
Hvis vi tar skalarverdiene, må indeksen oppgis. Skalarverdien vil bli gjentatt for å matche lengden på indeksen.
#import pandas library import pandas as pd import numpy as np x = pd.Series(4, index=[0, 1, 2, 3]) print (x)
Produksjon
0 4 1 4 2 4 3 4 dtype: int64
Tilgang til data fra serier med posisjon:
Når du har opprettet serieobjektet, kan du få tilgang til indeksene, dataene og til og med individuelle elementer.
Dataene i serien kan nås på samme måte som i ndarrayen.
import pandas as pd x = pd.Series([1,2,3],index = ['a','b','c']) #retrieve the first element print (x[0])
Produksjon
1
Serieobjektattributter
Series-attributtet er definert som all informasjon relatert til Series-objektet, for eksempel størrelse, datatype. osv. Nedenfor er noen av attributtene du kan bruke for å få informasjon om Series-objektet:
Attributter | Beskrivelse |
---|---|
Series.index | Definerer indeksen for serien. |
Serieform | Det returnerer en tuppel av formen til dataene. |
Series.dtype | Den returnerer datatypen til dataene. |
Serie.størrelse | Den returnerer størrelsen på dataene. |
Serie.tom | Det returnerer True hvis Series-objektet er tomt, ellers returnerer det usant. |
Series.hasnans | Den returnerer True hvis det er noen NaN-verdier, ellers returnerer den usann. |
Series.nbytes | Den returnerer antall byte i dataene. |
Serien er jeg | Den returnerer antall dimensjoner i dataene. |
Serie.varestørrelse | Den returnerer størrelsen på varens datatype. |
Henter indeksmatrise og datamatrise for et serieobjekt
Vi kan hente indeksmatrisen og datamatrisen til et eksisterende serieobjekt ved å bruke attributtene indeks og verdier.
import numpy as np import pandas as pd x=pd.Series(data=[2,4,6,8]) y=pd.Series(data=[11.2,18.6,22.5], index=['a','b','c']) print(x.index) print(x.values) print(y.index) print(y.values)
Produksjon
RangeIndex(start=0, stop=4, step=1) [2 4 6 8] Index(['a', 'b', 'c'], dtype='object') [11.2 18.6 22.5]
Henter typer (dtype) og størrelse på type (varestørrelse)
Du kan bruke attributtet dtype med Series-objekt som dtype for å hente datatypen til et individuelt element i et serieobjekt, du kan bruke elementstørrelse attributt for å vise antall byte som er tildelt hvert dataelement.
import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.dtype) print(a.itemsize) print(b.dtype) print(b.itemsize)
Produksjon
int64 8 float64 8
Henter Shape
Formen til Series-objektet definerer totalt antall elementer inkludert manglende eller tomme verdier (NaN).
import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) print(a.shape) print(b.shape)
Produksjon
(4,) (3,)
Henter dimensjon, størrelse og antall byte:
import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.ndim, b.ndim) print(a.size, b.size) print(a.nbytes, b.nbytes)
Produksjon
1 1 4 3 32 24
Kontrollere tomhet og tilstedeværelse av NaN
For å sjekke at serieobjektet er tomt, kan du bruke tomt attributt . På samme måte, for å sjekke om et serieobjekt inneholder noen NaN-verdier eller ikke, kan du bruke hassan Egenskap.
Eksempel
import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,np.NaN]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) c=pd.Series() print(a.empty,b.empty,c.empty) print(a.hasnans,b.hasnans,c.hasnans) print(len(a),len(b)) print(a.count( ),b.count( ))
Produksjon
False False True True False False 4 3 3 3
Seriefunksjoner
Det er noen funksjoner som brukes i serier som er som følger:
Funksjoner | Beskrivelse |
---|---|
Pandas Series.map() | Kartlegg verdiene fra to serier som har en felles kolonne. |
Pandas Series.std() | Beregn standardavviket til det gitte settet med tall, DataFrame, kolonne og rader. |
Pandas Series.to_frame() | Konverter serieobjektet til datarammen. |
Pandas Series.value_counts() | Returnerer en serie som inneholder antall unike verdier. |