logo

numpy.histogram() i Python

Den numpy-modulen til Python gir en funksjon kalt numpy.histogram() . Denne funksjonen representerer frekvensen av antall verdier som sammenlignes med et sett med verdiområder. Denne funksjonen ligner på hist() funksjon av matplotlib.pyplot .

Med enkle ord brukes denne funksjonen til å beregne histogrammet til settet med data.

Syntaks:

 numpy.histogram(x, bins=10, range=None, normed=None, weights=None, density=None) 

Parametere:

x: array_like

Denne parameteren definerer en flat matrise som histogrammet beregnes over.

bins: int eller sekvens av str eller skalarer (valgfritt)

Hvis denne parameteren er definert som et heltall, definerer den i det gitte området antallet hyller med lik bredde. Ellers defineres en rekke av beholderkanter som monotont øker. Den inkluderer også kanten lengst til høyre, noe som gir mulighet for uensartede søppelbredder. Den nyeste versjonen av numpy lar oss sette bin-parametere som en streng, som definerer en metode for å beregne optimal søppelbredde.

range : (flyte, flyte) (valgfritt)

stabel i ds

Denne parameteren definerer de nedre og øvre områdene til skuffene. Som standard er området (x.min(), x.max()) . Verdiene ignoreres, som er utenfor området. Områdene til det første elementet skal være lik eller mindre enn det andre elementet.

normert: bool (valgfritt)

Denne parameteren er den samme som tetthetsargumentet, men den kan gi feil utdata for ulik beholderbredde.

vekter: array_like (valgfritt)

Denne parameteren definerer en matrise som inneholder vekter og har samme form som 'x' .

tetthet: bool (valgfritt)

Hvis den er satt til True, vil det resultere i antall prøver i hver boks. Hvis verdien er False, vil tetthetsfunksjonen resultere i verdien av sannsynlighetstetthetsfunksjonen i beholderen.

Returnerer:

hist: array

alfabetet nummerert

Tetthetsfunksjonen returnerer verdiene til histogrammet.

edge_bin: en rekke float dtype

Denne funksjonen returnerer skuffekantene (lengde(hist+1)) .

Eksempel 1:

 import numpy as np a=np.histogram([1, 5, 2], bins=[0, 1, 2, 3]) a 

Produksjon:

 (array([0, 1, 1], dtype=int64), array([0, 1, 2, 3])) 

I koden ovenfor

  • Vi har importert numpy med alias navn np.
  • Vi har erklært variabelen 'a' og tildelt den returnerte verdien av np.histogram() funksjon.
  • Vi har passert en matrise og verdien av bin i funksjonen.
  • Til slutt prøvde vi å skrive ut verdien av 'en' .

I utgangen viser den en ndarray som inneholder verdiene til histogrammet.

Eksempel 2:

 import numpy as np x=np.histogram(np.arange(6), bins=np.arange(7), density=True) x 

Produksjon:

lesing fra en csv-fil i java
 (array([0.16666667, 0.16666667, 0.16666667, 0.16666667, 0.16666667, 0.16666667]), array([0, 1, 2, 3, 4, 5, 6])) 

Eksempel 3:

 import numpy as np x=np.histogram([[1, 3, 1], [1, 3, 1]], bins=[0,1,2,3]) x 

Produksjon:

 (array([0, 4, 2], dtype=int64), array([0, 1, 2, 3])) 

Eksempel 4:

 import numpy as np a = np.arange(8) hist, bin_edges = np.histogram(a, density=True) hist bin_edges 

Produksjon:

 array([0.17857143, 0.17857143, 0.17857143, 0. , 0.17857143, 0.17857143, 0. , 0.17857143, 0.17857143, 0.17857143]) array([0. , 0.7, 1.4, 2.1, 2.8, 3.5, 4.2, 4.9, 5.6, 6.3, 7. ]) 

Eksempel 5:

 import numpy as np a = np.arange(8) hist, bin_edges = np.histogram(a, density=True) hist hist.sum() np.sum(hist * np.diff(bin_edges)) 

Produksjon:

 array([0.17857143, 0.17857143, 0.17857143, 0. , 0.17857143, 0.17857143, 0. , 0.17857143, 0.17857143, 0.17857143]) 1.4285714285714288 1.0 

I koden ovenfor

  • Vi har importert numpy med alias navn np.
  • Vi har laget en matrise 'en' ved hjelp av np.arange() funksjon.
  • Vi har deklarert variabler 'histor' og 'bin_edges' og deretter tildelt den returnerte verdien av np.histogram() funksjon.
  • Vi har passert arrayet 'en' og sett 'tetthet' til True i funksjonen.
  • Vi prøvde å skrive ut verdien av 'histor' .
  • Og til slutt prøvde vi å beregne summen av histogramverdier ved hjelp av hist.sum() og np.sum() der vi passerte histogramverdier og kanter på bingen.

I utgangen viser den en ndarray som inneholder verdiene til histogrammet og summen av histogramverdiene.