logo

Hvordan finne standardavvik i R?

I denne artikkelen vil vi diskutere hvordan du finner standardavviket i R programmeringsspråk . Standardavvik R er målet for spredningen av verdiene. Det kan også defineres som kvadratroten av variansen.

Formel for prøvestandardavvik:



s = sqrt{frac{1}{N-1}displaystylesumlimits_{i=1}^N(x_i-overline{x})^2 }

hvor,

  • s = prøvestandardavvik
  • N = Antall enheter
  • overline{x}= Gjennomsnitt av enheter

I utgangspunktet er det to forskjellige måter å beregne standardavvik i R-programmeringsspråk, begge er diskutert nedenfor.



java matematikk pow

Metode 1: Naiv tilnærming

I denne metoden for å beregne standardavviket vil vi bruke standardformelen ovenfor for prøvestandardavviket i R-språk.

Eksempel 1:

R

v <->c>(12,24,74,32,14,29,84,56,67,41)> s<->sqrt>(>sum>((v->mean>(v))^2/(>length>(v)-1)))> print>(s)>
>
>

Produksjon:



[1]   25.53886>

Eksempel 2:

R

v <->c>(1.8,3.7,9.2,4.7,6.1,2.8,6.1,2.2,1.4,7.9)> s<->sqrt>(>sum>((v->mean>(v))^2/(>length>(v)-1)))> print>(s)>
>
>

Produksjon:

[1] 2.676004>

Metode 2: Bruk sd()

Funksjonen sd() brukes til å returnere standardavviket.

govinda

Syntaks: sd(x, na.rm = FALSE)

Parametere:

    x: en numerisk vektor, matrise eller dataramme.na.rm: manglende verdier fjernes?

Komme tilbake: Eksempelets standardavvik på x.

Eksempel 1:

R

v <->c>(12,24,74,32,14,29,84,56,67,41)> s<->sd>(v)> print>(s)>
>
>

Produksjon:

delvis derivat i lateks
[1] 25.53886>

Eksempel 2:

R

v <->c>(71,48,98,65,45,27,39,61,50,24,17)> s1<->sqrt>(>sum>((v->mean>(v))^2/(>length>(v)-1)))> print>(s1)> s2<->sd>(v)> print>(s2)>
>
>

Produksjon:

[1] 23.52175>

Eksempel 3:

R

v <->c>(1.8,3.7,9.2,4.7,6.1,2.8,6.1,2.2,1.4,7.9)> s1<->sqrt>(>sum>((v->mean>(v))^2/(>length>(v)-1)))> print>(s1)> s2<->sd>(v)> print>(s2)>
>
>

Produksjon:

nettverksoperativsystem
[1] 2.676004>

Beregn standardavviket til datarammen:

Vi kan beregne standardavviket til datarammen ved å bruke begge metodene. vi kan ta iris-datasettet og for hver kolonne vil vi beregne standardavviket.

Eksempel 1:

R

data>(iris)> sd>(iris$Sepal.Length)> sd>(iris$Sepal.Width)> sd>(iris$Petal.Length)> sd>(iris$Petal.Width)>
>
>

Produksjon:

[1] 0.8280661 [1] 0.4358663 [1] 1.765298 [1] 0.7622377>

Vi kan også beregne standardavviket for hele datarammen sammen ved hjelp av applikasjonsfunksjonen.

R

# Load the iris dataset> data>(iris)> # Calculate the standard deviation for each column> std_deviation <->apply>(iris[, 1:4], 2, sd)> # Display the standard deviation values> print>(std_deviation)>
>
>

Produksjon:

Sepal.Length Sepal.Width Petal.Length Petal.Width 0.8280661 0.4358663 1.7652982 0.7622377>

Kolonne 1 til 4 i iris-datasettet, som er de numeriske kolonnene som bærer de variable målingene, er valgt ved å bruke uttrykket iris[, 1:4] i koden ovenfor.

sd-funksjonen brukes på hver kolonne (merket med 2) i det valgte delsettet av iris-datasettet ved å bruke funksjonen. De resulterende standardavviksverdiene lagres i std_deviation-vektoren for hver kolonne.