logo

Gjennomsnitt, varians og standardavvik

Gjennomsnitt, varians og standardavvik er viktige statistiske tiltak. Varians kvantifiserer datapunktavvik fra gjennomsnittet, mens standardavvik måler datafordeling. Nøkkelforskjellen ligger i at standardavvik er i de samme enhetene som gjennomsnittet, mens variansen er i kvadratiske enheter. Dykk dypere inn i disse konseptene med definisjoner, formler og et illustrerende eksempel.

Mener

Mener er gjennomsnittet av et gitt sett med data. La oss vurdere eksemplet nedenfor



2, 4, 4, 4, 5, 5, 7, 9

Disse åtte datapunktene har gjennomsnittet (gjennomsnittet) på 5:

frac{2 + 4 + 4 + 4 + 5 + 5 + 7 + 9}{8} = 5.

Formel: mu=frac{sum_{i=1}^{N} x_{i}}{N}

Hvor ? er gjennomsnitt og x1, x2, x3…., xJeger elementer. Vær også oppmerksom på at gjennomsnitt noen ganger er betegnet med egin{array}{lll} (2-5)^2 = (-3)^2 = 9 && (5-5)^2 = 0^2 = 0  (4-5)^2 = (- 1)^2 = 1 && (5-5)^2 = 0^2 = 0  (4-5)^2 = (-1)^2 = 1 && (7-5)^2 = 2^2 = 4  (4-5)^2 = (-1)^2 = 1 && (9-5)^2 = 4^2 = 16.  end{array}

Forskjell

Forskjell er summen av kvadrater av forskjeller mellom alle tall og middel.
Avvik for eksempel ovenfor. Beregn først avvikene til hvert datapunkt fra gjennomsnittet, og kvadrer resultatet av hvert:

Formel: sigma^{2}= frac { sum_{i=1}^{N} (x_{i}-mu)^{2}}{N}

variasjon = 	extup{variasjonskoeffisient } =frac{ 	extup{Standardavvik}}{Mean}*100= 4.



Hvor ? er gjennomsnitt, N er det totale antallet elementer eller distribusjonsfrekvens.


Standardavvik

Standardavvik er kvadratroten av variansen. Det er et mål på i hvilken grad data varierer fra gjennomsnittet.

Standardavvik (for ovennevnte data) = = 2

Hvorfor valgte matematikere en kvadrat og deretter kvadratrot for å finne avvik, hvorfor ikke bare ta forskjellen på verdier?
En grunn er at summen av forskjeller blir 0 i henhold til definisjonen av gjennomsnitt. Sum av absolutte forskjeller kunne være et alternativ, men med absolutte forskjeller var det vanskelig å bevise mange fine teoremer. [Kilde: MIT videoforelesning klokken 1:19]



  1. Verdien av standardavviket er 0 hvis alle oppføringer i input er like.
  2. Hvis vi legger til (eller subtraherer) et tall, si 7, til alle verdiene i inndatasettet, økes (eller reduseres) gjennomsnittet med 7, men standardavviket endres ikke.
  3. Hvis vi multipliserer alle verdiene i inngangssettet med et tall 7, multipliseres både gjennomsnitt og standardavvik med 7. Men hvis vi multipliserer alle inngangsverdier med et negativt tall si -7, multipliseres gjennomsnittet med -7, men standardavvik multipliseres med 7.
  4. Standardavvik og varians er et mål som forteller hvor spredt tallene er. Mens varians gir deg en grov ide om spredning, er standardavviket mer konkret, og gir deg nøyaktige avstander fra gjennomsnittet.
  5. Gjennomsnitt, median og modus er mål på sentral tendens til data (enten gruppert eller ugruppert).

Kryss av:

  • Varians og standardavvik
  • Virkelige anvendelser av standardavvik
  • Forskjellen mellom varians og standardavvik

Spørsmålene nedenfor har blitt stilt i tidligere års GATE-eksamener Referanser:
https://en.wikipedia.org/wiki/Standard_deviation
http://staff.argyll.epsb.ca/jreed/math30p/statistics/standardDeviation.htm

Gjennomsnitt, varians og standardavvik – vanlige spørsmål

Hva er forskjellen mellom standardavvik og varians?

Både standardavvik og varians måler spredningen av datapunkter i et datasett i forhold til gjennomsnittet. Den viktigste forskjellen er at varians måler gjennomsnittet av kvadrerte avvik fra gjennomsnittet, mens standardavvik er kvadratroten av variansen, og gir et mål på spredning i de samme enhetene som dataene.



Hvordan beregner du gjennomsnitt, varians og standardavvik?

  • Gjennomsnitt: Legg alle tallene sammen og del på antall tall.
  • Varians: Beregn gjennomsnittet, trekk gjennomsnittet fra hvert tall, kvadrer resultatet, summer disse opphøyde resultatene og del på antallet tall minus én.
  • Standardavvik: Ta kvadratroten av variansen.

Hvorfor er gjennomsnitt, varians og standardavvik viktig?

Disse statistiske målene er avgjørende for å forstå distribusjonen av data. Gjennomsnittet gir en sentral verdi, mens varians og standardavvik gir innsikt i dataenes variabilitet eller spredning, som indikerer konsistensen eller volatiliteten til datasettet.

Kan varians og standardavvik være negative?

Nei, varians og standardavvik kan ikke være negative. Varians beregnes som gjennomsnittet av kvadrerte forskjeller fra gjennomsnittet, noe som resulterer i en ikke-negativ verdi. Siden standardavvik er kvadratroten av variansen, kan det heller ikke være negativt.

Hvordan påvirker uteliggere gjennomsnitt, varians og standardavvik?

Uteliggere kan påvirke gjennomsnittet betydelig ved å trekke det mot uteliggerverdien, og dermed ikke nøyaktig gjenspeile datasettets sentrale tendens. Varians og standardavvik påvirkes også ettersom de vil øke, noe som indikerer en høyere spredning av data på grunn av uteligger(e).