logo

Forskjell

Forskjell er en måleverdi som brukes til å finne hvordan dataene er spredt angående gjennomsnittet eller gjennomsnittsverdien til datasettet. Den brukes til å finne hvordan distribusjonsdataene er spredt angående middelverdien eller gjennomsnittsverdien. Symbolet som brukes til å definere variansen er σ2. Det er kvadratet av standardavviket.

Det er to typer varians som brukes i statistikk,



  • Eksempelvarians
  • Befolkningsvariasjon

Populasjonsvariansen brukes til å bestemme hvordan hvert datapunkt i en bestemt populasjon svinger eller er spredt, mens utvalgets varians brukes til å finne gjennomsnittet av kvadrerte avvik fra gjennomsnittet.

I denne artikkelen vil vi lære om Varians (utvalg, populasjon), deres formler, egenskaper og andre detaljer.

Innholdsfortegnelse



Hva er varians?

Vi måler de ulike verdiene av dataene og disse verdiene brukes til en rekke formål. Dataene kan gis i to typer grupperte data, eller ugrupperte (diskrete) data. Hvis dataene er gitt i form av klasseintervaller, kalles det grupperte data, mens hvis dataene er gitt i form av et enkelt datapunkt, blir det referert til som et diskret eller ugruppert datapunkt. Varians er målet for spredningen av dataene angående middelverdien av dataene. Den forteller oss hvordan dataene er spredt i den gitte dataverdien. Vi kan enkelt beregne utvalgsvariansen og populasjonsvariansen for både grupperte og ugrupperte data.

Avviksdefinisjon

Forskjell er et statistisk mål som kvantifiserer spredningen eller spredningen av et sett med datapunkter. Den angir hvor mye de enkelte datapunktene i et datasett avviker fra gjennomsnittet (gjennomsnittet) av datasettet

Typer varians

Vi kan definere variansen til de gitte dataene i to typer,



  • Befolkningsvariasjon
  • Eksempelvarians

La oss nå lære om dem i detalj.

Befolkningsvariasjon

Befolkningsvarians brukes til å finne spredningen av den gitte populasjonen. Befolkningen er definert som en gruppe mennesker og alle menneskene i den gruppen er en del av befolkningen. Den forteller oss hvordan befolkningen i en gruppe varierer i forhold til gjennomsnittsbefolkningen.

Alle medlemmene av en gruppe er kjent som befolkningen. Når vi ønsker å finne hvordan hvert datapunkt i en gitt populasjon varierer eller er spredt ut, bruker vi populasjonsvariansen. Den brukes til å gi kvadrert avstand til hvert datapunkt fra gjennomsnittet av befolkningen.

Eksempelvarians

Hvis populasjonsdataene er svært store, blir det vanskelig å beregne populasjonsvariasjonen til datasettet. I så fall tar vi et utvalg av data fra det gitte datasettet og finner variansen til det datasettet som kalles sample varians. Mens vi beregner utvalgets gjennomsnitt, sørger vi for å beregne utvalgets gjennomsnitt, dvs. gjennomsnittet av utvalgsdatasettet, ikke populasjonsgjennomsnittet. Vi kan definere prøvevariansen som gjennomsnittet av kvadratet av forskjellen mellom prøvedatapunktet og prøvegjennomsnittet.

Varianssymbol

Symbolet for varians er typisk representert med den greske bokstaven sigma squared (σ²) når det refereres til populasjonsvariansen. For prøvevarians er det ofte betegnet med s².

Eksempel på varians

Vi kan forstå begrepet varians ved hjelp av eksemplet diskutert nedenfor.

Finn populasjonsvariansen til dataene {4,6,8,10}

Løsning:

Gjennomsnitt = (4+6+8+10)/4 = 7

4 (4-7)2 9
6 (6-7)2 1
8 (8-7)2 1
10 (10-7)2 9

Varians = (9+1+1+9)/4 = 20/4 = 5

Dermed er variansen til dataene 5

Variansformel

Variansen for et datasett er angitt med symbolet σ2. For populasjonsdata er formelen lik summen av kvadrerte forskjeller mellom dataoppføringer fra gjennomsnittet delt på antall oppføringer. Mens for eksempeldata deler vi tellerverdien med forskjellen mellom antall oppføringer og enhet.

Eksempel på variansformel

Hvis datasettet er et eksempel, er variansformelen gitt av,

s 2 = ∑ (x Jeg – x̄) 2 /(n – 1)

hvor,

  • x er gjennomsnittet av prøvedatasettet
  • n er det totale antallet observasjoner

Befolkningsvariansformel

Hvis vi har et populasjonsdatasett, skrives formelen som,

s 2 = ∑ (x Jeg – x̄) 2 /n

hvor,

  • x er gjennomsnittet av populasjonsdatasettet
  • n er det totale antallet observasjoner

Vi kan også beregne variansen for grupperte og ugrupperte datasett. Ulike formler for variansen er,

juster css-bilde

Avviksformel for grupperte data

For grupperte data diskuteres variansformelen nedenfor,

Eksempelvariansformel for grupperte data (σ 2 ) = ∑ f(m Jeg – x̄) 2 /(n-1)

Populasjonsvariansformel for grupperte data (s 2 ) = ∑ f(m Jeg – x̄) 2 /n

hvor,

  • f er frekvensen til hvert intervall
  • m Jeg er midtpunktet av i-enthintervall
  • x er gjennomsnittet av de grupperte dataene

For grupperte data beregnes gjennomsnittet som,

Gjennomsnitt = ∑ (f Jeg x Jeg ) / ∑ f Jeg

Avviksformel for ugrupperte data

For ugrupperte data diskuteres variansformelen nedenfor,

  • Eksempelvariansformel for ugrupperte data (s 2 ) = ∑ (x Jeg – x̄) 2 /(n-1)
  • Populasjonsvariansformel for ugrupperte data (s 2 ) = ∑ (x Jeg – x̄) 2 /n

hvor x er gjennomsnittet av de grupperte dataene

Formel for beregning av varians

Formelen som brukes for å beregne variansen er diskutert i bildet nedenfor,

Variansformel

Hvordan beregne varians?

Generelt betyr varians populasjonsstandardvariasjon. Trinnene for å beregne variansen til et gitt sett med verdier er,

Trinn 1: Beregn gjennomsnittet av observasjonen ved å bruke formelen (Gjennomsnitt = sum av observasjoner/antall observasjoner)

Steg 2: Beregn de kvadrerte forskjellene mellom dataverdiene fra gjennomsnittet. (Dataverdi – gjennomsnitt)2

Trinn 3: Beregn gjennomsnittet av kvadrerte forskjeller av de gitte verdiene som kalles variansen til datasettet.

(Varians = sum av kvadratiske forskjeller / antall observasjoner)

Varians og standardavvik

Varians og Standardavvik begge er mål på den sentrale tendensen som brukes til å fortelle oss om i hvilken grad verdiene til datasettet avviker i forhold til den sentrale eller middelverdien til datasettet.

Det er en klar sammenheng mellom varians og standardavvik for et gitt datasett.

Varians = (Standardavvik) 2

Varians er definert som kvadratet av standardavviket, det vil si at å ta kvadratet av standardavviket for en hvilken som helst gruppe data gir oss variansen til det datasettet. varians defineres ved hjelp av symbolet s 2 mens s brukes til å definere standardavviket til datasettet. Variansen til datasettet er uttrykt i kvadratiske enheter mens standardavviket til datasettet er uttrykt i en enhet som ligner gjennomsnittet av datasettet.

Lære mer: Varians og standardavvik

Varians av binomial distribusjon

Binomial distribusjon er den diskrete sannsynlighetsfordelingen som forteller oss antall positive utfall i et binomialt eksperiment utført n antall ganger. Utfallet av det binomiale eksperimentet er 0 eller 1, dvs. enten positivt eller negativt.

I binomialeksperimentet til n forsøk og hvor sannsynligheten for hver prøve er gitt s , så er variansen til binomialfordelingen gitt ved å bruke,

s 2 = np (1 – p)

hvor 'f.eks' er definert som gjennomsnittet av verdiene til binomialfordelingen.

Varians av poisondistribusjon

Giftfordeling er definert som en diskret sannsynlighetsfordeling som brukes til å definere sannsynligheten for 'n' antall hendelser som skjer innenfor 'x' tidsperioden. Gjennomsnittet i Poisson-fordelingen er definert av symbolet l.

I Poisson-fordelingen er gjennomsnittet og variansen til det gitte datasettet like. Variansen til Poisson-fordelingen er gitt ved hjelp av formelen,

s 2 = λ

Varians av enhetlig distribusjon

I en enhetlig fordeling er sannsynlighetsfordelingsdataene kontinuerlige. Resultatet i disse eksperimentene ligger i området mellom en spesifikk øvre grense og en spesifikk nedre grense, og derfor kalles disse fordelingene også rektangulære distribusjoner. Hvis den øvre grensen eller maksimumsgrensen er b og den nedre grensen eller minimumsgrensen er a, så beregnes variansen til den ensartede fordelingen ved å bruke formelen,

s 2 = (1/12)(b – a) 2

Gjennomsnittet av den jevne fordelingen er gitt ved hjelp av formelen,

Gjennomsnitt = (b + a) / 2

hvor,

  • b er den øvre grensen for den jevne fordelingen
  • en er den nedre grensen for den jevne fordelingen

Varians og kovarians

Varians av datasettet definerer volatiliteten til alle verdiene til datasettet i forhold til gjennomsnittsverdien til datasettet. Kovarians forteller oss hvordan de tilfeldige variablene er relatert til hverandre, og den forteller oss hvordan endringen i en variabel påvirker endringen i andre variabler.

Kovarians kan være positiv eller negativ, den positive kovariansen betyr at begge variablene beveger seg i samme retning med hensyn til middelverdien, mens negativ kovarians betyr at begge variablene beveger seg i motsatte retninger i forhold til middelverdien.

For to tilfeldige variabler x og y hvor x er den avhengige variabelen og y er den uavhengige variabelen, beregnes kovariansen ved å bruke formelen nevnt i det vedlagte bildet nedenfor.

Kovariansformel

Avviksegenskaper

Varians er mye brukt i matematikk, statistikk og andre vitenskapsgrener for en rekke formål. Varians har ulike egenskaper som er mye brukt for å løse ulike problemer. Noen av de grunnleggende egenskapene til variansen er,

  • Varians av datasettet er den ikke-negative mengden og nullverdien av variansen betyr at alle verdiene til datasettet er like.
  • En høyere verdi av variansen forteller oss at alle dataverdiene til datasettet er vidt spredt, det vil si at de er langt unna gjennomsnittsverdien til datasettet.
  • En lavere verdi av variansen forteller oss at alle dataverdiene til datasettet er nær hverandre, det vil si at de er veldig nærme gjennomsnittsverdien til datasettet.

For enhver konstant 'c'

  • Var(x + c) = Var(x)

hvor x er en tilfeldig variabel

  • Var(cx) = c2

hvor x er en tilfeldig variabel

Også hvis en og b er den konstante verdien og x er en tilfeldig variabel da,

  • Var(ax + b) = a2

For uavhengige variabler x1, x2, x3…,xnvi vet det,

  • Hvor(x1+ x2+……+ xn) = Var(x1) + Hvor(x2) +……..+Hvor(xn)

Folk leser også:

  • Mener
  • Modus
  • Forskjellen mellom varians og standardavvik

Eksempler på variansformel

Eksempel 1: Beregn variansen til prøvedataene: 7, 11, 15, 19, 24.

Løsning:

Vi har dataene 7, 11, 15, 19, 24

Finn gjennomsnittet av dataene.

x̄ = (7 + 11 + 15 + 19 + 24)/5
= 76/5
= 15,2

Ved å bruke formelen for varians får vi,

maur vs maven

s2= ∑ (xJeg– x̄)2/(n – 1)
= (67,24 + 17,64 + 0,04 + 14,44 + 77,44)/(5 – 1)
= 176,8/4
= 44,2

Eksempel 2: Beregn antall observasjoner hvis variansen av data er 12 og summen av kvadrerte forskjeller av data fra gjennomsnittet er 156.

Løsning:

Vi har,

(xJeg– x̄)2= 156

s2= 12

Ved å bruke formelen for varians får vi,

s2= ∑ (xJeg– x̄)2/n

12 = 156/n

n = 156/12

n = 13

Eksempel 3: Beregn variansen for de gitte dataene

xJeg

fJeg

10 1
4 3
6 5
8 1

Løsning:

Gjennomsnitt (x̄) = ∑(fJegxJeg)/∑(fJeg)

= (10×1 + 4×3 + 6×5 + 8×1)/(1+3+5+1)
= 60/10 = 6

n = ∑(fJeg) = 1+3+5+1 = 10

xJeg

fJeg

fJegxJeg

(xJeg– x̄)

(xJeg– x̄)2

fJeg(xJeg– x̄)2

10 1 10 4 16 16
4 3 12 -2 4 12
6 5 30 0 0 0
8 1 8 2 4 8

Nå,

s 2 = (∑ Jeg n f Jeg (x Jeg – x̄) 2 /n)

= [(16 + 12 + 0 +8)/10]
= 3,6

Varians(σ2) = 3,6

Eksempel 4: Finn variansen til følgende datatabell

Klasse

Frekvens

0-10 3
10-20 6
20-30 4
30-40 2
40-50 1

Løsning:

Klasse

Xi

fJeg

f×Xi

Xi – μ

(Xi – μ)2

f×(Xi – μ)2

0-10

5

3

femten

-femten

225

675

10-20

femten

6

90

-5

25

150

20-30

25

4

100

skuespiller zeenat aman

5

25

100

30-40

35

2

70

femten

225

450

40-50

Fire fem

1

Fire fem

25

625

625

Total

16

320

2000

Gjennomsnitt (μ) = ∑(fi xi)/∑(fi)
= 320/16 = 20

s 2 = (∑ Jeg n f Jeg (x Jeg – m) 2 /n)

= [(2000)/(16)]
= (125)

Variansen til gitt datasett er 125.

Sammendrag – Varians

Varians er et statistisk mål som viser hvor mye verdiene i et datasett avviker fra gjennomsnittet. Det hjelper oss å forstå spredningen eller spredningen av datapunkter. Det er to hovedtyper av varians: populasjonsvarians, som måler hvordan datapunkter i en hel populasjon sprer seg, og utvalgsvarians, som måler hvordan datapunkter i et utvalg sprer seg. Varians er angitt med σ² og er kvadratet av standardavviket. For å beregne varians, finner du gjennomsnittet av dataene, trekker gjennomsnittet fra hvert datapunkt, kvadrerer forskjellene og midler deretter gjennomsnittet av disse kvadratiske forskjellene. Varians er viktig fordi det hjelper oss å forstå variabiliteten i et datasett. En høy varians indikerer at datapunkter er vidt spredt, mens en lav varians indikerer at de er nær gjennomsnittet. Varians er alltid ikke-negativ siden det innebærer å kvadrere forskjellene.

Vanlige spørsmål om varians

Hva er varians i statistikk?

Varians er definert som spredningen av verdiene til datasettet i forhold til gjennomsnittsverdien til datasettet. Variansen til datasettet forteller i hvilken grad verdiene i et bestemt datasett sprer seg fra middelverdien.

Hva er symbolet på varians?

Vi bruker symbolene σ2, s2 og Var(x) for å angi variansen til datasettet.

Hva er variansformelen?

Variansen til datasettet beregnes ved hjelp av formelen,

s 2 = E[( X – m ) 2 ]

Hva forteller Varians?

Varians brukes til å finne omfanget av spredningen av dataene, dvs. den forteller oss hvordan verdiene i et datasett er spredt ut i forhold til middelverdien. For den større variansverdien er verdiene vidt spredt med hensyn til middelverdien, mens med hensyn til den mindre variansverdien er verdiene tett spredt med hensyn til middelverdien

Hva er forholdet mellom varians og standardavvik?

For det gitte datasettet er variansen til datasettet kvadratet på standardavviket til det datasettet. Denne sammenhengen er uttrykt som

Varians = (Standardavvik) 2

Hvordan beregner du varians?

For å beregne varians finner du først gjennomsnittet (gjennomsnittet) av datasettet. Deretter trekker du gjennomsnittet fra hvert datapunkt og kvadrerer resultatet. Til slutt, gjennomsnitt disse kvadratiske forskjellene.

Hvorfor er varians viktig?

Varians er avgjørende for å forstå distribusjonen av data i et datasett. Det hjelper med å bestemme hvor spredt datapunktene er fra gjennomsnittsverdien, noe som indikerer variasjonen eller konsistensen i dataene.

Hva er forskjellen mellom varians og standardavvik?

Mens både varians og standardavvik måler dataspredning, er standardavviket kvadratroten av variansen. Standardavvik uttrykkes i samme enheter som dataene, noe som gjør det mer tolkbart for å angi spredning.

Kan varians være negativ?

Nei, varians kan ikke være negativ. Siden den beregnes som gjennomsnittet av kvadrerte forskjeller fra gjennomsnittet, er den resulterende verdien alltid ikke-negativ.