logo

Nominelle vs ordinære data

Datavitenskap dreier seg om behandling og analyse av data ved å bruke en rekke verktøy og teknikker. I dagens datadrevne verden kommer vi over typer data som hver krever håndtering og tolkning. Det er viktig å forstå ulike typer data for riktig dataanalyse og statistisk tolkning. Datatypen bestemmer de riktige statistiske metodene og operasjonene som skal brukes. Ulike datatyper trenger ulike analyse- og tolkningsmetoder for å trekke vesentlige konklusjoner. I denne artikkelen vil vi utforske begrepet data, og dets betydning gir eksempler fra den virkelige verden, og veileder deg gjennom måter å jobbe med det på.

Målenivåer

Før du analyserer et datasett, er det avgjørende å identifisere hvilken type data det inneholder. Heldigvis kan alle data grupperes i en av fire kategorier: nominelle, ordinære, intervall- eller forholdsdata. Selv om disse ofte omtales som datatyper, er de faktisk forskjellige målenivåer. Målenivået reflekterer nøyaktigheten som en variabel har blitt kvantifisert med, og det bestemmer metodene som kan brukes for å trekke ut innsikt fra dataene.



De fire kategoriene av data er ikke alltid enkle å skille og tilhører i stedet et hierarki, hvor hvert nivå bygger på det foregående.

1

Det er fire typer data: kategorisk, som kan deles videre inn i nominell og ordinær, og numerisk, som kan deles videre inn i intervall og forhold. De nominelle og ordinære skalaene er relativt upresise, noe som gjør dem lettere å analysere, men de gir mindre nøyaktige innsikter. På den annen side er intervall- og forholdsskalaene mer komplekse og vanskelige å analysere, men de har potensial til å gi mye rikere innsikt.



  • Nominelle data – Nominelle data er en grunnleggende datatype som kategoriserer data ved å merke eller navngi verdier som kjønn, hårfarge eller dyretyper. Den har ikke noe hierarki.
  • Ordinaldata – Ordinaldata innebærer å klassifisere data basert på rangering, for eksempel sosial status i kategorier som «rik», «middelinntekt» eller «fattig». Det er imidlertid ingen faste intervaller mellom disse kategoriene.
  • Intervalldata – Intervalldata er en måte å organisere og sammenligne data på som inkluderer målte intervaller. Temperaturskalaer, som Celsius eller Fahrenheit, er gode eksempler på intervalldata. Intervalldata har imidlertid ikke en sann null, noe som betyr at en måling av null fortsatt kan representere et kvantifiserbart mål (som null grader Celsius, som bare er et annet punkt på skalaen og faktisk ikke betyr at det ikke er noen temperatur tilstede) .
  • Forholdsdata – Det mest intrikate målenivået er forholdsdata. I likhet med intervalldata, kategoriserer og ordner den data ved å bruke målte intervaller. Men i motsetning til intervalldata inkluderer forholdsdata en ekte null. Når en variabel er null, er det ingen tilstedeværelse av den variabelen. En førsteklasses illustrasjon av forholdsdata er høydemåling, som ikke kan være negativ.

Hva er nominelle data?

Kategoriske data, også kjent som nominelle data, er en viktig type informasjon som brukes i ulike felt som forskning, statistikk og dataanalyse. Den består av kategorier eller etiketter som hjelper til med å klassifisere og ordne data. Det vesentlige ved kategoriske data er at de ikke har noen iboende rekkefølge eller rangering blant kategoriene. I stedet er disse kategoriene separate, distinkte og gjensidig utelukkende.

2

For eksempel brukes nominelle data til å klassifisere informasjon i distinkte etiketter eller kategorier uten noen naturlig rekkefølge eller rangering. Disse etikettene eller kategoriene er representert ved hjelp av navn eller termer, og det er ingen naturlig rekkefølge eller rangering blant dem. Nominelle data er nyttige for kvalitativ klassifisering og organisering av informasjon, slik at forskere og analytikere kan gruppere datapunkter basert på spesifikke attributter eller egenskaper uten å antyde noen numeriske sammenhenger.



  • Øyefargekategorier som blå eller grønn representerer nominelle data. Hver kategori er distinkt, uten rekkefølge eller rangering.
  • Smarttelefonmerker som iPhone eller Samsung er nominelle data. Det er ikke noe hierarki mellom merker.
  • Transportmåter som bil eller sykkel er nominelle data. De er diskrete kategorier uten iboende rekkefølge.

Kjennetegn på nominelle data

  • Data som er klassifisert som nominelle består av kategorier som er helt atskilte og forskjellige fra hverandre.
  • Data som faller inn under den nominelle kategorien er kjennetegnet ved beskrivende etiketter i stedet for noen numerisk eller kvantitativ verdi
  • Nominelle data kan ikke rangeres eller sorteres hierarkisk, siden ingen kategori er bedre eller dårligere enn en annen.

Eksempel

Her er noen eksempler på hvordan nominelle data brukes til å klassifisere og kategorisere informasjon i distinkte og ikke-ordnede kategorier:

1. Farger på bil: Bilfarger er nominelle data, med klare kategorier, men ingen iboende rekkefølge eller rangering. Hver bil faller inn under én fargekategori, uten noen logisk eller numerisk sammenheng mellom farger.

2. Typer frukt: Fruktkategorier i en kurv er nominelle. Hver frukt tilhører en bestemt kategori uten hierarki eller rekkefølge. Alle kategorier er distinkte og diskrete.

3. Filmsjangre: Filmsjangre er nominelle data siden det ikke er noen rangering blant kategorier som action eller komedie. Hver sjanger er unik, men vi kan ikke si om en er bedre enn en annen basert på disse dataene alene.

Hva er Ordinal Data?

Ordinaldata er en form for kvalitative data som klassifiserer variabler i beskrivende kategorier. Den kjennetegnes ved at kategoriene den benytter er rangert på en slags hierarkisk skala, for eksempel fra høy til lav. Ordinaldata er den nest mest kompliserte typen målinger, etter nominelle data. Selv om det er mer intrikat enn nominelle data, som mangler noen iboende rekkefølge, er det fortsatt relativt forenklet.

3

Ordinaldata er for eksempel en type data som brukes til å kategorisere elementer med et meningsfylt hierarki eller rekkefølge. Disse kategoriene hjelper oss med å sammenligne og rangere ulike prestasjoner, posisjoner eller prestasjoner til elever, selv om intervallene mellom dem ikke er like. Ordinaldata er nyttig for å forstå ordnede valg eller preferanser og for å vurdere relative forskjeller.

  • Skolekarakterer: Karakterer som A, B, C er ordinære data, rangert etter prestasjoner, men intervallene mellom dem varierer.
  • Utdanningsnivå: Nivåer som videregående skole, bachelor, master er ordinære data, sortert etter utdanning, men gapene mellom nivåene varierer.
  • Ansiennitetsnivå: Jobbnivåer som entry, mid, senior er ordinære data, som indikerer hierarki, men gapet varierer etter jobb og bransje.

Kjennetegn ved ordinære data

  • Ordinaldata faller inn under kategorien ikke-numeriske og kategoriske data, men de kan fortsatt bruke numeriske verdier som etiketter.
  • Ordinaldata er alltid rangert i et hierarki (derav navnet 'ordinal').
  • Ordinaldata kan rangeres, men verdiene er ikke jevnt fordelt.
  • Med ordinaldata kan du beregne frekvensfordeling, modus, median og rekkevidde av variabler.

Eksempel

Her er noen eksempler på hvordan ordinære data brukes i felt og domener:

1. Utdanningsnivåer: Ordinaldata brukes ofte for å representere utdanningsnivåer, for eksempel skole, bachelorgrad, mastergrad og Ph.D. Disse nivåene har en rekkefølge.

2. Kundetilfredshetsvurderinger: En annen anvendelse av data er i kundetilfredshetsundersøkelser. Disse undersøkelsene ber ofte respondentene vurdere opplevelsen sin på en skala, fra dårlig til utmerket.

3. Økonomiske klasser: klasser inkludert klasse middelklasse og overklasse kan klassifiseres som ordinære data basert på deres rangering.

Disse eksemplene viser hvordan ordinære data brukes på tvers av felt og domener.

Nominelle vs ordinære data

Kjennetegn

Nominelle data

Ordinaldata

Arten av kategorier

Distinkt og diskret

Diskret og distinkt

Ordre/rangering

Ingen iboende rekkefølge

Har en klar rekkefølge eller rangering

Numeriske verdier

Ingen meningsfulle tallverdier

Ingen meningsfulle tallverdier

Analyseteknikker

Frekvenstellinger, prosenter, søylediagrammer

Rangering, median, ikke-parametriske tester, ordnede søylediagrammer, ordinal regresjon

Eksempel

Farger, kjønn, dyretyper

hva er en monitor

Skolekarakterer, utdanningsnivå, ansiennitetsnivå

Tolkning

Brukes for klassifisering og gruppering basert på kategori

Brukes for å vurdere ordnede preferanser, hierarki eller rangeringer