Lineær regresjon og logistisk regresjon er de to kjente maskinlæringsalgoritmene som kommer under overvåket læringsteknikk. Siden begge algoritmene er av overvåket natur, bruker disse algoritmene merket datasett for å lage spådommene. Men hovedforskjellen mellom dem er hvordan de brukes. Den lineære regresjonen brukes til å løse regresjonsproblemer, mens logistisk regresjon brukes til å løse klassifiseringsproblemene. Beskrivelsen av begge algoritmene er gitt nedenfor sammen med differansetabellen.
Lineær regresjon:
- Lineær regresjon er en av de enkleste maskinlæringsalgoritmene som kommer under overvåket læringsteknikk og brukes til å løse regresjonsproblemer.
- Den brukes til å forutsi den kontinuerlige avhengige variabelen ved hjelp av uavhengige variabler.
- Målet med den lineære regresjonen er å finne den beste tilpasningslinjen som nøyaktig kan forutsi utgangen for den kontinuerlige avhengige variabelen.
- Hvis en enkelt uavhengig variabel brukes til prediksjon, kalles den enkel lineær regresjon, og hvis det er mer enn to uavhengige variabler, kalles en slik regresjon som multippel lineær regresjon.
- Ved å finne den beste tilpasningslinjen, etablerer algoritmen forholdet mellom avhengig variabel og uavhengig variabel. Og forholdet bør være av lineær karakter.
- Utdata for lineær regresjon skal kun være de kontinuerlige verdiene som pris, alder, lønn osv. Forholdet mellom den avhengige variabelen og den uavhengige variabelen kan vises i bildet nedenfor:
I bildet ovenfor er den avhengige variabelen på Y-aksen (lønn) og den uavhengige variabelen er på x-aksen (erfaring). Regresjonslinjen kan skrives som:
y= a<sub>0</sub>+a<sub>1</sub>x+ ε
Hvor en0og a1er koeffisientene og ε er feilleddet.
Logistisk regresjon:
- Logistisk regresjon er en av de mest populære maskinlæringsalgoritmene som kommer under overvåket læringsteknikker.
- Den kan brukes til klassifisering så vel som for regresjonsproblemer, men brukes hovedsakelig til klassifiseringsproblemer.
- Logistisk regresjon brukes til å forutsi den kategoriske avhengige variabelen ved hjelp av uavhengige variabler.
- Utdata fra logistisk regresjonsproblem kan bare være mellom 0 og 1.
- Logistisk regresjon kan brukes der det kreves sannsynligheter mellom to klasser. Som om det vil regne i dag eller ikke, enten 0 eller 1, sant eller usant osv.
- Logistisk regresjon er basert på begrepet Maximum Likelihood-estimering. I følge dette estimatet skulle de observerte dataene være mest sannsynlige.
- Ved logistisk regresjon sender vi den vektede summen av innganger gjennom en aktiveringsfunksjon som kan kartlegge verdier mellom 0 og 1. Slik aktiveringsfunksjon er kjent som sigmoid funksjon og den oppnådde kurven kalles som sigmoid-kurve eller S-kurve. Tenk på bildet nedenfor:
- Ligningen for logistisk regresjon er:
Forskjellen mellom lineær regresjon og logistisk regresjon:
Lineær regresjon | Logistisk regresjon |
---|---|
Lineær regresjon brukes til å forutsi den kontinuerlige avhengige variabelen ved å bruke et gitt sett med uavhengige variabler. | Logistisk regresjon brukes til å forutsi den kategoriske avhengige variabelen ved å bruke et gitt sett med uavhengige variabler. |
Lineær regresjon brukes til å løse regresjonsproblem. | Logistisk regresjon brukes til å løse klassifikasjonsproblemer. |
I lineær regresjon predikerer vi verdien av kontinuerlige variabler. | I logistisk regresjon predikerer vi verdiene til kategoriske variabler. |
Ved lineær regresjon finner vi den beste tilpasningslinjen, som vi enkelt kan forutsi utgangen med. | I logistisk regresjon finner vi S-kurven som vi kan klassifisere prøvene etter. |
Minste kvadratisk estimeringsmetode brukes for estimering av nøyaktighet. | Maksimal sannsynlighetsestimeringsmetode brukes for estimering av nøyaktighet. |
Utdata for lineær regresjon må være en kontinuerlig verdi, som pris, alder osv. | Utdata fra logistisk regresjon må være en kategorisk verdi som 0 eller 1, Ja eller Nei, osv. |
Ved lineær regresjon kreves det at forholdet mellom avhengig variabel og uavhengig variabel må være lineært. | I logistisk regresjon er det ikke nødvendig å ha den lineære sammenhengen mellom den avhengige og uavhengige variabelen. |
Ved lineær regresjon kan det være kollinearitet mellom de uavhengige variablene. | Ved logistisk regresjon skal det ikke være kollinearitet mellom den uavhengige variabelen. |