logo

Veiledet maskinlæring

Overvåket læring er typene maskinlæring der maskiner trenes ved å bruke godt 'merkede' treningsdata, og på grunnlag av disse dataene forutsier maskiner produksjonen. De merkede dataene betyr at noen inndata allerede er merket med riktig utdata.

Ved overvåket læring fungerer treningsdataene som leveres til maskinene som veilederen som lærer maskinene å forutsi utgangen riktig. Det gjelder det samme konseptet som en student lærer i veiledning av læreren.

Overvåket læring er en prosess for å gi inndata så vel som korrekte utdata til maskinlæringsmodellen. Målet med en overvåket læringsalgoritme er å finn en tilordningsfunksjon for å kartlegge inngangsvariabelen(x) med utdatavariabelen(y) .

"hva er forskjellen mellom en løve og en tiger"

I den virkelige verden kan veiledet læring brukes til Risikovurdering, bildeklassifisering, svindeldeteksjon, spamfiltrering , etc.

Hvordan fungerer veiledet læring?

I veiledet læring trenes modeller ved hjelp av merket datasett, der modellen lærer om hver type data. Når treningsprosessen er fullført, testes modellen på grunnlag av testdata (en undergruppe av treningssettet), og deretter forutsier den resultatet.

Arbeidet med veiledet læring kan lett forstås av eksemplet og diagrammet nedenfor:

Veiledet maskinlæring

Anta at vi har et datasett med forskjellige typer former som inkluderer kvadrat, rektangel, trekant og polygon. Nå er det første trinnet at vi må trene modellen for hver form.

  • Hvis den gitte formen har fire sider, og alle sidene er like, vil den bli merket som en Torget .
  • Hvis den gitte formen har tre sider, vil den bli merket som en triangel .
  • Hvis den gitte formen har seks like sider, vil den bli merket som sekskant .

Nå, etter trening, tester vi modellen vår ved hjelp av testsettet, og modellens oppgave er å identifisere formen.

Maskinen er allerede trent på alle typer former, og når den finner en ny form, klassifiserer den formen på bunnen av en rekke sider, og forutsier resultatet.

Trinn involvert i veiledet læring:

  • Først Bestem typen treningsdatasett
  • Samle inn/samle de merkede treningsdataene.
  • Del opplæringsdatasettet inn i trening datasett, testdatasett og valideringsdatasett .
  • Bestem inngangsfunksjonene til treningsdatasettet, som skal ha nok kunnskap slik at modellen kan forutsi resultatet nøyaktig.
  • Bestem den passende algoritmen for modellen, for eksempel støttevektormaskin, beslutningstre, etc.
  • Utfør algoritmen på treningsdatasettet. Noen ganger trenger vi valideringssett som kontrollparametere, som er undersettet av treningsdatasett.
  • Evaluer nøyaktigheten til modellen ved å gi testsettet. Hvis modellen forutsier riktig utgang, betyr det at modellen vår er nøyaktig.

Typer overvåkede maskinlæringsalgoritmer:

Veiledet læring kan videre deles inn i to typer problemer:

hva er modulo i c++
Veiledet maskinlæring

1. Regresjon

Regresjonsalgoritmer brukes hvis det er en sammenheng mellom inngangsvariabelen og utgangsvariabelen. Den brukes til prediksjon av kontinuerlige variabler, som værvarsling, markedstrender, osv. Nedenfor er noen populære regresjonsalgoritmer som er under overvåket læring:

  • Lineær regresjon
  • Regresjonstrær
  • Ikke-lineær regresjon
  • Bayesiansk lineær regresjon
  • Polynomregresjon

2. Klassifisering

java-logo

Klassifiseringsalgoritmer brukes når utdatavariabelen er kategorisk, noe som betyr at det er to klasser som Ja-Nei, Mannlig-Kvinnelig, Sann-falsk, etc.

Spamfiltrering,

  • Tilfeldig skog
  • Beslutningstrær
  • Logistisk regresjon
  • Støtte vektormaskiner

Merk: Vi vil diskutere disse algoritmene i detalj i senere kapitler.

Fordeler med veiledet læring:

  • Ved hjelp av veiledet læring kan modellen forutsi resultatet på grunnlag av tidligere erfaringer.
  • I veiledet læring kan vi ha en nøyaktig ide om objektklassene.
  • Veiledet læringsmodell hjelper oss å løse ulike reelle problemer som f.eks svindeldeteksjon, spamfiltrering , etc.

Ulemper med veiledet læring:

  • Veiledede læringsmodeller er ikke egnet for å håndtere de komplekse oppgavene.
  • Overvåket læring kan ikke forutsi riktig utgang hvis testdataene er forskjellig fra treningsdatasettet.
  • Trening krevde mange beregningstider.
  • I veiledet læring trenger vi nok kunnskap om objektklassene.