I forrige emne lærte vi overvåket maskinlæring der modeller trenes ved å bruke merkede data under veiledning av treningsdata. Men det kan være mange tilfeller der vi ikke har merket data og trenger å finne de skjulte mønstrene fra det gitte datasettet. Så for å løse slike typer tilfeller i maskinlæring, trenger vi uovervåket læringsteknikker.
Hva er uovervåket læring?
Som navnet antyder, er uovervåket læring en maskinlæringsteknikk der modeller ikke overvåkes ved hjelp av opplæringsdatasett. I stedet finner modellene selv de skjulte mønstrene og innsiktene fra de gitte dataene. Det kan sammenlignes med læring som foregår i menneskehjernen mens man lærer nye ting. Det kan defineres som:
hva er regex java
Uovervåket læring er en type maskinlæring der modeller trenes opp ved hjelp av umerket datasett og har lov til å handle på disse dataene uten tilsyn.
Uovervåket læring kan ikke brukes direkte på et regresjons- eller klassifiseringsproblem, fordi i motsetning til overvåket læring har vi inngangsdata, men ingen tilsvarende utdata. Målet med uovervåket læring er å finn den underliggende strukturen til datasettet, grupper disse dataene etter likheter, og representer datasettet i et komprimert format .
Eksempel: Anta at den uovervåkede læringsalgoritmen får et input-datasett som inneholder bilder av forskjellige typer katter og hunder. Algoritmen trenes aldri på det gitte datasettet, noe som betyr at den ikke har noen anelse om funksjonene til datasettet. Oppgaven til den uovervåkede læringsalgoritmen er å identifisere bildefunksjonene på egenhånd. Uovervåket læringsalgoritme vil utføre denne oppgaven ved å gruppere bildedatasettet i gruppene i henhold til likheter mellom bildene.
Hvorfor bruke uovervåket læring?
Nedenfor er noen hovedårsaker som beskriver viktigheten av uovervåket læring:
- Uovervåket læring er nyttig for å finne nyttig innsikt fra dataene.
- Uovervåket læring ligner mye på at et menneske lærer å tenke etter sine egne erfaringer, noe som gjør det nærmere den virkelige AI.
- Uovervåket læring fungerer på umerkede og ukategoriserte data som gjør uovervåket læring viktigere.
- I den virkelige verden har vi ikke alltid inndata med tilsvarende utdata, så for å løse slike tilfeller trenger vi uovervåket læring.
Arbeid av uovervåket læring
Arbeid med uovervåket læring kan forstås av diagrammet nedenfor:
jframe
Her har vi tatt en umerket inngangsdata, noe som betyr at den ikke er kategorisert og tilsvarende utganger er heller ikke gitt. Nå mates disse umerkede inndataene til maskinlæringsmodellen for å trene dem. For det første vil den tolke rådataene for å finne de skjulte mønstrene fra dataene og deretter bruke passende algoritmer som k-betyr klynging, beslutningstre, etc.
Når den bruker den passende algoritmen, deler algoritmen inn dataobjektene i grupper i henhold til likhetene og forskjellene mellom objektene.
Typer uovervåket læringsalgoritme:
Algoritmen for uovervåket læring kan videre kategoriseres i to typer problemer:
Merk: Vi vil lære disse algoritmene i senere kapitler.
Uovervåket læringsalgoritmer:
Nedenfor er listen over noen populære uovervåkede læringsalgoritmer:
Fordeler med uovervåket læring
- Uovervåket læring brukes til mer komplekse oppgaver sammenlignet med veiledet læring fordi vi i uovervåket læring ikke har merket inndata.
- Uovervåket læring er å foretrekke siden det er lett å få umerket data sammenlignet med merkede data.
Ulemper ved uovervåket læring
- Uovervåket læring er i seg selv vanskeligere enn veiledet læring, da den ikke har tilsvarende effekt.
- Resultatet av den uovervåkede læringsalgoritmen kan være mindre nøyaktig ettersom inngangsdata ikke er merket, og algoritmer ikke vet den nøyaktige utgangen på forhånd.