logo

Maskinlæring uten tilsyn

I forrige emne lærte vi overvåket maskinlæring der modeller trenes ved å bruke merkede data under veiledning av treningsdata. Men det kan være mange tilfeller der vi ikke har merket data og trenger å finne de skjulte mønstrene fra det gitte datasettet. Så for å løse slike typer tilfeller i maskinlæring, trenger vi uovervåket læringsteknikker.

Hva er uovervåket læring?

Som navnet antyder, er uovervåket læring en maskinlæringsteknikk der modeller ikke overvåkes ved hjelp av opplæringsdatasett. I stedet finner modellene selv de skjulte mønstrene og innsiktene fra de gitte dataene. Det kan sammenlignes med læring som foregår i menneskehjernen mens man lærer nye ting. Det kan defineres som:

hva er regex java
Uovervåket læring er en type maskinlæring der modeller trenes opp ved hjelp av umerket datasett og har lov til å handle på disse dataene uten tilsyn.

Uovervåket læring kan ikke brukes direkte på et regresjons- eller klassifiseringsproblem, fordi i motsetning til overvåket læring har vi inngangsdata, men ingen tilsvarende utdata. Målet med uovervåket læring er å finn den underliggende strukturen til datasettet, grupper disse dataene etter likheter, og representer datasettet i et komprimert format .

Eksempel: Anta at den uovervåkede læringsalgoritmen får et input-datasett som inneholder bilder av forskjellige typer katter og hunder. Algoritmen trenes aldri på det gitte datasettet, noe som betyr at den ikke har noen anelse om funksjonene til datasettet. Oppgaven til den uovervåkede læringsalgoritmen er å identifisere bildefunksjonene på egenhånd. Uovervåket læringsalgoritme vil utføre denne oppgaven ved å gruppere bildedatasettet i gruppene i henhold til likheter mellom bildene.

Veiledet maskinlæring

Hvorfor bruke uovervåket læring?

Nedenfor er noen hovedårsaker som beskriver viktigheten av uovervåket læring:

  • Uovervåket læring er nyttig for å finne nyttig innsikt fra dataene.
  • Uovervåket læring ligner mye på at et menneske lærer å tenke etter sine egne erfaringer, noe som gjør det nærmere den virkelige AI.
  • Uovervåket læring fungerer på umerkede og ukategoriserte data som gjør uovervåket læring viktigere.
  • I den virkelige verden har vi ikke alltid inndata med tilsvarende utdata, så for å løse slike tilfeller trenger vi uovervåket læring.

Arbeid av uovervåket læring

Arbeid med uovervåket læring kan forstås av diagrammet nedenfor:

jframe
Veiledet maskinlæring

Her har vi tatt en umerket inngangsdata, noe som betyr at den ikke er kategorisert og tilsvarende utganger er heller ikke gitt. Nå mates disse umerkede inndataene til maskinlæringsmodellen for å trene dem. For det første vil den tolke rådataene for å finne de skjulte mønstrene fra dataene og deretter bruke passende algoritmer som k-betyr klynging, beslutningstre, etc.

Når den bruker den passende algoritmen, deler algoritmen inn dataobjektene i grupper i henhold til likhetene og forskjellene mellom objektene.

Typer uovervåket læringsalgoritme:

Algoritmen for uovervåket læring kan videre kategoriseres i to typer problemer:

Veiledet maskinlæring
    Gruppering: Clustering er en metode for å gruppere objektene i klynger slik at objekter med flest likheter forblir i en gruppe og har mindre eller ingen likheter med objektene til en annen gruppe. Klyngeanalyse finner fellestrekkene mellom dataobjektene og kategoriserer dem i henhold til tilstedeværelsen og fraværet av disse fellestrekkene.assosiasjon: En assosiasjonsregel er en uovervåket læringsmetode som brukes for å finne sammenhenger mellom variabler i den store databasen. Det bestemmer settet med elementer som forekommer sammen i datasettet. Assosiasjonsregel gjør markedsføringsstrategi mer effektiv. For eksempel folk som kjøper X-vare (anta at et brød) har også en tendens til å kjøpe Y-vare (smør/syltetøy). Et typisk eksempel på assosiasjonsregel er Market Basket Analysis.

Merk: Vi vil lære disse algoritmene i senere kapitler.

Uovervåket læringsalgoritmer:

Nedenfor er listen over noen populære uovervåkede læringsalgoritmer:

    K-betyr gruppering KNN (k-nærmeste naboer) Hierarkisk klynging Anomalideteksjon Nevrale nettverk Prinsippkomponentanalyse Uavhengig komponentanalyse Apriori-algoritme Enkeltverdidekomponering

Fordeler med uovervåket læring

  • Uovervåket læring brukes til mer komplekse oppgaver sammenlignet med veiledet læring fordi vi i uovervåket læring ikke har merket inndata.
  • Uovervåket læring er å foretrekke siden det er lett å få umerket data sammenlignet med merkede data.

Ulemper ved uovervåket læring

  • Uovervåket læring er i seg selv vanskeligere enn veiledet læring, da den ikke har tilsvarende effekt.
  • Resultatet av den uovervåkede læringsalgoritmen kan være mindre nøyaktig ettersom inngangsdata ikke er merket, og algoritmer ikke vet den nøyaktige utgangen på forhånd.