logo

Typer maskinlæring

Maskinlæring er en undergruppe av AI, som gjør at maskinen automatisk kan lære av data, forbedre ytelsen fra tidligere erfaringer og komme med spådommer . Maskinlæring inneholder et sett med algoritmer som fungerer på en enorm mengde data. Data mates til disse algoritmene for å trene dem, og på grunnlag av trening bygger de modellen og utfører en spesifikk oppgave.

Typer maskinlæring

Disse ML-algoritmene hjelper til med å løse forskjellige forretningsproblemer som regresjon, klassifisering, prognoser, gruppering og assosiasjoner, etc.

Basert på metodene og måten å lære på er maskinlæring delt inn i hovedsakelig fire typer, som er:

  1. Veiledet maskinlæring
  2. Maskinlæring uten tilsyn
  3. Semi-overvåket maskinlæring
  4. Forsterkende læring
Typer maskinlæring

I dette emnet vil vi gi en detaljert beskrivelse av typene maskinlæring sammen med deres respektive algoritmer:

1. Overvåket maskinlæring

Som navnet antyder, Overvåket maskinlæring er basert på tilsyn. Det betyr at i veiledet læringsteknikk trener vi maskinene ved å bruke det 'merkede' datasettet, og basert på opplæringen forutsier maskinen resultatet. Her spesifiserer de merkede dataene at noen av inngangene allerede er kartlagt til utgangen. Mer dyrebart kan vi si; først trener vi maskinen med inndata og tilsvarende utdata, og deretter ber vi maskinen om å forutsi utgangen ved hjelp av testdatasettet.

La oss forstå veiledet læring med et eksempel. Anta at vi har et input-datasett med bilder av katter og hunder. Så først vil vi gi opplæringen til maskinen for å forstå bildene, for eksempel form og størrelse på halen til katt og hund, form på øyne, farge, høyde (hunder er høyere, katter er mindre), etc. Etter fullført trening legger vi inn bildet av en katt og ber maskinen identifisere objektet og forutsi resultatet. Nå er maskinen godt trent, så den vil sjekke alle egenskapene til objektet, som høyde, form, farge, øyne, ører, hale osv., og finne ut at det er en katt. Så den vil plassere den i Cat-kategorien. Dette er prosessen for hvordan maskinen identifiserer objektene i overvåket læring.

Hovedmålet med veiledet læringsteknikk er å kartlegge inngangsvariabelen(x) med utdatavariabelen(y). Noen virkelige anvendelser av veiledet læring er Risikovurdering, svindeloppdagelse, søppelpostfiltrering, etc.

Kategorier for overvåket maskinlæring

Overvåket maskinlæring kan klassifiseres i to typer problemer, som er gitt nedenfor:

    Klassifisering Regresjon

a) Klassifisering

Klassifikasjonsalgoritmer brukes til å løse klassifiseringsproblemene der utdatavariabelen er kategorisk, for eksempel ' Ja eller nei, mann eller kvinne, rød eller blå osv . Klassifiseringsalgoritmene forutsier kategoriene som finnes i datasettet. Noen virkelige eksempler på klassifiseringsalgoritmer er Spamdeteksjon, e-postfiltrering osv.

Noen populære klassifiseringsalgoritmer er gitt nedenfor:

    Tilfeldig skogalgoritme Decision Tree Algoritme Logistisk regresjonsalgoritme Støtte Vector Machine Algorithm

b) Regresjon

Regresjonsalgoritmer brukes til å løse regresjonsproblemer der det er en lineær sammenheng mellom inngangs- og utdatavariabler. Disse brukes til å forutsi kontinuerlige produksjonsvariabler, som markedstrender, værprediksjon, etc.

Noen populære regresjonsalgoritmer er gitt nedenfor:

    Enkel lineær regresjonsalgoritme Multivariat regresjonsalgoritme Decision Tree Algoritme Lasso-regresjon

Fordeler og ulemper med veiledet læring

Fordeler:

  • Siden veiledet læring arbeid med det merkede datasettet slik at vi kan ha en nøyaktig ide om objektklassene.
  • Disse algoritmene er nyttige for å forutsi resultatet på grunnlag av tidligere erfaring.

Ulemper:

  • Disse algoritmene er ikke i stand til å løse komplekse oppgaver.
  • Den kan forutsi feil utgang hvis testdataene er forskjellig fra treningsdataene.
  • Det krever mye beregningstid å trene algoritmen.

Anvendelser av veiledet læring

Noen vanlige bruksområder for veiledet læring er gitt nedenfor:

    Bildesegmentering:
    Overvåket læringsalgoritmer brukes i bildesegmentering. I denne prosessen utføres bildeklassifisering på forskjellige bildedata med forhåndsdefinerte etiketter.Medisinsk diagnose:
    Overvåkede algoritmer brukes også i det medisinske feltet for diagnoseformål. Det gjøres ved å bruke medisinske bilder og tidligere merkede data med etiketter for sykdomstilstander. Med en slik prosess kan maskinen identifisere en sykdom for de nye pasientene.Svindeloppdagelse -Supervised Learning klassifiseringsalgoritmer brukes for å identifisere svindeltransaksjoner, svindelkunder osv. Det gjøres ved å bruke historiske data for å identifisere mønstrene som kan føre til mulig svindel.Spamdeteksjon -I spam-deteksjon og -filtrering brukes klassifiseringsalgoritmer. Disse algoritmene klassifiserer en e-post som spam eller ikke spam. Spam-e-postene sendes til spam-mappen.Talegjenkjenning -Overvåkede læringsalgoritmer brukes også i talegjenkjenning. Algoritmen trenes opp med stemmedata, og ulike identifiseringer kan gjøres ved hjelp av det samme, som stemmeaktiverte passord, talekommandoer osv.

2. Maskinlæring uten tilsyn

Uovervåket læring g er forskjellig fra veiledet læringsteknikk; som navnet antyder, er det ikke behov for tilsyn. Det betyr at i uovervåket maskinlæring trenes maskinen ved å bruke det umerkede datasettet, og maskinen forutsier utdataene uten tilsyn.

Ved uovervåket læring trenes modellene med data som verken er klassifisert eller merket, og modellen handler på disse dataene uten tilsyn.

Hovedmålet med den uovervåkede læringsalgoritmen er å gruppere eller kategorisere det usorterte datasettet i henhold til likheter, mønstre og forskjeller. Maskiner blir bedt om å finne de skjulte mønstrene fra inndatadatasettet.

La oss ta et eksempel for å forstå det mer verdifullt; anta at det er en kurv med fruktbilder, og vi legger den inn i maskinlæringsmodellen. Bildene er totalt ukjente for modellen, og maskinens oppgave er å finne mønstrene og kategoriene til objektene.

Så nå vil maskinen oppdage sine mønstre og forskjeller, for eksempel fargeforskjell, formforskjell, og forutsi resultatet når den testes med testdatasettet.

Kategorier for uovervåket maskinlæring

Uovervåket læring kan videre klassifiseres i to typer, som er gitt nedenfor:

    Gruppering assosiasjon

1) Klynger

Klyngeteknikken brukes når vi ønsker å finne de iboende gruppene fra dataene. Det er en måte å gruppere objektene i en klynge slik at objektene med flest likheter forblir i én gruppe og har færre eller ingen likheter med objektene til andre grupper. Et eksempel på klyngealgoritmen er å gruppere kundene etter deres kjøpsatferd.

Noen av de populære klyngealgoritmene er gitt nedenfor:

    K-Means Clustering-algoritme Mean-shift algoritme DBSCAN-algoritme Hovedkomponentanalyse Uavhengig komponentanalyse

2) Forening

Assosiasjonsregellæring er en uovervåket læringsteknikk, som finner interessante relasjoner mellom variabler i et stort datasett. Hovedmålet med denne læringsalgoritmen er å finne avhengigheten til ett dataelement av et annet dataelement og kartlegge disse variablene deretter, slik at det kan generere maksimal fortjeneste. Denne algoritmen brukes hovedsakelig i Market Basket analyse, gruvedrift av nettbruk, kontinuerlig produksjon , etc.

Noen populære algoritmer for læring av assosiasjonsregler er Apriori-algoritme, Eclat, FP-vekstalgoritme.

Fordeler og ulemper med uovervåket læringsalgoritme

Fordeler:

  • Disse algoritmene kan brukes til kompliserte oppgaver sammenlignet med de overvåkede fordi disse algoritmene fungerer på det umerkede datasettet.
  • Uovervåkede algoritmer er å foretrekke for ulike oppgaver, da det er enklere å få det umerkede datasettet sammenlignet med det merkede datasettet.

Ulemper:

  • Utdata fra en uovervåket algoritme kan være mindre nøyaktig ettersom datasettet ikke er merket, og algoritmer er ikke trent med den nøyaktige utgangen i tidligere.
  • Å jobbe med uovervåket læring er vanskeligere siden det fungerer med det umerkede datasettet som ikke kartlegger med utdata.

Anvendelser av uovervåket læring

    Nettverksanalyse:Uovervåket læring brukes til å identifisere plagiat og opphavsrett i dokumentnettverksanalyse av tekstdata for vitenskapelige artikler.Anbefalingssystemer:Anbefalingssystemer bruker i stor grad uovervåkede læringsteknikker for å bygge anbefalingsapplikasjoner for forskjellige nettapplikasjoner og e-handelsnettsteder.Anomalideteksjon:Anomalideteksjon er en populær applikasjon av uovervåket læring, som kan identifisere uvanlige datapunkter i datasettet. Den brukes til å oppdage uredelige transaksjoner.Enkeltverdidekomponering:Singular Value Decomposition eller SVD brukes til å trekke ut bestemt informasjon fra databasen. For eksempel å trekke ut informasjon om hver bruker som befinner seg på et bestemt sted.

3. Semi-veiledet læring

Semi-overvåket læring er en type maskinlæringsalgoritme som ligger mellom overvåket og uovervåket maskinlæring . Den representerer mellomtinget mellom overvåket (med merkede opplæringsdata) og uovervåket læring (uten merket opplæringsdata) algoritmer og bruker kombinasjonen av merkede og umerkede datasett i løpet av opplæringsperioden.

EN Selv om semi-veiledet læring er mellomveien mellom veiledet og uovervåket læring og opererer på dataene som består av noen få etiketter, består den for det meste av umerkede data. Siden etiketter er kostbare, men for bedriftsformål, kan de ha få etiketter. Det er helt forskjellig fra veiledet og uovervåket læring, da de er basert på tilstedeværelse og fravær av etiketter.

For å overvinne ulempene med veiledet læring og uovervåket læringsalgoritmer, introduseres konseptet med semi-overvåket læring . Hovedmålet med semi-veiledet læring er å effektivt bruke alle tilgjengelige data, i stedet for bare merkede data som i veiledet læring. Til å begynne med blir lignende data gruppert sammen med en uovervåket læringsalgoritme, og videre hjelper det å merke de umerkede dataene til merkede data. Det er fordi merket data er en relativt dyrere anskaffelse enn umerkede data.

Vi kan forestille oss disse algoritmene med et eksempel. Veiledet læring er der en student er under veiledning av en instruktør hjemme og på college. Videre, hvis den studenten selv analyserer det samme konseptet uten hjelp fra instruktøren, kommer det under uovervåket læring. Under semi-veiledet læring må studenten revidere seg selv etter å ha analysert det samme konseptet under veiledning av en instruktør ved høgskolen.

Fordeler og ulemper med semi-veiledet læring

Fordeler:

  • Det er enkelt og lett å forstå algoritmen.
  • Det er svært effektivt.
  • Den brukes til å løse ulempene ved overvåket og uovervåket læringsalgoritmer.

Ulemper:

  • Iterasjonsresultater er kanskje ikke stabile.
  • Vi kan ikke bruke disse algoritmene på data på nettverksnivå.
  • Nøyaktigheten er lav.

4. Forsterkende læring

Forsterkende læring fungerer på en tilbakemeldingsbasert prosess, der en AI-agent (en programvarekomponent) automatisk utforsker omgivelsene ved å trykke og spore, ta handling, lære av erfaringer og forbedre ytelsen. Agent blir belønnet for hver god handling og blir straffet for hver dårlig handling; derfor er målet med forsterkende læringsagent å maksimere belønningene.

I forsterkende læring er det ingen merket data som overvåket læring, og agenter lærer kun av sine erfaringer.

java stack

Læringsprosessen for forsterkning ligner på et menneske; for eksempel lærer et barn forskjellige ting ved opplevelser i det daglige livet. Et eksempel på forsterkende læring er å spille et spill, der spillet er miljøet, bevegelser til en agent ved hvert trinn definerer tilstander, og målet til agenten er å få en høy poengsum. Agent får tilbakemelding når det gjelder straff og belønning.

På grunn av sin måte å jobbe på, er forsterkende læring ansatt i ulike felt som f.eks Spillteori, operasjonsforskning, informasjonsteori, multiagentsystemer.

Et forsterkende læringsproblem kan formaliseres ved hjelp av Markov Decision Process (MDP). I MDP interagerer agenten konstant med miljøet og utfører handlinger; ved hver handling reagerer miljøet og genererer en ny tilstand.

Kategorier for forsterkende læring

Forsterkende læring kategoriseres hovedsakelig i to typer metoder/algoritmer:

    Positiv forsterkende læring:Positiv forsterkende læring spesifiserer å øke tendensen til at den nødvendige atferden vil oppstå igjen ved å legge til noe. Det forsterker styrken til oppførselen til agenten og påvirker den positivt.Negativ forsterkende læring:Negativ forsterkende læring fungerer stikk motsatt av den positive RL. Det øker tendensen til at den spesifikke atferden vil oppstå igjen ved å unngå den negative tilstanden.

Reelle brukstilfeller av forsterkende læring

    Videospill:
    RL-algoritmer er mye populære i spillapplikasjoner. Den brukes til å oppnå overmenneskelig ytelse. Noen populære spill som bruker RL-algoritmer er AlphaGO og AlphaGO Zero .Ressursforvaltning:
    Papiret 'Ressursstyring med dyp forsterkningslæring' viste at hvordan man bruker RL i datamaskiner for automatisk å lære og planlegge ressurser til å vente på forskjellige jobber for å minimere gjennomsnittlig nedgang i jobben.Robotikk:
    RL er mye brukt i robotapplikasjoner. Roboter brukes i industri- og produksjonsområdet, og disse robotene gjøres kraftigere med forsterkningslæring. Det er forskjellige bransjer som har sin visjon om å bygge intelligente roboter ved hjelp av AI og maskinlæringsteknologi.Tekstgruvedrift
    Tekstmining, en av de store applikasjonene til NLP, implementeres nå ved hjelp av Reinforcement Learning av Salesforce-selskapet.

Fordeler og ulemper med forsterkende læring

Fordeler

  • Det hjelper med å løse komplekse problemer i den virkelige verden som er vanskelige å løse med generelle teknikker.
  • Læringsmodellen til RL ligner på læringen til mennesker; derfor kan de mest nøyaktige resultatene bli funnet.
  • Hjelper med å oppnå langsiktige resultater.

Ulempe

  • RL-algoritmer er ikke foretrukket for enkle problemer.
  • RL-algoritmer krever enorme data og beregninger.
  • For mye forsterkende læring kan føre til en overbelastning av tilstander som kan svekke resultatene.

Dimensjonalitetens forbannelse begrenser forsterkende læring for ekte fysiske systemer.