logo

Maskinlæringsalgoritmer

Maskinlæringsalgoritmer er beregningsmodeller som lar datamaskiner forstå mønstre og forutsi eller foreta vurderinger basert på data uten behov for eksplisitt programmering. Disse algoritmene danner grunnlaget for moderne kunstig intelligens og brukes i et bredt spekter av applikasjoner, inkludert bilde- og talegjenkjenning, naturlig språkbehandling, anbefalingssystemer, svindeldeteksjon, autonome biler etc.

Dette Maskinlæringsalgoritmer artikkelen vil dekke alle de essensielle algoritmene for maskinlæring som Støtte vektormaskin, beslutningstaking, logistikkregresjon, naiv bayees-klassifisering, tilfeldig skog, k-mean clustering, forsterkningslæring, vektor, hierarkisk clustering, xgboost, adaboost, logistikk, etc.



Typer maskinlæringsalgoritmer

Det finnes tre typer maskinlæringsalgoritmer.

  1. Veiledet læring
    • Regresjon
    • Klassifisering
  2. Uovervåket læring
  3. Forsterkende læring

Typer maskinlæringsalgoritmer

SIM-kort satt inn men ingen tjeneste android

1. Overvåket læringsalgoritme

Veiledet læring er en type maskinlæringsalgoritmer der vi brukte merket datasett for å trene modellen eller algoritmene. Målet med algoritmen er å lære en kartlegging fra inngangsdata til utdataetiketter, slik at den kan lage spådommer eller klassifiseringer på nye, usynlige data.

Overvåket maskinlæringsalgoritmer

  1. Lineær modell:
    • Regresjon
      • Vanlig minste kvadratiske regresjon
      • Enkel lineær regresjon
      • Multippel lineær regresjon
      • Polynomregresjon
      • Ortogonal Matching Pursuit (OMP)
      • Bayesiansk regresjon
      • Kvantile regresjon
      • Isotonisk regresjon
      • Trinnvis regresjon
      • Regresjon med minste vinkel (LARS)
    • Klassifisering:
    • Regulering :
      • Lasso (L1-regularisering)
      • Ridge (L2-regularisering)
        • Ridge regresjon
        • Ridge Classifier
      • Elastisk nett
      • LARS Lasso
  2. K-Nærmeste Naboer (KNN):
    • Brute Force Algoritmer
    • Ball Tree og KD Tree Algoritmer
    • K-Nærmeste Naboer (KNN) Klassifisering
    • K-Nærmeste Naboer (KNN) Regressor
  3. Støtte vektormaskiner:
    • Støtte Vector Machines Regressor
    • Ulike kjernefunksjoner i SVM
  4. Stokastisk gradientnedstigning
    • Stokastisk Gradient Descent Classifier
    • Stokastisk Gradient Descent Regressor
    • Ulike tapsfunksjoner i SGD
  5. Beslutningstre:
    • Decision Tree Algoritms
      • Iterative Dichotomiser 3 (ID3) Algoritmer
      • C5. Algoritmer
      • Klassifiserings- og regresjonstræralgoritmer
    • Decision Tree Classifier
    • Beslutningstreregressor
  6. Ensemble læring:
    • Bagging (Bootstrap Aggregating)
    • Forsterkning
      • AdaBoost
      • XGBoost
      • CatBoost
      • Gradient Boosting Machines (GBM)
      • LightGBM
    • Stabling
  7. Generativ modell
    • Naiv Bayes
      • Gaussisk naiv Bayes
      • Multinomial naive Bayes
      • Bernoulli Naive Bayes
    • Gaussiske prosesser
      • Gaussisk prosessregresjon (GPR)
      • Gaussisk prosessklassifisering (GPC)
    • Gaussisk diskriminerende analyse
      • Lineær diskrimineringsanalyse (LDA)
      • Quadratic Discriminant Analysis (QDA)
    • Bayesian Belief Networks
    • Skjulte Markov-modeller (HMM)
  8. Tidsserieprognoser:
    • Tidsserievisualisering og analyse:
      • Tidsseriekomponenter: Trend, sesongvariasjon og støy
      • Tidsseriedekomponeringsteknikker
      • Sesongjustering og forskjell
      • Autokorrelasjon og delvis autokorrelasjonsfunksjoner
      • Utvidet Dickey-Fuller-test
      • Sesongmessig dekomponering av tidsserier (STL-dekomponering)
      • Box-Jenkins metodikk for ARIMA-modeller
    • Algoritmer for tidsserieprognoser:
      • Glidende gjennomsnitt (MA) og vektet glidende gjennomsnitt
      • Eksponentielle utjevningsmetoder (enkel, dobbel og trippel)
      • Autoregressive (AR) modeller
      • Glidende gjennomsnitt (MA) modeller
      • Autoregressive Integrated Moving Average (ARIMA) modeller
      • Sesongmessig dekomponering av tidsserier av Loess (STL)
      • Seasonal Autoregressive Integrated Moving Average (SARIMA)-modeller
      • ARIMAX og SARIMAX-modeller
  9. Overvåket dimensjonsreduksjonsteknikk:
    • Lineær diskrimineringsanalyse (LDA)

Noen av de overvåkede maskinlæringsalgoritmene kan brukes til både klassifisering og regresjon med litt modifikasjoner

  • Multiclass og multioutput algoritmer:
    • Flerklasseklassifisering
      • OneVsRest Classifier
    • Multilabel klassifisering
    • Multioutput regresjon

Beregninger for klassifiserings- og regresjonsalgoritmer:

  • Regresjonsberegninger:
    • Gjennomsnittlig kvadratfeil (MSE)
    • Root mean squared error (RMSE)
    • Gjennomsnittlig absolutt feil (MAE)
    • R-kvadrat
    • Justert R-kvadrat
  • Klassifiseringsberegninger:
  • Sannsynlighetskalibrering
    • Kalibreringskurver
    • Kalibrerer en klassifiserer

Kryssvalideringsteknikk:

  • K-fold kryssvalidering
  • Stratifisert k-fold kryssvalidering
  • Utelat kryssvalidering
  • Shuffle Split Kryssvalidering
  • Kryssvalidering av tidsserier

Optimaliseringsteknikk:

  • Gradient Nedstigning
    • Stokastisk gradientnedstigning
    • Mini-batch Gradient Descent
    • Momentum-basert Gradient Descent
  • Newton-baserte optimaliseringsteknikker
    • Newtons algoritme
    • Kvasi-Newton-metoder (BFGS, L-BFGS)
    • Konjugert gradient
  • Lokale søkeoptimaliseringsteknikker
    • Bakkeklatring
    • Tabu-søk

2. Uovervåket læringsalgoritme

Uovervåket læring er en type maskinlæringsalgoritmer der algoritmene brukes til å finne mønstrene, strukturen eller forholdet i et datasett ved hjelp av umerket datasett. Den utforsker dataens iboende struktur uten forhåndsdefinerte kategorier eller etiketter.

java sammenknytte strenger

Algoritmer for maskinlæring uten tilsyn

  • Gruppering
    • Centroid-baserte metoder
    • Distribusjonsbaserte metoder
    • Tilkoblingsbaserte metoder
      • Hierarkisk klynging
        • Agglomerativ gruppering
        • Splittende gruppering
      • Affinitetsforplantning
    • Tetthetsbaserte metoder
      • DBSCAN (densitetsbasert romlig klynging av applikasjoner med støy)
      • OPTIKK (bestillingspunkter for å identifisere klyngestrukturen)
  • Foreningen Regel Gruvedrift
    • Apriori-algoritme
    • FP-Growth (Hyppig Pattern-Growth)
    • ECLAT (Equivalence Class Clustering og bottom-up Lattice Traversal)
  • Anomalideteksjon:
    • Z-score
    • Local Outlier Factor (LOF)
    • Isolasjonsskogen
  • Dimensjonsreduksjonsteknikk:
    • Hovedkomponentanalyse (PCA)
    • t-distribuert Stokastisk Neighbor Embedding (t-SNE)
    • Ikke-negativ matrisefaktorisering (NMF)
    • Uavhengig komponentanalyse (ICA)
    • Faktor analyse
    • Latent Dirichlet Allocation (LDA)
    • Isomap
    • Locally Linear Embedding (LLE)
    • Latent semantisk analyse (LSA)

3. Forsterkende læring

Forsterkende læring er en type maskinlæringsalgoritmer der en agent lærer å ta suksessive beslutninger ved å samhandle med omgivelsene. Agenten mottar tilbakemeldingen i form av insentiver eller straff basert på handlingene dens. Agentens formål er å oppdage optimale taktikker som maksimerer kumulative belønninger over tid gjennom prøving og feiling. Forsterkende læring brukes ofte i scenarier der agenten må lære å navigere i et miljø, spille spill, administrere roboter eller foreta vurderinger i usikre situasjoner.

Forsterkende læring

  • Modellbaserte metoder:
    • Markov beslutningsprosesser (MDPs)
    • Bellman-ligningen
    • Verdi iterasjonsalgoritme
    • Monte Carlo Tree Search
  • Modellfrie metoder:
    • Verdibaserte metoder:
      • Q-læring
      • SAUS
      • Monte Carlo-metoder
    • Policybaserte metoder:
      • FORSTERK algoritme
      • Skuespillerkritisk algoritme
    • Skuespillerkritiske metoder
      • Asynchronous Advantage Actor-Critic (A3C)

Liste over populære maskinlæringsalgoritmer

Her er en liste over de 10 mest populære maskinlæringsalgoritmene.

1. Lineær regresjon

Lineær regresjon er en enkel algoritme som brukes til å kartlegge det lineære forholdet mellom inputfunksjoner og en kontinuerlig målvariabel. Det fungerer ved å tilpasse en linje til dataene og deretter bruke linjen til å forutsi nye verdier.

2. Logistisk regresjon

Logistisk regresjon er en utvidelse av lineær regresjon som brukes til klassifiseringsoppgaver for å estimere sannsynligheten for at en forekomst tilhører en bestemt klasse.

3. SVM (Support Vector Machine)

SVM-er er overvåkede læringsalgoritmer som kan utføre klassifiserings- og regresjonsoppgaver. Den finner et hyperplan som best skiller klasser i funksjonsrom.

4. KNN (K-nærmeste nabo)

KNN er en ikke-parametrisk teknikk som kan brukes til klassifisering så vel som regresjon. Det fungerer ved å identifisere de k mest like datapunktene til et nytt datapunkt og deretter forutsi etiketten til det nye datapunktet ved å bruke etikettene til disse datapunktene.

5. Beslutningstre

Beslutningstrær er en type veiledet læringsteknikk som kan brukes til klassifisering så vel som regresjon. Den opererer ved å segmentere dataene i mindre og mindre grupper inntil hver gruppe kan klassifiseres eller forutsies med høy grad av nøyaktighet.

6. Tilfeldig skog

Tilfeldige skoger er en type ensemblelæringsmetode som bruker et sett med beslutningstrær for å lage spådommer ved å samle spådommer fra individuelle trær. Det forbedrer presisjonen og motstandskraften til enkeltbeslutningstrær. Den kan brukes til både klassifiserings- og regresjonsoppgaver.

document.queryselector

7. Naive Bayes

Naive Bayes er en sannsynlighetsklassifisering basert på Bayes' teorem som brukes til klassifiseringsoppgaver. Det fungerer ved å anta at funksjonene til et datapunkt er uavhengige av hverandre.

8. PCA (Principal Component Analysis)

PCA er en dimensjonsreduksjonsteknikk som brukes til å transformere data til et rom med lavere dimensjoner, samtidig som det beholder så mye variasjon som mulig. Det fungerer ved å finne retningene i dataene som inneholder mest variasjon, og deretter projisere dataene på disse retningene.

9. Apriori-algoritmer

Apriori-algoritme er en tradisjonell datautvinningsteknikk for utvinning av assosiasjonsregler i transaksjonsdatabaser eller datasett. Den er designet for å avdekke koblinger og mønstre mellom ting som regelmessig oppstår samtidig i transaksjoner. Apriori oppdager hyppige varesett, som er grupper av varer som vises sammen i transaksjoner med et gitt minimumsstøttenivå.

10. K-Means Clustering

K-Means clustering er en uovervåket læringstilnærming som kan brukes til å gruppere datapunkter. Det fungerer ved å finne k klynger i dataene slik at datapunktene i hver klynge er så like hverandre som mulig, samtidig som de forblir så forskjellige som mulig fra datapunktene i andre klynger.

syreegenskaper i dbms

Oppdag de grunnleggende konseptene som driver maskinlæring ved å lære topp 10 algoritmer , slik som lineær regresjon, beslutningstrær og nevrale nettverk.

Maskinlæringsalgoritme – vanlige spørsmål

1. Hva er en algoritme i maskinlæring?

Maskinlæringsalgoritmer er teknikker basert på statistiske konsepter som gjør det mulig for datamaskiner å lære av data, oppdage mønstre, lage spådommer eller fullføre oppgaver uten behov for eksplisitt programmering. Disse algoritmene er bredt klassifisert i de tre typene, dvs. overvåket læring, uovervåket læring og forsterkende læring.

2. Hva er typer maskinlæring?

Det er hovedsakelig tre typer maskinlæring:

  • Overvåket algoritme
  • Algoritme uten tilsyn
  • Forsterkningsalgoritme

3. Hvilken ML-algoritme er best for prediksjon?

Den ideelle maskinlæringsmetoden for prediksjon bestemmes av en antall kriterier , inkludert typen av problemet, typen data og de unike kravene. Support Vector Machines, Random Forests og Gradient Boosting-tilnærminger er populære for prediksjonsarbeidsmengder. Valget av en algoritme bør derimot baseres på testing og evaluering av det spesifikke problemet og datasettet.

4. Hva er de 10 populære maskinlæringsalgoritmene?

Nedenfor er listen over de 10 mest brukte algoritmene for maskinlæring (ML):

  1. Lineær regresjon
  2. Logistisk regresjon
  3. SVM (Support Vector Machine)
  4. KNN (K-nærmeste nabo)
  5. Beslutningstre
  6. Tilfeldig skog
  7. Naiv Bayes
  8. PCA (Principal Component Analysis)
  9. Apriori-algoritmer
  10. K-Means Clustering