Hyperparametere i maskinlæring er de parametrene som er eksplisitt definert av brukeren for å kontrollere læringsprosessen. Disse hyperparametrene brukes til å forbedre læringen av modellen, og verdiene deres settes før du starter læringsprosessen til modellen.
I dette emnet skal vi diskutere et av de viktigste konseptene for maskinlæring, dvs. hyperparametere, deres eksempler, hyperparameterinnstilling, kategorier av hyperparametere, hvordan hyperparameter er forskjellig fra parameter i maskinlæring? Men før vi begynner, la oss først forstå hyperparameteren.
Hva er hyperparametre?
I Machine Learning/Deep Learning er en modell representert ved sine parametere. I kontrast innebærer en treningsprosess å velge de beste/optimale hyperparametrene som brukes av å lære algoritmer for å gi det beste resultatet. Så, hva er disse hyperparametrene? Svaret er, ' Hyperparametere er definert som parametere som er eksplisitt definert av brukeren for å kontrollere læringsprosessen.'
Her antyder prefikset 'hyper' at parametrene er parametere på toppnivå som brukes til å kontrollere læringsprosessen. Verdien av hyperparameteren velges og stilles inn av maskinlæringsingeniøren før læringsalgoritmen begynner å trene modellen. Derfor er disse eksterne i forhold til modellen, og verdiene deres kan ikke endres under opplæringsprosessen .
telle distinkt
Noen eksempler på hyperparametre i maskinlæring
- K-en i kNN eller K-Nearest Neighbor-algoritmen
- Læringshastighet for å trene et nevralt nettverk
- Tog-test split ratio
- Partistørrelse, Gruppestørrelse
- Antall epoker
- Grener i beslutningstreet
- Antall klynger i Clustering Algorithm
Forskjellen mellom parameter og hyperparameter?
Det er alltid en stor forvirring mellom parametere og hyperparametere eller modellhyperparametre. Så, for å fjerne denne forvirringen, la oss forstå forskjellen mellom dem begge og hvordan de er relatert til hverandre.
Modellparametere:
Modellparametere er konfigurasjonsvariabler som er interne i modellen, og en modell lærer dem på egen hånd. For eksempel , W Vekter eller koeffisienter av uavhengige variabler i den lineære regresjonsmodellen . eller Vekter eller koeffisienter av uavhengige variabler i SVM, vekt og skjevheter i et nevralt nettverk, klynge centroid i klynging. Noen nøkkelpunkter for modellparametere er som følger:
- De brukes av modellen for å lage spådommer.
- De læres av modellen fra selve dataene
- Disse settes vanligvis ikke manuelt.
- Disse er delen av modellen og nøkkelen til en maskinlæringsalgoritme.
Modellhyperparametere:
Hyperparametere er de parametrene som er eksplisitt definert av brukeren for å kontrollere læringsprosessen. Noen nøkkelpunkter for modellparametere er som følger:
- Disse er vanligvis definert manuelt av maskinlæringsingeniøren.
- Man kan ikke vite den eksakte beste verdien for hyperparametere for det gitte problemet. Den beste verdien kan bestemmes enten ved hjelp av tommelfingerregelen eller ved prøving og feiling.
- Noen eksempler på hyperparametre er læringshastigheten for å trene et nevralt nettverk, K i KNN-algoritmen,
Kategorier av hyperparametre
Grovt sett kan hyperparametre deles inn i to kategorier, som er gitt nedenfor:
Hyperparameter for optimalisering
Prosessen med å velge de beste hyperparametrene som skal brukes er kjent som hyperparameterinnstilling, og innstillingsprosessen er også kjent som hyperparameteroptimalisering. Optimaliseringsparametere brukes for å optimalisere modellen.
Noen av de populære optimaliseringsparametrene er gitt nedenfor:
Merk: Læringshastighet er en avgjørende hyperparameter for å optimalisere modellen, så hvis det er et krav om å justere kun en enkelt hyperparameter, foreslås det å justere læringshastigheten.
Hyperparameter for spesifikke modeller
Hyperparametere som er involvert i strukturen til modellen er kjent som hyperparametre for spesifikke modeller. Disse er gitt nedenfor:
Det er viktig å spesifisere antall skjulte enheter hyperparameter for det nevrale nettverket. Det skal være mellom størrelsen på inngangslaget og størrelsen på utgangslaget. Mer spesifikt bør antallet skjulte enheter være 2/3 av størrelsen på inngangslaget, pluss størrelsen på utdatalaget.
For komplekse funksjoner er det nødvendig å spesifisere antall skjulte enheter, men det bør ikke overpasse modellen.
Konklusjon
Hyperparametere er parametrene som er eksplisitt definert for å kontrollere læringsprosessen før en maskinlæringsalgoritme brukes på et datasett. Disse brukes til å spesifisere læringskapasiteten og kompleksiteten til modellen. Noen av hyperparametrene brukes for optimalisering av modellene, slik som batchstørrelse, læringshastighet osv., og noen er spesifikke for modellene, som antall skjulte lag osv.