En boksgraf er et diagram som brukes til å vise informasjon i form av distribusjon ved å tegne boksplott for hver av dem. Denne fordelingen av data er basert på fem sett (minimum, første kvartil, median, tredje kvartil og maksimum).
Boxplotter inn R programmeringsspråk
Boxplot lages i R ved å bruke boxplot() funksjon.
Syntaks: boxplot(x, data, notch, varwidth, names, main)
Parametere:
x: Denne parameteren angis som en vektor eller en formel. data: Denne parameteren setter datarammen. notch: Denne parameteren er etiketten for horisontal akse. varwidth: Denne parameteren er en logisk verdi. Sett som sann for å tegne bredden på boksen i forhold til prøvestørrelsen. main: Denne parameteren er tittelen på diagrammet. navn: Denne parameteren er gruppeetikettene som vises under hvert boksplott.
Opprette et datasett
For å forstå hvordan vi kan lage et boxplot:
- Vi bruker datasettet mtcars.
- La oss se på kolonnene mpg og cyl i mtcars.
R
huffman-kodekode
input <- mtcars[,>c>(>'mpg'>,>'cyl'>)]> print>(>head>(input))> |
>
>
Produksjon:
mpg cyl Mazda RX4 21.0 6 Mazda RX4 Wag 21.0 6 Datsun 710 22.8 4 Hornet 4 Drive 21.4 6 Hornet Sportabout 18.7 8 Valiant 18.1 6>
Opprette Boxplot
Opprette Boxplot-grafen.
- Ta parametrene som kreves for å lage et boxplot.
- Nå tegner vi en graf for forholdet mellom mpg og cyl.
R
# Load the dataset> data>(mtcars)> # Create the box plot> boxplot>(disp ~ gear, data = mtcars,> >main =>'Displacement by Gear'>,> >xlab =>'Gear'>,> >ylab =>'Displacement'>)> |
>
>
Produksjon:

Bokstomt i R
Boksplott med hakk
Slik tegner du et boksplott med et hakk:
- Ved hjelp av Notch kan vi finne ut hvordan medianene til ulike datagrupper samsvarer med hverandre.
R
np.random.rand
# Load the dataset> data>(mtcars)> # Set up plot colors> my_colors <->c>(>'#FFA500'>,>'#008000'>,>'#1E90FF'>,>'#FF1493'>)> # Create the box plot with customized aesthetics> boxplot>(disp ~ gear, data = mtcars,> >main =>'Displacement by Gear'>, xlab =>'Gear'>, ylab =>'Displacement'>,> >col = my_colors, border =>'black'>, notch =>TRUE>, notchwidth = 0.5,> >medcol =>'white'>, whiskcol =>'black'>, boxwex = 0.5, outpch = 19,> >outcol =>'black'>)> # Add a legend> legend>(>'topright'>, legend =>unique>(mtcars$gear),> >fill = my_colors, border =>'black'>, title =>'Gear'>)> |
>
>
Produksjon:

Box Tomt i R
col: Bruker en vektor av farger (mine_farger) for å endre fyllfargen til boksene.
grenser: Setter fargen på bokskantene til svart.
hakk: For å illustrere konfidensintervaller er det lagt til et hakk i boksene.
hakkbredde: Administrerer hakkenes bredde.
medcol: Gjør medianlinjens farge hvit.
whiskcol: Setter værhårens farge til svart med whiskcol-kommandoen.
boxwex: Endrer boksenes bredde.
outpch : Setter uteliggeres former til solide sirkler.
outcol: Endrer fargen til uteliggere til svart.
Multiple Boxplot
Her lager vi flere boxplot. De individuelle dataene som det kreves en boxplot-representasjon for, er basert på funksjonen.
R
# Load the dataset> data>(mtcars)> # Define the variables for the box plots> variables <->c>(>'mpg'>,>'disp'>,>'hp'>,>'wt'>)> # Set up the plotting layout> par>(mfrow =>c>(1,>length>(variables)))> # Create the box plots> for>(var>in> variables) {> >boxplot>(>get>(var) ~ gear, data = mtcars,> >main =>paste>(>'Box Plot of'>, var),> >xlab =>'Gear'>,> >ylab = var,> >col =>'skyblue'>,> >border =>'black'>,> >notch =>TRUE>,> >notchwidth = 0.5,> >medcol =>'white'>,> >whiskcol =>'black'>,> >boxwex = 0.5,> >outpch = 19,> >outcol =>'black'>)> }> # Reset the plotting layout> par>(mfrow =>c>(1, 1))> |
>
binær søkepython
>
Produksjon:

Flere boksplotter i R
- I denne koden begynner vi med å liste variablene i variabelvektoren som vi ønsker å lage boksplott for. Jeg har lagt til mpg, disp, hp og wt i dette eksemplet, men du kan endre denne listen for å passe dine behov.
- Kartoppsettet lages deretter ved å bruke par-funksjonen og syntaksen mfrow = c(1, lengde(variabler)), som genererer et rutenett med én rad og like mange kolonner som det er variabler i variabelvektoren.
- Vi bruker boxplot-funksjonen inne i loopen for å generere et boxplott for hver variabel. Get(var)-funksjonen trekker dynamisk de samsvarende kolonneverdiene fra datasettet. Ved å bruke de gitte innstillingene endrer vi hvert boksplotts utseende.