logo

R – Datarammer

R programmeringsspråk er et programmeringsspråk med åpen kildekode som er mye brukt som et statistisk programvare- og dataanalyseverktøy. Datarammer i R Language er generiske dataobjekter av R som brukes til å lagre tabelldata.

Datarammer kan også tolkes som matriser der hver kolonne i en matrise kan være av forskjellige datatyper. R DataFrame består av tre hovedkomponenter, data, rader og kolonner.



R Datarammestruktur

Som du kan se på bildet nedenfor, er det slik en dataramme er bygget opp.

Dataene presenteres i tabellform, noe som gjør det enklere å betjene og forstå.

R - Data FramesGeeksforgeeks

R – Datarammer



Opprett dataramme i R programmeringsspråk

For å lage en R-dataramme bruk Dataramme() funksjon og deretter sende hver av vektorene du har laget som argumenter til funksjonen.

R






# R program to create dataframe> # creating a data frame> friend.data <->data.frame>(> >friend_id =>c>(1:5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,> >'Dravid'>,>'Sehwag'>,> >'Dhoni'>),> >stringsAsFactors =>FALSE> )> # print the data frame> print>(friend.data)>

>

>

Produksjon:

 friend_id friend_name 1 1 Sachin 2 2 Sourav 3 3 Dravid 4 4 Sehwag 5 5 Dhoni>

Få strukturen til R-datarammen

Man kan få strukturen til R-datarammen ved hjelp av str() funksjon i R.

Den kan vise til og med den interne strukturen til store lister som er nestet. Den gir one-liner-utgang for de grunnleggende R-objektene som lar brukeren vite om objektet og dets bestanddeler.

R




python lagre json til fil

# R program to get the> # structure of the data frame> # creating a data frame> friend.data <->data.frame>(> >friend_id =>c>(1:5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,> >'Dravid'>,>'Sehwag'>,> >'Dhoni'>),> >stringsAsFactors =>FALSE> )> # using str()> print>(>str>(friend.data))>

>

>

Produksjon:

'data.frame': 5 obs. of 2 variables:  $ friend_id : int 1 2 3 4 5  $ friend_name: chr 'Sachin' 'Sourav' 'Dravid' 'Sehwag' ... NULL>

Sammendrag av data i R-datarammen

I R-datarammen kan den statistiske oppsummeringen og arten av data fås ved å søke sammendrag() funksjon.

Det er en generisk funksjon som brukes til å lage resultatoppsummeringer av resultatene fra ulike modelltilpasningsfunksjoner. Funksjonen påkaller spesielle metoder som avhenger av klassen til det første argumentet.

R




# R program to get the> # summary of the data frame> # creating a data frame> friend.data <->data.frame>(> >friend_id =>c>(1:5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,> >'Dravid'>,>'Sehwag'>,> >'Dhoni'>),> >stringsAsFactors =>FALSE> )> # using summary()> print>(>summary>(friend.data))>

>

>

Produksjon:

 friend_id friend_name   Min. :1 Length:5   1st Qu.:2 Class :character   Median :3 Mode :character   Mean :3   3rd Qu.:4   Max. :5>

Trekk ut data fra dataramme i R

Å trekke ut data fra en R-dataramme betyr at for å få tilgang til radene eller kolonnene. Man kan trekke ut en spesifikk kolonne fra en R-dataramme ved å bruke kolonnenavnet.

R




# R program to extract> # data from the data frame> # creating a data frame> friend.data <->data.frame>(> >friend_id =>c>(1:5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,> >'Dravid'>,>'Sehwag'>,> >'Dhoni'>),> >stringsAsFactors =>FALSE> )> # Extracting friend_name column> result <->data.frame>(friend.data$friend_name)> print>(result)>

>

>

Produksjon:

 friend.data.friend_name 1 Sachin 2 Sourav 3 Dravid 4 Sehwag 5 Dhoni>

Utvid Data Frame i R Language

En dataramme i R kan utvides ved å legge til nye kolonner og rader til den allerede eksisterende R-datarammen.

R


parallell behandling



# R program to expand> # the data frame> # creating a data frame> friend.data <->data.frame>(> >friend_id =>c>(1:5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,> >'Dravid'>,>'Sehwag'>,> >'Dhoni'>),> >stringsAsFactors =>FALSE> )> # Expanding data frame> friend.data$location <->c>(>'Kolkata'>,>'Delhi'>,> >'Bangalore'>,>'Hyderabad'>,> >'Chennai'>)> resultant <- friend.data> # print the modified data frame> print>(resultant)>

>

>

Produksjon:

 friend_id friend_name location 1 1 Sachin Kolkata 2 2 Sourav Delhi 3 3 Dravid Bangalore 4 4 Sehwag Hyderabad 5 5 Dhoni Chennai>

I R kan man utføre ulike typer operasjoner på en dataramme som tilgang til rader og kolonner, velge delsett av datarammen, redigere datarammer, slette rader og kolonner i en dataramme , etc.

Vennligst se DataFrame-operasjoner i R å vite om alle typer operasjoner som kan utføres på en dataramme.

Få tilgang til elementer i R Data Frame

Vi kan velge og få tilgang til ethvert element fra dataramme ved å bruke enkelt$>, parentes[ ] or>doble parenteser[[]]>for å få tilgang til kolonner fra en dataramme.

R




# creating a data frame> friend.data <->data.frame>(> >friend_id =>c>(1:5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,> >'Dravid'>,>'Sehwag'>,> >'Dhoni'>),> >stringsAsFactors =>FALSE> )> # Access Items using []> friend.data[1]> # Access Items using [[]]> friend.data[[>'friend_name'>]]> # Access Items using $> friend.data$friend_id>

>

>

Produksjon:

 friend_id 1 1 2 2 3 3 4 4 5 5 Access Items using [[]] [1] 'Sachin' 'Sourav' 'Dravid' 'Sehwag' 'Dhoni'   Access Items using $ [1] 1 2 3 4 5>

Antall rader og kolonner

Vi kan finne ut hvor mange rader og kolonner parsant i vår dataramme ved å bruke dim funksjon.

R




# creating a data frame> friend.data <->data.frame>(> >friend_id =>c>(1:5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,> >'Dravid'>,>'Sehwag'>,> >'Dhoni'>),> >stringsAsFactors =>FALSE> )> # find out the number of rows and clumns> dim>(friend.data)>

>

>

Produksjon:

[1] 5 2>

Legg til rader og kolonner i R Data Frame

Du kan enkelt legge til rader og kolonner i en R DataFrame. Innsetting hjelper til med å utvide den allerede eksisterende DataFrame, uten å trenge en ny.

La oss se på hvordan du legger til rader og kolonner i en DataFrame? med et eksempel:

Legg til rader i R Data Frame

For å legge til rader i en dataramme kan du bruke en innebygd funksjon rbind().

hvordan endre streng til int

Følgende eksempel demonstrerer hvordan rbind() fungerer i R Data Frame.

R




# Creating a dataframe representing products in a store> Products <->data.frame>(> >Product_ID =>c>(101, 102, 103),> >Product_Name =>c>(>'T-Shirt'>,>'Jeans'>,>'Shoes'>),> >Price =>c>(15.99, 29.99, 49.99),> >Stock =>c>(50, 30, 25)> )> # Print the existing dataframe> cat>(>'Existing dataframe (Products): '>)> print>(Products)> # Adding a new row for a new product> New_Product <->c>(104,>'Sunglasses'>, 39.99, 40)> Products <->rbind>(Products, New_Product)> # Print the updated dataframe after adding the new product> cat>(>' Updated dataframe after adding a new product: '>)> print>(Products)>

>

>

Produksjon:

Existing dataframe (Products):   Product_ID Product_Name Price Stock 1 101 T-Shirt 15.99 50 2 102 Jeans 29.99 30 3 103 Shoes 49.99 25  Updated dataframe after adding a new product:   Product_ID Product_Name Price Stock 1 101 T-Shirt 15.99 50 2 102 Jeans 29.99 30 3 103 Shoes 49.99 25 4 104 Sunglasses 39.99 40>

Legg til kolonner i R Data Frame

For å legge til kolonner i en dataramme kan du bruke en innebygd funksjon cbind().

Følgende eksempel demonstrerer hvordan cbind() fungerer i R Data Frame .

R




# Existing dataframe representing products in a store> Products <->data.frame>(> >Product_ID =>c>(101, 102, 103),> >Product_Name =>c>(>'T-Shirt'>,>'Jeans'>,>'Shoes'>),> >Price =>c>(15.99, 29.99, 49.99),> >Stock =>c>(50, 30, 25)> )> # Print the existing dataframe> cat>(>'Existing dataframe (Products): '>)> print>(Products)> # Adding a new column for 'Discount' to the dataframe> Discount <->c>(5, 10, 8)># New column values for discount> Products <->cbind>(Products, Discount)> # Rename the added column> colnames>(Products)[>ncol>(Products)] <->'Discount'> # Renaming the last column> # Print the updated dataframe after adding the new column> cat>(>' Updated dataframe after adding a new column 'Discount': '>)> print>(Products)>

>

>

Produksjon:

Existing dataframe (Products):   Product_ID Product_Name Price Stock 1 101 T-Shirt 15.99 50 2 102 Jeans 29.99 30 3 103 Shoes 49.99 25  Updated dataframe after adding a new column 'Discount':   Product_ID Product_Name Price Stock Discount 1 101 T-Shirt 15.99 50 5 2 102 Jeans 29.99 30 10 3 103 Shoes 49.99 25 8>

Fjern rader og kolonner

En dataramme i R fjerner kolonner og rader fra den allerede eksisterende R-datarammen.

Fjern rad i R DataFrame

R




library>(dplyr)> # Create a data frame> data <->data.frame>(> >friend_id =>c>(1, 2, 3, 4, 5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,>'Dravid'>,>'Sehwag'>,>'Dhoni'>),> >location =>c>(>'Kolkata'>,>'Delhi'>,>'Bangalore'>,>'Hyderabad'>,>'Chennai'>)> )> data> # Remove a row with friend_id = 3> data <->subset>(data, friend_id != 3)> data>

>

>

Produksjon:

 friend_id friend_name location 1 1 Sachin Kolkata 2 2 Sourav Delhi 3 3 Dravid Bangalore 4 4 Sehwag Hyderabad 5 5 Dhoni Chennai   # Remove a row with friend_id = 3   friend_id friend_name location 1 1 Sachin Kolkata 2 2 Sourav Delhi 4 4 Sehwag Hyderabad 5 5 Dhoni Chennai>

I koden ovenfor opprettet vi først en dataramme kalt data med tre kolonner: venn_id , venn_navn , og plassering . For å fjerne en rad med venn_id lik 3, brukte vi delsett() funksjon og spesifiserte tilstanden venn_id != 3 . Dette fjernet raden med venn_id lik 3.

Fjern kolonne i R DataFrame

R


hvordan åpne en json-fil



library>(dplyr)> # Create a data frame> data <->data.frame>(> >friend_id =>c>(1, 2, 3, 4, 5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,>'Dravid'>,>'Sehwag'>,>'Dhoni'>),> >location =>c>(>'Kolkata'>,>'Delhi'>,>'Bangalore'>,>'Hyderabad'>,>'Chennai'>)> )> data> # Remove the 'location' column> data <->select>(data, -location)> data>

>

>

Produksjon:

 friend_id friend_name location 1 1 Sachin Kolkata 2 2 Sourav Delhi 3 3 Dravid Bangalore 4 4 Sehwag Hyderabad 5 5 Dhoni Chennai>Fjern 'location'-kolonnen friend_id friend_name 1 1 Sachin 2 2 Sourav 3 3 Dravid 4 4 Sehwag 5 5 Dhoni>

For å fjerne plassering kolonnen brukte vi plukke ut() funksjon og spesifisert -plassering . De tegn indikerer at vi ønsker å fjerne plassering kolonne. Den resulterende datarammen data vil bare ha to kolonner: venn_id og venn_navn .

Kombinere datarammer i R

Det er to måter å kombinere datarammer i R. Du kan enten kombinere dem vertikalt eller horisontalt.

La oss se på begge tilfeller med eksempel:

Kombiner R-dataramme vertikalt

Hvis du ønsker å kombinere 2 datarammer vertikalt, kan du bruke rbind() funksjon. Denne funksjonen fungerer for kombinasjon av to eller flere datarammer.

R




# Creating two sample dataframes> df1 <->data.frame>(> >Name =>c>(>'Alice'>,>'Bob'>),> >Age =>c>(25, 30),> >Score =>c>(80, 75)> )> df2 <->data.frame>(> >Name =>c>(>'Charlie'>,>'David'>),> >Age =>c>(28, 35),> >Score =>c>(90, 85)> )> # Print the existing dataframes> cat>(>'Dataframe 1: '>)> print>(df1)> cat>(>' Dataframe 2: '>)> print>(df2)> # Combining the dataframes using rbind()> combined_df <->rbind>(df1, df2)> # Print the combined dataframe> cat>(>' Combined Dataframe: '>)> print>(combined_df)>

>

>

Produksjon:

Dataframe 1:   Name Age Score 1 Alice 25 80 2 Bob 30 75  Dataframe 2:   Name Age Score 1 Charlie 28 90 2 David 35 85  Combined Dataframe:   Name Age Score 1 Alice 25 80 2 Bob 30 75 3 Charlie 28 90 4 David 35 85>

Kombiner R-dataramme horisontalt:

Hvis du ønsker å kombinere 2 datarammer horisontalt, kan du bruke cbind() funksjon. Denne funksjonen fungerer for kombinasjon av to eller flere datarammer.

R




# Creating two sample dataframes> df1 <->data.frame>(> >Name =>c>(>'Alice'>,>'Bob'>),> >Age =>c>(25, 30),> >Score =>c>(80, 75)> )> df2 <->data.frame>(> >Height =>c>(160, 175),> >Weight =>c>(55, 70)> )> # Print the existing dataframes> cat>(>'Dataframe 1: '>)> print>(df1)> cat>(>' Dataframe 2: '>)> print>(df2)> # Combining the dataframes using cbind()> combined_df <->cbind>(df1, df2)> # Print the combined dataframe> cat>(>' Combined Dataframe: '>)> print>(combined_df)>

>

>

Produksjon:

Dataframe 1:   Name Age Score 1 Alice 25 80 2 Bob 30 75  Dataframe 2:   Height Weight 1 160 55 2 175 70  Combined Dataframe:   Name Age Score Height Weight 1 Alice 25 80 160 55 2 Bob 30 75 175 70>

Les også:

  • R – Objekter
  • Datastrukturer i R-programmering

I denne artikkelen har vi dekket R datarammer, og alle grunnleggende operasjoner som opprette, få tilgang til, oppsummere, legge til og fjerne. Formålet med denne artikkelen er å gjøre deg kjent med datarammer i R, slik at du kan bruke den i prosjektene dine.

Håper dette hjelper deg med å forstå konseptet med datarammer i R, og du kan enkelt implementere R-dataramme i prosjektene dine.