Programmiersprache R ist eine Open-Source-Programmiersprache, die häufig als Statistiksoftware und Datenanalysetool verwendet wird. Datenrahmen in der R-Sprache sind generische Datenobjekte von R, die zum Speichern tabellarischer Daten verwendet werden.
Datenrahmen können auch als Matrizen interpretiert werden, bei denen jede Spalte von a Matrix können unterschiedliche Datentypen haben. R DataFrame besteht aus drei Hauptkomponenten: den Daten, Zeilen und Spalten.
R-Datenrahmenstruktur
Wie Sie im Bild unten sehen können, ist ein Datenrahmen folgendermaßen aufgebaut.
Die Daten werden in tabellarischer Form dargestellt, was die Bedienung und das Verständnis erleichtert.

R – Datenrahmen
Erstellen Sie einen Datenrahmen in der Programmiersprache R
Um einen R-Datenrahmen zu erstellen, verwenden Sie data.frame() Funktion und übergeben Sie dann jeden der von Ihnen erstellten Vektoren als Argumente an die Funktion.
R
# R program to create dataframe> # creating a data frame> friend.data <->data.frame>(> >friend_id =>c>(1:5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,> >'Dravid'>,>'Sehwag'>,> >'Dhoni'>),> >stringsAsFactors =>FALSE> )> # print the data frame> print>(friend.data)> |
>
>
Ausgabe:
friend_id friend_name 1 1 Sachin 2 2 Sourav 3 3 Dravid 4 4 Sehwag 5 5 Dhoni>
Rufen Sie die Struktur des R-Datenrahmens ab
Die Struktur des R-Datenrahmens kann man mit erhalten str() Funktion in R.
Es kann sogar die interne Struktur großer Listen anzeigen, die verschachtelt sind. Es bietet eine einzeilige Ausgabe für die grundlegenden R-Objekte und informiert den Benutzer über das Objekt und seine Bestandteile.
R
Umkehrzeichenfolge Java
# R program to get the> # structure of the data frame> # creating a data frame> friend.data <->data.frame>(> >friend_id =>c>(1:5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,> >'Dravid'>,>'Sehwag'>,> >'Dhoni'>),> >stringsAsFactors =>FALSE> )> # using str()> print>(>str>(friend.data))> |
>
>
Ausgabe:
'data.frame': 5 obs. of 2 variables: $ friend_id : int 1 2 3 4 5 $ friend_name: chr 'Sachin' 'Sourav' 'Dravid' 'Sehwag' ... NULL>
Zusammenfassung der Daten im R-Datenrahmen
Im R-Datenrahmen können die statistische Zusammenfassung und die Art der Daten durch Anwenden erhalten werden Zusammenfassung() Funktion.
Es handelt sich um eine generische Funktion, mit der Ergebniszusammenfassungen der Ergebnisse verschiedener Modellanpassungsfunktionen erstellt werden. Die Funktion ruft bestimmte Methoden auf, die von der Klasse des ersten Arguments abhängen.
R
# R program to get the> # summary of the data frame> # creating a data frame> friend.data <->data.frame>(> >friend_id =>c>(1:5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,> >'Dravid'>,>'Sehwag'>,> >'Dhoni'>),> >stringsAsFactors =>FALSE> )> # using summary()> print>(>summary>(friend.data))> |
>
>
Ausgabe:
friend_id friend_name Min. :1 Length:5 1st Qu.:2 Class :character Median :3 Mode :character Mean :3 3rd Qu.:4 Max. :5>
Extrahieren Sie Daten aus dem Datenrahmen in R
Das Extrahieren von Daten aus einem R-Datenrahmen bedeutet, auf dessen Zeilen oder Spalten zuzugreifen. Mithilfe des Spaltennamens kann eine bestimmte Spalte aus einem R-Datenrahmen extrahiert werden.
R
# R program to extract> # data from the data frame> # creating a data frame> friend.data <->data.frame>(> >friend_id =>c>(1:5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,> >'Dravid'>,>'Sehwag'>,> >'Dhoni'>),> >stringsAsFactors =>FALSE> )> # Extracting friend_name column> result <->data.frame>(friend.data$friend_name)> print>(result)> |
>
>
Ausgabe:
friend.data.friend_name 1 Sachin 2 Sourav 3 Dravid 4 Sehwag 5 Dhoni>
Erweitern Sie den Datenrahmen in der R-Sprache
Ein Datenrahmen in R kann erweitert werden, indem neue Spalten und Zeilen zum bereits vorhandenen R-Datenrahmen hinzugefügt werden.
R
Latex-Textgröße
# R program to expand> # the data frame> # creating a data frame> friend.data <->data.frame>(> >friend_id =>c>(1:5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,> >'Dravid'>,>'Sehwag'>,> >'Dhoni'>),> >stringsAsFactors =>FALSE> )> # Expanding data frame> friend.data$location <->c>(>'Kolkata'>,>'Delhi'>,> >'Bangalore'>,>'Hyderabad'>,> >'Chennai'>)> resultant <- friend.data> # print the modified data frame> print>(resultant)> |
>
>
Ausgabe:
friend_id friend_name location 1 1 Sachin Kolkata 2 2 Sourav Delhi 3 3 Dravid Bangalore 4 4 Sehwag Hyderabad 5 5 Dhoni Chennai>
In R kann man verschiedene Arten von Operationen an einem Datenrahmen ausführen, z Zugreifen auf Zeilen und Spalten, Auswählen der Teilmenge des Datenrahmens, Bearbeiten von Datenrahmen, Löschen von Zeilen und Spalten in einem Datenrahmen , usw.
Bitte beziehen Sie sich auf DataFrame-Operationen in R um alle Arten von Operationen zu kennen, die an einem Datenrahmen ausgeführt werden können.
Greifen Sie auf Elemente im R-Datenrahmen zu
Mit Single können wir jedes Element aus dem Datenrahmen auswählen und darauf zugreifen$>,Klammern[ ] or>doppelte Klammern[[]]>um auf Spalten aus einem Datenrahmen zuzugreifen.
R
# creating a data frame> friend.data <->data.frame>(> >friend_id =>c>(1:5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,> >'Dravid'>,>'Sehwag'>,> >'Dhoni'>),> >stringsAsFactors =>FALSE> )> # Access Items using []> friend.data[1]> # Access Items using [[]]> friend.data[[>'friend_name'>]]> # Access Items using $> friend.data$friend_id> |
>
>
Ausgabe:
friend_id 1 1 2 2 3 3 4 4 5 5 Access Items using [[]] [1] 'Sachin' 'Sourav' 'Dravid' 'Sehwag' 'Dhoni' Access Items using $ [1] 1 2 3 4 5>
Anzahl der Zeilen und Spalten
Mit der Dim-Funktion können wir herausfinden, wie viele Zeilen und Spalten in unserem Datenrahmen vorhanden sind.
R
# creating a data frame> friend.data <->data.frame>(> >friend_id =>c>(1:5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,> >'Dravid'>,>'Sehwag'>,> >'Dhoni'>),> >stringsAsFactors =>FALSE> )> # find out the number of rows and clumns> dim>(friend.data)> |
>
>
Ausgabe:
[1] 5 2>
Fügen Sie Zeilen und Spalten im R-Datenrahmen hinzu
Sie können problemlos Zeilen und Spalten in einem R DataFrame hinzufügen. Das Einfügen hilft dabei, den bereits vorhandenen DataFrame zu erweitern, ohne dass ein neuer erforderlich ist.
Schauen wir uns an, wie man Zeilen und Spalten in einem DataFrame hinzufügt. mit einem Beispiel:
Fügen Sie Zeilen im R-Datenrahmen hinzu
Um Zeilen in einem Datenrahmen hinzuzufügen, können Sie eine integrierte Funktion verwenden rbind().
Das folgende Beispiel demonstriert die Funktionsweise von rbind() im R-Datenrahmen.
R
# Creating a dataframe representing products in a store> Products <->data.frame>(> >Product_ID =>c>(101, 102, 103),> >Product_Name =>c>(>'T-Shirt'>,>'Jeans'>,>'Shoes'>),> >Price =>c>(15.99, 29.99, 49.99),> >Stock =>c>(50, 30, 25)> )> # Print the existing dataframe> cat>(>'Existing dataframe (Products):
'>)> print>(Products)> # Adding a new row for a new product> New_Product <->c>(104,>'Sunglasses'>, 39.99, 40)> Products <->rbind>(Products, New_Product)> # Print the updated dataframe after adding the new product> cat>(>'
Updated dataframe after adding a new product:
'>)> print>(Products)> |
>
>
Ausgabe:
Existing dataframe (Products): Product_ID Product_Name Price Stock 1 101 T-Shirt 15.99 50 2 102 Jeans 29.99 30 3 103 Shoes 49.99 25 Updated dataframe after adding a new product: Product_ID Product_Name Price Stock 1 101 T-Shirt 15.99 50 2 102 Jeans 29.99 30 3 103 Shoes 49.99 25 4 104 Sunglasses 39.99 40>
Fügen Sie Spalten im R-Datenrahmen hinzu
Um Spalten in einem Datenrahmen hinzuzufügen, können Sie eine integrierte Funktion verwenden cbind().
Das folgende Beispiel demonstriert die Funktionsweise von cbind() im R-Datenrahmen .
vergleichbare Schnittstelle in Java
R
# Existing dataframe representing products in a store> Products <->data.frame>(> >Product_ID =>c>(101, 102, 103),> >Product_Name =>c>(>'T-Shirt'>,>'Jeans'>,>'Shoes'>),> >Price =>c>(15.99, 29.99, 49.99),> >Stock =>c>(50, 30, 25)> )> # Print the existing dataframe> cat>(>'Existing dataframe (Products):
'>)> print>(Products)> # Adding a new column for 'Discount' to the dataframe> Discount <->c>(5, 10, 8)># New column values for discount> Products <->cbind>(Products, Discount)> # Rename the added column> colnames>(Products)[>ncol>(Products)] <->'Discount'> # Renaming the last column> # Print the updated dataframe after adding the new column> cat>(>'
Updated dataframe after adding a new column 'Discount':
'>)> print>(Products)> |
>
>
Ausgabe:
Existing dataframe (Products): Product_ID Product_Name Price Stock 1 101 T-Shirt 15.99 50 2 102 Jeans 29.99 30 3 103 Shoes 49.99 25 Updated dataframe after adding a new column 'Discount': Product_ID Product_Name Price Stock Discount 1 101 T-Shirt 15.99 50 5 2 102 Jeans 29.99 30 10 3 103 Shoes 49.99 25 8>
Entfernen Sie Zeilen und Spalten
Ein Datenrahmen in R entfernt Spalten und Zeilen aus dem bereits vorhandenen R-Datenrahmen.
Zeile im R DataFrame entfernen
R
library>(dplyr)> # Create a data frame> data <->data.frame>(> >friend_id =>c>(1, 2, 3, 4, 5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,>'Dravid'>,>'Sehwag'>,>'Dhoni'>),> >location =>c>(>'Kolkata'>,>'Delhi'>,>'Bangalore'>,>'Hyderabad'>,>'Chennai'>)> )> data> # Remove a row with friend_id = 3> data <->subset>(data, friend_id != 3)> data> |
>
>
Ausgabe:
friend_id friend_name location 1 1 Sachin Kolkata 2 2 Sourav Delhi 3 3 Dravid Bangalore 4 4 Sehwag Hyderabad 5 5 Dhoni Chennai # Remove a row with friend_id = 3 friend_id friend_name location 1 1 Sachin Kolkata 2 2 Sourav Delhi 4 4 Sehwag Hyderabad 5 5 Dhoni Chennai>
Im obigen Code haben wir zunächst einen Datenrahmen mit dem Namen erstellt Daten mit drei Spalten: freund_id , Freund_Name , Und Standort . Um eine Zeile mit zu entfernen freund_id gleich 3, wir haben das verwendet Teilmenge() Funktion und spezifizierte die Bedingung freund_id != 3 . Dadurch wurde die Zeile mit entfernt freund_id gleich 3.
Spalte im R DataFrame entfernen
R
Gimp-Export als JPG
library>(dplyr)> # Create a data frame> data <->data.frame>(> >friend_id =>c>(1, 2, 3, 4, 5),> >friend_name =>c>(>'Sachin'>,>'Sourav'>,>'Dravid'>,>'Sehwag'>,>'Dhoni'>),> >location =>c>(>'Kolkata'>,>'Delhi'>,>'Bangalore'>,>'Hyderabad'>,>'Chennai'>)> )> data> # Remove the 'location' column> data <->select>(data, -location)> data> |
>
>
Ausgabe:
friend_id friend_name location 1 1 Sachin Kolkata 2 2 Sourav Delhi 3 3 Dravid Bangalore 4 4 Sehwag Hyderabad 5 5 Dhoni Chennai>Entfernen Sie die Spalte 'Standort' freund_id freund_name 1 1 Sachin 2 2 Sourav 3 3 Dravid 4 4 Sehwag 5 5 Dhoni>
Um das zu entfernen Standort Spalte, wir haben die verwendet wählen() Funktion und spezifiziert -Standort . Der – Das Zeichen zeigt an, dass wir das entfernen möchten Standort Spalte. Der resultierende Datenrahmen Daten wird nur zwei Spalten haben: freund_id Und Freund_Name .
Kombinieren von Datenrahmen in R
Es gibt zwei Möglichkeiten, Datenrahmen in R zu kombinieren. Sie können sie entweder vertikal oder horizontal kombinieren.
Schauen wir uns beide Fälle anhand eines Beispiels an:
R-Datenrahmen vertikal kombinieren
Wenn Sie zwei Datenrahmen vertikal kombinieren möchten, können Sie Folgendes verwenden rbind()-Funktion. Diese Funktion funktioniert für die Kombination von zwei oder mehr Datenrahmen.
R
# Creating two sample dataframes> df1 <->data.frame>(> >Name =>c>(>'Alice'>,>'Bob'>),> >Age =>c>(25, 30),> >Score =>c>(80, 75)> )> df2 <->data.frame>(> >Name =>c>(>'Charlie'>,>'David'>),> >Age =>c>(28, 35),> >Score =>c>(90, 85)> )> # Print the existing dataframes> cat>(>'Dataframe 1:
'>)> print>(df1)> cat>(>'
Dataframe 2:
'>)> print>(df2)> # Combining the dataframes using rbind()> combined_df <->rbind>(df1, df2)> # Print the combined dataframe> cat>(>'
Combined Dataframe:
'>)> print>(combined_df)> |
>
>
Ausgabe:
Dataframe 1: Name Age Score 1 Alice 25 80 2 Bob 30 75 Dataframe 2: Name Age Score 1 Charlie 28 90 2 David 35 85 Combined Dataframe: Name Age Score 1 Alice 25 80 2 Bob 30 75 3 Charlie 28 90 4 David 35 85>
R-Datenrahmen horizontal kombinieren:
Wenn Sie zwei Datenrahmen horizontal kombinieren möchten, können Sie Folgendes verwenden cbind()-Funktion. Diese Funktion funktioniert für die Kombination von zwei oder mehr Datenrahmen.
R
# Creating two sample dataframes> df1 <->data.frame>(> >Name =>c>(>'Alice'>,>'Bob'>),> >Age =>c>(25, 30),> >Score =>c>(80, 75)> )> df2 <->data.frame>(> >Height =>c>(160, 175),> >Weight =>c>(55, 70)> )> # Print the existing dataframes> cat>(>'Dataframe 1:
'>)> print>(df1)> cat>(>'
Dataframe 2:
'>)> print>(df2)> # Combining the dataframes using cbind()> combined_df <->cbind>(df1, df2)> # Print the combined dataframe> cat>(>'
Combined Dataframe:
'>)> print>(combined_df)> |
>
>
Ausgabe:
Dataframe 1: Name Age Score 1 Alice 25 80 2 Bob 30 75 Dataframe 2: Height Weight 1 160 55 2 175 70 Combined Dataframe: Name Age Score Height Weight 1 Alice 25 80 160 55 2 Bob 30 75 175 70>
Lesen Sie auch:
- R – Objekte
- Datenstrukturen in der R-Programmierung
In diesem Artikel haben wir behandelt R-Datenrahmen, und alle grundlegenden Vorgänge wie Erstellen, Zugreifen, Zusammenfassen, Hinzufügen und Entfernen. Dieser Artikel soll Sie mit Datenrahmen in R vertraut machen, damit Sie sie in Ihren Projekten verwenden können.
Ich hoffe, dies hilft Ihnen dabei, das Konzept der Datenrahmen in R zu verstehen und Sie können R-Datenrahmen problemlos in Ihren Projekten implementieren.