Pandas DataFrame ist eine zweidimensional beschriftete Datenstruktur wie eine Tabelle mit Zeilen und Spalten. Die Größe und Werte des DataFrame sind veränderbar, d. h. können geändert werden.
DataFrame wird hauptsächlich in der Datenanalyse und Datenmanipulation verwendet. Damit können Sie Daten in tabellarischer Form wie in einer SQL-Datenbank, MS Excel oder Google Sheets speichern und so einfacher arithmetische Operationen an den Daten durchführen.
Es ist das am häufigsten verwendete Pandas-Objekt. Der DataFrame()-Funktion wird verwendet, um einen DataFrame in Pandas zu erstellen. Sie können Pandas DataFrame auch auf verschiedene Arten erstellen.
Pandas Dataframe()-Syntax
pandas.DataFrame(Daten, Index, Spalten)
Thread-Synchronisation
Parameter:
- Daten : Es handelt sich um einen Datensatz, aus dem ein DataFrame erstellt werden soll. Es kann sich um eine Liste, ein Wörterbuch, einen Skalarwert, eine Reihe, ein Array usw. handeln.
- Index : Es ist optional, standardmäßig beginnt der Index des DataFrame bei 0 und endet beim letzten Datenwert (n-1). Es definiert die Zeilenbezeichnung explizit.
- Säulen : Dieser Parameter wird verwendet, um Spaltennamen im DataFrame bereitzustellen. Wenn der Spaltenname nicht standardmäßig definiert ist, nimmt er einen Wert von 0 bis n-1 an.
Kehrt zurück:
- DataFrame-Objekt
Nachdem wir nun die DataFrame()-Funktion besprochen haben, schauen wir uns verschiedene Möglichkeiten zum Erstellen eines DataFrame an:
Verschiedene Möglichkeiten zum Erstellen von Datenrahmen in Python
Es gibt mehrere Möglichkeiten, eine zu erstellen Pandas-Datenrahmen In Python . Sie können einen DataFrame mit den folgenden Methoden erstellen:
- Erstellen Sie Pandas DataFrame mit der Funktion DataFrame()
- Erstellen Sie Pandas DataFrame aus einer Liste von Listen
- Erstellen Sie Pandas DataFrame aus dem Wörterbuch von ndarray/list
- Erstellen Sie Pandas DataFrame aus einer Liste von Wörterbüchern
- Erstellen Sie Pandas DataFrame aus einem Wörterbuch von Serien
- Erstellen eines DataFrame mit der Funktion zip()
- Erstellen eines DataFrame durch expliziten Nachweis der Indexbezeichnung
Erstellen Sie einen leeren DataFrame mit der Methode DataFrame()
DataFrame in Python kann mit der Funktion DataFrame() erstellt werden Pandas-Bibliothek . Rufen Sie einfach die Funktion mit dem DataFrame-Konstruktor auf, um einen DataFrame zu erstellen.
Beispiel : Erstellen eines leeren DataFrame mit der Funktion DataFrame() in Python
Python3
# Importing Pandas to create DataFrame> import> pandas as pd> # Creating Empty DataFrame and Storing it in variable df> df> => pd.DataFrame()> # Printing Empty DataFrame> print> (df)> |
>
>
Ausgabe:
Empty DataFrame Columns: [] Index: []>
Erstellen Sie einen DataFrame aus Listen von Listen
So erstellen Sie einen Pandas DataFrame aus einem Liste Für Listen können Sie die Funktion pd.DataFrame() verwenden. Diese Funktion verwendet eine Liste von Listen als Eingabe und erstellt einen DataFrame mit der gleichen Anzahl von Zeilen und Spalten wie die Eingabeliste.
Beispiel : Erstellen eines DataFrame aus Listen von Listen mithilfe der DataFrame()-Methode
Python3
# Import pandas library> import> pandas as pd> # initialize list of lists> data> => [[> 'tom'> ,> 10> ], [> 'nick'> ,> 15> ], [> 'juli'> ,> 14> ]]> # Create the pandas DataFrame> df> => pd.DataFrame(data, columns> => [> 'Name'> ,> 'Age'> ])> # print dataframe.> print> (df)> |
>
>
Ausgabe:
Fakultät in Java
Name Age 0 tom 10 1 nick 15 2 juli 14>
Erstellen Sie einen DataFrame aus dem Wörterbuch von ndArray/Listen
So erstellen Sie einen DataFrame aus einem Wörterbuch von ndarrays /lists, alle Arrays müssen die gleiche Länge haben. Wenn ein Index übergeben wird, sollte der Längenindex gleich der Länge der Arrays sein.
Wenn kein Index übergeben wird, ist der Index standardmäßig „range(n)“, wobei n die Array-Länge ist.
Beispiel : DataFrame aus einem Wörterbuch von Ndarray/Listen erstellen
Python3
# Python code demonstrate creating> # DataFrame from dict narray / lists> # By default addresses.> import> pandas as pd> # initialize data of lists.> data> => {> 'Name'> : [> 'Tom'> ,> 'nick'> ,> 'krish'> ,> 'jack'> ],> > 'Age'> : [> 20> ,> 21> ,> 19> ,> 18> ]}> # Create DataFrame> df> => pd.DataFrame(data)> # Print the output.> print> (df)> |
>
>
SQL-Server-Pivot
Ausgabe:
Name Age 0 Tom 20 1 nick 21 2 krish 19 3 jack 18>
Notiz: Beim Erstellen eines DataFrame mithilfe eines Wörterbuchs sind die Schlüssel des Wörterbuchs standardmäßig Spaltennamen. Wir können Spaltennamen auch explizit mithilfe von Spaltenparametern angeben.
Erstellen Sie einen DataFrame aus der Liste der Wörterbücher
Pandas DataFrame kann durch Übergabe erstellt werden Listen von Wörterbüchern als Eingabedaten. Standardmäßig werden Wörterbuchschlüssel als Spalten verwendet.
Python3
# Python code demonstrate how to create> # Pandas DataFrame by lists of dicts.> import> pandas as pd> # Initialize data to lists.> data> => [{> 'a'> :> 1> ,> 'b'> :> 2> ,> 'c'> :> 3> },> > {> 'a'> :> 10> ,> 'b'> :> 20> ,> 'c'> :> 30> }]> # Creates DataFrame.> df> => pd.DataFrame(data)> # Print the data> print> (df)> |
>
>
Ausgabe:
a b c 0 1 2 3 1 10 20 30>
Ein weiteres Beispiel ist die Erstellung eines Pandas DataFrame durch Übergabe von Listen mit Wörterbüchern und Zeilenindizes .
Python3
# Python code demonstrate to create> # Pandas DataFrame by passing lists of> # Dictionaries and row indices.> import> pandas as pd> # Initialize data of lists> data> => [{> 'b'> :> 2> ,> 'c'> :> 3> }, {> 'a'> :> 10> ,> 'b'> :> 20> ,> 'c'> :> 30> }]> # Creates pandas DataFrame by passing> # Lists of dictionaries and row index.> df> => pd.DataFrame(data, index> => [> 'first'> ,> 'second'> ])> # Print the data> print> (df)> |
>
>
Ausgabe:
b c a first 2 3 NaN second 20 30 10.0>
Erstellen Sie einen DataFrame aus einem Wörterbuch von Serien
So erstellen Sie einen DataFrame aus einem Wörterbuch von Serie , kann ein Wörterbuch übergeben werden, um einen DataFrame zu bilden. Der resultierende Index ist die Vereinigung aller übergebenen indizierten Reihen.
Beispiel: Erstellen eines DataFrame aus einem Wörterbuch von Reihen.
Python3
Python-Pfadeinstellung
# Python code demonstrate creating> # Pandas Dataframe from Dicts of series.> import> pandas as pd> # Initialize data to Dicts of series.> d> => {> 'one'> : pd.Series([> 10> ,> 20> ,> 30> ,> 40> ],> > index> => [> 'a'> ,> 'b'> ,> 'c'> ,> 'd'> ]),> > 'two'> : pd.Series([> 10> ,> 20> ,> 30> ,> 40> ],> > index> => [> 'a'> ,> 'b'> ,> 'c'> ,> 'd'> ])}> # creates Dataframe.> df> => pd.DataFrame(d)> # print the data.> print> (df)> |
>
>
Ausgabe:
one two a 10 10 b 20 20 c 30 30 d 40 40>
Erstellen Sie einen DataFrame mit der Funktion zip()
Zwei Listen können mithilfe von zusammengeführt werden zip()-Funktion . Erstellen Sie nun den Pandas DataFrame, indem Sie die Funktion pd.DataFrame() aufrufen.
Beispiel: Erstellen eines DataFrame mit der Funktion zip().
Python3
# Python program to demonstrate creating> # pandas Dataframe from lists using zip.> import> pandas as pd> # List1> Name> => [> 'tom'> ,> 'krish'> ,> 'nick'> ,> 'juli'> ]> # List2> Age> => [> 25> ,> 30> ,> 26> ,> 22> ]> # get the list of tuples from two lists.> # and merge them by using zip().> list_of_tuples> => list> (> zip> (Name, Age))> # Assign data to tuples.> list_of_tuples> # Converting lists of tuples into> # pandas Dataframe.> df> => pd.DataFrame(list_of_tuples,> > columns> => [> 'Name'> ,> 'Age'> ])> # Print data.> print> (df)> |
>
Wer ist Freddie Mercury?
>
Ausgabe:
Name Age 0 tom 25 1 krish 30 2 nick 26 3 juli 22>
Erstellen Sie einen DataFrame, indem Sie die Indexbezeichnung explizit beweisen
Um einen DataFrame durch explizite Bereitstellung der Indexbezeichnung zu erstellen, können Sie den Indexparameter des pd.DataFrame()-Konstruktors verwenden. Der Indexparameter verwendet eine Liste von Indexbezeichnungen als Eingabe, und der DataFrame verwendet diese Bezeichnungen für die Zeilen des DataFrame.
Beispiel: Erstellen eines DataFrame durch expliziten Nachweis der Indexbezeichnung
Python3
# Python code demonstrate creating> # pandas DataFrame with indexed by> # DataFrame using arrays.> import> pandas as pd> # initialize data of lists.> data> => {> 'Name'> : [> 'Tom'> ,> 'Jack'> ,> 'nick'> ,> 'juli'> ],> > 'marks'> : [> 99> ,> 98> ,> 95> ,> 90> ]}> # Creates pandas DataFrame.> df> => pd.DataFrame(data, index> => [> 'rank1'> ,> > 'rank2'> ,> > 'rank3'> ,> > 'rank4'> ])> # print the data> print> (df)> |
>
>
Ausgabe:
Name marks rank1 Tom 99 rank2 Jack 98 rank3 nick 95 rank4 juli 90>
Abschluss
Python Pandas DataFrame ähnelt einer Tabelle mit Zeilen und Spalten. Es handelt sich um eine zweidimensionale Datenstruktur, die für die Datenanalyse und Datenmanipulation sehr nützlich ist.
In diesem Tutorial haben wir verschiedene Möglichkeiten zum Erstellen eines Pandas DataFrame besprochen. Mit diesem Tutorial werden Sie in der Lage sein, alle komplexen Anforderungen beim Erstellen von DataFrame zu bewältigen.