logo

Hinzufügen einer neuen Spalte zum vorhandenen DataFrame in Pandas

Das Hinzufügen neuer Spalten zu einem vorhandenen DataFrame ist eine grundlegende Aufgabe bei der Datenanalyse mit Pandas . Es ermöglicht Ihnen, Ihre Daten mit zusätzlichen Informationen anzureichern und weitere Analysen und Manipulationen zu erleichtern. In diesem Artikel werden verschiedene Methoden zum Hinzufügen neuer Spalten untersucht, einschließlich der einfachen Zuweisunginsert()>Methode, dieassign()>Methode. Lassen Sie uns das Hinzufügen neuer Spalten zum vorhandenen DataFrame von Pandas besprechen.

Was ist Pandas DataFrame?

A Pandas DataFrame ist eine zweidimensionale, größenveränderliche, potenziell heterogene tabellarische Datenstruktur mit beschrifteten Achsen (Zeilen und Spalten). Es handelt sich um eine grundlegende Datenstruktur im Python-Data-Science-Ökosystem und bietet eine leistungsstarke Möglichkeit, mit Tabellendaten zu arbeiten.



Hier sind einige Hauptfunktionen eines Pandas DataFrame:

  • Daten Präsentation: Speichert Daten in einem Tabellenformat mit Zeilen und Spalten.
  • Heterogene Datentypen: Kann verschiedene Datentypen in verschiedenen Spalten enthalten (z. B. Ganzzahlen, Gleitkommazahlen, Zeichenfolgen, Boolesche Werte).
  • Beschriftung: Jede Zeile und Spalte hat eine Beschriftung (Index- und Spaltennamen).
  • Veränderlich: Ermöglicht die Manipulation und Änderung von Daten.
  • Leistungsstarke Operationen: Bietet verschiedene Funktionen und Methoden zur Datenanalyse, -manipulation und -exploration.
  • Erweiterbar: Kann durch Bibliotheken und benutzerdefinierte Funktionen individuell angepasst und um zusätzliche Funktionalitäten erweitert werden.

Es gibt mehrere Möglichkeiten, in Pandas eine neue Spalte zu einem vorhandenen DataFrame hinzuzufügen Python :

  • Erstellen eines Beispieldatenrahmens
  • Durch die Nutzung Dataframe.insert() Methode
  • Durch die Nutzung Dataframe.assign() Methode
  • Verwenden des Wörterbuchs
  • Verwenden von Liste
  • Benutzen .Ort()
  • Hinzufügen mehrerer Spalten zum vorhandenen Datenrahmen

Erstellen eines Beispieldatenrahmens

Hier erstellen wir einen Beispieldatenrahmen:



Hashset Java

Python3






import> pandas as pd> data>=> {>'Name'>: [>'Jai'>,>'Princi'>,>'Gaurav'>,>'Anuj'>],> >'Height'>: [>5.1>,>6.2>,>5.1>,>5.2>],> >'Qualification'>: [>'Msc'>,>'MA'>,>'Msc'>,>'Msc'>]}> df>=> pd.DataFrame(data)> print>(df)>

>

>

Ausgabe:

   Name Height Qualification     0    Jai 5.1 Msc   1    Princi 6.2 MA   2   Gaurav 5.1 Msc   3   Anuj 5.2 Msc>

Beachten Sie, dass die Länge Ihrer Liste mit der Länge der Indexspalte übereinstimmen sollte, andernfalls wird ein Fehler angezeigt.

Fügen Sie mit DataFrame.insert() eine neue Spalte zu einem vorhandenen Datframe hinzu

Es gibt die Freiheit, eine Spalte an jeder beliebigen Position und nicht nur am Ende hinzuzufügen. Es bietet auch verschiedene Optionen zum Einfügen der Spaltenwerte.

Python3




import> pandas as pd> # Define a dictionary containing Students data> data>=> {>'Name'>: [>'Jai'>,>'Princi'>,>'Gaurav'>,>'Anuj'>],> >'Height'>: [>5.1>,>6.2>,>5.1>,>5.2>],> >'Qualification'>: [>'Msc'>,>'MA'>,>'Msc'>,>'Msc'>]}> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Using DataFrame.insert() to add a column> df.insert(>2>,>'Age'>, [>21>,>23>,>24>,>21>],>True>)> # Observe the result> print>(df)>

>

Rend-Karte

>

Ausgabe:

  Name Height Age Qualification     0   Jai 5.1 21 Msc   1   Princi 6.2 23 MA   2   Gaurav 5.1 24 Msc   3    Anuj 5.2 21 Msc>

Hinzufügen von Spalten zu Pandas DataFrame mit Dataframe.assign()

Diese Methode erstellt einen neuen Datenrahmen, wobei eine neue Spalte zum alten Datenrahmen hinzugefügt wird.

Python3




import> pandas as pd> # Define a dictionary containing Students data> data>=> {>'Name'>: [>'Jai'>,>'Princi'>,>'Gaurav'>,>'Anuj'>],> >'Height'>: [>5.1>,>6.2>,>5.1>,>5.2>],> >'Qualification'>: [>'Msc'>,>'MA'>,>'Msc'>,>'Msc'>]}> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Using 'Address' as the column name and equating it to the list> df2>=> df.assign(address>=>[>'Delhi'>,>'Bangalore'>,>'Chennai'>,>'Patna'>])> print>(df2)>

>

>

Ausgabe:

   Name Height Qualification address     0    Jai 5.1 Msc Delhi   1    Princi 6.2 MA Bangalore   2    Gaurav 5.1 Msc Chennai   3    Anuj 5.2 Msc Patna>

Pandas fügen mithilfe eines Wörterbuchs eine Spalte zu DataFrame hinzu

Wir können a verwenden Python-Wörterbuch um eine neue Spalte in Pandas DataFrame hinzuzufügen. Verwenden Sie eine vorhandene Spalte als Schlüsselwerte und ihre jeweiligen Werte sind die Werte für eine neue Spalte.

Python3




# Import pandas package> import> pandas as pd> # Define a dictionary containing Students data> data>=> {>'Name'>: [>'Jai'>,>'Princi'>,>'Gaurav'>,>'Anuj'>],> >'Height'>: [>5.1>,>6.2>,>5.1>,>5.2>],> >'Qualification'>: [>'Msc'>,>'MA'>,>'Msc'>,>'Msc'>]}> # Define a dictionary with key values of> # an existing column and their respective> # value pairs as the # values for our new column.> address>=> {>'Delhi'>:>'Jai'>,>'Bangalore'>:>'Princi'>,> >'Patna'>:>'Gaurav'>,>'Chennai'>:>'Anuj'>}> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Provide 'Address' as the column name> df[>'Address'>]>=> address> # Observe the output> print>(df)>

>

>

Ausgabe:

  Name Height Qualification Address     0   Jai 5.1 Msc Delhi   1   Princi 6.2 MA Bangalore   2   Gaurav 5.1 Msc Chennai   3    Anuj 5.2 Msc Patna>

Hinzufügen einer neuen Spalte zu einem Pandas DataFrame mithilfe von List

In diesem Beispiel, Pandas fügen neue Spalten aus der Liste hinzu Adressieren Sie mithilfe eines Wörterbuchs und einer Liste einen vorhandenen Pandas DataFrame.

Python3




# Declare a list that is to be converted into a column> address>=> [>'Delhi'>,>'Bangalore'>,>'Chennai'>,>'Patna'>]> # Using 'Address' as the column name> # and equating it to the list> df[>'Address'>]>=> address> print>(df)>

>

math.pow Java
>

Ausgabe:

  Name Height Qualification Address     0   Jai 5.1 Msc Delhi   1   Princi 6.2 MA Bangalore   2   Gaurav 5.1 Msc Chennai   3    Anuj 5.2 Msc Patna>

Mit Dataframe.loc() eine neue Spalte zu einem vorhandenen Pandas-DataFrame hinzufügen

In diesem Beispiel wird ein Pandas DataFrame mit dem Namen erstelltdf>mit den Spalten „Name“, „Höhe“ und „Qualifikation“ und fügt mithilfe der eine neue Spalte „Adresse“ hinzuloc>Attribut.

Python3




import> pandas as pd> data>=> {>'Name'>: [>'Jai'>,>'Princi'>,>'Gaurav'>,>'Anuj'>],> >'Height'>: [>5.1>,>6.2>,>5.1>,>5.2>],> >'Qualification'>: [>'Msc'>,>'MA'>,>'Msc'>,>'Msc'>]}> df>=> pd.DataFrame(data)> # Create the list of new column values> address>=> [>'Delhi'>,>'Bangalore'>,>'Chennai'>,>'Patna'>]> # Add the new column using loc> df.loc[:,>'Address'>]>=> address> print>(df)>

>

Spieltaube Android

>

Ausgabe:

  Name Height Qualification Address     0    Jai 5.1 Msc Delhi   1   Princi 6.2 MA Bangalore   2   Gaurav 5.1 Msc Chennai   3   Anuj 5.2 Msc Patna>

Hinzufügen mehrerer Spalten zum vorhandenen Datenrahmen

In diesem Beispiel wird ein vorhandener Pandas DataFrame erweitertdf>mit zwei neuen Spalten, Alter und Staat, unter Verwendung ihrer jeweiligen Datenlisten.

Python3




import> pandas as pd> data>=> {>'Name'>: [>'Jai'>,>'Princi'>,>'Gaurav'>,>'Anuj'>],> >'Height'>: [>5.1>,>6.2>,>5.1>,>5.2>],> >'Qualification'>: [>'Msc'>,>'MA'>,>'Msc'>,>'Msc'>],> >'Address'>: [>'Delhi'>,>'Bangalore'>,>'Chennai'>,>'Patna'>]}> df>=> pd.DataFrame(data)> # Define new data for additional columns> age>=> [>22>,>25>,>23>,>24>]> state>=> [>'NCT'>,>'Karnataka'>,>'Tamil Nadu'>,>'Bihar'>]> # Add multiple columns using dictionary assignment> new_data>=> {>'Age'>: age,>'State'>: state }> df>=> df.assign(>*>*>new_data)> print>(df)>

>

>

Ausgabe:

   Name Height Qualification Address Age State     0    Jai 5.1 Msc Delhi 22 NCT   1   Princi 6.2 MA Bangalore 25 Karnataka   2    Gaurav 5.1 Msc Chennai 23 Tamil Nadu   3   Anuj 5.2 Msc Patna 24 Bihar>

Abschluss

Für die Datenexploration und -manipulation in Pandas ist es wichtig zu verstehen, wie neue Spalten zu DataFrames hinzugefügt werden. Die Wahl der geeigneten Methode hängt vom spezifischen Kontext und dem gewünschten Ergebnis ab. Wenn Sie diese Techniken beherrschen, können Sie Ihre Daten effektiv manipulieren, analysieren und wertvolle Erkenntnisse daraus gewinnen.