logo

Python | Pandas DataFrame.set_index()

In diesem Artikel besprechen wir Pandas DataFrame.set_index() in Python. Python zeichnet sich als hervorragende Sprache für die Datenanalyse aus, vor allem aufgrund seines hervorragenden Ökosystems datenzentrierter Pakete. Unter diesen Paketen sind Pandas spielt eine wichtige Rolle bei der Vereinfachung des Imports und der Analyse von Daten.

Pandas DataFrame.set_index() Syntax

Syntax: DataFrame.set_index(keys, drop=True, append=False, inplace=False, verify_integrity=False)

Parameter:



  • Schlüssel: Spaltenname oder eine Liste von Spaltennamen.
  • fallen: Ein boolescher Wert, der bei True die für den Index verwendete Spalte löscht.
  • anhängen: Wenn True, wird die angegebene Spalte an die vorhandene Indexspalte angehängt.
  • an Ort und Stelle: Bei True werden die Änderungen im DataFrame selbst vorgenommen.
  • Verifiziere_Integrität: Wenn True, wird die neue Indexspalte auf Duplikate überprüft.

Was ist Pandas DataFrame.set_index()?

Der Pandas-Datenrahmen. set_index() Die Methode wird verwendet, um eine Liste, eine Reihe oder einen anderen Datenrahmen als Index eines bestimmten Datenrahmens zuzuweisen. Dies ist besonders nützlich, wenn mehrere Datenrahmen kombiniert werden, da es eine einfache Änderung des Index ermöglicht. Während bei der Datenrahmenerstellung eine Indexspalte angegeben werden kann, bietet set_index() eine flexible Möglichkeit, den Index später zu ändern. Im Wesentlichen ermöglicht es Ihnen, eine Liste, eine Reihe oder einen Datenrahmen als Index eines Datenrahmens festzulegen. Manchmal besteht ein Datenrahmen jedoch aus zwei oder mehr Datenrahmen, sodass der Index später mit dieser Methode geändert werden kann.

Um die verwendete CSV-Datei herunterzuladen, klicken Sie auf Hier.

Beispiele für Pandas DataFrame.set_index()

Nachfolgend finden Sie entsprechende Abbildungen der Beispiele für Pandas DataFrame.set_index().

  • Pandas setzen den Index auf Spalte
  • Spalte mit mehreren Indizes
  • Eine Single einstellen Float-Spalte als Index
  • Einstellung drei Spalten als MultiIndex
  • Pandas legen den Index einer bestimmten Spalte fest

Pandas setzen den Index auf Spalte

In diesem Beispiel ändern wir die Indexspalte. Die Spalte „Vorname“ wurde zur Indexspalte des Datenrahmens gemacht.

Python3




# importing pandas package> import> pandas as pd> # making data frame from csv file> data>=> pd.read_csv(>'employees.csv'>)> # setting first name as index column> data.set_index(>'First Name'>, inplace>=> True>)> # display> data.head()>

Teilzeichenfolge Java

>

>

Ausgabe : Vor der Operation –

Nach der Operation –

Wie in den Ausgabebildern gezeigt, bestand die Indexspalte früher aus einer Zahlenreihe, später wurde sie jedoch durch „Vorname“ ersetzt.

Pandas setzen den Index auf die Spalte mit mehreren Indizes

In diesem Beispiel werden zwei Spalten als Indexspalte erstellt. Der Drop-Parameter wird verwendet, um die Spalte zu löschen, und der Append-Parameter wird verwendet, um übergebene Spalten an die bereits vorhandene Indexspalte anzuhängen.

Python3




# importing pandas package> import> pandas as pd> # making data frame from csv file> data>=> pd.read_csv(>'employees.csv'>)> # setting first name as index column> data.set_index([>'First Name'>,>'Gender'>], inplace>=> True>,> >append>=> True>, drop>=> False>)> # display> data.head()>

Hoppla, Konzepte in Java
>

>

Ausgabe:

Wie im Ausgabebild gezeigt, verfügen die Daten über drei Indexspalten.

Pandas Dataframe Index Einstellung eines einzelnen Float-Spalte als Index

In diesem Beispiel verwendet das folgende Codefragment die Pandas-Bibliothek, um aus einer verschachtelten Liste von Schülerdaten einen DataFrame mit dem Namen „df“ zu erstellen. Es legt die Spalte „Agg_Marks“ als Index fest und zeigt den resultierenden DataFrame mit den Spalten „Name“, „Alter“, „Stadt“ und „Land“ an.

Python3




# importing pandas library> import> pandas as pd> # creating and initializing a nested list> students>=> [[>'jack'>,>34>,>'Sydeny'>,>'Australia'>,>85.96>],> >[>'Riti'>,>30>,>'Delhi'>,>'India'>,>95.20>],> >[>'Vansh'>,>31>,>'Delhi'>,>'India'>,>85.25>],> >[>'Nanyu'>,>32>,>'Tokyo'>,>'Japan'>,>74.21>],> >[>'Maychan'>,>16>,>'New York'>,>'US'>,>99.63>],> >[>'Mike'>,>17>,>'las vegas'>,>'US'>,>47.28>]]> # Create a DataFrame object> df>=> pd.DataFrame(students,> >columns>=>[>'Name'>,>'Age'>,>'City'>,>'Country'>,>'Agg_Marks'>],> >index>=>[>'a'>,>'b'>,>'c'>,>'d'>,>'e'>,>'f'>])> # here we set Float column 'Agg_Marks' as index of data frame> # using dataframe.set_index() function> df>=> df.set_index(>'Agg_Marks'>)> # Displaying the Data frame> df>

>

>

Ausgabe :

 Name Age City Country Agg_Marks 85.96 jack 34 Sydeny Australia 95.20 Riti 30 Delhi India 85.25 Vansh 31 Delhi India 74.21 Nanyu 32 Tokyo Japan 99.63 Maychan 16 New York US 47.28 Mike 17 las vegas US>

Im obigen Beispiel setzen wir die Spalte „ Agg_Marks ‘ als Index des Datenrahmens.

Gimp Wasserzeichen entfernen

Indexeinstellung für Pandas-Datenrahmen drei Spalten als MultiIndex

In diesem Beispiel verwendet der folgende Code Pandas, um aus Studentendaten einen DataFrame „df“ mit den Spalten „Name“, „Alter“, „Stadt“, „Land“, „Agg_Marks“ und „ID“ zu erstellen. Es verwendet die Funktion „set_index()“, um einen mehrstufigen Index mit „Name“, „Stadt“ und „ID“ zu erstellen und zeigt dann den resultierenden DataFrame an.

Python3




# importing pandas library> import> pandas as pd> # creating and initializing a nested list> students>=> [[>'jack'>,>34>,>'Sydeny'>,>'Australia'>,>85.96>,>400>],> >[>'Riti'>,>30>,>'Delhi'>,>'India'>,>95.20>,>750>],> >[>'Vansh'>,>31>,>'Delhi'>,>'India'>,>85.25>,>101>],> >[>'Nanyu'>,>32>,>'Tokyo'>,>'Japan'>,>74.21>,>900>],> >[>'Maychan'>,>16>,>'New York'>,>'US'>,>99.63>,>420>],> >[>'Mike'>,>17>,>'las vegas'>,>'US'>,>47.28>,>555>]]> # Create a DataFrame object> df>=> pd.DataFrame(students,> >columns>=>[>'Name'>,>'Age'>,>'City'>,>'Country'>,>'Agg_Marks'>,>'ID'>],> >index>=>[>'a'>,>'b'>,>'c'>,>'d'>,>'e'>,>'f'>])> # Here we pass list of 3 columns i.e 'Name', 'City' and 'ID'> # to dataframe.set_index() function> # to set them as multiIndex of dataframe> df>=> df.set_index([>'Name'>,>'City'>,>'ID'>])> # Displaying the Data frame> df>

>

>

Ausgabe :

 Age Country Agg_Marks Name City ID jack Sydeny 400 34 Australia 85.96 Riti Delhi 750 30 India 95.20 Vansh Delhi 101 31 India 85.25 Nanyu Tokyo 900 32 Japan 74.21 Maychan New York 420 16 US 99.63 Mike las vegas 555 17 US 47.28>

Im obigen Beispiel setzen wir die Spalten „ Name ', ' Stadt ', Und ' AUSWEIS ‘ als MultiIndex des Datenrahmens.

Pandas legen den Index einer bestimmten Spalte fest

In diesem Beispiel zeigt der folgende Code, wie Sie mit Pandas einen DataFrame erstellen und mithilfe von eine bestimmte Spalte (in diesem Fall „Name“) als Index festlegenset_index()>-Methode und zeigt dann sowohl die ursprünglichen als auch die geänderten DataFrames an. Derinplace=True>Der Parameter stellt sicher, dass die Änderungen direkt auf den DataFrame angewendet werden, ohne dass eine Neuzuweisung erforderlich ist.

Python3


Abfrageselektor



import> pandas as pd> # Creating a sample DataFrame> data>=> {>'Name'>: [>'Geek1'>,>'Geek2'>,>'Geek3'>],> >'Age'>: [>25>,>30>,>35>],> >'City'>: [>'New York'>,>'San Francisco'>,>'Los Angeles'>]}> df>=> pd.DataFrame(data)> # Displaying the original DataFrame> print>(>'Original DataFrame:'>)> print>(df)> # Using set_index() to set 'Name' column as the index> df.set_index(>'Name'>, inplace>=>True>)> # Displaying the DataFrame after setting the index> print>(>' DataFrame after set_index:'>)> print>(df)>

>

>

Ausgabe :

Original DataFrame: Name Age City 0 Geek1 25 New York 1 Geek2 30 San Francisco 2 Geek3 35 Los Angeles DataFrame after set_index: Age City Name Geek1 25 New York Geek2 30 San Francisco Geek3 35 Los Angeles>