Die Funktion unique() entfernt alle doppelten Werte in einer Spalte und gibt einen einzelnen Wert für mehrere gleiche Werte zurück. In diesem Artikel besprechen wir, wie wir eindeutige Werte aus einer Spalte erhalten können Pandas DataFrame .
Erstellen eines Pandas-Datenrahmens mit doppelten Elementen
Erstellen Sie einen Beispiel-Pandas-Datenrahmen mit einem Wörterbuch von Listen, beispielsweise Spaltennamen A, B, C, D und E mit doppelten Elementen.
Python3
# Import pandas package> import> pandas as pd> # create a dictionary with five fields each> data>=> {> >'A'>: [>'A1'>,>'A2'>,>'A3'>,>'A4'>,>'A5'>],> >'B'>: [>'B1'>,>'B2'>,>'B3'>,>'B4'>,>'B4'>],> >'C'>: [>'C1'>,>'C2'>,>'C3'>,>'C3'>,>'C3'>],> >'D'>: [>'D1'>,>'D2'>,>'D2'>,>'D2'>,>'D2'>],> >'E'>: [>'E1'>,>'E1'>,>'E1'>,>'E1'>,>'E1'>]}> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> |
>
>

Rufen Sie eindeutige Werte aus einer Spalte in Pandas DataFrame ab
Nachfolgend finden Sie einige Beispiele, mit denen wir die eindeutigen Werte einer Spalte in diesem Datenrahmen ermitteln können.
- Holen Sie sich die eindeutigen Werte der Spalte „B“.
- Holen Sie sich die eindeutigen Werte der Spalte „E“.
- Ermitteln Sie die Anzahl der eindeutigen Werte in einer Spalte
- Verwenden von set() zum Entfernen doppelter Werte aus einer Spalte
- Verwendung der Methoden pandas.concat() und Unique()
- Verwenden von Series.drop_duplicates()
Holen Sie sich die eindeutigen Werte der Spalte „B“.
In diesem Beispiel rufen wir die eindeutigen Werte aus der Spalte „B“ mithilfe von ab und drucken sie aus unique()> Methode. Die resultierenden eindeutigen Werte sind['B1', 'B2', 'B3', 'B4']>.
Python3
# Import pandas package> import> pandas as pd> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Get the unique values of 'B' column> df.B.unique()> |
>
>
Ausgabe
array(['B1', 'B2', 'B3', 'B4'], dtype=object)>
Erhalten Sie die einzigartigen Werte von Pandas in der Spalte „E“.
In diesem Beispiel erstellen wir einen Pandas-DataFrame aus einem Wörterbuch und rufen dann mithilfe von die eindeutigen Werte aus der Spalte „E“ abunique()>Methode. Die resultierenden eindeutigen Werte sind['E1']>.
Python3
# Import pandas package> import> pandas as pd> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Get the unique values of 'E' column> df.E.unique()> |
>
>
Ausgabe
array(['E1'], dtype=object)>
Ermitteln Sie die Anzahl der eindeutigen Werte in einer Spalte
In diesem Beispiel erstellen wir einen Pandas-DataFrame aus einem Wörterbuch und berechnen und drucken dann die Anzahl der eindeutigen Werte in der Spalte „C“, mit Ausnahme der NaN-Werte. Das Ergebnis ist 3, was darauf hinweist, dass in Spalte „C“ drei eindeutige Werte vorhanden sind.
Python3
# Import pandas package> import> pandas as pd> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Get number of unique values in column 'C'> df.C.nunique(dropna>=>True>)> |
>
>
Ausgabe
3>
Eliminieren Sie doppelte Werte aus einer Spalte mit set()
In diesem Beispiel erstellen wir einen Pandas-DataFrame aus einem Wörterbuch und verwenden dann den set()>Funktion um eindeutige Werte aus Spalte „C“ zu extrahieren und Duplikate zu vermeiden. Die resultierende Menge,{'C1', 'C2', 'C3'}>stellt die eindeutigen Werte in Spalte „C“ dar.
Python3
# Import pandas package> import> pandas as pd> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Use set() to eliminate duplicate values in column 'C'> unique_values_set>=> set>(df[>'C'>])> # Print the unique values> print>(unique_values_set)> |
>
>
Ausgabe
{'C1', 'C2', 'C3'}> Verwendung der Methoden pandas.concat() und Unique()
In diesem Beispiel erstellen wir einen Pandas-DataFrame aus einem Wörterbuch und verketten dann mithilfe von eindeutige Werte aus allen Spalten pd.concat()> . Das resultierende NumPy-Array zeigt beim Drucken alle eindeutigen Werte aus den Spalten „A“ bis „E“ an.
Python3
# Import pandas package> import> pandas as pd> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Use pd.concat() to concatenate all columns and then apply unique()> unique_values_all_columns>=> pd.concat([df[col].unique()>for> col>in> df.columns])> # Print the unique values> print>(unique_values_all_columns)> |
ist eine Beziehung
>
>
Ausgabe
['A1' 'A2' 'A3' 'A4' 'A5' 'B1' 'B2' 'B3' 'B4' 'C1' 'C2' 'C3' 'D1' 'D2' 'E1']>
Verwenden von Series.drop_duplicates()
In diesem Beispiel erstellen wir einen Pandas-DataFrame aus einem Wörterbuch und entfernen Duplikate aus den Spalten „A“ und „D“ mithilfe von drop_duplicates()>Methode . Der resultierende DataFrame zeigt beim Drucken die eindeutigen Werte in den Spalten „A“ und „D“ an, mit NaN-Werten, bei denen Duplikate aus „D“ entfernt wurden.
Python3
# Import pandas package> import> pandas as pd> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Use drop_duplicates() to remove duplicates from columns 'A' and 'D'> df[>'A'>]>=> df[>'A'>].drop_duplicates()> df[>'D'>]>=> df[>'D'>].drop_duplicates()> # Print the DataFrame after removing duplicates from columns 'A' and 'D'> print>(df)> |
>
>
Ausgabe
A B C D E 0 A1 B1 C1 D1 E1 1 A2 B2 C2 D2 E1 2 A3 B3 C3 NaN E1 3 A4 B4 C3 NaN E1 4 A5 B4 C3 NaN E1>