Das Filtern eines Pandas DataFrame anhand von Spaltenwerten ist ein alltäglicher Vorgang bei der Ausführung mit Informationen in Python. Um dies zu erreichen, können Sie verschiedene Methoden und Techniken nutzen. Es gibt zahlreiche Möglichkeiten, einen Pandas DataFrame anhand von Spaltenwerten herauszufiltern.
In diesem Beitrag sehen wir verschiedene Möglichkeiten, Pandas Dataframe nach Spaltenwerten zu filtern. Erstellen wir zunächst einen Datenrahmen:
Python3
# importing pandas> import> pandas as pd> > # declare a dictionary> record>=> {> >'Name'> : [>'Ankit'>,>'Swapnil'>,>'Aishwarya'>,> >'Priyanka'>,>'Shivangi'>,>'Shaurya'> ],> > >'Age'> : [>22>,>20>,>21>,>19>,>18>,>22>],> > >'Stream'> : [>'Math'>,>'Commerce'>,>'Science'>,> >'Math'>,>'Math'>,>'Science'>],> > >'Percentage'> : [>90>,>90>,>96>,>75>,>70>,>80>] }> > # create a dataframe> dataframe>=> pd.DataFrame(record,> >columns>=> [>'Name'>,>'Age'>,> >'Stream'>,>'Percentage'>])> # show the Dataframe> print>(>'Given Dataframe :
'>, dataframe)> |
>
>
Ausgabe:

Auswählen von Zeilen des Pandas-Datenrahmens basierend auf einem bestimmten Spaltenwert mit den Operatoren „>“, „=“, „=“, „<=“, „!=“.
Beispiel 1: Auswahl aller Zeilen aus dem angegebenen Datenrahmen, in denen „Prozentsatz“ größer als 75 ist [ ] .
Python3
# selecting rows based on condition> rslt_df>=> dataframe[dataframe[>'Percentage'>]>>70>]> > print>(>'
Result dataframe :
'>, rslt_df)> |
>
>
Ausgabe:

Beispiel 2: Auswahl aller Zeilen aus dem angegebenen Datenrahmen, in denen „Prozentsatz“ größer als 70 ist Ort [ ] .
Python3
# selecting rows based on condition> rslt_df>=> dataframe.loc[dataframe[>'Percentage'>]>>70>]> > print>(>'
Result dataframe :
'>,> >rslt_df)> |
>
>
Ausgabe:

Auswählen der Zeilen von Pandas Dataframe, deren Spaltenwert in der Liste vorhanden ist, mit Du() Methode des Datenrahmens.
Beispiel 1: Wählen Sie mit alle Zeilen aus dem angegebenen Datenrahmen aus, in denen „Stream“ in der Optionsliste vorhanden ist [ ] .
Python3
options>=> [>'Science'>,>'Commerce'>]> > # selecting rows based on condition> rslt_df>=> dataframe[dataframe[>'Stream'>].isin(options)]> > print>(>'
Result dataframe :
'>,> >rslt_df)> |
>
>
Ausgabe:

Beispiel 2: Wählen Sie mit alle Zeilen aus dem angegebenen Datenrahmen aus, in denen „Stream“ in der Optionsliste vorhanden ist Ort [ ] .
Python
options>=> [>'Science'>,>'Commerce'>]> > # selecting rows based on condition> rslt_df>=> dataframe.loc[dataframe[>'Stream'>].isin(options)]> > print>(>'
Result dataframe :
'>,> >rslt_df)> |
>
>
Ausgabe:

Auswählen von Zeilen des Pandas-Datenrahmens basierend auf mehreren Spaltenbedingungen mithilfe des Operators „&“.
Beispiel 1: Wählen Sie alle Zeilen aus dem angegebenen Datenrahmen aus, in denen „Alter“ gleich 22 ist und „Stream“ in der Optionsliste vorhanden ist [ ] .
Python3
options>=> [>'Commerce'> ,>'Science'>]> > # selecting rows based on condition> rslt_df>=> dataframe[(dataframe[>'Age'>]>=>=> 22>) &> >dataframe[>'Stream'>].isin(options)]> > print>(>'
Result dataframe :
'>,> >rslt_df)> |
>
>
Ausgabe:

Beispiel 2: Wählen Sie alle Zeilen aus dem angegebenen Datenrahmen aus, in denen „Alter“ gleich 22 ist und „Stream“ in der Optionsliste vorhanden ist Ort [ ] .
Python3
Gimp-Rechteck zeichnen
options>=> [>'Commerce'>,>'Science'>]> > # selecting rows based on condition> rslt_df>=> dataframe.loc[(dataframe[>'Age'>]>=>=> 22>) &> >dataframe[>'Stream'>].isin(options)]> > print>(>'
Result dataframe :
'>,> >rslt_df)> |
>
>
Ausgabe:
