Datenvisualisierung ist die Technik, mit der mithilfe visueller Hinweise wie Grafiken, Diagramme, Karten und vielen anderen Einblicke in Daten gewonnen werden. Dies ist nützlich, da es dabei hilft, die großen Datenmengen intuitiv und einfach zu verstehen und dadurch bessere Entscheidungen zu treffen. Wenn wir eine große Anzahl eines Datensatzes drucken, wird dieser abgeschnitten. In diesem Artikel erfahren Sie, wie Sie das Ganze ausdrucken Pandas-Datenrahmen oder Serie ohne Kürzung.
Drucken Sie einen gesamten Pandas DataFrame in Python
Standardmäßig wird der vollständige Datenrahmen nicht gedruckt, wenn die Länge die Standardlänge überschreitet. Die Ausgabe wird wie unten gezeigt abgeschnitten:
Python3
import> numpy as np> from> sklearn.datasets>import> load_iris> import> pandas as pd> # Loading irirs dataset> data>=> load_iris()> df>=> pd.DataFrame(data.data,> >columns>=> data.feature_names)> display(df)> |
>
>
Ausgabe:
Es gibt 4 Methoden zum Drucken des gesamten Pandas-Datenrahmens:
- Verwenden Sie die Methode to_string()
- Verwenden Sie die Methode pd.option_context()
- Verwenden Sie die Methode pd.set_options()
- Verwenden Sie die Methode pd.to_markdown()
Methode 1: Verwendung von to_string()
Obwohl diese Methode die einfachste von allen ist, empfiehlt sie sich nicht für sehr große Datensätze (in der Größenordnung von Millionen), da sie den gesamten Datenrahmen in ein String-Objekt umwandelt, funktioniert aber sehr gut für Datenrahmen mit einer Größe in der Größenordnung von Tausenden.
Syntax: DataFrame.to_string(buf=None, columns=None, col_space=None, header=True, index=True, na_rep='NaN', formatters=None, float_format=None, index_names=True, justify=None, max_rows=None, max_cols=Keine, show_dimensions=False, decimal='.', line_width=Keine)
Beispiel: In diesem Beispiel verwenden wir dieload_iris>Funktion von scikit-learn zum Laden des Iris-Datensatzes und erstellt dann einen Pandas-DataFrame (df>), die die Datensatzfunktionen enthält, und konvertiert schließlich den gesamten DataFrame mithilfe von in eine Zeichenfolgendarstellung to_string()> und zeigt es an.
Python3
import> numpy as np> from> sklearn.datasets>import> load_iris> import> pandas as pd> data>=> load_iris()> df>=> pd.DataFrame(data.data,> >columns>=> data.feature_names)> # Convert the whole dataframe as a string and display> display(df.to_string())> |
Java-Lambda-Beispiel
>
>
Ausgabe:
Methode 2: Verwendung von pd.option_context()
Pandas ermöglichen das Ändern von Einstellungen über option_context() Methode und set_option() Methoden. Beide Methoden sind identisch, mit dem Unterschied, dass die Einstellungen später dauerhaft geändert werden und erstere dies nur im Rahmen des Kontextmanagers tun.
Syntax : pandas.option_context(*args)
Beispiel: In diesem Beispiel verwenden wir den Iris-Datensatz von scikit-learn und erstellen einen Pandas-DataFrame (df>) mit angegebenen Formatierungsoptionen und druckt den DataFrame in einem temporären Kontext, in dem Anzeigeeinstellungen, wie maximale Zeilen, Spalten und Genauigkeit, nur für den lokalen Bereich geändert werden.
Python3
import> numpy as np> from> sklearn.datasets>import> load_iris> import> pandas as pd> data>=> load_iris()> df>=> pd.DataFrame(data.data,> >columns>=> data.feature_names)> # The scope of these changes made to> # pandas settings are local to with statement.> with pd.option_context(>'display.max_rows'>,>None>,> >'display.max_columns'>,>None>,> >'display.precision'>,>3>,> >):> >print>(df)> |
>
>
Ausgabe:
Methode 3: Verwenden von pd.set_option()
Diese Methode ähnelt der Methode pd.option_context() und verwendet dieselben Parameter wie für Methode 2 besprochen, unterscheidet sich jedoch von pd.option_context() Geltungsbereich und Wirkung beziehen sich auf das gesamte Skript, d. h. alle Datenrahmeneinstellungen werden dauerhaft geändert
So rufen Sie versteckte Apps ab
Um den Wert explizit zurückzusetzen, verwenden Sie pd.reset_option('all') Um die Änderungen rückgängig zu machen, muss die Methode verwendet werden.
Syntax : pandas.set_option(pat, value)
Beispiel: Dieser Code ändert die globalen Pandas-Anzeigeoptionen, um alle Zeilen und Spalten mit unbegrenzter Breite und Genauigkeit für den angegebenen DataFrame anzuzeigen (df>). Anschließend werden die Optionen auf ihre Standardwerte zurückgesetzt und der DataFrame erneut angezeigt, um die Wiederherstellung der Standardeinstellungen zu veranschaulichen.
Python3
import> numpy as np> from> sklearn.datasets>import> load_iris> import> pandas as pd> data>=> load_iris()> df>=> pd.DataFrame(data.data,> >columns>=> data.feature_names)> # Permanently changes the pandas settings> pd.set_option(>'display.max_rows'>,>None>)> pd.set_option(>'display.max_columns'>,>None>)> pd.set_option(>'display.width'>,>None>)> pd.set_option(>'display.max_colwidth'>,>->1>)> # All dataframes hereafter reflect these changes.> display(df)> print>(>'**RESET_OPTIONS**'>)> # Resets the options> pd.reset_option(>'all'>)> display(df)> |
>
>
Ausgabe:
Methode 4: Verwendung von to_markdown()
Diese Methode ähnelt der to_string()-Methode, da sie auch den Datenrahmen in ein String-Objekt konvertiert und ihm außerdem Stil und Formatierung hinzufügt.
Syntax : DataFrame.to_markdown(buf=None, mode=’wt’, index=True,, **kwargs)
Beispiel: Dieser Code verwendet den Iris-Datensatz von scikit-learn, um einen Pandas-DataFrame zu erstellen (df>) und druckt dann eine formatierte Markdown-Darstellung des DataFrame unter Verwendung von to_markdown()>Methode .
Python3
import> numpy as np> from> sklearn.datasets>import> load_iris> import> pandas as pd> data>=> load_iris()> df>=> pd.DataFrame(data.data,> >columns>=>data.feature_names)> # Converts the dataframe into str object with formatting> print>(df.to_markdown())> |
Datenstrukturen Java
>
>
Ausgabe: