logo

Pandas DataFrame.describe()

Die Methode „beschreiben()“ wird zum Berechnen einiger statistischer Daten verwendet, z Perzentil, Mittelwert Und std der numerischen Werte der Serie oder des DataFrame. Es analysiert sowohl numerische als auch Objektreihen sowie die DataFrame-Spaltensätze gemischter Datentypen.

Syntax

 DataFrame.describe(percentiles=None, include=None, exclude=None) 

Parameter

    Perzentil:Es handelt sich um einen optionalen Parameter, bei dem es sich um einen listenähnlichen Datentyp mit Zahlen handelt, die zwischen 0 und 1 liegen sollten. Sein Standardwert ist [.25, .5, .75], der das 25., 50. und 75. Perzentil zurückgibt.enthalten:Es handelt sich außerdem um einen optionalen Parameter, der die Liste der Datentypen einschließt und gleichzeitig den DataFrame beschreibt. Der Standardwert ist None.ausschließen:Es handelt sich außerdem um einen optionalen Parameter, der bei der Beschreibung von DataFrame die Liste der Datentypen ausschließt. Der Standardwert ist None.

Kehrt zurück

Es gibt die statistische Zusammenfassung der Serie und des DataFrame zurück.

Beispiel 1

 import pandas as pd import numpy as np a1 = pd.Series([1, 2, 3]) a1.describe() 

Ausgabe

 count 3.0 mean 2.0 std 1.0 min 1.0 25% 1.5 50% 2.0 75% 2.5 max 3.0 dtype: float64 

Beispiel2

 import pandas as pd import numpy as np a1 = pd.Series(['p', 'q', 'q', 'r']) a1.describe() 

Ausgabe

 count 4 unique 3 top q freq 2 dtype: object 

Beispiel3

 import pandas as pd import numpy as np a1 = pd.Series([1, 2, 3]) a1.describe() a1 = pd.Series(['p', 'q', 'q', 'r']) a1.describe() info = pd.DataFrame({'categorical': pd.Categorical(['s','t','u']), 'numeric': [1, 2, 3], 'object': ['p', 'q', 'r'] }) info.describe(include=[np.number]) info.describe(include=[np.object]) info.describe(include=['category']) 

Ausgabe

 categorical count 3 unique 3 top u freq 1 

Beispiel4

 import pandas as pd import numpy as np a1 = pd.Series([1, 2, 3]) a1.describe() a1 = pd.Series(['p', 'q', 'q', 'r']) a1.describe() info = pd.DataFrame({'categorical': pd.Categorical(['s','t','u']), 'numeric': [1, 2, 3], 'object': ['p', 'q', 'r'] }) info.describe() info.describe(include='all') info.numeric.describe() info.describe(include=[np.number]) info.describe(include=[np.object]) info.describe(include=['category']) info.describe(exclude=[np.number]) info.describe(exclude=[np.object]) 

Ausgabe

 categorical numeric count 3 3.0 unique 3 NaN top u NaN freq 1 NaN mean NaN 2.0 std NaN 1.0 min NaN 1.0 25% NaN 1.5 50% NaN 2.0 75% NaN 2.5 max NaN 3.0