Die Pandas-Serie kann als eindimensionales Array definiert werden, das verschiedene Datentypen speichern kann. Wir können die Liste, das Tupel und das Wörterbuch einfach in Serien umwandeln, indem wir „ Serie ' Methode. Die Zeilenbeschriftungen von Reihen werden als Index bezeichnet. Eine Serie kann nicht mehrere Spalten enthalten. Es hat den folgenden Parameter:
Erstellen einer Serie:
Wir können eine Serie auf zwei Arten erstellen:
- Erstellen Sie eine leere Serie
- Erstellen Sie eine Serie mithilfe von Eingaben.
Erstellen Sie eine leere Serie:
Wir können in Pandas leicht eine leere Serie erstellen, was bedeutet, dass sie keinen Wert hat.
Die Syntax, die zum Erstellen einer leeren Serie verwendet wird:
= pandas.Series()
Das folgende Beispiel erstellt ein Objekt vom Typ „Empty Series“, das keine Werte hat und den Standarddatentyp hat, d. h. float64 .
Beispiel
import pandas as pd x = pd.Series() print (x)
Ausgabe
Series([], dtype: float64)
Erstellen einer Serie mithilfe von Eingaben:
Wir können Serien erstellen, indem wir verschiedene Eingaben verwenden:
- Array
- Diktat
- Skalarwert
Erstellen einer Serie aus einem Array:
Bevor wir eine Serie erstellen, müssen wir zunächst die importieren Numpy Modul und verwenden Sie dann die Funktion array() im Programm. Wenn die Daten ndarray sind, muss der übergebene Index dieselbe Länge haben.
Wenn wir keinen Index übergeben, wird standardmäßig der Index verwendet Bereich(n) wird übergeben, wobei n die Länge eines Arrays definiert, d. h. [0,1,2,.... Bereich(len(array))-1 ].
was xd bedeutet
Beispiel
import pandas as pd import numpy as np info = np.array(['P','a','n','d','a','s']) a = pd.Series(info) print(a)
Ausgabe
0 P 1 a 2 n 3 d 4 a 5 s dtype: object
Erstellen Sie eine Serie aus dict
Wir können auch eine Serie aus dict erstellen. Wenn das Wörterbuchobjekt als Eingabe übergeben wird und der Index nicht angegeben ist, werden die Wörterbuchschlüssel in sortierter Reihenfolge verwendet, um den Index zu erstellen .
Wenn ein Index übergeben wird, werden Werte, die einer bestimmten Bezeichnung im Index entsprechen, aus dem extrahiert Wörterbuch .
#import the pandas library import pandas as pd import numpy as np info = {'x' : 0., 'y' : 1., 'z' : 2.} a = pd.Series(info) print (a)
Ausgabe
x 0.0 y 1.0 z 2.0 dtype: float64
Erstellen Sie eine Reihe mit Scalar:
Wenn wir die Skalarwerte nehmen, muss der Index angegeben werden. Der Skalarwert wird wiederholt, um ihn an die Länge des Index anzupassen.
#import pandas library import pandas as pd import numpy as np x = pd.Series(4, index=[0, 1, 2, 3]) print (x)
Ausgabe
0 4 1 4 2 4 3 4 dtype: int64
Zugriff auf Daten aus Serien mit Position:
Sobald Sie das Objekt vom Typ „Serie“ erstellt haben, können Sie auf seine Indizes, Daten und sogar einzelne Elemente zugreifen.
Auf die Daten in der Serie kann ähnlich zugegriffen werden wie im ndarray.
Anonyme Java-Funktion
import pandas as pd x = pd.Series([1,2,3],index = ['a','b','c']) #retrieve the first element print (x[0])
Ausgabe
1
Objektattribute der Serie
Das Serienattribut ist als jede Information definiert, die sich auf das Serienobjekt bezieht, beispielsweise Größe und Datentyp. usw. Im Folgenden sind einige der Attribute aufgeführt, die Sie verwenden können, um Informationen über das Series-Objekt abzurufen:
Attribute | Beschreibung |
---|---|
Serien.index | Definiert den Index der Serie. |
Serienform | Es gibt ein Tupel der Form der Daten zurück. |
Series.dtype | Es gibt den Datentyp der Daten zurück. |
Seriengröße | Es gibt die Größe der Daten zurück. |
Serie.leer | Es gibt „True“ zurück, wenn das Serienobjekt leer ist, andernfalls wird „False“ zurückgegeben. |
Serie.hasnans | Es gibt True zurück, wenn NaN-Werte vorhanden sind, andernfalls wird False zurückgegeben. |
Series.nbytes | Es gibt die Anzahl der Bytes in den Daten zurück. |
Serie. Ich bin | Es gibt die Anzahl der Dimensionen in den Daten zurück. |
Series.itemsize | Es gibt die Größe des Datentyps des Elements zurück. |
Abrufen des Index-Arrays und des Daten-Arrays eines Serienobjekts
Wir können das Index-Array und das Daten-Array eines vorhandenen Serienobjekts abrufen, indem wir die Attribute Index und Werte verwenden.
import numpy as np import pandas as pd x=pd.Series(data=[2,4,6,8]) y=pd.Series(data=[11.2,18.6,22.5], index=['a','b','c']) print(x.index) print(x.values) print(y.index) print(y.values)
Ausgabe
RangeIndex(start=0, stop=4, step=1) [2 4 6 8] Index(['a', 'b', 'c'], dtype='object') [11.2 18.6 22.5]
Abrufen von Typen (dtype) und Typgröße (itemsize)
Sie können das Attribut dtype mit dem Serienobjekt als dtype zum Abrufen des Datentyps eines einzelnen Elements eines Serienobjekts verwenden Artikelgröße Attribut, um die Anzahl der jedem Datenelement zugewiesenen Bytes anzuzeigen.
Winterschlaf-Dialekt
import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.dtype) print(a.itemsize) print(b.dtype) print(b.itemsize)
Ausgabe
int64 8 float64 8
Form abrufen
Die Form des Series-Objekts definiert die Gesamtzahl der Elemente, einschließlich fehlender oder leerer Werte (NaN).
import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) print(a.shape) print(b.shape)
Ausgabe
(4,) (3,)
Dimension, Größe und Anzahl der Bytes abrufen:
import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.ndim, b.ndim) print(a.size, b.size) print(a.nbytes, b.nbytes)
Ausgabe
1 1 4 3 32 24
Überprüfung der Leere und Anwesenheit von NaNs
Um zu überprüfen, ob das Series-Objekt leer ist, können Sie Folgendes verwenden: leeres Attribut . Um zu überprüfen, ob ein Serienobjekt einige NaN-Werte enthält oder nicht, können Sie ebenfalls Folgendes verwenden: hassan Attribut.
Beispiel
import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,np.NaN]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) c=pd.Series() print(a.empty,b.empty,c.empty) print(a.hasnans,b.hasnans,c.hasnans) print(len(a),len(b)) print(a.count( ),b.count( ))
Ausgabe
False False True True False False 4 3 3 3
Serienfunktionen
In Series werden einige Funktionen verwendet:
Funktionen | Beschreibung |
---|---|
Pandas Series.map() | Ordnen Sie die Werte aus zwei Reihen zu, die eine gemeinsame Spalte haben. |
Pandas Series.std() | Berechnen Sie die Standardabweichung des angegebenen Satzes von Zahlen, DataFrame, Spalten und Zeilen. |
Pandas Series.to_frame() | Konvertieren Sie das Serienobjekt in den Datenrahmen. |
Pandas Series.value_counts() | Gibt eine Reihe zurück, die die Anzahl der eindeutigen Werte enthält. |