logo

Python Pandas-Serie

Die Pandas-Serie kann als eindimensionales Array definiert werden, das verschiedene Datentypen speichern kann. Wir können die Liste, das Tupel und das Wörterbuch einfach in Serien umwandeln, indem wir „ Serie ' Methode. Die Zeilenbeschriftungen von Reihen werden als Index bezeichnet. Eine Serie kann nicht mehrere Spalten enthalten. Es hat den folgenden Parameter:

    Daten:Es kann sich um eine beliebige Liste, ein Wörterbuch oder einen Skalarwert handeln.Index:Der Wert des Index sollte eindeutig und hashbar sein. Es muss die gleiche Länge wie die Daten haben. Wenn wir keinen Index übergeben, gilt die Standardeinstellung np.arrange(n) verwendet wird.dtype:Es bezieht sich auf den Datentyp der Serie.Kopieren:Es wird zum Kopieren der Daten verwendet.

Erstellen einer Serie:

Wir können eine Serie auf zwei Arten erstellen:

  1. Erstellen Sie eine leere Serie
  2. Erstellen Sie eine Serie mithilfe von Eingaben.

Erstellen Sie eine leere Serie:

Wir können in Pandas leicht eine leere Serie erstellen, was bedeutet, dass sie keinen Wert hat.

Die Syntax, die zum Erstellen einer leeren Serie verwendet wird:

 = pandas.Series() 

Das folgende Beispiel erstellt ein Objekt vom Typ „Empty Series“, das keine Werte hat und den Standarddatentyp hat, d. h. float64 .

Beispiel

 import pandas as pd x = pd.Series() print (x) 

Ausgabe

 Series([], dtype: float64) 

Erstellen einer Serie mithilfe von Eingaben:

Wir können Serien erstellen, indem wir verschiedene Eingaben verwenden:

  • Array
  • Diktat
  • Skalarwert

Erstellen einer Serie aus einem Array:

Bevor wir eine Serie erstellen, müssen wir zunächst die importieren Numpy Modul und verwenden Sie dann die Funktion array() im Programm. Wenn die Daten ndarray sind, muss der übergebene Index dieselbe Länge haben.

Wenn wir keinen Index übergeben, wird standardmäßig der Index verwendet Bereich(n) wird übergeben, wobei n die Länge eines Arrays definiert, d. h. [0,1,2,.... Bereich(len(array))-1 ].

was xd bedeutet

Beispiel

 import pandas as pd import numpy as np info = np.array(['P','a','n','d','a','s']) a = pd.Series(info) print(a) 

Ausgabe

 0 P 1 a 2 n 3 d 4 a 5 s dtype: object 

Erstellen Sie eine Serie aus dict

Wir können auch eine Serie aus dict erstellen. Wenn das Wörterbuchobjekt als Eingabe übergeben wird und der Index nicht angegeben ist, werden die Wörterbuchschlüssel in sortierter Reihenfolge verwendet, um den Index zu erstellen .

Wenn ein Index übergeben wird, werden Werte, die einer bestimmten Bezeichnung im Index entsprechen, aus dem extrahiert Wörterbuch .

 #import the pandas library import pandas as pd import numpy as np info = {'x' : 0., 'y' : 1., 'z' : 2.} a = pd.Series(info) print (a) 

Ausgabe

 x 0.0 y 1.0 z 2.0 dtype: float64 

Erstellen Sie eine Reihe mit Scalar:

Wenn wir die Skalarwerte nehmen, muss der Index angegeben werden. Der Skalarwert wird wiederholt, um ihn an die Länge des Index anzupassen.

 #import pandas library import pandas as pd import numpy as np x = pd.Series(4, index=[0, 1, 2, 3]) print (x) 

Ausgabe

 0 4 1 4 2 4 3 4 dtype: int64 

Zugriff auf Daten aus Serien mit Position:

Sobald Sie das Objekt vom Typ „Serie“ erstellt haben, können Sie auf seine Indizes, Daten und sogar einzelne Elemente zugreifen.

Auf die Daten in der Serie kann ähnlich zugegriffen werden wie im ndarray.

Anonyme Java-Funktion
 import pandas as pd x = pd.Series([1,2,3],index = ['a','b','c']) #retrieve the first element print (x[0]) 

Ausgabe

 1 

Objektattribute der Serie

Das Serienattribut ist als jede Information definiert, die sich auf das Serienobjekt bezieht, beispielsweise Größe und Datentyp. usw. Im Folgenden sind einige der Attribute aufgeführt, die Sie verwenden können, um Informationen über das Series-Objekt abzurufen:

Attribute Beschreibung
Serien.index Definiert den Index der Serie.
Serienform Es gibt ein Tupel der Form der Daten zurück.
Series.dtype Es gibt den Datentyp der Daten zurück.
Seriengröße Es gibt die Größe der Daten zurück.
Serie.leer Es gibt „True“ zurück, wenn das Serienobjekt leer ist, andernfalls wird „False“ zurückgegeben.
Serie.hasnans Es gibt True zurück, wenn NaN-Werte vorhanden sind, andernfalls wird False zurückgegeben.
Series.nbytes Es gibt die Anzahl der Bytes in den Daten zurück.
Serie. Ich bin Es gibt die Anzahl der Dimensionen in den Daten zurück.
Series.itemsize Es gibt die Größe des Datentyps des Elements zurück.

Abrufen des Index-Arrays und des Daten-Arrays eines Serienobjekts

Wir können das Index-Array und das Daten-Array eines vorhandenen Serienobjekts abrufen, indem wir die Attribute Index und Werte verwenden.

 import numpy as np import pandas as pd x=pd.Series(data=[2,4,6,8]) y=pd.Series(data=[11.2,18.6,22.5], index=['a','b','c']) print(x.index) print(x.values) print(y.index) print(y.values) 

Ausgabe

 RangeIndex(start=0, stop=4, step=1) [2 4 6 8] Index(['a', 'b', 'c'], dtype='object') [11.2 18.6 22.5] 

Abrufen von Typen (dtype) und Typgröße (itemsize)

Sie können das Attribut dtype mit dem Serienobjekt als dtype zum Abrufen des Datentyps eines einzelnen Elements eines Serienobjekts verwenden Artikelgröße Attribut, um die Anzahl der jedem Datenelement zugewiesenen Bytes anzuzeigen.

Winterschlaf-Dialekt
 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.dtype) print(a.itemsize) print(b.dtype) print(b.itemsize) 

Ausgabe

 int64 8 float64 8 

Form abrufen

Die Form des Series-Objekts definiert die Gesamtzahl der Elemente, einschließlich fehlender oder leerer Werte (NaN).

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) print(a.shape) print(b.shape) 

Ausgabe

 (4,) (3,) 

Dimension, Größe und Anzahl der Bytes abrufen:

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.ndim, b.ndim) print(a.size, b.size) print(a.nbytes, b.nbytes) 

Ausgabe

 1 1 4 3 32 24 

Überprüfung der Leere und Anwesenheit von NaNs

Um zu überprüfen, ob das Series-Objekt leer ist, können Sie Folgendes verwenden: leeres Attribut . Um zu überprüfen, ob ein Serienobjekt einige NaN-Werte enthält oder nicht, können Sie ebenfalls Folgendes verwenden: hassan Attribut.

Beispiel

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,np.NaN]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) c=pd.Series() print(a.empty,b.empty,c.empty) print(a.hasnans,b.hasnans,c.hasnans) print(len(a),len(b)) print(a.count( ),b.count( )) 

Ausgabe

 False False True True False False 4 3 3 3 

Serienfunktionen

In Series werden einige Funktionen verwendet:

Funktionen Beschreibung
Pandas Series.map() Ordnen Sie die Werte aus zwei Reihen zu, die eine gemeinsame Spalte haben.
Pandas Series.std() Berechnen Sie die Standardabweichung des angegebenen Satzes von Zahlen, DataFrame, Spalten und Zeilen.
Pandas Series.to_frame() Konvertieren Sie das Serienobjekt in den Datenrahmen.
Pandas Series.value_counts() Gibt eine Reihe zurück, die die Anzahl der eindeutigen Werte enthält.