logo

Pandas-Verkettung

Pandas ist in der Lage, Serien-, DataFrame- und Panel-Objekte durch verschiedene Arten von Mengenlogik für die Indizes und die Funktionalität der relationalen Algebra zu kombinieren.

Der concat() Die Funktion ist für die Durchführung einer Verkettungsoperation entlang einer Achse im DataFrame verantwortlich.

Syntax:

 pd.concat(objs,axis=0,join='outer',join_axes=None, ignore_index=False) 

Parameter:

    Objekte:Es handelt sich um eine Sequenz oder Zuordnung von Serien- oder DataFrame-Objekten.
    Wenn wir im DataFrame ein Diktat übergeben, werden die sortierten Schlüssel als verwendet Schlüsselargument, und die Werte werden in diesem Fall ausgewählt. Wenn Nicht-Objekte vorhanden sind, werden sie verworfen, es sei denn, sie sind alle keine, und in diesem Fall a Wertfehler wird erhöht.Achse:Es ist eine Achse, entlang der man verketten kann.verbinden:Verantwortlich für die Handhabung von Indizes auf einer anderen Achse.join_axes:Eine Liste von Indexobjekten. Anstatt die innere oder äußere Satzlogik auszuführen, werden bestimmte Indizes für die andere (n-1) Achse verwendet.ignorieren_index:bool, Standardwert False
    Bei „true“ werden die Indexwerte auf der Verkettungsachse nicht verwendet. Die resultierende Achse wird mit 0, ..., n - 1 beschriftet.

Kehrt zurück

Eine Reihe wird zurückgegeben, wenn wir alle Reihen entlang der Achse verketten (Achse=0). Für den Fall, dass objs Enthält mindestens einen DataFrame, wird ein DataFrame zurückgegeben.

Beispiel 1:

 import pandas as pd a_data = pd.Series(['p', 'q']) b_data = pd.Series(['r', 's']) pd.concat([a_data, b_data]) 

Ausgabe

 0 p 1 q 0 r 1 s dtype: object 

Beispiel2: Im obigen Beispiel können wir den vorhandenen Index mithilfe von zurücksetzen ignorieren_index Parameter. Der folgende Code demonstriert die Funktionsweise von ignorieren_index .

 import pandas as pd a_data = pd.Series(['p', 'q']) b_data = pd.Series(['r', 's']) pd.concat([a_data, b_data], ignore_index=True) 

Ausgabe

 0 p 1 q 2 r 3 s dtype: object 

Beispiel 3: Wir können einen hierarchischen Index auf der äußersten Ebene der Daten hinzufügen, indem wir verwenden Schlüssel Parameter.

 import pandas as pd a_data = pd.Series(['p', 'q']) b_data = pd.Series(['r', 's']) pd.concat([a_data, b_data], keys=['a_data', 'b_data']) 

Ausgabe

 a_data 0 p 1 q b_data 0 r 1 s dtype: object 

Beispiel 4: Wir können die Indexschlüssel mit dem beschriften Namen Parameter. Der folgende Code zeigt die Funktionsweise des Namensparameters.

 import pandas as pd a_data = pd.Series(['p', 'q']) b_data = pd.Series(['r', 's']) pd.concat([a_data, b_data], keys=['a_data', 'b_data']) pd.concat([a_data, b_data], keys=['a_data', 'b_data'], names=['Series name', 'Row ID']) 

Ausgabe

 Series name Row ID a_data 0 p 1 q b_data 0 r 1 s dtype: object 

Verkettung per Append

Die Append-Methode ist als nützliche Verknüpfung zum Verketten von Series und DataFrame definiert.

Beispiel:

 import pandas as pd one = pd.DataFrame({ 'Name': ['Parker', 'Smith', 'Allen', 'John', 'Parker'], 'subject_id':['sub1','sub2','sub4','sub6','sub5'], 'Marks_scored':[98,90,87,69,78]}, index=[1,2,3,4,5]) two = pd.DataFrame({ 'Name': ['Billy', 'Brian', 'Bran', 'Bryce', 'Betty'], 'subject_id':['sub2','sub4','sub3','sub6','sub5'], 'Marks_scored':[89,80,79,97,88]}, index=[1,2,3,4,5]) print (one.append(two)) 

Ausgabe

 Name subject_id Marks_scored 1 Parker sub1 98 2 Smith sub2 90 3 Allen sub4 87 4 John sub6 69 5 Parker sub5 78 1 Billy sub2 89 2 Brian sub4 80 3 Bran sub3 79 4 Bryce sub6 97 5 Betty sub5 88