Pandas ist in der Lage, Serien-, DataFrame- und Panel-Objekte durch verschiedene Arten von Mengenlogik für die Indizes und die Funktionalität der relationalen Algebra zu kombinieren.
Der concat() Die Funktion ist für die Durchführung einer Verkettungsoperation entlang einer Achse im DataFrame verantwortlich.
Syntax:
pd.concat(objs,axis=0,join='outer',join_axes=None, ignore_index=False)
Parameter:
Wenn wir im DataFrame ein Diktat übergeben, werden die sortierten Schlüssel als verwendet Schlüsselargument, und die Werte werden in diesem Fall ausgewählt. Wenn Nicht-Objekte vorhanden sind, werden sie verworfen, es sei denn, sie sind alle keine, und in diesem Fall a Wertfehler wird erhöht.
Bei „true“ werden die Indexwerte auf der Verkettungsachse nicht verwendet. Die resultierende Achse wird mit 0, ..., n - 1 beschriftet.
Kehrt zurück
Eine Reihe wird zurückgegeben, wenn wir alle Reihen entlang der Achse verketten (Achse=0). Für den Fall, dass objs Enthält mindestens einen DataFrame, wird ein DataFrame zurückgegeben.
Beispiel 1:
import pandas as pd a_data = pd.Series(['p', 'q']) b_data = pd.Series(['r', 's']) pd.concat([a_data, b_data])
Ausgabe
0 p 1 q 0 r 1 s dtype: object
Beispiel2: Im obigen Beispiel können wir den vorhandenen Index mithilfe von zurücksetzen ignorieren_index Parameter. Der folgende Code demonstriert die Funktionsweise von ignorieren_index .
import pandas as pd a_data = pd.Series(['p', 'q']) b_data = pd.Series(['r', 's']) pd.concat([a_data, b_data], ignore_index=True)
Ausgabe
0 p 1 q 2 r 3 s dtype: object
Beispiel 3: Wir können einen hierarchischen Index auf der äußersten Ebene der Daten hinzufügen, indem wir verwenden Schlüssel Parameter.
import pandas as pd a_data = pd.Series(['p', 'q']) b_data = pd.Series(['r', 's']) pd.concat([a_data, b_data], keys=['a_data', 'b_data'])
Ausgabe
a_data 0 p 1 q b_data 0 r 1 s dtype: object
Beispiel 4: Wir können die Indexschlüssel mit dem beschriften Namen Parameter. Der folgende Code zeigt die Funktionsweise des Namensparameters.
import pandas as pd a_data = pd.Series(['p', 'q']) b_data = pd.Series(['r', 's']) pd.concat([a_data, b_data], keys=['a_data', 'b_data']) pd.concat([a_data, b_data], keys=['a_data', 'b_data'], names=['Series name', 'Row ID'])
Ausgabe
Series name Row ID a_data 0 p 1 q b_data 0 r 1 s dtype: object
Verkettung per Append
Die Append-Methode ist als nützliche Verknüpfung zum Verketten von Series und DataFrame definiert.
Beispiel:
import pandas as pd one = pd.DataFrame({ 'Name': ['Parker', 'Smith', 'Allen', 'John', 'Parker'], 'subject_id':['sub1','sub2','sub4','sub6','sub5'], 'Marks_scored':[98,90,87,69,78]}, index=[1,2,3,4,5]) two = pd.DataFrame({ 'Name': ['Billy', 'Brian', 'Bran', 'Bryce', 'Betty'], 'subject_id':['sub2','sub4','sub3','sub6','sub5'], 'Marks_scored':[89,80,79,97,88]}, index=[1,2,3,4,5]) print (one.append(two))
Ausgabe
Name subject_id Marks_scored 1 Parker sub1 98 2 Smith sub2 90 3 Allen sub4 87 4 John sub6 69 5 Parker sub5 78 1 Billy sub2 89 2 Brian sub4 80 3 Bran sub3 79 4 Bryce sub6 97 5 Betty sub5 88