logo

Wie verkette ich zwei oder mehr Pandas-DataFrames?

Die Verkettung von zwei oder mehr Datenrahmen kann mit der Methode pandas.concat() erfolgen. concat() in Pandas funktioniert durch die Kombination von Datenrahmen über Zeilen oder Spalten hinweg. Wir können zwei oder mehr Datenrahmen entweder entlang von Zeilen (Achse=0) oder entlang von Spalten (Achse=1) verketten. In diesem Artikel werden wir sehen, wie wir zwei oder mehr verketten oder hinzufügen können Pandas-Datenrahmen .

Verketten Sie zwei oder mehr Pandas DataFrames Python

Es gibt verschiedene Methoden zum vertikalen oder horizontalen Verketten von DataFrames. Hier besprechen wir einige allgemein verwendete Methoden zum vertikalen oder horizontalen Verketten von DataFrames. das sind die folgenden.



  • Verketten von zwei Pandas-DataFrames
  • Using> pd.merge()> um zwei DataFrames zu verketten
  • pd.DataFrame.reindex()> für vertikale Verkettung mit Indexausrichtung
  • Using pd.concat()>mitsort=False>für eine schnellere Verkettung
  • Verwenden von pandas.concat() zum Verketten von zwei DataFrames
  • Verketten Sie mehrere DataFrames mit pandas.concat()
  • Benutzen pandas.join() um zwei DataFrames zu verbinden
  • Benutzen DataFrame.append() um zwei DataFrames zu verketten

Erstellen Sie einen Beispiel-DataFrame

Erstellen Sie zwei Datenrahmen, die wir jetzt verketten werden. Zum Erstellen von Datenrahmen werden wir verwenden Numpy und Pandas.

Python3








Mark Zuckerberg Ausbildung
import> pandas as pd> import> numpy as np> df>=> pd.DataFrame({>'Courses'>: [>'GFG'>,>'JS'>,>'Python'>,>'Numpy'>],> >'Fee'>: [>20000>,>25000>,>22000>,>24000>]})> df1>=> pd.DataFrame({>'Courses'>: [>'Matplotlib'>,>'SSC'>,>'CHSL'>,>'Java'>],> >'Fee'>: [>25000>,>25200>,>24500>,>24900>]})> df2>=> pd.DataFrame({>'Duration'>: [>'30day'>,>'40days'>,>'35days'>,>'60days'>],> >'Discount'>: [>1000>,>2300>,>2500>,>2000>]})> print>(>'DataFrame 1:'>)> print>(df)> print>(>'DataFrame 2:'>)> print>(df1)> print>(>'DataFrame 3:'>)> print>(df2)>

>

>

Ausgabe:

DataFrame 1:    Courses     Fee  0 GFG 20000 1 JS 25000 2 Python 22000 3 Numpy 24000 DataFrame 2:    Courses     Fee  0 Matplotlib 25000 1 SSC 25200 2 CHSL 24500 3 Java 24900 DataFrame 3:    Duration     Discount  0 30day 1000 1 40days 2300 2 35days 2500 3 60days 2000>

Verketten Sie zwei Pandas-DataFrames vertikal und horizontal

Wir übergeben zwei Datenrahmen an pd.concat() Methode in Form einer Liste und geben Sie an, in welcher Achse Sie verketten möchten, d. h. Achse=0 entlang von Reihen verketten, Achse=1 entlang von Spalten verketten.

Python3




# concatenating df1 and df2 along rows> vertical_concat>=> pd.concat([df, df1], axis>=>0>)> # concatenating df3 and df4 along columns> horizontal_concat>=> pd.concat([df1, df2], axis>=>1>)> print>(>'Vertical:'>)> print>(vertical_concat)> print>(>'Horizontal:'>)> print>(horizontal_concat)>

>

>

Ausgabe:

Vertical:    Courses     Fee  0 GFG 20000 1 JS 25000 2 Python 22000 3 Numpy 24000 0 Matplotlib 25000 1 SSC 25200 2 CHSL 24500 3 Java 24900 Horizontal:    Courses     Fee     Duration     Discount  0 Matplotlib 25000 30day 1000 1 SSC 25200 40days 2300 2 CHSL 24500 35days 2500 3 Java 24900 60days 2000>

Verkettung von Datenrahmen mithilfe von pd.merge() zum Zusammenführen von zwei Datenrahmen

The method> 'pd.merge()'> in pandas is used to concatenate DataFrames either vertically or horizontally. It combines two DataFrames based on common columns using a merge operation. The 'how' parameter in pd.merge() specifies the type of merge (inner, outer, left, or right), determining how the DataFrames are combined.>

Python3




result>=> pd.merge(df, df1, on>=>'Courses'>, how>=>'outer'>, suffixes>=>(>'_df1'>,>'_df2'>)).fillna(>0>)> result[>'Fee'>]>=> result[>'Fee_df1'>]>+> result[>'Fee_df2'>]> result>=> result[[>'Courses'>,>'Fee'>]]> print>(result)>

>

>

Ausgabe :

   Courses     Fee  0 GFG 20000.0 1 JS 25000.0 2 Python 22000.0 3 Numpy 24000.0 4 Matplotlib 25000.0 5 SSC 25200.0 6 CHSL 24500.0 7 Java 24900.0>

Using pd.DataFrame.reindex()>für vertikale Verkettung mit Indexausrichtung

Die Methode pd.DataFrame.reindex() wird für die vertikale Verkettung von DataFrames in Pandas verwendet. Es richtet die Indizes der DataFrames aus und sorgt so für eine ordnungsgemäße Stapelung. Dies ist ein entscheidender Schritt beim vertikalen Kombinieren von DataFrames mithilfe der Verkettung in Pandas.

Beispiel: In diesem Beispiel verkettet der Code zwei Pandas-DataFrames.df1>Unddf>, ignoriert ihre ursprünglichen Indizes und speichert das Ergebnis in der Variablenresult>. Anschließend wird der Index des verketteten DataFrame zurückgesetzt

Python3

Java-Sammlungen




result>=> pd.concat([df1, df], ignore_index>=>True>)># Concatenate and reset index> result>=> result.reindex(>range>(>8>))> print>(result)>

>

>

Ausgabe :

   Courses     Fee  0 Matplotlib 25000 1 SSC 25200 2 CHSL 24500 3 Java 24900 4 GFG 20000 5 JS 25000 6 Python 22000 7 Numpy 24000>

Using pd.concat()>mitsort=False>für eine schnellere Verkettung

Die Methode ` pd.concat() ` wird in der Pandas-Bibliothek von Python verwendet, um DataFrames entweder vertikal (entlang Zeilen) oder horizontal (entlang Spalten) zu kombinieren. Der Parameter „sort=False“ wird verwendet, um die Verkettungsgeschwindigkeit zu erhöhen, indem die Sortierung des resultierenden DataFrame deaktiviert wird.

Beispiel : In diesem Beispiel verwendet der Code die Pandas-Bibliothek, um zwei DataFrames, df1 und df, entlang ihrer Zeilen zu verketten (Achse=0). Der Parameter sort=False verhindert das Sortieren des resultierenden DataFrame nach Spaltennamen.

Python3




result>=> pd.concat([df1, df], sort>=>False>)> print>(result)>

>

>

Ausgabe :

   Courses     Fee  0 Matplotlib 25000 1 SSC 25200 2 CHSL 24500 3 Java 24900 0 GFG 20000 1 JS 25000 2 Python 22000 3 Numpy 24000>

Verketten Sie zwei oder mehr Pandas-DataFrames in Python mit pandas.concat()

„pandas.concat()“ kombiniert zwei DataFrames entweder vertikal oder horizontal, stapelt sie übereinander oder nebeneinander und bietet so eine flexible Möglichkeit, Daten entlang bestimmter Achsen zu verketten.

Beispiel :In diesem Beispiel ist daspd.concat()>Die Funktion wird verwendet, um diese Datenrahmen vertikal zu verketten und so einen neuen Datenrahmen mit dem Namen zu erzeugenresult>, Undignore_index=True>wird verwendet, um den Index zurückzusetzen. Das Endergebnis wird gedruckt.

Python3




result>=> pd.concat([df, df1], ignore_index>=>True>)> print>(result)>

>

>

Ausgabe:

   Courses     Fee  0 GFG 20000 1 JS 25000 2 Python 22000 3 Numpy 24000 4 Matplotlib 25000 5 SSC 25200 6 CHSL 24500 7 Java 24900>

Mehrere DataFrames in Python mit pandas.concat() zusammenführen

Die Methode pandas.concat() wird verwendet, um DataFrames entweder vertikal (entlang Zeilen) oder horizontal (entlang Spalten) zu kombinieren. Es nimmt eine Liste von DataFrames als Eingabe und verkettet sie basierend auf der angegebenen Achse (0 für vertikal, 1 für horizontal).

Beispiel : In diesem Beispiel werden Pandas verwendet, um drei Datenrahmen zu erstellen (df>,df1>, Unddf2>) mit Informationen zu Kursen, Gebühren, Dauer und Rabatten. Anschließend werden diese Datenrahmen mithilfe von vertikal verkettetpd.concat()>, wodurch ein neuer Datenrahmen mit dem Namen erstellt wirdresult>mit einem Reset-Index, und der resultierende Datenrahmen wird gedruckt.

Python3

CSS für fett




result>=> pd.concat([df, df1, df2], ignore_index>=>True>)> print>(result)>

>

>

Ausgabe:

   Courses     Fee     Duration     Discount  0 GFG 20000 NaN NaN 1 JS 25000 NaN NaN 2 Python 22000 NaN NaN 3 Numpy 24000 NaN NaN 4 Matplotlib 25000 NaN NaN 5 SSC 25200 NaN NaN 6 CHSL 24500 NaN NaN 7 Java 24900 NaN NaN 8 NaN NaN 30day 1000.0 9 NaN NaN 40days 2300.0 10 NaN NaN 35days 2500.0 11 NaN NaN 60days 2000.0>

Pandas verbindet zwei DataFrames mit pandas.join(), um zwei DataFrames zu verbinden

Derpandas.join()>Die Methode wird verwendet, um DataFrames basierend auf angegebenen Spalten vertikal oder horizontal zu verketten und eine Verknüpfung im SQL-Stil durchzuführen. Es kombiniert Zeilen oder Spalten aus zwei DataFrames basierend auf gemeinsamen Spaltenwerten und ermöglicht so innere, äußere, linke oder rechte Verknüpfungen.

Beispiel : In diesem Beispiel ist diejoin>Die Methode wird verwendet, um diese Datenrahmen basierend auf ihren Indizes zu kombinieren, was zu einem neuen Datenrahmen mit dem Namen führtresult>, das gedruckt wird.

Python3




result>=> df.join(df1)> print>(result)>

>

>

Ausgabe:

   Courses     Fee     Duration     Discount  0 GFG 20000 30day 1000 1 JS 25000 40days 2300 2 Python 22000 35days 2500 3 Numpy 24000 60days 2000>

Kombinieren Sie zwei Datenrahmen in Python mit DataFrame.append()

Das ` DataFrame.append() Die Methode in Pandas wird verwendet, um zwei DataFrames vertikal zu verketten und die Zeilen eines DataFrames untereinander hinzuzufügen. Es gibt einen neuen DataFrame mit den kombinierten Daten zurück. Stellen Sie sicher, dass beide DataFrames dieselben Spalten haben.

Beispiel : In diesem Beispiel verwenden wir dieappend()>Methode, was zu einem neuen Datenrahmen mit dem Namen führtresult>mit einem Reset-Index, der gedruckt wird.

Python3




result>=> df.append(df1, ignore_index>=>True>)> print>(result)>

>

>

Ausgabe:

   Courses     Fee  0 GFG 20000 1 JS 25000 2 Python 22000 3 Numpy 24000 4 Matplotlib 25000 5 SSC 25200 6 CHSL 24500 7 Java 24900>