logo

Unterschied zwischen loc() und iloc() im Pandas DataFrame

Die Pandas-Bibliothek von Python ist sehr nützlich für die Manipulation mathematischer Daten und wird häufig im Bereich des maschinellen Lernens verwendet. Es umfasst viele Methoden für sein ordnungsgemäßes Funktionieren. Ort() Und iloc() sind eine dieser Methoden. Diese werden beim Slicing von Daten aus dem verwendet Pandas DataFrame . Sie helfen bei der bequemen Auswahl von Daten aus dem DataFrame Python . Sie werden zum Filtern der Daten nach bestimmten Bedingungen verwendet.

Unterschied zwischen loc() und iloc() im Pandas DataFrame

Hier sehen wir den Unterschied zwischen der Funktion loc() und iloc() in Pandas DataFrame. Um den Unterschied zwischen diesen beiden zu sehen und zu vergleichen, erstellen wir einen Beispieldatenrahmen, den wir im gesamten Absatz verwenden. Die Funktionsweise beider Methoden wird im Beispieldatensatz von Autos erläutert.



Python3




die frühen Muker





# importing the module> import> pandas as pd> > # creating a sample dataframe> data>=> pd.DataFrame({>'Brand'>: [>'Maruti'>,>'Hyundai'>,>'Tata'>,> >'Mahindra'>,>'Maruti'>,>'Hyundai'>,> >'Renault'>,>'Tata'>,>'Maruti'>],> >'Year'>: [>2012>,>2014>,>2011>,>2015>,>2012>,> >2016>,>2014>,>2018>,>2019>],> >'Kms Driven'>: [>50000>,>30000>,>60000>,> >25000>,>10000>,>46000>,> >31000>,>15000>,>12000>],> >'City'>: [>'Gurgaon'>,>'Delhi'>,>'Mumbai'>,> >'Delhi'>,>'Mumbai'>,>'Delhi'>,> >'Mumbai'>,>'Chennai'>,>'Ghaziabad'>],> >'Mileage'>: [>28>,>27>,>25>,>26>,>28>,> >29>,>24>,>21>,>24>]})> > # displaying the DataFrame> display(data)>

>

>

Ausgabe

 Brand Year Kms Driven City Mileage 0 Maruti 2012 50000 Gurgaon 28 1 Hyundai 2014 30000 Delhi 27 2 Tata 2011 60000 Mumbai 25 3 Mahindra 2015 25000 Delhi 26 4 Maruti 2012 10000 Mumbai 28 5 Hyundai 2016 46000 Delhi 29 6 Renault 2014 31000 Mumbai 24 7 Tata 2018 15000 Chennai 21 8 Maruti 2019 12000 Ghaziabad 24>

Python-Funktion loc()

Der loc()-Funktion ist eine etikettenbasierte Datenauswahlmethode, was bedeutet, dass wir den Namen der Zeile oder Spalte übergeben müssen, die wir auswählen möchten. Im Gegensatz zu iloc() enthält diese Methode das letzte Element des übergebenen Bereichs. loc() kann im Gegensatz zu iloc() boolesche Daten akzeptieren. Viele Operationen können mit der loc()-Methode ausgeführt werden, z

Beispiel 1: Auswählen von Daten entsprechend bestimmten Bedingungen

In diesem Beispiel verwendet der Code dieloc>Funktion zum Auswählen und Anzeigen von Zeilen aus dem DataFrame, in denen die Marke „Maruti“ lautet und der Kilometerstand mehr als 25 beträgt, um relevante Informationen zu Maruti-Fahrzeugen mit hohem Kilometerstand anzuzeigen.

Python3




# selecting cars with brand 'Maruti' and Mileage>25> display(data.loc[(data.Brand>=>=> 'Maruti'>) & (data.Mileage>>25>)])>

>

>

Ausgabe

 Brand Year Kms Driven City Mileage 0 Maruti 2012 50000 Gurgaon 28 4 Maruti 2012 10000 Mumbai 28>

Beispiel 2: Auswählen eines Zeilenbereichs aus dem DataFrame

In diesem Beispiel verwendet der Code dieloc>Funktion zum Extrahieren und Anzeigen von Zeilen mit Indizes im Bereich von 2 bis 5 (einschließlich) aus dem DataFrame, die Informationen über eine bestimmte Reihe von Fahrzeugen im Datensatz bereitstellen.

Python3

Java-Sortierliste




# selecting range of rows from 2 to 5> display(data.loc[>2>:>5>])>

>

Edith Mack Hirsch

>

Ausgabe

 Brand Year Kms Driven City Mileage 2 Tata 2011 60000 Mumbai 25 3 Mahindra 2015 25000 Delhi 26 4 Maruti 2012 10000 Mumbai 28 5 Hyundai 2016 46000 Delhi 29>

Beispiel 3: Aktualisieren des Werts einer beliebigen Spalte

In diesem Beispiel verwendet der Code dieloc>Funktion zum Aktualisieren der „Kilometerstand“-Werte auf 22 für Autos im DataFrame, deren Herstellungsjahr vor 2015 liegt. Anschließend wird der geänderte DataFrame angezeigt, der die an der Spalte „Kilometerstand“ vorgenommenen Änderungen widerspiegelt.

Python3




# updating values of Mileage if Year <2015> data.loc[(data.Year <>2015>), [>'Mileage'>]]>=> 22> display(data)>

>

Java-Programmierung umstellen
>

Ausgabe

 Brand Year Kms Driven City Mileage 0 Maruti 2012 50000 Gurgaon 22 1 Hyundai 2014 30000 Delhi 22 2 Tata 2011 60000 Mumbai 22 3 Mahindra 2015 25000 Delhi 26 4 Maruti 2012 10000 Mumbai 22 5 Hyundai 2016 46000 Delhi 29 6 Renault 2014 31000 Mumbai 22 7 Tata 2018 15000 Chennai 21 8 Maruti 2019 12000 Ghaziabad 24>

Python iloc()-Funktion

Der iloc()-Funktion ist eine indexbasierte Auswahlmethode, was bedeutet, dass wir in der Methode einen ganzzahligen Index übergeben müssen, um eine bestimmte Zeile/Spalte auszuwählen. Im Gegensatz zu loc() enthält diese Methode nicht das letzte Element des übergebenen Bereichs. iloc() akzeptiert im Gegensatz zu loc() keine booleschen Daten. Mit iloc() ausgeführte Operationen sind:

Beispiel 1: Auswählen von Zeilen mithilfe ganzzahliger Indizes

In diesem Beispiel verwendet der Code dasiloc>Funktion zum Extrahieren und Anzeigen bestimmter Zeilen mit den Indizes 0, 2, 4 und 7 aus dem DataFrame, um Informationen zu ausgewählten Autos im Datensatz anzuzeigen.

Python3




# selecting 0th, 2nd, 4th, and 7th index rows> display(data.iloc[[>0>,>2>,>4>,>7>]])>

>

String in Java ersetzen

>

Ausgabe

 Brand Year Kms Driven City Mileage 0 Maruti 2012 50000 Gurgaon 28 2 Tata 2011 60000 Mumbai 25 4 Maruti 2012 10000 Mumbai 28 7 Tata 2018 15000 Chennai 21>

Beispiel 2: Gleichzeitiges Auswählen eines Bereichs von Spalten und Zeilen

In diesem Beispiel verwendet der Code dieiloc>Funktion zum Extrahieren und Anzeigen einer Teilmenge des DataFrame, einschließlich der Zeilen 1 bis 4 und der Spalten 2 bis 4. Dies liefert Informationen über eine bestimmte Reihe von Fahrzeugen und ihre relevanten Attribute im Datensatz.

Python3




# selecting rows from 1 to 4 and columns from 2 to 4> display(data.iloc[>1>:>5>,>2>:>5>])>

>

>

Ausgabe

 Kms Driven City Mileage 1 30000 Delhi 27 2 60000 Mumbai 25 3 25000 Delhi 26 4 10000 Mumbai 28>