logo

Wget-Befehl unter Linux/Unix

Wget ist der nicht interaktive Netzwerk-Downloader, der zum Herunterladen von Dateien vom Server verwendet wird, auch wenn der Benutzer nicht am System angemeldet ist, und der im Hintergrund arbeiten kann, ohne den aktuellen Prozess zu behindern.

  • GNU wget ist ein kostenloses Dienstprogramm zum nicht interaktiven Herunterladen von Dateien aus dem Web. Es unterstützt die Protokolle HTTP, HTTPS und FTP sowie den Abruf über HTTP-Proxys.
  • wget ist nicht interaktiv, d. h. es kann im Hintergrund arbeiten, während der Benutzer nicht angemeldet ist. Auf diese Weise können Sie einen Abruf starten und die Verbindung zum System trennen, sodass wget die Arbeit beenden kann. Im Gegensatz dazu erfordern die meisten Webbrowser eine ständige Anwesenheit des Benutzers, was bei der Übertragung großer Datenmengen ein großes Hindernis darstellen kann.
  • wget kann Links in HTML- und XHTML-Seiten folgen und lokale Versionen von Remote-Websites erstellen, wobei die Verzeichnisstruktur der ursprünglichen Site vollständig wiederhergestellt wird. Dies wird manchmal als rekursives Herunterladen bezeichnet. Dabei respektiert wget den Robot Exclusion Standard (/robots.txt). wget kann angewiesen werden, die Links in heruntergeladenen HTML-Dateien zur Offline-Anzeige in lokale Dateien zu konvertieren.
  • wget wurde für Robustheit gegenüber langsamen oder instabilen Netzwerkverbindungen entwickelt; Wenn ein Download aufgrund eines Netzwerkproblems fehlschlägt, wird der Download so lange wiederholt, bis die gesamte Datei abgerufen wurde. Wenn der Server die Fortsetzung unterstützt, weist er den Server an, den Download dort fortzusetzen, wo er aufgehört hat.

Grundlegende Syntax:

Die grundlegende Syntax des Wget-Befehls lautet wie folgt:

wget [option] [URL]>

Hier



[options]> stellt verschiedene Befehlszeilenoptionen dar, die das Verhalten von Wget ändern

[URL]> ist die Adresse der Datei oder Website, die heruntergeladen werden soll.

Optionen:

Hier sind die Optionen, die im Befehl wget unter Linux verfügbar sind.

Möglichkeit Beschreibung Syntax
-v / –version Zeigen Sie die auf Ihrem System installierte Version von Wget an. $ wget -v
-h / –help Drucken Sie eine Hilfemeldung mit allen verfügbaren Befehlszeilenoptionen für Wget. $ wget -h [URL]
-o Protokolldatei Leiten Sie alle vom System generierten Nachrichten an die angegebene Protokolldatei weiter. Wenn keine Protokolldatei angegeben ist, werden Nachrichten an die Standardprotokolldatei („wget-log“) umgeleitet. $ wget -o Logfile [URL]
-b / –Hintergrund Senden Sie den Prozess sofort nach dem Start in den Hintergrund, damit andere Prozesse fortfahren können. Wenn keine Ausgabedatei angegeben ist, wird die Ausgabe standardmäßig an „wget-log“ umgeleitet. $ wget -b [URL]
-A Hängen Sie Ausgabemeldungen an die aktuelle Ausgabeprotokolldatei an, ohne diese zu überschreiben. Dadurch bleibt das Protokoll früherer Befehle erhalten, wobei das aktuelle Protokoll danach angehängt wird. $ wget -a Protokolldatei [URL]
-ich Lesen Sie URLs aus einer Datei. Bei Angabe als Datei werden URLs aus der Standardeingabe gelesen. Wenn URLs sowohl in der Befehlszeile als auch in der Eingabedatei vorhanden sind, haben diejenigen in der Befehlszeile Vorrang. Die Datei muss kein HTML-Dokument sein. $ wget -i Eingabedatei
$ wget -i Eingabedatei [URL]
-t Zahl / –tries=Zahl Legen Sie die Anzahl der Wiederholungsversuche fest. Geben Sie „0“ oder „inf“ für unbegrenzte Wiederholungsversuche an. Der Standardwert beträgt 20 Wiederholungen, mit Ausnahme schwerwiegender Fehler wie Verbindungsverweigerung oder nicht gefundener Link. $ wget -t Nummer [URL]
-C Setzen Sie eine teilweise heruntergeladene Datei fort, wenn die Datei das Fortsetzen unterstützt. Wenn das Fortsetzen nicht unterstützt wird, kann der Download nicht fortgesetzt werden. $ wget -c [URL]
-In Stellen Sie das System so ein, dass es zwischen den Abrufen die angegebene Anzahl von Sekunden wartet. Diese Option hilft, die Serverlast zu reduzieren, indem sie Anfragen zeitlich verteilt. Die Zeit kann in Sekunden, Minuten (m), Stunden (h) oder Tagen (d) angegeben werden. $ wget -w number_in_seconds [URL]
-R Ermöglichen Sie den rekursiven Abruf angegebener Links, auch im Falle schwerwiegender Fehler. Diese Option folgt rekursiv Links innerhalb der angegebenen URL. $ wget -r [URL]

Beispiel :

1. So laden Sie einfach eine Webseite herunter:

Um eine einzelne Datei von einer URL herunterzuladen, geben Sie einfach die URL wie folgt an:

wget http://example.com/sample.php>

2. Um die Datei im Hintergrund herunterzuladen

Führen Sie den Download-Vorgang im Hintergrund aus-b>oder--background>Möglichkeit:

wget -b http://www.example.com/samplepage.php>

3. Um das Protokoll während des Befehls wget zu überschreiben

Leiten Sie die Ausgabemeldungen mithilfe von in eine Protokolldatei um-o>Möglichkeit:

wget http://www.example.com/filename.txt -o /path/filename.txt>

4. Um eine teilweise heruntergeladene Datei fortzusetzen

Wenn ein Download unterbrochen wird, setzen Sie ihn mit fort-c>Möglichkeit:

wget -c http://example.com/samplefile.tar.gz>

5. Eine bestimmte Anzahl von Malen versuchen

Geben Sie die Anzahl der Wiederholungsversuche mit an--tries>Möglichkeit:

wget --tries=10 http://example.com/samplefile.tar.gz>

6. Legen Sie die Wartezeit zwischen den Abrufen fest:

Legen Sie die Wartezeit zwischen Abrufen mithilfe von fest-w>Option (in Sekunden, Minuten, Stunden oder Tagen):

wget -w 10 http://example.com/large_file.zip>

7. Aktivieren Sie den rekursiven Abruf:

Aktivieren Sie den rekursiven Abruf, um eine gesamte Website mithilfe von herunterzuladen-r>Möglichkeit:

wget -r http://example.com/>

8. URLs aus Datei lesen:

Lesen Sie URLs aus einer Datei und laden Sie sie mit herunter-i>Möglichkeit:

wget -i urls.txt>

Wget-Befehl – ​​FAQs

Wofür wird der Befehl wget verwendet?

Der Befehl wget ist ein leistungsstarkes Befehlszeilentool, das in Linux- und Unix-basierten Systemen zum Abrufen von Dateien aus dem Internet über die Protokolle HTTP, HTTPS und FTP verwendet wird. Es ist besonders nützlich für nicht interaktive Downloads, gespiegelte Websites und rekursive Downloads.

Wie lädt man eine Datei mit wget herunter?

Um eine einzelne Datei mit wget herunterzuladen, können Sie einfach den Befehl gefolgt von der URL der Datei ausführen, die Sie herunterladen möchten.

Zum Beispiel:

wget https://example.com/file.zip>

Wie kann ich mit wget eine ganze Website herunterladen?

Um eine ganze Website rekursiv herunterzuladen, verwenden Sie die-m>oder--mirror>Option zusammen mit der-p>oder--page-requisites>Option zum Herunterladen aller erforderlichen Dateien.

Zum Beispiel:

wget -m -p https://example.com>

Wie begrenze ich die Download-Geschwindigkeit oder Bandbreite, wenn ich wget verwende?

Du kannst den ... benutzen--limit-rate>Option zum Begrenzen der Download-Geschwindigkeit oder der Bandbreitennutzung.

Wie bekomme ich ein aktuelles Datum in Java?

Beispiel: Um die Download-Geschwindigkeit auf 500 KB/s zu begrenzen, können Sie Folgendes ausführen:

wget --limit-rate=500k https://example.com/file.zip>

Wie kann ich einen unterbrochenen Download mit wget fortsetzen?

Wenn ein Download unterbrochen wird, können Sie die verwenden-c>oder--continue>Option, um den Download dort fortzusetzen, wo er aufgehört hat.

Zum Beispiel:

wget -c https://example.com/file.zip>

Abschluss

In diesem Artikel haben wir den Befehl Wget besprochen, ein praktisches Tool unter Linux zum Herunterladen von Dateien aus dem Internet, ohne dass eine Benutzerinteraktion erforderlich ist. Es arbeitet leise im Hintergrund, sodass Sie einen Download starten und andere Dinge erledigen können, während es läuft. Wget kann mit verschiedenen Arten von Webadressen umgehen und sogar ganze Websites kopieren. Dies ist hilfreich bei langsamen oder unzuverlässigen Internetverbindungen, da so lange versucht wird, den Download durchzuführen, bis er erfolgreich ist. Darüber hinaus bietet es nützliche Funktionen wie das Fortsetzen unterbrochener Downloads und das Festlegen von Wartezeiten zwischen Abrufen. Durch das Erlernen der einfachen Befehle und Optionen können Benutzer ihre Downloads effizient verwalten und Zeit sparen.