Repository 32bit  Forum
Repository 64bit  Wiki

Strano comportamento wget [RISOLTO]

Postate qui per tutte le discussioni legate a Linux in generale.

Moderatore: Staff

Regole del forum
1) Citare sempre la distribuzione usata e la versione della utility coinvolta. Questi dati aiutano le persone che possono rispondere.
2) Per evitare confusione prego inserire in questo forum solo topic che riguardano Gnu/Linux in genere.
3) Leggere attentamente le risposte ricevute
4) Scrivere i messaggi con il colore di default, evitare altri colori.
5) Scrivere in Italiano o in Inglese, se possibile grammaticalmente corretto, evitate stili di scrittura poco chiari, quindi nessuna abbreviazione tipo telegramma o scrittura stile SMS o CHAT.
6) Appena registrati è consigliato presentarsi nel forum dedicato.

La non osservanza delle regole porta a provvedimenti di vari tipo da parte dello staff, in particolare la non osservanza dell'ultima regola porta alla cancellazione del post e alla segnalazione dell'utente. In caso di recidività l'utente rischia il ban temporaneo.

Strano comportamento wget [RISOLTO]

Messaggioda Burroughs » lun mar 26, 2012 10:04

Buona settimana a tutti!

Avrei la necessità di scaricare i binari di kde4 per poi installarli su un'altra macchina; vista la notevole quantità di file ho pensato di scaricare con wget la directory contenente gli stessi per poi fare io un po' di pulizia dopo, con la cli.
Bene, vado a dare questo comando:
Codice: Seleziona tutto
wget -m http://mirrors.prometeus.net/archlinux/extra/os/i686

ma, qualche secondo dopo, tutto ciò che mi ritrovo è:
Codice: Seleziona tutto
[alutri@andy ~]$ ls mirrors.prometeus.net/
archlinux  robots.txt

e, dentro archlinux, una serie di sottodirectory, con, alla fine, il file index.html.
Come mai?

Burroughs.
Ultima modifica di Burroughs il lun mar 26, 2012 10:42, modificato 1 volta in totale.
"Two things are infinite: the universe and human stupidity; and I'm not sure about the universe" (Albert Einstein)
Avatar utente
Burroughs
Linux 2.6
Linux 2.6
 
Messaggi: 935
Iscritto il: mer dic 15, 2004 1:00
Località: Lago Patria (NA)
Nome Cognome: Andrea Lutri
Kernel: 3.8.7
Desktop: KDE SC 4.10.2
Distribuzione: Arch Linux

Re: Strano comportamento wget

Messaggioda conraid » lun mar 26, 2012 10:33

perché wget giustamente onora il file robots.txt, puoi forzarlo con
Codice: Seleziona tutto
-e robots=off

se poi ci sono anche altri controlli usa wait, user-agent, etc... e considerando la directory direi anche -np
Avatar utente
conraid
Staff
Staff
 
Messaggi: 11884
Iscritto il: gio lug 14, 2005 0:00
Località: Livorno
Nome Cognome: Corrado Franco
Slackware: current


Torna a Gnu/Linux in genere

Chi c’è in linea

Visitano il forum: Nessuno e 1 ospite