Strano comportamento wget [RISOLTO]

Postate qui per tutte le discussioni legate a Linux in generale.

Moderatore: Staff

Regole del forum
1) Citare sempre la versione di Slackware usata, la versione del Kernel e magari anche la versione della libreria coinvolta. Questi dati aiutano le persone che possono rispondere.
2) Per evitare confusione prego inserire in questo forum solo topic che riguardano appunto Gnu/Linux in genere, se l'argomento è specifico alla Slackware usate uno dei forum Slackware o Slackware64.
3) Leggere attentamente le risposte ricevute
4) Scrivere i messaggi con il colore di default, evitare altri colori.
5) Scrivere in Italiano o in Inglese, se possibile grammaticalmente corretto, evitate stili di scrittura poco chiari, quindi nessuna abbreviazione tipo telegramma o scrittura stile SMS o CHAT.
6) Appena registrati è consigliato presentarsi nel forum dedicato.

La non osservanza delle regole porta a provvedimenti di vari tipo da parte dello staff, in particolare la non osservanza della regola 5 porta alla cancellazione del post e alla segnalazione dell'utente. In caso di recidività l'utente rischia il ban temporaneo.
Avatar utente
Burroughs
Linux 2.6
Linux 2.6
Messaggi: 973
Iscritto il: mer dic 15, 2004 0:00
Nome Cognome: Andrea Lutri
Kernel: 3.16.0
Desktop: KDE SC 4.13.3
Distribuzione: Arch Linux
Località: Lago Patria (NA)
Contatta:

Strano comportamento wget [RISOLTO]

Messaggioda Burroughs » lun mar 26, 2012 10:04

Buona settimana a tutti!

Avrei la necessità di scaricare i binari di kde4 per poi installarli su un'altra macchina; vista la notevole quantità di file ho pensato di scaricare con wget la directory contenente gli stessi per poi fare io un po' di pulizia dopo, con la cli.
Bene, vado a dare questo comando:

Codice: Seleziona tutto

wget -m http://mirrors.prometeus.net/archlinux/extra/os/i686

ma, qualche secondo dopo, tutto ciò che mi ritrovo è:

Codice: Seleziona tutto

[alutri@andy ~]$ ls mirrors.prometeus.net/
archlinux  robots.txt

e, dentro archlinux, una serie di sottodirectory, con, alla fine, il file index.html.
Come mai?

Burroughs.
Ultima modifica di Burroughs il lun mar 26, 2012 10:42, modificato 1 volta in totale.
"Two things are infinite: the universe and human stupidity; and I'm not sure about the universe" (Albert Einstein)

Avatar utente
conraid
Staff
Staff
Messaggi: 12737
Iscritto il: gio lug 14, 2005 0:00
Nome Cognome: Corrado Franco
Slackware: current64
Località: Livorno
Contatta:

Re: Strano comportamento wget

Messaggioda conraid » lun mar 26, 2012 10:33

perché wget giustamente onora il file robots.txt, puoi forzarlo con

Codice: Seleziona tutto

-e robots=off

se poi ci sono anche altri controlli usa wait, user-agent, etc... e considerando la directory direi anche -np


Torna a “Gnu/Linux in genere”

Chi c’è in linea

Visitano il forum: Nessuno e 3 ospiti