Pagina 1 di 1

Strano comportamento wget [RISOLTO]

Inviato: lun mar 26, 2012 10:04
da Burroughs
Buona settimana a tutti!

Avrei la necessità di scaricare i binari di kde4 per poi installarli su un'altra macchina; vista la notevole quantità di file ho pensato di scaricare con wget la directory contenente gli stessi per poi fare io un po' di pulizia dopo, con la cli.
Bene, vado a dare questo comando:

Codice: Seleziona tutto

wget -m http://mirrors.prometeus.net/archlinux/extra/os/i686

ma, qualche secondo dopo, tutto ciò che mi ritrovo è:

Codice: Seleziona tutto

[alutri@andy ~]$ ls mirrors.prometeus.net/
archlinux  robots.txt

e, dentro archlinux, una serie di sottodirectory, con, alla fine, il file index.html.
Come mai?

Burroughs.

Re: Strano comportamento wget

Inviato: lun mar 26, 2012 10:33
da conraid
perché wget giustamente onora il file robots.txt, puoi forzarlo con

Codice: Seleziona tutto

-e robots=off

se poi ci sono anche altri controlli usa wait, user-agent, etc... e considerando la directory direi anche -np