Para descargar un sitio con wget es tan simple como: wget -r -k http://www.sitio.com -r : Esto indica que se descargará el sitio web completo. -k : Esto indica que se convertirán los links del sitio descargado para poder verlos en ordenadores sin internet. Ahora, el asunto se complica cuando el administrador del sitio nos la pone difícil… ¿qué restricciones pudieran existir? La más común que podríamos encontrarnos es que solo se permite el acceso al sitio si tienes un UserAgent reconocido. O sea, el sitio reconocerá que el UserAgent que tantas páginas está descargando no es de los “normales” y por lo tanto cerrará el acceso. También mediante el archivo robots.txt se puede especificar que wget ( al igual que un montón más de aplicaciones similares ) no podrá descargar según desee el cliente, pues … bueno, el administrador del sitio así lo quiere y punto :D ¿cómo burlar estas restricciones? Para el primer caso le estableceremos un UserAgent a wget, esto podremos ha...
Editores, Notificaciones, Red, Seguridad, Repositorios, Soluciones, Tutoriales, Tips y mas...