Aspirateur de site

Installation, configuration et utilisation des logiciels que vous souhaitez installer.
Malynou
Messages : 264
Enregistré le : mar. 13 sept. 2016 06:05

Aspirateur de site

Message par Malynou »

Bonjour à tou(te)s

Je crois que tout est dans le titre. Je cherche un aspirateur de site linuxien. Pas pour faire le ménage sur un site internet (pour pallier aux "bonnes" blagues de Zeb ou Deb) mais pour aspirer le contenu d'un site pour pouvoir le consulter en local.

Vala vala.

Merci bien...

Bises

Maly
PC 1 : DELL Latitude E4310 | Linux Mint 21.3 Virginia | Cinnamon 6.0.4 | 5.15.0-94-generic x86_64 | dual core Intel Core i5 M 560 | 3 Go | Intel Core Processor Integrated Graphics
PC 2 : HP Pavilion dv5 Notebook | Linux Mint 21.3 Virginia | Cinnamon 6.0.4 | 5.15.0-92-generic x86_64 | dual core AMD Turion X2 Ultra | 3 Go | AMD RV620/M82 [Mobility Radeon HD 3450/3470]

Avatar du membre
thyam
modérateur
Messages : 8033
Enregistré le : mar. 14 juil. 2015 10:33
Localisation : Lille - Hauts de France

Re: Aspirateur de site

Message par thyam »

'Jour,

un peu de doc ;) https://doc.ubuntu-fr.org/httrack" onclick="window.open(this.href);return false;

ou là http://lea-linux.org/documentations/Log ... spirateurs" onclick="window.open(this.href);return false;
pc principal : hp pavilion dv6 - core i5 - 8go ram - dd 1 to - CG dual Intel HD graphics 3000 / Amd Radeon HD 7400m
dual boot W$ (taf oblige) / LMDE 6 'Faye' et Cinnamon

« Seul, on va plus vite... Ensemble, on va plus loin ;) »

Avatar du membre
arghlub
Administrateur du site
Messages : 10421
Enregistré le : dim. 21 mai 2017 08:19
Localisation : Provence
Contact :

Re: Aspirateur de site

Message par arghlub »

Salut Malynou (un bail qu'on t'avait plus vue :B )

En ligne de commandes, tu peux faire ça avec la commande «wget».
«wget» possède de nombreuses options et peut se révéler très très puissant.

Plus Infos sur «wget» : ;)
Tour1 (custom)CM MSI Z270 M3 | CPU Intel I7-7700K | CG Nvidia GTX 1080 | RAM 16Go | tripleBoot : Debian 11 | MXlinux 21 | LMint 19.3 | XFCE
Tour2 (custom)CM Gigabyte | CPU AMD Athlon 5200+ | CG Nvidia GTX 560 | RAM 6Go | FreeBSD 12.1 XFCE
Portable1 MSI GF75 Thin 9SC | CPU Intel I7-9750H | CG Nvidia GTX 1650 | RAM 32Go | dualBoot : LMint 20.2 | MXlinux 21 | XFCE
Portable2 MacBook Air A1466 (2015) | CPU Intel I5-5250U | CG Intel HD Graphics 6000 | RAM 8Go | dualBoot : macOS Sierra | MXlinux 21 XFCE
─────( pour une informatique libre ! -membre en stand-by de l' April.org────────────────

mpedro
Messages : 1517
Enregistré le : dim. 8 nov. 2015 22:13
Contact :

Re: Aspirateur de site

Message par mpedro »

Code : Tout sélectionner

wget -r -l5 -k -E "http://patrimoines-de-guadeloupe.over-blog.com" 
Stretch 32bits cinnamon/Fedora25/Sarah
Compaq 8510p/MSI GE70/Raspberry Pi2

Malynou
Messages : 264
Enregistré le : mar. 13 sept. 2016 06:05

Re: Aspirateur de site

Message par Malynou »

Coucou tous et merci pour vos redirections.

Je vais regarder ça de très près. Je vous tiens au jus...

Bises.

Maly
PC 1 : DELL Latitude E4310 | Linux Mint 21.3 Virginia | Cinnamon 6.0.4 | 5.15.0-94-generic x86_64 | dual core Intel Core i5 M 560 | 3 Go | Intel Core Processor Integrated Graphics
PC 2 : HP Pavilion dv5 Notebook | Linux Mint 21.3 Virginia | Cinnamon 6.0.4 | 5.15.0-92-generic x86_64 | dual core AMD Turion X2 Ultra | 3 Go | AMD RV620/M82 [Mobility Radeon HD 3450/3470]

Malynou
Messages : 264
Enregistré le : mar. 13 sept. 2016 06:05

Re: Aspirateur de site

Message par Malynou »

Bon... Ben ça ne marche pas...

:|

Ce sont des pages dynamiques en php. Du coup, wget n'arrive pas à récupérer les données.

Sniff...

Tant pis...

Merci quand même :B
PC 1 : DELL Latitude E4310 | Linux Mint 21.3 Virginia | Cinnamon 6.0.4 | 5.15.0-94-generic x86_64 | dual core Intel Core i5 M 560 | 3 Go | Intel Core Processor Integrated Graphics
PC 2 : HP Pavilion dv5 Notebook | Linux Mint 21.3 Virginia | Cinnamon 6.0.4 | 5.15.0-92-generic x86_64 | dual core AMD Turion X2 Ultra | 3 Go | AMD RV620/M82 [Mobility Radeon HD 3450/3470]

Avatar du membre
arghlub
Administrateur du site
Messages : 10421
Enregistré le : dim. 21 mai 2017 08:19
Localisation : Provence
Contact :

Re: Aspirateur de site

Message par arghlub »

Il ne me semble pas que cela soit possible de récupérer le PHP d'un site à la volée.
Le PHP est interprété en amont par le serveur pour être visible par le client en HTML. Donc le PHP reste sur le serveur et n'arrive pas jusqu'au client (toi).
Pour récupérer le PHP il faut que tu t'adresses à l'admin du site pour qu'il te donne accés aux sources de son site et après tu les récupères avec «Filezilla» par exemple.
;)
Tour1 (custom)CM MSI Z270 M3 | CPU Intel I7-7700K | CG Nvidia GTX 1080 | RAM 16Go | tripleBoot : Debian 11 | MXlinux 21 | LMint 19.3 | XFCE
Tour2 (custom)CM Gigabyte | CPU AMD Athlon 5200+ | CG Nvidia GTX 560 | RAM 6Go | FreeBSD 12.1 XFCE
Portable1 MSI GF75 Thin 9SC | CPU Intel I7-9750H | CG Nvidia GTX 1650 | RAM 32Go | dualBoot : LMint 20.2 | MXlinux 21 | XFCE
Portable2 MacBook Air A1466 (2015) | CPU Intel I5-5250U | CG Intel HD Graphics 6000 | RAM 8Go | dualBoot : macOS Sierra | MXlinux 21 XFCE
─────( pour une informatique libre ! -membre en stand-by de l' April.org────────────────

mpedro
Messages : 1517
Enregistré le : dim. 8 nov. 2015 22:13
Contact :

Re: Aspirateur de site

Message par mpedro »

Pour aspirer un site et le regarder en local ça fonctionne.
Stretch 32bits cinnamon/Fedora25/Sarah
Compaq 8510p/MSI GE70/Raspberry Pi2

Avatar du membre
arghlub
Administrateur du site
Messages : 10421
Enregistré le : dim. 21 mai 2017 08:19
Localisation : Provence
Contact :

Re: Aspirateur de site

Message par arghlub »

Je suis d'accord avec mpedro, tu peux aspirer n'importe quel site (même dynamique construit en PHP), le résultat sera en HTML+CSS et tu pourras le visionner en local.
Par contre, si tu veux récupérer la structure PHP pour voir comment le site est construit, là ce n'est pas possible, à moins d'être administrateur du site ou de lui demander.
Tour1 (custom)CM MSI Z270 M3 | CPU Intel I7-7700K | CG Nvidia GTX 1080 | RAM 16Go | tripleBoot : Debian 11 | MXlinux 21 | LMint 19.3 | XFCE
Tour2 (custom)CM Gigabyte | CPU AMD Athlon 5200+ | CG Nvidia GTX 560 | RAM 6Go | FreeBSD 12.1 XFCE
Portable1 MSI GF75 Thin 9SC | CPU Intel I7-9750H | CG Nvidia GTX 1650 | RAM 32Go | dualBoot : LMint 20.2 | MXlinux 21 | XFCE
Portable2 MacBook Air A1466 (2015) | CPU Intel I5-5250U | CG Intel HD Graphics 6000 | RAM 8Go | dualBoot : macOS Sierra | MXlinux 21 XFCE
─────( pour une informatique libre ! -membre en stand-by de l' April.org────────────────

Malynou
Messages : 264
Enregistré le : mar. 13 sept. 2016 06:05

Re: Aspirateur de site

Message par Malynou »

Non non.
Je voudrais récupérer le site avec ses docs etc que je pourrais consulter en local.
Mais là, ça semble pas prendre les "données". Juste le "contenant".
:cry:
PC 1 : DELL Latitude E4310 | Linux Mint 21.3 Virginia | Cinnamon 6.0.4 | 5.15.0-94-generic x86_64 | dual core Intel Core i5 M 560 | 3 Go | Intel Core Processor Integrated Graphics
PC 2 : HP Pavilion dv5 Notebook | Linux Mint 21.3 Virginia | Cinnamon 6.0.4 | 5.15.0-92-generic x86_64 | dual core AMD Turion X2 Ultra | 3 Go | AMD RV620/M82 [Mobility Radeon HD 3450/3470]

Répondre