3) Utiliser un éditeur PDF pour les pages Web
J'ai fait récemment l'expérience de récupérer des fichiers du forum Marque Jaune grâce au moteur de recherche Web archive (page 1 de ce sujet). Et cela m'a ouvert les yeux sur l'intérêt des éditeurs PDF. Ce sont des programmes permettant de transformer des pages Web en fichiers PDF. Je rappelle ici que le format PDF permet la conservation à long terme des documents. C'est un format très courant sur Internet. Il est lisible avec le programme Adobe Reader, téléchargeable gratuitement.
Dans cette perspective, j'ai découvert le logiciel Bullzip PDF Printer, un éditeur PDF gratuit sur le Web. Il est excellent et très simple d'utilisation. Vous pouvez trouver un tutoriel et un lien pour le télécharger à l'adresse
http://www.pcastuces.com/pratique/inter ... /page1.htm (et pages suivantes). Bullzip permet d'enregistrer une page Web entière (ou d'autres documents), seulement une partie de cette page après l'avoir sélectionnée, plusieurs pages Web à la suite, fusionner des pages Web... L'enregistrement s'effectue par défaut au format PDF, mais vous pouvez aussi choisir des formats images (JPG, BMP...).
Réglez au départ vos options les plus courantes dans les Options, en face du raccourci vers Bullzip dans votre liste des programmes installés sur votre ordinateur. Cela permettra ensuite d'aller plus vite. Bullzip fonctionne comme une imprimante. Dans votre page Web ou document, sélectionnez par exemple la partie qui vous intéresse, cliquez ensuite sur Fichier / Imprimer, choisissez l'imprimante virtuelle Bullzip, cochez Sélection, cliquez sur OK, réglez les options si ce n'est déjà fait, cliquez enfin sur Sauvegarder.
Voyons maintenant un cas concret. Vous souhaitez enregistrer une page Web contenant beaucoup d'images, mais aussi ces images indépendamment. Comment faire ? Voici la procédure complète :
1) N'enregistrez tout d'abord pas directement cette page au format PDF. Vous ne pourriez plus ensuite dissocier ses images. Non, faites plutôt un enregistrement classique en cliquant sur Fichier / Enregistrer sous.
2) Vous avez maintenant sur votre disque dur deux éléments : un fichier HTM reproduisant la page Web et un dossier contenant ses images. Votre but est apparemment atteint, mais cette organisation n'est pas non plus très souple. En effet, ces deux éléments sont solidaires. Vous ne pourrez pas les mettre dans des dossiers différents. Faites l'expérience : c'est ainsi ! De plus, le format HTM est beaucoup moins facilement exportable que le format PDF.
3) Ouvrez alors votre fichier HTM. Vérifiez pour commencer que les caractères accentués du texte sont bien affichés. Ils posent souvent des problèmes. Si tel n'est pas le cas, cliquez alors sur Affichage / Encodage des caractères / Unicode UTF-8 (ou voisin). Miracle : tout se rétablit, mais seulement jusqu'à la fermeture du fichier. Aucune importance : cela vous donne un délai suffisant...
4) Cliquez alors sur Fichier / Imprimer, choisissez l'imprimante virtuelle Bullzip, puis menez la procédure jusqu'à son terme. Vous avez maintenant trois éléments : un fichier HTM, un autre PDF identique et un dossier d'images.
5) Puisque vous avez maintenant un fichier PDF équivalent au fichier HTM, votre premier réflexe serait de supprimer celui-ci. Mais attention, le dossier d'images disparaitrait alors automatiquement. Et vous souhaitez justement conserver ces images.
6) Une première solution serait alors de copier ou déplacer le fichier HTM, sinon le dossier d'images. Mais quelle que soit la solution adoptée, l'autre élément suit automatiquement son compère. Ce sont vraiment des inséparables !
7) Déjà plus malin : vous ouvrez le dossier d'images, sélectionnez en bloc tous ses fichiers (Ctrl + A), puis les copiez dans un autre dossier créé pour la circonstance. Vous pouvez alors supprimer le dossier initial : vos images se trouvent en lieu sûr. Bien entendu, le fichier HTM disparaitra par la même occasion. Mais aucune importance : vous possédez déjà l'équivalent au format PDF.
8) Encore mieux : renommez le dossier d'images. Un message s'affiche alors, vous avertissant que cette opération rendra illisible le fichier HTM. Sans importance, puisque vous l'avez maintenant en PDF. Confirmez alors, puis supprimez le fichier HTM. Miracle : le dossier d'images reste intact !
9) Au bout du compte, vous aurez alors deux éléments : un fichier PDF de la page Web, un dossier d'images correspondant à cette page. Et ces deux éléments pourront être gérés de manière complètement indépendante !
Je ne vous cache pas qu'il m'a fallu pas mal de patience pour arriver à ce résultat. Mais cela en valait le coup pour l'occasion. J'ai pu en particulier transmettre les fichiers de la Marque Jaune sous un format PDF lisible, tous les dossiers d'images étant par ailleurs préservés et manipulables séparément. Bon à savoir pour la prochaine fois...