10 janvier 2005
J'ai aspiré BlogOKat !
Quand j'ai décidé de commencer ce blog, je ne savais pas quel serait
son avenir... J'ai donc choisi la solution la plus simple : un
hébergement gratuit avec un éditeur intégré en ligne. J'ai opté pour
Canalblog parce que la présentation proposée était celle qui me
convenait le mieux. Malgré ses fonctionnalités limitées, je suis plutôt
satisfaite de cet outil que j'ai pu m'approprier très rapidement (je
n'ai aucune compétence en informatique et ne connais pas le html).
Un peu plus de 2 mois après le lancement de BlogOKat, j'ai rédigé une
soixantaine de billets dont certains m'ont demandé un peu de travail
(cf La saga des DTD). Or, j'écris directement dans l'éditeur de Canalblog et ne garde pas d'autre trace de ce que je mets en ligne.
Si
les serveurs de Canalblog étaient détruits ou si Canalblog
disparaissait (on se sait jamais !), mes billets seraient donc
irrémédiablement perdus !
Même s'il y a peu de chances que
ce scénario catastrophe ne se réalise, il devenait urgent de garder une
trace de de BlogOKat, ne serait-ce que pour disposer d'une archive de
mes écrits.
La solution ?
HTTrack, un robot aspirateur de sites web qui "permet
de télécharger un site web d'Internet vers votre disque dur, en
construisant récursivement tous les répertoires, récupérant html,
images et fichiers du serveur vers votre ordinateur. HTTrack réorganise
la structure des liens en relatif. Ouvrez simplement une page du site
"aspiré" dans votre navigateur, et vous pourrez browser librement à
l'intérieur, comme si vous étiez connecté."
J'ai choisi cet outil plutôt qu'un autre (Memoweb, Wysigot...) pour les raisons suivantes :
- il s'agit d'un logiciel libre sous licence GPL,
- créé par des français donc disponible en français (je suis plutôt fainéante en ce qui concerne l'anglais...),
- considéré comme performant par les spécialistes,
- et c'est un outil utilisé par la BNF dans le cadre de ses expérimentations sur le dépôt légal d'internet.
Le résultat ?
La capture de site s'effectue par l'intermédiaire d'un assistant, dont
le paramétrage est relativement aisé. La profondeur d'exploration du
site ou la taille maximale des fichiers téléchargés peuvent être
limitées et il est possible de définir des filtres afin de contrôler le
type d'éléments qui seront rapatriés. Par ailleurs, les copies existantes de sites peuvent être mises à jour aisément. A noter qu'une aide en ligne est disponible (uniquement en anglais).
Et si je vais au bout de ma logique, il ne me reste plus qu'à graver
l'archive de BlogOKat sur un cd car mon ordinateur peut rendre l'âme,
on ne sait jamais !
Compléments :
- un article de Framasoft et un tutoriel
- un autre tutoriel
- Capture de sites en ligne présentation de Xavier Roche, l'auteur du logiciel HTTrack
- Logiciels pour tenir son journal en ligne (blogs) par Emmanuel Barthe
