BlogOKat

Documentation, technologies de l'information, internet, etc...

10 janvier 2005

J'ai aspiré BlogOKat !

Quand j'ai décidé de commencer ce blog, je ne savais pas quel serait son avenir... J'ai donc choisi la solution la plus simple : un hébergement gratuit avec un éditeur intégré en ligne. J'ai opté pour Canalblog parce que la présentation proposée était celle qui me convenait le mieux. Malgré ses fonctionnalités limitées, je suis plutôt satisfaite de cet outil que j'ai pu m'approprier très rapidement (je n'ai aucune compétence en informatique et ne connais pas le html).

Un peu plus de 2 mois après le lancement de BlogOKat, j'ai rédigé une soixantaine de billets dont certains m'ont demandé un peu de travail (cf La saga des DTD). Or, j'écris directement dans l'éditeur de Canalblog et ne garde pas d'autre trace de ce que je mets en ligne.
Si les serveurs de Canalblog étaient détruits ou si Canalblog disparaissait (on se sait jamais !), mes billets seraient donc irrémédiablement perdus !
Même s'il y a peu de chances que ce scénario catastrophe ne se réalise, il devenait urgent de garder une trace de de BlogOKat, ne serait-ce que pour disposer d'une archive de mes écrits.

La solution ?
HTTrack, un robot aspirateur de sites web
qui "permet de télécharger un site web d'Internet vers votre disque dur, en construisant récursivement tous les répertoires, récupérant html, images et fichiers du serveur vers votre ordinateur. HTTrack réorganise la structure des liens en relatif. Ouvrez simplement une page du site "aspiré" dans votre navigateur, et vous pourrez browser librement à l'intérieur, comme si vous étiez connecté."

J'ai choisi cet outil plutôt qu'un autre (Memoweb, Wysigot...) pour les raisons suivantes :
- il s'agit d'un logiciel libre sous licence GPL,
- créé par des français donc disponible en français (je suis plutôt
fainéante en ce qui concerne l'anglais...),
- considéré comme performant par les spécialistes,
- et c'est un outil utilisé par la BNF dans le cadre de ses expérimentations sur le dépôt légal d'internet.

Le résultat ? La capture de site s'effectue par l'intermédiaire d'un assistant, dont le paramétrage est relativement aisé. La profondeur d'exploration du site ou la taille maximale des fichiers téléchargés peuvent être limitées et il est possible de définir des filtres afin de contrôler le type d'éléments qui seront rapatriés. Par ailleurs, les copies
existantes de sites peuvent être mises à jour aisément. A noter qu'une aide en  ligne est disponible (uniquement en anglais).
Et si je vais au bout de ma logique, il ne me reste plus qu'à graver l'archive de BlogOKat sur un cd car mon ordinateur peut rendre l'âme, on ne sait jamais !


Compléments :

Posté par BlogOKat à 22:03 - Outils - Commentaires [5] - Rétroliens [0] - Permalien [#]

29 novembre 2004

Vérification de liens brisés

J'avais pensé évoquer les vérificateurs de liens car je trouve qu'il est agaçant de se balader sur un site et de tomber sur des liens brisés. Armelle Thomas a eu la même idée que moi et a écrit dernièrement un post sur le sujet dans son blog "Outils de veille".

Pour ma part, j'utilise Xenu's link Sleuth parcequ'il est gratuit, vraiment très simple d'utilisation, rapide et performant. Il permet de vérifier la validité des liens tant internes qu'externes et crée un rapport que l'on peut ensuite trier de différentes façons.

Posté par BlogOKat à 12:45 - Outils - Commentaires [0] - Rétroliens [0] - Permalien [#]



« Accueil  1