22 décembre 2005
Devoir de vacances : Structurer, décrire et organiser l'information
Si ce n'est pas déjà fait, je vous recommande d'aller faire un tour du côté des petites cases de Got qui a écrit une série de 3 billets autour de l'information :
- Structurer l'information grâce à XML
- Décrire l'information : le rôle des métadonnées et de RDF
- Comment organiser l'information pour y naviguer efficacement ?
Ami(e)s documentalistes Chers lecteurs [les
documentalistes sont mes amis, mais je sais qu'ils ne sont pas les
seuls à me lire ;-)], il s'agit là d'une saine lecture qui vous
permettra de comprendre un peu mieux XML, d'approfondir RDF et le web
sémantique, de comprendre comment les informations sont oragnisées pour
le web... bref, de vous y retrouver parmi tous ces concepts barbares ;-)
Certes, c'est plutôt technique, mais les exemples concrets permettent de s'y retrouver...
Je reproduis ici la conclusion de Got qui résume bien son propos :
"A l'issue de ces trois billets, j'espère avoir montré que la structuration, la description et l'organisation
correspondent à des étapes différentes dans le mécanisme de création de
l'information voire de connaissance. Une compréhension fine de ces
étapes et de leurs impacts sur les données qui vont constituer
l'information permet de choisir les technologies adaptées. A mon avis,
cela permet de faciliter le développement des applications, leurs
maintenances et donc la conservation des données."
Publi-reportage Google
Google fait de l'oeil aux professionnels de l'information-documentation (librarians). Le moteur vient en effet de lancer une newsletter qui leur est spécialement destinée : "Librarians
and Google share the same mission to organize the world's information
and make it universally accessible and useful. The goal of this
newsletter is to highlight ways we can work together to fulfil that
mission for patrons, students and users."
L'unique article proposé dans le premier numéro est intitulé How does Google collect and rank results?
Il dévoile (un peu) la cuisine interne de Google et ses recettes pour
le Page Rank. Pour continuer avec les métaphotres culinaires,
j'ajouterais qu'on reste sur sa faim ;-)
[Via Outils Froids]
J'en profite pour vous signaler cette page présentant le fonctionnement des moteurs de recherche en général et celui de Google en particulier. [Via ???]
21 décembre 2005
Blogs et documentaliste
J'ai testé Google Blog Search...
et je me suis abonnée au fil RSS correspondant à la requête
"documentaliste". C'est assez efficace même si parmi les résultats
apparaissent des billets assez anciens et d'autres qui ne sont pas très
intéressants.
La récolte est tout de même fructueuse puisqu'elle m'a permis de découvrir :
- Le blog des professionnels de la doc, un blog qui s'adresse aux enseignants, aux professionnels et aux étudiants et qui aborde des thèmes plutôt classiques comme les outils bibliographiques, les aspects juridiques de l'information ou les sciences de l'information.
- Le pirate de la veille documentaire, "le blog avec des vrais morceaux de veille documentaire dedans"
- Les blogs d'étudiants de licence professionnelle BDAN (Bibliothèques, Documentation et Archives Numériques) de l'IUT de Grenoble qui mettent en ligne des fiches de lectures et des grilles d'analyse de collections numériques en ligne dans le cadre d'un cours intitulé "construction et diffusion d'une collection numérique" (voir celui-ci par exemple).
- 2 CV sous forme de blog
- etc.
20 décembre 2005
Blog de cuisine
Je ne vais pas vous livrer une liste de blogs de cuisine, il en existe
de nombreux, connus ou pas du tout, pour tous les goûts. Il m'arrive
parfois de me perdre sur certains d'entre eux et d'être accablée (oui,
j'exagère) par les photos que j'y vois : mets peu appétissants,
couleurs moches, décor laissant à désirer....
Sur Les Culino-tests,
c'est tout le contraire. Les photos sont soignées, mises en scène et
elles détaillent toutes les étapes des recettes testées (d'où le titre)
par Caroline. Et puis, la cuisinière a de l'humour, ce qui est encore
mieux : j'ai bien ri en lisant son billet
dédié à une émission de cuisine de la BBC diffuséee sur Cuisine TV
[j'avoue regarder de temps à autre cette chaîne et apprécier les
émissions culinaires de la BBC qui n'ont rien a voir avec ce qu'on voit
sur nos chaînes françaises ;-)].
18 décembre 2005
Métadonnées pour les nuls : métadonnées et sites internet
Après avoir présenté très succintement le Dublin Core,
j'ai décidé de me pencher sur son utilisation pour les sites internet.
Les éléments du Dublin Core sont tout à fait utilisables pour
décrire
des pages web : il suffit de les insérer parmi les balises meta, dans
la section <head> et ils peuvent cohabiter avec les balises meta
"traditionnelles".
Pour BlogOKat, voici ce que cela pourrait donner :
<head>
<title>BlogOKat</title>
<meta name="dc.title" content=”BlogOKat" />
<meta name="dc.format" content="text/html" />
<meta name="dc.language" content="fr" />
<meta name="dc.creator" content="Catherine" />
<meta name="dc.description" content="Documentation, technologies de l’information, internet, etc..." />
<meta name="Description" content="Documentation, technologies de l'information, internet, etc..." />
<meta name="dc.subject" content="documentation, documentaliste, technologies de l’information, TIC, NTIC, internet " />
<meta name="Keywords" content="documentation, documentaliste, technologies de l’information, TIC, NTIC, internet " />
</head>
Mais dans les faits, les balises meta n'ont pas la cote auprès des
webmasters ! Quant au Dublin Core... J'ai trouvé des chiffres de 2003
sur Abondance : 40 % des sites
francophones contenaient à l'époque une balise "Description" et une balise
"Keywords" et seulemement 2% des éléments Dublin Core. Je ne pense pas que les
chiffres aient beaucoup évolué...
En effet, les
webmasters, qui sont plus sensibilisés aux questions de référencement
qu'aux questions de structuration ou de qualification de l'information,
ne sont pas vraiment encouragés à utiliser ces balises meta :
"Parmi les critères "in the Page", le titre de la page
ou "title", (balise html) serait particulièrement déterminant pour le
référencement dans Google. La balise description, en revanche,
semblerait ne plus contribuer au référencement, tout du moins elle
n'influencerait plus le classement dans Google mais permet d'indiquer à
l'internaute le contenu d'un site grâce à un texte succinct (200
caractères maximum) présenté dans les résultats de recherche. La balise
"keywords" serait purement et simplement ignorée par Google."
(e-humeurs via Influx).
Et Abondance confirme d'ailleurs que les balises "Description" et "Keywords" sont aujourd'hui inutiles pour le référencement.
[edit] Il y a tout de même quelques moteurs de recherche qui comprennent le Dublin Core. Mais ce ne sont pas des moteurs de recherche "grand public" comme Google, Yahoo et compagnie...
Mais alors pourquoi insérer des balises meta au format Dublin Core dans un site ?
Tout
simplement pour décrire d'une manière plus précise le contenu des
sites, afin de pouvoir mieux les identifier grâce à de l'information
structurée. Il s'agit aussi d'un travail sur la qualité, d'autant que
le Dublin Core est un standard et qu'il peut favoriser
l'interopérabilité.
Et tout cela va dans le sens d'un web sémantique, d'un web plus intelligent (surtout que ces fameuses balises meta DC peuvent être implémentées en RDF).
En conclusion, il me semble que pour favoriser l'adoption du Dublin Core pour la description des
sites web, il est nécessaire d'adopter des normes comme l'a fait le gouvernement du Canada : "tous
les sites Web du GdC doivent adopter les cinq métabalises suivantes
comme norme de métadonnées aux fins de la description des ressources du
Web : titre, créateur, langue de la ressource, date et index
idéologique normalisé." (voir aussi ce guide)
Je suis allée voir quelles étaient les pratiques des
sites gouvernementaux français : leurs pratiques en matière de balises meta sont on ne peut plus
hétérogènes. (Mais il y a un bon élève...)
16 décembre 2005
A propos d'archivage du web
Le prochain examen de la loi DAVDSI (au cours de la semaine de Noël,
comme par hasard) suscite des articles et réactions divers et variés sur ses
différents points. Il en est un qui est un peu plus "consensuel" (et
c'est un euphémisme) que (au hasard) la question des DRM : c'est
l'archivage du web.
Cette semaine, j'ai repéré sur 2 articles que le sujet :
- chez zdnet : L'INA et la BNF prêts pour archiver l'internet
- pour l'Expansion : La BNF se met au défi d'archiver le web
En résumé (pour ceux qui ne seraient pas au courant) : le dépôt
légal des sites web va être mis en place en France. L'INA (Institut
National de l'Audiovisuel) sera chargé des sites relevant du domaine de
l'audiovisuel et la BNF du reste. Et comme l'écrit justement zdnet : "au-delà de la collecte et de la conservation de ces
données, l'INA et la BNF doivent travaillent également pour offrir les
moyens d'une consultation aisée, par les chercheurs et les
professionnels, de cette mémoire collective. Une problématique qui
rejoint celle de la bibliothèque numérique européenne, dont Jean-Noël
Jeanneney est l'un des principaux promoteurs".La
problématique est donc l'indexation des contenus des sites web pour
ensuite les mettre à disposition, c'est à dire les rendre accessibles
au public.
Pour aller plus loin :
- La présentation (pdf) de l'expérience de la BNF en matière de collecte automatique de sites web au dernier Congrès de l'IFLA qui a eu lieu à Oslo en août dernier.
- Les actes du 5ème atelier international sur l'archivage du web qui a eu lieu à Vienne (Autriche) en septembre dernier.
- Un article sur le blog d'Emmanuel Barthe.
- Le billet du Culture et TIC qui cite l'article de l'Expansion.
- Et un billet que j'ai écrit en 2005 avec d'autres lectures recommandables.
14 décembre 2005
Bon lecteur ?
Lire vite. Etre capable de comprendre et de synthétiser les
informations lues. Ces savoirs sont indispensables pour les
documentalistes et autres bibliothécaires...
Il
existe des techniques qui permettent de doubler voire de tripler sa
vitesse de lecture et tout en améliorant sa vitesse de mémorisation.
Pour en savoir plus et tester votre niveau de lecture, voir le dossier du Journal du Management.
Pour ma part, je suis une "assez bonne lectrice". Il me semble que mon
score aurait été meilleur si j'avais fait le test en début de journée.
;-)
[Vu sur Culture et TIC]
Et aussi : un autre test (le texte est nettement moins dense que ceux du JDM) et un guide avec un test (pas encore fait).
13 décembre 2005
Encore du web 2.0 !
Fred Cavazza nous présente les lauréats du grand concours des meilleurs services en ligne 2005 du web 2.0. Parmi ceux-ci des "classiques" comme del.icio.us ou flickr.
Netvibes fait aussi partie des lauréats. Il est testé et approuvé par
BlogOKat ;-)
Je l'ai adopté comme page de démarrage depuis quelques temps... J'apprécie
particulièrement la sélection de photos de flickr qui vient égayer cette page quelque austère : aujourd'hui j'ai découvert les photos de Dave Gorman. Voir celle-ci, celle-là, ou encore celle-ci et puis celle-là !
12 décembre 2005
En savoir plus sur le web 2.0
Web 2.0 : mythe et réalité, tel est le titre d'un article éclairant d'Eric van der Vlist sur ce "sujet à la mode" :
"Le Web 2.0 n'est pas un standard mais plutôt une série de
principes d'utilisation de technologies existantes."
Il s'agit d'un "concept flou qui regroupe un certain nombre de tendances et chacun
semble en avoir sa propre définition comme on peut le constater devant
la foison d'articles décrivant « ce qu'est le Web 2.0 »."
L'auteur de l'article site un long article de Tim O'Reilly qui complète bien son propos : What Is Web 2.0
[Vu sur le blog de Jean-Luc Raymond]
Voir aussi 01.net qui met du Web 1.5 entre le Web 1.0 et le Web 2.0 !
07 décembre 2005
Glossaire de la gestion de l'information
Voici un glossaire proposé par le centre de ressources de la gestion
de l'information (CRGI), organisme gouvernemental canadien. Les
définitions sont consultables par ordre alphabétique ou thématique. Les
thèmes couverts sont les suivants :
- Accès à l'information
- Gestion de l'information
- Accessibilité
- Gestion des documents administratifs
- Bibliothèque
- Gouvernance
- Classification
- Infrastructure à clé publique
- Conservation
- Langue
- Courrier électronique
- Métadonnées
- Édition
- Portails
- Exploration des ressources
