BlogOKat

Documentation, technologies de l'information, internet, etc...

22 décembre 2005

Devoir de vacances : Structurer, décrire et organiser l'information

Si ce n'est pas déjà fait, je vous recommande d'aller faire un tour du côté des petites cases de Got qui a écrit une série de 3 billets autour de l'information :

  1. Structurer l'information grâce à XML
  2. Décrire l'information : le rôle des métadonnées et de RDF
  3. Comment organiser l'information pour y naviguer efficacement ?

Ami(e)s documentalistes Chers lecteurs [les documentalistes sont mes amis, mais je sais qu'ils ne sont pas les seuls à me lire ;-)], il s'agit là d'une saine lecture qui vous permettra de comprendre un peu mieux XML, d'approfondir RDF et le web sémantique, de comprendre comment les informations sont oragnisées pour le web... bref, de vous y retrouver parmi tous ces concepts barbares ;-)
Certes, c'est plutôt technique, mais les exemples concrets permettent de s'y retrouver...

Je reproduis ici la conclusion de Got qui résume bien son propos :
"A l'issue de ces trois billets, j'espère avoir montré que la structuration, la description et l'organisation correspondent à des étapes différentes dans le mécanisme de création de l'information voire de connaissance. Une compréhension fine de ces étapes et de leurs impacts sur les données qui vont constituer l'information permet de choisir les technologies adaptées. A mon avis, cela permet de faciliter le développement des applications, leurs maintenances et donc la conservation des données."

Posté par BlogOKat à 18:18 - XML, RSS et compagnie - Commentaires [0] - Rétroliens [0] - Permalien [#]

Publi-reportage Google

Google fait de l'oeil aux professionnels de l'information-documentation (librarians). Le moteur vient en effet de lancer une newsletter qui leur est spécialement destinée : "Librarians and Google share the same mission to organize the world's information and make it universally accessible and useful. The goal of this newsletter is to highlight ways we can work together to fulfil that mission for patrons, students and users."
L'unique article proposé dans le premier numéro est intitulé How does Google collect and rank results? Il dévoile (un peu) la cuisine interne de Google et ses recettes pour le Page Rank. Pour continuer avec les métaphotres culinaires, j'ajouterais qu'on reste sur sa faim ;-)
[Via Outils Froids]

J'en profite pour vous signaler cette page présentant le fonctionnement des moteurs de recherche en général et celui de Google en particulier. [Via ???]

Posté par BlogOKat à 17:17 - Recherche d'information - Commentaires [3] - Rétroliens [0] - Permalien [#]

21 décembre 2005

Blogs et documentaliste

J'ai testé Google Blog Search... et je me suis abonnée au fil RSS correspondant à la requête "documentaliste". C'est assez efficace même si parmi les résultats apparaissent des billets assez anciens et d'autres qui ne sont pas très intéressants.
La récolte est tout de même fructueuse puisqu'elle m'a permis de découvrir :

Posté par BlogOKat à 22:45 - Blogs - Commentaires [2] - Rétroliens [0] - Permalien [#]

20 décembre 2005

Blog de cuisine

Je ne vais pas vous livrer une liste de blogs de cuisine, il en existe de nombreux, connus ou pas du tout, pour tous les goûts. Il m'arrive parfois de me perdre sur certains d'entre eux et d'être accablée (oui, j'exagère) par les photos que j'y vois : mets peu appétissants, couleurs moches, décor laissant à désirer....
Sur Les Culino-tests, c'est tout le contraire. Les photos sont soignées, mises en scène et elles détaillent toutes les étapes des recettes testées (d'où le titre) par Caroline. Et puis, la cuisinière a de l'humour, ce qui est encore mieux : j'ai bien ri en lisant son billet dédié à une émission de cuisine de la BBC diffuséee sur Cuisine TV [j'avoue regarder de temps à autre cette chaîne et apprécier les émissions culinaires de la BBC qui n'ont rien a voir avec ce qu'on voit sur nos chaînes françaises ;-)].

Posté par BlogOKat à 22:27 - Blogs - Commentaires [2] - Rétroliens [0] - Permalien [#]

18 décembre 2005

Métadonnées pour les nuls : métadonnées et sites internet

Après avoir présenté très succintement le Dublin Core, j'ai décidé de me pencher sur son utilisation pour les sites internet.
Les éléments du Dublin Core sont tout à fait utilisables pour décrire des pages web : il suffit de les insérer parmi les balises meta, dans la section <head> et ils peuvent cohabiter avec les balises meta "traditionnelles".
Pour BlogOKat, voici ce que cela pourrait donner :

	<head>
<title>BlogOKat</title>
<meta name="dc.title" content=”BlogOKat" />

<meta name="dc.format" content="text/html" />
<meta name="dc.language" content="fr" />
<meta name="dc.creator" content="Catherine" />

<meta name="dc.description" content="Documentation, technologies de l’information, internet, etc..." />
<meta name="Description" content="Documentation, technologies de l'information, internet, etc..." />
<meta name="dc.subject" content="documentation, documentaliste, technologies de l’information, TIC, NTIC, internet " />
<meta name="Keywords" content="documentation, documentaliste, technologies de l’information, TIC, NTIC, internet " />
</head>

Mais dans les faits, les balises meta n'ont pas la cote auprès des webmasters ! Quant au Dublin Core... J'ai trouvé des chiffres de 2003 sur Abondance : 40 % des sites francophones contenaient à l'époque une balise "Description" et une balise "Keywords" et seulemement 2% des éléments Dublin Core. Je ne pense pas que les
chiffres aient beaucoup évolué...
En effet, les webmasters, qui sont plus sensibilisés aux questions de référencement qu'aux questions de structuration ou de qualification de l'information, ne sont pas vraiment encouragés à utiliser ces balises meta :
"Parmi les critères "in the Page", le titre de la page ou "title", (balise html) serait particulièrement déterminant pour le référencement dans Google. La balise description, en revanche, semblerait ne plus contribuer au référencement, tout du moins elle n'influencerait plus le classement dans Google mais permet d'indiquer à l'internaute le contenu d'un site grâce à un texte succinct (200 caractères maximum) présenté dans les résultats de recherche. La balise "keywords" serait purement et simplement ignorée par Google."
(e-humeurs via Influx). 
Et Abondance confirme d'ailleurs que les balises "Description" et "Keywords" sont aujourd'hui inutiles pour le référencement.
[edit] Il y a tout de même quelques moteurs de recherche qui comprennent le Dublin Core. Mais ce ne sont pas des moteurs de recherche "grand public" comme Google, Yahoo et compagnie...

Mais alors pourquoi insérer des balises meta au format Dublin Core dans un site ?
Tout simplement pour décrire d'une manière plus précise le contenu des sites, afin de pouvoir mieux les identifier grâce à de l'information structurée. Il s'agit aussi d'un travail sur la qualité, d'autant que le Dublin Core est un standard et qu'il peut favoriser l'interopérabilité.
Et tout cela va dans le sens d'un web sémantique, d'un web plus intelligent (surtout que ces fameuses balises meta DC peuvent être implémentées en RDF).

En conclusion, il me semble que pour favoriser l'adoption du Dublin Core pour la description des sites web, il est nécessaire d'adopter des normes comme l'a fait le gouvernement du Canada : "tous les sites Web du GdC doivent adopter les cinq métabalises suivantes comme norme de métadonnées aux fins de la description des ressources du Web : titre, créateur, langue de la ressource, date et index idéologique normalisé." (voir aussi ce guide)
Je suis allée voir quelles étaient les pratiques des sites gouvernementaux français : leurs pratiques en matière de balises meta sont on ne peut plus hétérogènes. (Mais il y a un bon élève...)

Posté par BlogOKat à 22:46 - Métadonnées pour les nuls - Commentaires [1] - Rétroliens [0] - Permalien [#]

16 décembre 2005

A propos d'archivage du web

Le prochain examen de la loi DAVDSI (au cours de la semaine de Noël, comme par hasard) suscite des articles et réactions divers et variés sur ses différents points. Il en est un qui est un peu plus "consensuel" (et c'est un euphémisme) que (au hasard) la question des DRM : c'est l'archivage du web.
Cette semaine, j'ai repéré sur 2 articles que le sujet :

En résumé (pour ceux qui ne seraient pas au courant) : le dépôt légal des sites web va être mis en place en France. L'INA (Institut National de l'Audiovisuel) sera chargé des sites relevant du domaine de l'audiovisuel et la BNF du reste. Et comme l'écrit justement zdnet : "au-delà de la collecte et de la conservation de ces données, l'INA et la BNF doivent travaillent également pour offrir les moyens d'une consultation aisée, par les chercheurs et les professionnels, de cette mémoire collective. Une problématique qui rejoint celle de la bibliothèque numérique européenne, dont Jean-Noël Jeanneney est l'un des principaux promoteurs".La problématique est donc l'indexation des contenus des sites web pour ensuite les mettre à disposition, c'est à dire les rendre accessibles au public.

Pour aller plus loin :

  • La présentation (pdf) de l'expérience de la BNF en matière de collecte automatique de sites web au dernier Congrès de l'IFLA qui a eu lieu à Oslo en août dernier.
  • Les actes du 5ème atelier international sur l'archivage du web qui a eu lieu à Vienne (Autriche) en septembre dernier.
  • Un article sur le blog d'Emmanuel Barthe.
  • Le billet du Culture et TIC qui cite l'article de l'Expansion.
  • Et un billet que j'ai écrit en 2005 avec d'autres lectures recommandables.

Posté par BlogOKat à 20:56 - Archives et archivage - Commentaires [2] - Rétroliens [0] - Permalien [#]

14 décembre 2005

Bon lecteur ?

Lire vite. Etre capable de comprendre et de synthétiser les informations lues. Ces savoirs sont indispensables pour les documentalistes et autres bibliothécaires...
Il existe des techniques qui permettent de doubler voire de tripler sa vitesse de lecture et tout en améliorant sa vitesse de mémorisation. Pour en savoir plus et tester votre niveau de lecture, voir le dossier du Journal du Management. Pour ma part, je suis une "assez bonne lectrice". Il me semble que mon score aurait été meilleur si j'avais fait le test en début de journée. ;-)
[Vu sur Culture et TIC]

Et aussi :  un autre test (le texte est nettement moins dense que ceux du JDM) et un guide avec un test (pas encore fait).

Posté par BlogOKat à 22:01 - A classer - Commentaires [0] - Rétroliens [0] - Permalien [#]

13 décembre 2005

Encore du web 2.0 !

Fred Cavazza nous présente les lauréats du grand concours des meilleurs services en ligne 2005 du web 2.0. Parmi ceux-ci des "classiques" comme del.icio.us ou flickr.
Netvibes fait aussi partie des lauréats. Il est testé et approuvé par BlogOKat ;-)
Je l'ai adopté comme page de démarrage depuis quelques temps... J'apprécie particulièrement la sélection de photos de flickr qui vient égayer cette page quelque austère : aujourd'hui j'ai découvert les photos de Dave Gorman. Voir celle-ci, celle-là, ou encore celle-ci et puis celle-là !

Posté par BlogOKat à 18:53 - Internet - Commentaires [1] - Rétroliens [0] - Permalien [#]

12 décembre 2005

En savoir plus sur le web 2.0

Web 2.0 : mythe et réalité, tel est le titre d'un article éclairant d'Eric van der Vlist sur ce "sujet à la mode" :
"Le Web 2.0 n'est pas un standard mais plutôt une série de principes d'utilisation de technologies existantes."
Il s'agit d'un "concept flou qui regroupe un certain nombre de tendances et chacun semble en avoir sa propre définition comme on peut le constater devant la foison d'articles décrivant « ce qu'est le Web 2.0 »."
L'auteur de l'article site un long article de Tim O'Reilly qui complète bien son propos : What Is Web 2.0
[Vu sur le blog de Jean-Luc Raymond]

Voir aussi  01.net qui met du Web 1.5 entre le Web 1.0 et le Web 2.0 !

Posté par BlogOKat à 22:22 - Internet - Commentaires [0] - Rétroliens [0] - Permalien [#]

07 décembre 2005

Glossaire de la gestion de l'information

Voici un glossaire proposé par le centre de ressources de la gestion de l'information (CRGI), organisme gouvernemental canadien. Les définitions sont consultables par ordre alphabétique ou thématique. Les thèmes couverts sont les suivants :

  • Accès à l'information
  • Gestion de l'information
  • Accessibilité
  • Gestion des documents administratifs
  • Bibliothèque
  • Gouvernance
  • Classification
  • Infrastructure à clé publique
  • Conservation
  • Langue
  • Courrier électronique
  • Métadonnées
  • Édition
  • Portails
  • Exploration des ressources

Posté par BlogOKat à 22:01 - Dictionnaires, glossaires et lexiques - Commentaires [0] - Rétroliens [0] - Permalien [#]



« Accueil  1  2   Page suivante »