19 mars 2006
Protocole OAI : principes techniques
Après une introduction et quelques mots sur les acteurs mettant en oeuvre le protocole OAI, j'en viens à son fonctionnement.
Tout d'abord, le protocole OAI concerne 3 types d'objets documentaires :
- Les ressources (resource), objets physiques ou numériques faisant l'objet d'une description. Par exemple un livre imprimé ou numérique, une image, etc.
- Les item qui sont des ensembles de données descriptives, structurées et numériques, c'est à dire des notices descriptives concernant les ressources. Chaque item doit avoir un identifiant unique respectant les recommandant de l'Open Archive Initiative. Les items peuvent être regroupés en ensembles (set) selon certains critères (types de support, thèmes, etc...).
- L'enregistrement (record) est un ensemble de métadonnées extraites d'un item au format XML. Ce sont les enregistrements qui font l'objet des échanges entre moissonneurs et entrepôts OAI.
Les enregistrements sont échangés d'une manière très simple : le moissonneur soumet des requêtes OAI à l'entrepôt via le protocole http. Les requêtes (verbs) sont constituées par un vocabulaire restreint décrit dans la spécification du protocole OAI. Elles sont au nombre de 6 et permettent (source) :
- "de vérifier si le service désigné est un répertoire OAI (Identify),
- de demander la liste des formats de métadonnées que l’entrepôt est capable de fournir (ListMetadataformats),
- d’obtenir, le cas échéant, la liste des ensembles (par exemple thématiques) formés par le fournisseur de données (ListSets),
- d’obtenir la liste des identifiants et des dates de dernière modification des items disponibles dans la base (ListIdentifiers),
- de collecter l’information d’un item spécifique (GetRecord),
- de récupérer en bloc l’ensemble des items d’un répertoire (ListRecords)."
Les requêtes sont donc de simples URL qui permettant d'accéder aux entrepôts via le protocole http. Elles peuvent être affinées grâce à des paramètres.
Quelques exemples de requêtes :
- l'URL http://archivesic.ccsd.cnrs.fr/oai/oai.php?verb=Identify permet d'obtenir des informations sur l'entrepôt OAI d'@rchiveSIC
- l'URL http://www.numdam.org/oai?verb=ListSets permet d'obtenir la liste des revues numérisées présentes dans l'entrepôt de NUMDAM.
- la base des articles de l'IRCAM est aussi un entrepôt OAI et sur cette page 4 requêtes (Identify, ListMetadataFormats, ListIdentifiers, List Records) sont disponibles.
Ci-dessous, une illustration en provenance de OAForum :
La suite prochainement...
Commentaires
Poster un commentaire
Rétroliens
URL pour faire un rétrolien vers ce message :
http://www.canalblog.com/cf/fe/tb/?bid=16814&pid=1547442
Liens vers des weblogs qui référencent ce message :

