20 décembre 2004
Les DTD : 3. la DTD TEI
Pour continuer mon énumération des DTD à connaître, je vais m'attarder sur la TEI ou Text Encoding Initiative, issue des travaux de chercheurs de Vassar College (Etats-Unis) en 1987.
Voici d'abord une définition (extraite du 3ème document de la liste de références ci-dessous) : "La TEI que l'on pourrait traduire par groupe d'initiative pour le balisage normalisé des textes est une norme de balisage, de notation et d'échange de corpus des documents électroniques
fondée sur le SGML. Elle s'est élaborée pragmatiquement à partir des
besoins de structuration, de conceptualisation et de mise en réseau de
textes."
Plus simplement, la DTD TEI, fondée à l'origine sur le SGML et s'appuyant désormais sur le XML,
est un langage de marquage qui permet d'échanger des données
textuelles, notamment pour les sciences humaines et les études sur les
textes littéraires. Une version allégée dite TEI Lite contient les définitions des éléments les plus couramment utilisés.
Ses éléments recouvrent toutes les spécificités littéraires,
qu'elles concernent le document lui même (paragraphes, strophes,
chapitres, notes de bas de page, etc.) ou qu'elles lui soient
extérieures (commentaire éditorial, interprétation, analyse, etc.).
Ainsi, tout texte conforme à la TEI comporte :
- un en-tête TEI balisé comme un élément
- la transcription du texte lui-même balisé comme un élément
L'en-tête
TEI est obligatoire et contient des informations analogues à celles que
l'on trouve sur la page de titre d'un texte imprimé. Il fournit donc
des métadonnées sur le document balisé telles que la source, les
principes retenus pour le balisage, des informations sur l'histoire du
texte, en particulier ses révisions et modifications.
Pour des applications de la TEI en France, voir deux projets (concurrents ?) concernant les thèses électroniques :
- SPARTE : il s'agit de la chaîne de traitement des thèses électroniques gérée par l'ABES (Agence Bibliographique de l'Enseignement Supérieur) et le CINES (Centre Informatique de l'Enseignement Supérieur) dont l'objectif est la diffusion et l'archivage des thèses déposées sous forme électronique. SPARTE permet la conversion des thèses du format RTF au format XML TEI Lite ainsi que la gestion des métadonnées et du bordereau de chaque thèse.
- Cyberdocs : plateforme dédiée au traitement, à la diffusion et à l'archivage des thèses dans le cadre du projet Cyberthèses. Elle permet de structurer des documents issus de traitements de texte et de les publier sur Internet, à l'aide de XML et la DTD TEI Lite.
Références et ressources :
- Site "officiel" de la TEI
- La TEI simplifiée : une introduction au codage des textes électroniques en vue de leur échange, traduction française d'un texte de Lou Barnard et C.M. SPERBERG-MCQUEEN (1996)
- La Text Encoding Initiative : les moyens pour ajouter de la valeur à un texte numérisé par Guylaine Beaudry (ESBI, 1996)
- TEI - Text encoding initiative par Laurent Romary (CNRS-Loria) et Henri Hudrisier (Université de Paris 8)
- Introduction à la TEI sur Texto !, site consacré à la sémantique des textes (2003)
[Edit 06/11/05] Et pour vraiment tout savoir sur TEI, voir la saga de la TEI de Got....
Les épisodes précédents : introduction, EAD. Les épisodes à venir : DocBook, BiblioML, conclusion
Commentaires
Compléments sur la TEI en France
Merci pour cette présentation de la TEI qui est, malheureusement à mon avis, encore trop peu connu et utilisé en France.
Pourtant, elle n'est pas simplement utilisable pour les thèses au format électronique, mais pour tous types de publication en sciences humaines. Ainsi, l'Ecole des chartes a décidé de l'utiliser pour éditer ces sources historiques en ligne. Vous pouvez voir la première édition en TEI : le Cartulaire blanc de l'abbaye de Saint-Denis (http://elec.enc.sorbonne.fr/cartulaireblanc/), d'autres vont suivre bientôt.
Cette utilisation de la TEI a fait l'objet d'un article dans le médiéviste et l'ordinateur, Réflexions sur l'utilisation de la TEI pour coder les sources diplomatiques : http://lemo.irht.cnrs.fr/43/43-12.htm.
Merci pour ces précisions... Je ne connaissais pas ce travail remarquable de l'Ecole des Chartes sur la TEI.
NB : pour accéder aux sites recommandés, ne pas indiquer ), à la fin de la 1ère URL et . à la fin de la seconde !
Application de la TEI aux manuscrits
Un aspects très important de la TEI a été omis dans votre article : Il s'agit de la possibilité d'appliquer la TEI pour la description des manuscrits.
Un manuscrit étant une oeuvre ne présentant en général, qu'une seule copie, sa description permet d'établir un catalogage.
La TEI P5 offre justement les outils nécessaires à ce catalogage.
Poster un commentaire
Rétroliens
URL pour faire un rétrolien vers ce message :
http://www.canalblog.com/cf/fe/tb/?bid=16814&pid=220271
Liens vers des weblogs qui référencent ce message :
