BlogOKat

Documentation, technologies de l'information, internet, etc...

20 décembre 2004

Les DTD : 3. la DTD TEI

Pour continuer mon énumération des DTD à connaître, je vais m'attarder sur la TEI ou Text Encoding Initiative, issue des travaux de chercheurs de Vassar College (Etats-Unis) en 1987.

Voici d'abord une
définition (extraite du 3ème document de la liste de références ci-dessous) : "La TEI que l'on pourrait traduire par groupe d'initiative pour le balisage normalisé des textes est une norme de balisage, de notation et d'échange de corpus des documents électroniques fondée sur le SGML. Elle s'est élaborée pragmatiquement à partir des besoins de structuration, de conceptualisation et de mise en réseau de textes." 

Plus simplement, la DTD TEI, fondée à l'origine sur le SGML et s'appuyant désormais sur le XML, est un langage de marquage qui permet d'échanger des données textuelles, notamment pour les sciences humaines et les études sur les textes littéraires.
Une version allégée dite TEI Lite contient les définitions des éléments les plus couramment utilisés.
Ses éléments recouvrent toutes les spécificités littéraires, qu'elles concernent le document lui même (paragraphes, strophes, chapitres, notes de bas de page, etc.) ou qu'elles lui soient extérieures (commentaire éditorial, interprétation, analyse, etc.).
Ainsi, tout texte conforme à la TEI comporte :

  • un en-tête TEI balisé comme un élément
  • la transcription du texte lui-même balisé comme un élément

L'en-tête TEI est obligatoire et contient des informations analogues à celles que l'on trouve sur la page de titre d'un texte imprimé. Il fournit donc des métadonnées sur le document balisé telles que la source, les principes retenus pour le balisage, des informations sur l'histoire du texte, en particulier ses révisions et modifications.

Pour des applications de la TEI en France
, voir deux projets (concurrents ?) concernant les thèses électroniques :

  • SPARTE : il s'agit de la chaîne de traitement des thèses électroniques gérée par  l'ABES (Agence Bibliographique de l'Enseignement Supérieur) et le CINES (Centre Informatique de l'Enseignement Supérieur) dont l'objectif est la diffusion et l'archivage des thèses déposées sous forme électronique. SPARTE permet la conversion des thèses du format RTF au format XML TEI Lite ainsi que la gestion des métadonnées et du bordereau de chaque thèse.
  • Cyberdocs : plateforme dédiée au traitement, à la diffusion et à l'archivage des thèses dans le cadre du projet Cyberthèses. Elle permet de structurer des documents issus de traitements de texte et de les publier sur Internet, à l'aide de XML et la DTD TEI Lite.

Références et ressources :

[Edit 06/11/05] Et pour vraiment tout savoir sur TEI, voir la saga de la TEI de Got....

Les épisodes précédents : introduction, EAD. Les épisodes à venir : DocBook, BiblioML, conclusion

Posté par BlogOKat à 09:24 - La saga des DTD - Commentaires [3] - Rétroliens [0] - Permalien [#]

Commentaires

Compléments sur la TEI en France

Merci pour cette présentation de la TEI qui est, malheureusement à mon avis, encore trop peu connu et utilisé en France.
Pourtant, elle n'est pas simplement utilisable pour les thèses au format électronique, mais pour tous types de publication en sciences humaines. Ainsi, l'Ecole des chartes a décidé de l'utiliser pour éditer ces sources historiques en ligne. Vous pouvez voir la première édition en TEI : le Cartulaire blanc de l'abbaye de Saint-Denis (http://elec.enc.sorbonne.fr/cartulaireblanc/), d'autres vont suivre bientôt.
Cette utilisation de la TEI a fait l'objet d'un article dans le médiéviste et l'ordinateur, Réflexions sur l'utilisation de la TEI pour coder les sources diplomatiques : http://lemo.irht.cnrs.fr/43/43-12.htm.

Posté par Got, 21 décembre 2004 à 12:53

Merci pour ces précisions... Je ne connaissais pas ce travail remarquable de l'Ecole des Chartes sur la TEI.
NB : pour accéder aux sites recommandés, ne pas indiquer ), à la fin de la 1ère URL et . à la fin de la seconde !

Posté par BlogOKat, 21 décembre 2004 à 17:21

Application de la TEI aux manuscrits

Un aspects très important de la TEI a été omis dans votre article : Il s'agit de la possibilité d'appliquer la TEI pour la description des manuscrits.
Un manuscrit étant une oeuvre ne présentant en général, qu'une seule copie, sa description permet d'établir un catalogage.
La TEI P5 offre justement les outils nécessaires à ce catalogage.

Posté par Rabah, 16 avril 2008 à 15:39

Poster un commentaire







Rétroliens

URL pour faire un rétrolien vers ce message :
http://www.canalblog.com/cf/fe/tb/?bid=16814&pid=220271

Liens vers des weblogs qui référencent ce message :