Ce dépôt est en cours de construction.
Ce dépôt comprend les données TEI produites dans le cadre du projet SETAF.
Description :
- La liste des textes avec plus de détails se trouve dans le tableau CSV du dépôt.
- Le dossier "schema" contient l'ODD du projet sous différents formats (.odd, .html, .rng).
- Le dossier "data" contient les textes au format XML-TEI et HTML.
Description des fichiers XML-TEI :
- Chaque fichier .xml se compose de trois grandes parties : teiHeader, sourceDoc et body. Le teiHeader, l'en-tête du fichier, contient les métadonnées de l'ouvrage et les informations indispensables à l'identification du fichier. La section sourceDoc comprend toutes les informations qui étaient contenues dans les fichiers ALTO d'origine. Dans le body, le corps du texte, nous proposons une balise choice qui comprend trois couches : les lignes océrisées et extraites à partir du sourceDoc, dans la balise orig, et les mêmes lignes normalisées dans les balises reg type="intermediary" et reg type="advanced".
Description des fichiers HTML :
- Chaque fichier .html orig présente, de façon plus lisible, les lignes de texte tirées des balises orig (original form).
- Chaque fichier .html reg_int présente, de façon plus lisible, les lignes de texte tirées des balises reg type="intermediary". Il s'agit de la régularisation intermédiaire du texte source produite grâce à un guide de normalisation en cours de préparation.
- Chaque fichier .html reg_adv présente, de façon plus lisible, les lignes de texte tirées des balises reg type="advanced". Il s'agit de la régularisation avancée du texte source produite grâce à un guide de normalisation en cours de préparation. Cette étape ne concerne que certains textes.
Chaque version .html orig, reg_int ou reg_adv, est ajoutée quand le travail sur les lignes de texte tirées des balises correspodantes, dans le fichier XML-TEI, est terminé (qualité gold).
Pour comprendre l'état d'avancement des textes (qualité gold, en cours ou à venir), il suffit de consulter le tableau CSV du dépôt et/ou le teiHeader des fichiers XML-TEI.
GitHub du projet : https://github.com/SETAFDH
Site du projet : https://www.unige.ch/setaf
Ce projet est financé par le Fonds national suisse (FNS). Numéro de projet : 205056.
Les transcriptions sont CC-BY, et les images suivent les règles de différentes bibliothèques numériques : e-rara, ONB, Gallica, BSB.
- Version
0.9
: Sonia Solfrini, Geneviève Gross, Pierre-Olivier Beaulnes, Aurélia Marques Oliveira, Simon Gabay et Daniela Solfaroli Camillocci, Données TEI du projet SETAF, version0.9
, Genève, université de Genève, 2023, https://github.com/SETAFDH/TEI-SETAF.
@misc{solfrini_tei_setaf_2023,
author={Solfrini, Sonia and Gross, Geneviève and Beaulnes, Pierre-Olivier and Marques Oliveira, Aurélia, and Gabay, Simon and Solfaroli Camillocci, Daniela},
title={Données TEI du projet SETAF},
version={0.9},
address={Genève},
publisher={université de Genève},
year={2023},
url={https://github.com/SETAFDH/TEI-SETAF},
}