Skip to content

Données OCR dans le cadre d'un projet de recherche sur M. Malingre

Notifications You must be signed in to change notification settings

SETAFDH/HTR-Varia-Malingre-romain

Repository files navigation

HTR-Varia-Malingre

characters badge regions badge lines badge files badge

Ce dépôt comprend les données OCR (en caractères romains) de textes littéraires qui ont des liens avec l'œuvre du poète réformé M. Malingre (c.1500-1572).

La liste des textes avec plus de détails se trouve dans le tableau CSV du dépôt.

Les ouvrages attribués à M. Malingre, imprimés par Pierre de Vingle et Jean Michel, se trouvent dans les dépots HTR-SETAF-Pierre-de-Vingle et HTR-SETAF-Jean-Michel.

Financeur

Ce projet est financé par le Fonds national suisse (FNS) dans le cadre du projet SETAF.

Licence

Les transcriptions sont CC-BY, et les images suivent les règles de différentes bibliothèques numériques : e-rara, ONB, Gallica, BSB.

Données

Les données se trouvent au chemin ‘./data//.xml‘ et sont au format ALTO. Elles suivent les normes de segmentation de SegmOnto et sont cataloguées sur HTR-United. Les fichiers sont corrigés manuellement : la qualité de la segmentation des pages et de la transcription produite par l'OCR est indiqué dans le tableau CSV du dépôt ("gold" ou "en cours").

Le contrôle de la transcription produite par l'OCR se base sur un guide redigé par l'équipe du projet : Solfrini et al., Guide de transcription pour les imprimés français du XVIe siècle en caractères gothiques, Version A, 2023, https://hal.science/hal-04281804.

Infrastructure

Les données pour l'OCR sont produites à l'aide de l’instance genevoise FoNDUE d'eScriptorium.

Les calculs sont effectués à l'Université de Genève en utilisant le service HPC.

Citer le dépôt

  • Version 1.0: Sonia Solfrini, Données OCR (en caractères romains) et segmentation de textes littéraires qui ont des liens avec l'œuvre de M. Malingre, version 1.0, Genève, université de Genève, 2023, https://github.com/SETAFDH/HTR-Varia-Malingre-romain.
@misc{solfrini_ocr_varia_malingre_gothique_2023,
  author={Solfrini, Sonia},
  title={Données OCR (en caractères romains) et segmentation de textes littéraires qui ont des liens avec l'œuvre de M. Malingre},
  version={1.0},
  address={Genève},
  publisher={université de Genève},
  year={2023},
  url={https://github.com/SETAFDH/HTR-Varia-Malingre-romain},
}

About

Données OCR dans le cadre d'un projet de recherche sur M. Malingre

Resources

Stars

Watchers

Forks

Packages

No packages published