6533b7d9fe1ef96bd126d3fe

RESEARCH PRODUCT

Une approche structurelle pour la reconnaissance de notices bibliographiques

Y. ChenevoyAbdel Belaïd

subject

[ INFO.INFO-DL ] Computer Science [cs]/Digital Libraries [cs.DL]NoticeDocument structureBibliographySGMLFormat UNIMARCTechnical instructionsUNIMARC formatReconnaissance formePattern recognitionDocument analysis[INFO.INFO-DL]Computer Science [cs]/Digital Libraries [cs.DL]Analyse documentaire[INFO.INFO-DL] Computer Science [cs]/Digital Libraries [cs.DL]Structure documentBibliographie

description

National audience; Cet article présente un système de reconnaissance de la structure logique de notices bibliographiques en vue de la conversion rétrospective de catalogues de bibliothèques. Le système est guidé par un modèle de structures de la classe des notices, construit sur la base de spécifications détaillées par la bibliothèque. Le modèle fait intervenir aussi bien des connaissances sur la macro-structure des notices que sur la micro-structure de leur contenu. La reconnaissance de la structure d'une notice consiste à retrouver, à partir d'un flux OCR (Optical Character Recognition), sa structure logique spécifique, conformément aux descriptions du modèle. Le résultat est un flux structuré hiérarchiquement, présentant dans le format UNIMARC, les différents champs de la notice, accompagnés de leur score de confiance. Ce travail a été réalisé dans le cadre du projet européen LIB-MORE associant la société JOUVE et la Bibliothèque Royale de Belgique.

https://hal.inria.fr/inria-00534043