Document numérique : Le document, de l'image aux mots RSTI série DN Volume 16 N° 2 - Mines Saint-Étienne
Ouvrages Année : 2013

Document numérique : Le document, de l'image aux mots RSTI série DN Volume 16 N° 2

Résumé

Ce numéro spécial est constitué d’articles issus de la 9e COnférence en Recherche d’Information et Application (CORIA) et du 12e Colloque International Francophone sur l’Écrit et le Document (CIFED). Ces deux manifestations ont été rassemblées dans la troisième édition de la « Semaine du Document Numérique et de la Recherche d’ Informations » (SDNRI) du 21 au 23 mars 2012 à Bordeaux, organisée par le LaBRI (laboratoire bordelais de recherche en informatique). Parmi les 27 articles publiés à CORIA (sur 48 soumis) et les 31 articles publiés à CIFED (sur 54 soumis), cinq papiers ont été finalement sélectionnés en raison de leur qualité et de l’ importance des thématiques concernées.Rappelons ici que les conférences CORIA et CIFED sont les points de rassemblement des communautés francophones respectivement en recherche d’information et en analyse de l’écrit et des documents numérisés. L’édition de la SDNRI de 2012 a permis de montrer qu’il existait une réelle synergie de recherche entre les deux communautés, notamment à travers l’introduction de plus en plus fréquente de modèles de langues mis à l’honneur dans cette édition spéciale de la revue Document numérique. Des travaux portant sur l’élaboration d’outils de recherche d’informations dans les corpus de documents, l’extraction de mots-clés et la reconnaissance de l’écrit portant sur ce thème sont présentés ici.Les articles retenus de CORIA sont dans la tradition de la communauté de la recherche d’information, avec un modèle et sa mise en œuvre expérimentale sur des collections construites par la communauté elle-même, s’agissant ici des collections de CLEF pour leur multilinguisme et de INEX pour la structuration en XML des documents. Les articles retenus de CIFED démontrent la possibilité de nouveaux mécanismes d’extraction de mots sans recherche exhaustive et de reconnaissance de l’écriture exploitant des modèles de langues. Les mises en œuvre expérimentales ont porté sur l’analyse de bases de compétitions ICDAR partagées par la communauté de chercheurs en analyse et reconnaissance de documents.
Fichier non déposé

Dates et versions

emse-00989602 , version 1 (12-05-2014)

Identifiants

  • HAL Id : emse-00989602 , version 1

Citer

Michel Beigbeder, Véronique Eglin (Dir.). Document numérique : Le document, de l'image aux mots RSTI série DN Volume 16 N° 2. Hermes Science, 118 p, 2013, 9782746246270. ⟨emse-00989602⟩
188 Consultations
0 Téléchargements

Partager

More