Editorial : Document Numérique
Abstract
Ce numéro spécial est constitué d'articles issus de la 3e conférence en recherche d'information et application (CORIA) qui s'est déroulée à Lyon du 15 au 17 mars 2006 et du 24e congrès INFORSID qui s'est déroulé à Hammamet (Tunisie) du 31 mai au 3 juin 2006. Parmi les 68 articles publiés à INFORSID (sur 155 soumis) et les 28 articles publiés à CORIA (sur 55 soumis), 6 ont été sélectionnés en raison de leur qualité et de leur thématique : " la recherche d'information dans les documents structurés (web, XML) ". Leurs auteurs ont rédigé une version longue qui a été évaluée en 2007 par un nouveau comité de lecture. Ce numéro met en exergue deux aspects de la recherche d'information : les modèles et la structuration selon XML. La " recherche d'information " se situe du point de vue scientifique au carrefour " de l'ingénierie des documents ", " des bases de données multimédias", " des systèmes d'information ", " des systèmes à base de connaissance ", et " du traitement automatique de la langue naturelle " . Le domaine de recherche auquel elle s'intéresse connaît un essor considérable en partie grâce d'une part, au développement exponentiel des applications du web et des bases de documents (bibliothèques numériques) des organisations humaines (entreprises, associations, administrations, collectivités locales) et, d'autre part, au fait que les systèmes d'information intègrent de plus en plus de données multimédias et semi-structurées. La force des modèles semi-structurés tels que les modèles de la " galaxie XML " est de ne plus imposer de structure a priori dans le schéma d'une base de données, mais de la définir a posteriori dans les données elles-mêmes. Ce type de modèle est particulièrement adapté au stockage des documents structurés et des hyperdocuments. Les articles publiés dans ce numéro constituent un panel représentatif des réponses à apporter aux différentes préoccupations rencontrées lors de toute activité de recherche d'information dans des bases de documents (multimédias, multilingues, multistructurés) interconnectées et réparties.