Structure et proximité pour la recherche documentaire

Résumé : Notre étude compare les performances d'un système de recherche d'information basé sur la proximité des occurrences des termes de la requête dans les documents avec un système classique de modèle de langue avec lissage de Dirichlet et le modèle Okapi BM25 . Notre modèle basé sur la proximité calcule en chaque position du document une valeur d'autant plus grande que des occurrences de tous les termes de la requête sont proches de cette position. De plus pour le modèle à proximité nous testons dans le cas de documents structurés l'hypothèse que les termes apparaissant dans les titres doivent être considérés comme proches des positions de toute la section correspondant à ce titre.
Type de document :
Communication dans un congrès
CORIA 2009 - Conférence en Recherche d'Information et Applications, 2009, France. pp.373, 2009
Liste complète des métadonnées

https://hal-emse.ccsd.cnrs.fr/emse-00680462
Contributeur : Florent Breuil <>
Soumis le : lundi 19 mars 2012 - 15:17:56
Dernière modification le : mercredi 29 novembre 2017 - 10:06:33

Identifiants

  • HAL Id : emse-00680462, version 1

Citation

Michel Beigbeder. Structure et proximité pour la recherche documentaire. CORIA 2009 - Conférence en Recherche d'Information et Applications, 2009, France. pp.373, 2009. 〈emse-00680462〉

Partager

Métriques

Consultations de la notice

56