Structure et proximité pour la recherche documentaire

Résumé : Notre étude compare les performances d'un système de recherche d'information basé sur la proximité des occurrences des termes de la requête dans les documents avec un système classique de modèle de langue avec lissage de Dirichlet et le modèle Okapi BM25 . Notre modèle basé sur la proximité calcule en chaque position du document une valeur d'autant plus grande que des occurrences de tous les termes de la requête sont proches de cette position. De plus pour le modèle à proximité nous testons dans le cas de documents structurés l'hypothèse que les termes apparaissant dans les titres doivent être considérés comme proches des positions de toute la section correspondant à ce titre.
Document type :
Conference papers
Complete list of metadatas

https://hal-emse.ccsd.cnrs.fr/emse-00680462
Contributor : Florent Breuil <>
Submitted on : Monday, March 19, 2012 - 3:17:56 PM
Last modification on : Thursday, October 17, 2019 - 12:34:35 PM

Identifiers

  • HAL Id : emse-00680462, version 1

Citation

Michel Beigbeder. Structure et proximité pour la recherche documentaire. CORIA 2009 - Conférence en Recherche d'Information et Applications, 2009, France. pp.373. ⟨emse-00680462⟩

Share

Metrics

Record views

93