Recherche d'information dans des documents structurés par proximité des termes

Michel Beigbeder

Communication Dans Un Congrès Année : 2008

Recherche d'information dans des documents structurés par proximité des termes

(1)

Michel Beigbeder

Fonction : Auteur
PersonId : 840581

Centre de Génie Industriel et Informatique

Résumé

Nous présentons une méthode pour calculer un score d'un élément quelconque d'un document structuré qui prend en compte la proximité des termes de la requête dans le texte du document. Plus précisément nous définissons autour de chaque occurrence d'un terme de la requête une fonction d'influence. Pour une occurrence qui apparaît dans le texte proprement dit, cette fonction d'influence décroit linéairement de 1 à 0 selon la distance à l'occurrence. Lorsqu'un terme de la requête apparaît dans le titre d'une (sous-)section d'un document structuré, son influence est uniformément 1 du début à la fin de la (sous-)section. Nous utilisons des requêtes booléennes et les fonctions d'influence sont combinées à chaque noeud ET et OU de l'arbre de la requête selon le modèle de la logique floue. Le score d'une partie quelconque de document est la normalisation de la somme de la fonction d'influence résultante à la racine de l'arbre de la requête sur l'intervalle associé à cette partie. Nous présentons et commentons les résultats obtenus dans le cadre de la tâche ad'hoc de la campagne INEX 2006.

Domaines

Recherche d'information [cs.IR]

Florent Breuil : Connectez-vous pour contacter le contributeur

https://hal-emse.ccsd.cnrs.fr/emse-00680488

Soumis le : lundi 19 mars 2012-15:39:49

Dernière modification le : mardi 17 septembre 2024-15:46:10

Dates et versions

emse-00680488 , version 1 (19-03-2012)

Identifiants

HAL Id : emse-00680488 , version 1

Citer

Michel Beigbeder. Recherche d'information dans des documents structurés par proximité des termes. CORIA 2008, 5th French Information Retrieval Conference, Mar 2008, Trégastel, France. p 165-180. ⟨emse-00680488⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

EMSE RIM-ENSMSE UR-LSTI-ENSMSE ISCODE-ENSMSE FAYOL-ENSMSE ISCOD-ENSMSE INSTITUT-MINES-TELECOM

70 Consultations

0 Téléchargements

Recherche d'information dans des documents structurés par proximité des termes

Résumé

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager