Méthodes pour la sélection de collections dans un environnement distribué

Résumé : Nous explorons dans cet article trois approches de sélection de collections dans un environnement de recherche d'informations distribuée. Le processus de recherche se fait par l'intermédiaire d'un courtier qui pour une requête donnée sélectionne les collections à interroger et fusionne les résultats qu'elles retournent. Notre première approche de sélection consiste à classer les collections selon leur pertinence à la requête posée, les n premières collections sont alors interrogées. La seconde approche sélectionne les collections dont le score dépasse un certain seuil. Enfin, la troisième approche définit le nombre de documents à rechercher dans chaque collection. L'originalité de notre démarche est qu'elle utilise des données récoltées au moment de l'interrogation et ne repose pas sur des méta-données sauvegardées a priori au niveau du courtier comme c'est le cas de la plupart des méthodes connues dans la littérature. Afin d'évaluer nos approches et les comparer aux autres techniques notamment l'approche centralisée (à index unique) et CORI [CALL95] [XU98], nous avons conduit des expérimentations sur la collection de test WT10g, et les gains sont appréciables
Type de document :
Communication dans un congrès
CIDE 2002, 5e Colloque International sur le Document Électronique, Oct 2002, Hammamet, Tunisie. 12p., 2002
Liste complète des métadonnées

https://hal-emse.ccsd.cnrs.fr/emse-00948068
Contributeur : Florent Breuil <>
Soumis le : lundi 17 février 2014 - 16:44:22
Dernière modification le : mardi 22 mars 2016 - 01:16:46

Identifiants

  • HAL Id : emse-00948068, version 1

Citation

Faïza Abbaci, Jacques Savoy, Michel Beigbeder. Méthodes pour la sélection de collections dans un environnement distribué. CIDE 2002, 5e Colloque International sur le Document Électronique, Oct 2002, Hammamet, Tunisie. 12p., 2002. 〈emse-00948068〉

Partager

Métriques

Consultations de la notice

72