L'utilisation des entités nommées pour l'expansion sémantique des requêtes Web

Résumé : Les entités nommées sont des éléments intéressants pour les applications fondées sur le Traitement du Langage Naturel. Dans le cas de la recherche d'information, les entités nommées sont largement employées par les utilisateurs du web dans les requêtes de recherche, soit pour définir un concept de base, soit pour décrire un autre concept dans la requête. Du côté du modèle de recherche, les entités nommées sont des éléments riches en information qui aident à mieux cibler les documents pertinents. Dans cet article, nous étudions l'avantage d'étendre les entités nommées dans la requête. L'idée est d'utiliser une technique d'expansion sémantique sur une ontologie générale (Yago) pour désambiguïser les entités nommées et pour trouver leurs différentes appellations que l'on intègre dans la requête en utilisant 3 approches : sac de mots, dépendance séquentielle, et concept clé. Nous mesurons l'efficacité de ces expériences en termes de précision et rappel, et nous étudions l'effet du rôle des entités nommées sur l'expansion. Nous concluons que l'expansion des entités nommées est une méthode simple qui améliore significativement la qualité de la recherche quand elle est comparée à un modèle de référence sans expansion. De plus, cette méthode est assez compétitive par rapport à l'approche pseudo retour de pertinence souvent utilisée pour l'expansion de la requête.
Document type :
Journal articles
Complete list of metadatas

https://hal-emse.ccsd.cnrs.fr/emse-00949381
Contributor : Florent Breuil <>
Submitted on : Wednesday, February 19, 2014 - 3:43:14 PM
Last modification on : Thursday, October 17, 2019 - 12:36:11 PM

Identifiers

  • HAL Id : emse-00949381, version 1

Citation

Bissan Audeh, Philippe Beaune, Michel Beigbeder. L'utilisation des entités nommées pour l'expansion sémantique des requêtes Web. Revue des Nouvelles Technologies de l'Information, Hermann, 2014, EGC 2014, vol. RNTI-E-26, pp.11-22. ⟨emse-00949381⟩

Share

Metrics

Record views

220