Construction et utilisation de contextes autour des nœuds d'un hypertexte pour la recherche d'information
Abstract
Nous faisons l'hypothèse que la mise sous forme hypertexte d'un document atomise l'information dans le sens où les noeuds de l'hypertexte qui sont créés ne sont pas auto-suffisants pour pouvoir être appréhendés. Sous cette hypothèse, le contenu seul du noeud n'est pas suffisant pour l'indexer dans un but de l'insérer dans un système de recherche d'information. Nous avons implémenté et testé une méthode de construction de contextes autour des noeuds d'un hypertexte en utilisant une méthode de classification automatique. Cette dernière est basée sur une mesure de similarité entre les noeuds prenant en compte à la fois les aspects structurels de l'hypertexte, à savoir les liens entre les noeuds, et le contenu textuel des noeuds. Notre système de recherche d'information indexe à la fois les noeuds et leurs contextes. Le modèle de requête que nous utilisons est à deux niveaux : niveau sujet et niveau contexte.
Domains
Modeling and SimulationOrigin | Files produced by the author(s) |
---|