Exploitation de syntagmes dans la découverte de thèmes

Résumé : Le but de cet article est d'étudier l'apport des syntagmes nominaux, verbaux et ad- jectivaux pour la découverte de thèmes ( topic modeling). Nous testons l'hypothèse qu'ajouter des syntagmes à la représentation des documents-- pour lesquels ne sont traditionnellement considérés que les mots simples-- permettrait d'améliorer la qualité d'un modèle de thèmes, en l'occurrence LDA. Des différences significatives sont attendues notamment lorsque plusieurs thèmes partagent le même vocabulaire. Nous présentons des résultats sur un corpus catégorisé de 20 000 résumés d'articles scientifiques. Il s'agit d'une étude de cas qu'il conviendrait de reproduire sur un corpus plus conséquent.
Complete list of metadatas

https://hal-emse.ccsd.cnrs.fr/emse-02124465
Contributor : Florent Breuil <>
Submitted on : Thursday, May 9, 2019 - 3:43:52 PM
Last modification on : Tuesday, November 19, 2019 - 2:37:28 AM

Identifiers

Citation

Amaury Delamaire, Michel Beigbeder, Mihaela Juganaru-Mathieu. Exploitation de syntagmes dans la découverte de thèmes. COnférence en Recherche d'Informations et Applications - CORIA 2019, May 2019, Lyon, France. pp.1-14, ⟨10.24348/coria.2019.RJCRI_2019_paper_14⟩. ⟨emse-02124465⟩

Share

Metrics

Record views

33