Une méthode automatique non supervisée pour évaluer le score de sévérité de la parole chez les patients traités pour un cancer ORL - Structuration, Analyse et Modélisation de documents Vidéo et Audio Accéder directement au contenu
Poster De Conférence Année : 2021

Une méthode automatique non supervisée pour évaluer le score de sévérité de la parole chez les patients traités pour un cancer ORL

Résumé

Entre 2007 et 2016, le nombre de cancers de la cavité buccale et du pharynx combinés a augmenté, avec une incidence de 3 % aux États-Unis chaque année [1]. De nombreuses autres pathologies peuvent entraîner des troubles de la parole en influant sur les mécanismes de production de la parole [2]. Cela peut réduire la qualité de vie des patients affectés [3]. Pour quantifier l'impact de ces pathologies sur la production de la parole, il est courant d'utiliser des scores qui reflètent l'intelligibilité de la production et l'indice de sévérité de la parole. Ils mesurent l'impact des pathologies. Ainsi, ces scores ne mesurent pas la qualité du signal audio, mais la capacité des patients à produire des sons intelligibles. Les experts obtiennent ces scores en écoutant leurs patients. La familiarité avec les patients et l'habitude d'entendre la voix pathologique peuvent influencer ce score [4]. Afin d'augmenter la stabilité de la mesure, celle-ci peut être traitée par un groupe d'experts [5]. Néanmoins, le fait de demander à un groupe d'obtenir un score objectif complique le suivi des patients. L'utilisation d'un outil automatique, calculé par un ordinateur sur un échantillon de discours enregistré, pourrait fournir un moyen objectif et libérer du temps pour les experts. Dans notre étude, nous proposons une nouvelle méthode non supervisée utilisant un modèle appris sur la parole standard en Anglais. Nous proposons un formalisme basé sur des caractéristiques de la parole qui produisent un score de sévérité. Cette méthode, utilisant l’encodeur PASE+[6], s’inspire du modèle Inception [7] (modèle de réseau de neurones profonds, généralement utilisé en vision par ordinateur pour évaluer la qualité des images générées où les locuteurs sont ici considérés comme des générateurs). Cette approche, bien que fondée sur un modèle en Anglais, nous donne d’excellents résultats sur les données en Français de lecture du corpus de voix pathologiques C2SI [8]. En effet, une corrélation de Spearman de 0,87 est obtenue par rapport à l'indice de sévérité, réalisé manuellement par un groupe d'experts cliniques (voir figure 1). Notons que la mesure de sévérité est très corrélée (> 0,91) avec la mesure d’intelligibilité [9]. Nous arrivons à des résultats comparables avec ceux obtenus par des méthodes qui ont réalisé un apprentissage sur les données du corpus [10,11]. La corrélation élevée et le fait que cette méthode ne nécessite aucun apprentissage sur des enregistrements de voix pathologiques, nous permettent d'envisager des applications cliniques intéressantes.
Fichier principal
Vignette du fichier
AFCP-JPC2021_Roger.pdf (216.14 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-03269228 , version 1 (23-06-2021)

Identifiants

  • HAL Id : hal-03269228 , version 1

Citer

Vincent Roger, Jérôme Farinas, Virginie Woisard, Julien Pinquier. Une méthode automatique non supervisée pour évaluer le score de sévérité de la parole chez les patients traités pour un cancer ORL. Séminaire AFCP 2021 – Phonétique Clinique, May 2021, Toulouse (virtuel), France. , 2021. ⟨hal-03269228⟩
118 Consultations
12 Téléchargements

Partager

Gmail Facebook X LinkedIn More