Mixture of segmentation for heterogeneous functional data
Mélange de segmentation pour les données fonctionnelles hétérogènes
Résumé
In this paper, we consider functional data with heterogeneity in time and population. We propose a mixture model with segmentation of time to represent this heterogeneity while keeping the functional structure. The maximum likelihood estimator is considered and proved to be identifiable and consistent. In practice, an EM algorithm is used, combined with dynamic programming for the maximization step, to approximate the maximum likelihood estimator. The method is illustrated on a simulated dataset and used on a real dataset of electricity consumption.
Dans cet article, nous considérons des données fonctionnelles avec une hétérogénéité dans le temps et dans la population. Nous proposons un modèle de mélange avec segmentation du temps pour représenter cette hétérogénéité tout en conservant la structure fonctionnelle. Il est prouvé que le modèle est identifiable et que l'estimateur du maximum de vraisemblance est consistant. En pratique, un algorithme EM est utilisé, combiné à la programmation dynamique pour l'étape de maximisation, afin d'approximer l'estimateur du maximum de vraisemblance. La méthode est illustrée sur un ensemble de données simulées et utilisée sur un ensemble de données réelles de consommation d'électricité.
Domaines
Machine Learning [stat.ML]Origine | Fichiers éditeurs autorisés sur une archive ouverte |
---|