Penalised flexible modelling of recurrent events. Development of a marginal intensity model with application to adverse events associated with cancer immunotherapy
Modélisation flexible pénalisée d’évènements récurrents. Développement d’un modèle d’intensité marginale avec application aux effets indésirables associés à l’immunothérapie anti-cancéreuse
Résumé
The mechanisms associated with adverse events under immunotherapy and the identification of risk profiles in patients are currently the subject of numerous studies. However, toxicity data associated with treatment are often highly complex and present many challenges both in terms of data collection and in terms of methodological approaches. The objective of this thesis is to explore statistical methods for comparing toxicity profiles associated with treatment. Due to the multidimensionality of these data (e.g., temporality, recurrence, severity), evaluating treatment toxicity can involve numerous absolute indicators (e.g., probabilities, hazards) and relative indicators (e.g., odds ratios, hazard ratios). A preliminary review of the indicators associated with regression models proposed in the literature highlighted methodological aspects that are frequently overlooked in risk assessment, particularly regarding the representation of absolute risk over time. In response to this observation, two models were explored during this research. The first model is a penalized flexible hazard model focusing on the occurrence of a single event (e.g. first event, maximum grade). The value of this model lies in its ability to flexibly describe the dynamics of the hazard according to time using splines while also accounting for non-linear and non-proportional effects of covariates. However, the use of splines may lead to overfitting issues. Adding a penalty to the likelihood, with a smoothing objective, helps mitigate this issue. The so-called penalized hazard model was explored through simulation, taking into account the specificities of adverse events data: modest sample sizes, competing risks, non-proportionality, and dynamics different from those encountered with death as the event of interest. The model was also applied to observational data from patients treated with immunotherapy within the European Qualitop project. The second model also describes the dynamics of event occurrence using splines while accounting for the possibility of event recurrence. The indicator used is the marginal intensity (MI), which provides a synthetic description of a recurrent process within a population. Two approaches were proposed in this thesis for modelling the indicator with splines. The first, called direct, follows the framework of the semi-parametric MI model based on estimating equations, which does not require strict assumptions about the correlation of events within the same subject. The second, called indirect, estimates the MI from a Poisson process intensity-based model with a random effect. The performances of these two approaches are compared through an original simulation study based on multi-state processes. Both approaches were then extended to the penalized smoothing framework in order to limit overfitting.
Les mécanismes associés aux effets indésirables sous immunothérapie et l’identification de profils à risque chez les patients font à ce jour l’objet de nombreuses études. Cependant, les données de toxicités associées à un traitement sont souvent d’une grande complexité et posent de nombreux défis aussi bien en termes de recueil que d’un point de vue méthodologique. L’objectif de cette thèse est d’explorer des approches statistiques permettant de comparer des profils de toxicité associés à un traitement. Du fait de la multi-dimensionnalité de ces données (e.g. temporalité, récurrence, sévérité), évaluer la toxicité d’un traitement peut se faire à travers de nombreux indicateurs donnant soit une mesure absolue du risque de toxicité étudié (e.g. probabilités, taux), soit une mesure relative (e.g. odds ratios, hazard ratios). Une première revue des indicateurs liés aux modèles de régression proposés dans la littérature a mis en lumière des aspects méthodologiques fréquemment négligés dans l’évaluation du risque, en particulier en ce qui concerne la représentation du risque absolu au cours du temps. En réponse à cette observation, deux modèles ont ensuite été explorés au cours de ces travaux. Le premier modèle est un modèle flexible pénalisé du taux de survenue d’un unique évènement de toxicité (e.g. première apparition, grade maximum). L'intérêt de ce modèle réside dans sa capacité à décrire de manière flexible la dynamique du taux au cours du temps en utilisant des splines, tout en intégrant les effets non linéaires et non proportionnels des covariables. L’utilisation de splines s’accompagne toutefois de problématiques de sur-ajustement potentiel. Introduire une pénalisation de la vraisemblance, avec un objectif de lissage, permet de réduire ce phénomène. Le modèle de taux pénalisé a été exploré par simulation en tenant compte des spécificités du contexte des données de toxicité : échantillons de taille modeste, risques compétitifs, non-proportionnalité, dynamique différente de celle rencontrée pour la survenue du décès. L’application du modèle sur des données observationnelles de patients traités par immunothérapie dans le cadre du projet Européen Qualitop a également été réalisée. Le second modèle offre une description de la dynamique de survenue des événements basée sur des splines, tout en prenant en compte la possibilité d'une récurrence de ces événements. L'indicateur utilisé est l'intensité marginale (IM), qui présente l'avantage de décrire un processus récurrent au sein d'une population de manière synthétique. Deux approches ont été proposées dans cette thèse pour modéliser l’indicateur avec des splines. La première, dite directe, reprend le cadre du modèle d’IM semi-paramétrique basé sur des équations d’estimation, qui ne nécessite pas d'hypothèses strictes sur la corrélation des événements chez un même sujet. La seconde, dite indirecte, estime l’IM à partir d’un modèle d’intensité basé sur le processus de Poisson avec effet aléatoire. Les performances des deux approches sont comparées par une étude de simulation originale, basée sur des processus de type multi-états. Les deux approches ont ensuite été étendues au cadre pénalisé, avec objectif de lissage, afin de limiter le sur-ajustement.
Origine | Version validée par le jury (STAR) |
---|