Un petit mot pour dire qu’il ne faut pas confondre pronostic sous traitement et réponse au traitement. La réponse à un traitement, c’est la différence d’évolution entre un sujet qui aurait le traitement et le même sujet qui ne l’aurait pas. Généralement, on peut évaluer la réponse moyenne à un traitement par un essai clinique randomisé en groupes parallèles. La réponse individuelle est bien plus difficile à évaluer, voire impossible, car il n’est pas forcément possible de savoir qu’elle aurait été l’évolution si le patient n’avait pas reçu la prise en charge qu’il eût.
Ce qu’il faut faire
L’identification d’un facteur de réponse au traitement nécessite schématiquement quatre groupes:
- un groupe exposé au facteur et prenant le traitement
- un groupe exposé au facteur et ne prenant pas le traitement
- un groupe non exposé au facteur et prenant le traitement
- un groupe non exposé au facteur et ne prenant pas le traitement
(pour un facteur quantitatif, on peut distinguer différents niveaux d’exposition, mais l’idée reste la même, il doit y avoir une variance de ce facteur d’exposition dans un groupe traité comme dans un groupe non traité)
La différence moyenne entre (1) et (2) représente la réponse moyenne des exposés alors que la différence moyenne entre (3) et (4) représente la réponse moyenne des non exposés. La différence des différences (interaction) représente la différence de réponses et si elle est statistiquement significativement différente de zéro (ou d’un seuil de significativité clinique) conduit à la conclusion que l’exposition considérée est un facteur de réponse au traitement.
Ces analyses de facteur de réponse au traitement correspondent aux fameuses analyses en sous-groupes que l’on retrouve dans bon nombre d’essais cliniques randomisés.
Ce qu’il ne faut pas faire
Malheureusement la majorité des soi-disant recherche de facteurs de réponse à un traitement qu’il m’ait été donné de voir ne contenaient que deux groupes: les patients traités et exposés au facteur et les patients traités et non exposés au facteur. Cela permet seulement de trouver des facteurs pronostics sous traitement, c’est-à-dire des facteurs prédictifs d’une évolution favorable ou défavorable, et ce, sur une population de patients tous traités.
Comme exemple frappant, je suggère de considérer l’analyse de soi-disant facteurs de réponse à l’homéopathie sur le cancer de la prostate. Le critère de jugement principal serait la survie globale de patients. On constaterait alors que les patients peu symptomatiques, dont le stade tumoral est précoce (notamment sans métastases) et de bas grade Gleason sont les meilleurs répondeurs à l’homéopathie.
Régression vers la moyenne
Pourquoi confond-on la réponse au traitement et le pronostic sous traitement ? Pourquoi toute évolution clinique n’est-elle pas totalement attribuable au traitement ?
Certaines maladies ont une évolution spontanée tendant vers une évolution inexorablement défavorable; cela comprend notamment la plupart des maladies neurodégénératives telles que les maladies démentielles, la maladie de Parkinson, la sclérose latérale amyotrophique. Même si cette évolution défavorable ne concerne pas forcément 100% des patients, on peut dire que l’état clinique moyen se dégrade.
D’autres maladies ont une évolution moyenne plus stable, comme l’asthme chronique. Néanmoins, il est très rare que la stabilité individuelle soit parfaite. Il existera presque toujours des fluctuations intra-sujet, c’est-à-dire, des jours, semaines ou mois plus symptomatiques que d’autres. Le phénomène de régression vers la moyenne s’applique alors à ces sujets. En moyenne un sujet sélectionné sur un état clinique moins bon que la moyenne, tendra à en voir une amélioration dans les jours, semaines ou mois avenir. Or, l’initiation des traitements est rarement faite au moment où le sujet va le mieux; au contraire, ce sera lors d’un état clinique médiocre ou d’une dégradation de l’état habituel. Parfois cela est même formalisé explicitement dans les critères d’inclusions, sous forme d’un seuil sur un score ! Par simple régression vers la moyenne, l’état clinique du sujet tendra à s’améliorer quel que soit le traitement donné; c’est une des principales raisons justifiant la perception d’efficacité de l’homéopathie. Il s’agit alors de l’évolution spontanée de la maladie.
Si on analyse la différence entre deux mesures répétées d’un score des symptômes, à baseline et un certain temps après (p.e. 3 mois), alors il s’agit de la somme de deux composantes:
- L’évolution spontanée
- La réponse au traitement
Malheureusement, c’est souvent interprété comme la réponse au traitement.
Il apparaît alors que les patients dont l’état est le pire vont le mieux s’améliorer, ce qui pourra être, à tort, considéré comme une meilleure réponse au traitement.
Si on a en conscience cela, il faut savoir qu’on peut avoir une réponse au traitement quand bien même l’état clinique du patient est stable, comme pour la sclérose latérale amyotrophique pour laquelle l’évolution naturelle est très défavorable et une stabilisation prolongée déjà acceptable pour un traitement. Et bien sûr, il peut y avoir une évolution spontanée favorable sans la moindre réponse au traitement. Un traitement homéopathique d’une angine tendra à une résolution totale des symptômes en généralement quelques jours, ainsi que l’absence totale de traitement. La réponse doit être évaluée par la différence entre les des deux effets.
C’est peut-être pour cette confusion entre réponse au traitement et pronostic sous traitement que l’homéopathie est aussi populaire en France.
Pour aller plus loin
Comme mentionné au début, un facteur de réponse au traitement est un facteur ayant une interaction statistique avec l’effet du traitement, c’est-à-dire, la différence entre un groupe traité et un groupe non traité. La notion d’interaction est assez simple lorsque les états cliniques sans traitement sont identiques chez les exposés et les non exposés au facteur. Par contre, si ces états diffèrent, l’interaction statistique dépend alors du modèle employé, pouvant conduire à des conclusions opposées.
Considérons, par exemple, que l’on s’intéresse à un critère de jugement binaire, tel que « mortalité à 1 an ».
Non traités | Traités | |
Non exposés | 30% | 10% |
Exposés | 60% | 30% |
Pour une différence absolue de mortalité, on peut dire que les non exposés ont une meilleure réponse au traitement (-30% de décès) que les non exposés (-20%). Pour un risque relatif de décès, au contraire, les non exposés ont une réponse moindre (RR = 0.50) aux exposés (RR = 0.33). Pour un odds ratio de risque de décès, c’est à nouveau les non exposés qui ont une meilleure réponse (0.26 vs 0.29). La réponse pourrait encore différer si l’on s’intéressait aux rapport des chances de survie plutôt que des risques de décès. Bien sûr, les hazard ratio conduisent encore à des conclusions différentes.
Est-ce vraiment si important que ça ? De toute façon, les deux groupes, exposés et non exposés, bénéficient chacun du traitement et ces deux groupes ne sont pas comparables de toute façon. Au final, à quoi sert-il de comparer leur réponse ? Il pourrait finalement être plus sage de juste comparer leur pronostic sous traitement ou de ne rien comparer du tout.
Là où il est crucial d’identifier des facteurs de réponse au traitement, c’est lorsque certains sous-groupes ne répondent pas du tout, voire pire, ont une réponse négative au traitement (interaction qualitative). Dans ces situations, la statistique d’analyse de l’effet du traitement n’importe pas, puisque toutes tendront à la même conclusion.
On peut aussi s’interroger sur la pratique consistant à tenter de prouver l’homogénéité de l’effet d’un traitement dans divers sous-groupes en formulant une hypothèse nulle d’absence d’interaction, puis en acceptant cette hypothèse après réalisation d’un test statistique sous-puissant. Comme précédemment décrit, les interactions quantitatives, consistant à des effets plus ou moins forts du traitement selon les sous-groupes, sont bien moins préoccupantes que les interactions qualitatives; mieux vaudrait juste prouver l’existence d’un effet positif du traitement dans chacun des sous-groupes plutôt que de comparer les effets entre eux ; mais cette méthode mettrait en évidence l’incapacité à conclure sur certains sous-groupes en situation de sous-puissance statistique plutôt que de fournir une confortable acceptation de l’hypothèse nulle en situtation de sous-puissance majorée.
Sur ce, je vous laisse méditer…