Imaginez que vous vous intéressiez à comparer des techniques médicales ou chirurgicales pour lesquels il existe à la fois une grande variance de pratique inter-centre mais aussi une variance de pratique intra-centre. Que faire de l’effet centre ? Faut-il ajuster dessus ?
Il existe deux approches orthogonales, toutes deux soumises à des biais bien différents.
- La comparaison intra-centre, obtenue par analyse de la corrélation individuelle entre l’exposition (traitement) et l’outcome avec un ajustement sur l’effet centre
- La comparaison inter-centre, écologique, par analyse de la corrélation de l’exposition moyenne du centre avec l’outcome moyen du centre. On considère alors qu’il n’y a qu’une seule observation par centre, tous les patients de chaque centre étant aggrégés.
La première approche, est soumise à un possible biais d’indication, qui est parfois majeur, le traitement n’étant pas donné au hasard mais pouvant dépendre très fortement des caractéristiques du patient et de son pronostic. La deuxième approche ne souffre pas du biais d’indication car tous les patients d’un même centre sont assignés à la même valeur synthétique (taux moyen d’exposition) peu importe leurs caractéristiques. Cependant, elle souffre de problèmes de confusion au niveau des centres. Par exemple, on peut craindre que les centres publics de grande taille accueillent une population plus fragile, présentant un plus grand nombre de comorbidités, et aient aussi une attitude thérapeutique différente. Ces facteurs de confusion sont totalement anéantis par les comparaisons intra-centres (première approche). Dans la deuxième approche, il reste possible de procéder à des ajustements sur les caractéristiques du centre (public/privé, nombre de lits, etc.) ainsi que sur les caractéristiques aggrégées des patients (niveau de comorbidité moyen des patients). Cependant, seuls les facteurs de confusion observables et mesurés sans erreur de mesure majeure sont contrôlables alors que l’approche de comparaison intra-centre fait disparaître même les différences inobservables entre centres.
D’autres aspects pragmatiques peuvent aider à décider d’une méthode d’analyse, de l’autre ou des deux.
Si la variance de pratique inter-centre est trop faible (p.e. les centres prescrivant peu la thérapeutique sont à 45% de prescription alors que les centres la prescrivant beaucoup sont à 50%), la puissance de la deuxième approche peut être trop faible, avec un risque que l’effet soit noyé dans les biais dans le pire des cas ; en effet, l’effet du traitement sera dilué sans forcément que les biais soient diminués, conduisant à un rapport effet/biais défavorable. Au contraire, si la variance inter-centre est forte alors que la variance intra-centre est faible (p.e. les centres prescrivant peu la thérapeutique sont à 5% alors que les centres la prescrivant beaucoup sont à 95%), alors que l’approche de comparaison intra-centre sera certainement soumise à un biais d’indication incontrôlable, les rares patients n’ayant pas la pratique habituelle du centre correspondant possiblement à des indications formelles ou des contre-indications formelles de la thérapeutique ; sans compter le problème de la faible puissance de la première approche.
Un autre cas de figure doit rentrer en ligne de compte : le nombre de centres. Si celui-ci est élevé, l’approche écologique est tout à fait possible. S’il n’y a que deux ou trois centres, elle peut être impossible. On ne pourra plus estimer empiriquement la variance inter-centre de l’outcome moyen, la variance inter-centre de l’exposition moyenne et la covariance entre les deux, comme cela est possible avec l’estimation d’un coefficient de corrélation de Pearson. En effet, avec n=2, on ne peut pas estimer un coefficient de corrélation de Pearson. La comparaison inter-centre sera alors faite avec une méthodologie ici-ailleurs dans laquelle la différence du résultat moyen entre les centres sera entièrement attribuée aux fluctuations d’échantillonnages intra-centre et à la différence du taux moyen d’exposition. C’est alors que des différences de caractéristiques des centres ou de leur recrutement qui ne correspondent même pas à des facteurs de confusion vont engendrer un biais dans l’estimation de l’effet du traitement. Par exemple, si, par hasard, le centre ayant un niveau élevé de la prescription s’avère avoir une population particulièrement fragile en raison du voisinage d’une clinique absorbant l’activité des patients les plus stables, alors cette différence sera attribuée à la différence d’exposition au traitement. Une telle différence conjoncturelle serait incluse dans le calcul empirique de la variance inter-centre dans une analyse écologique intégrant un grand nombre de centres. Une étude ici-ailleurs bicentrique sera alors plus sujette au biais qu’une grande étude écologique et l’approche d’ajustement sur l’effet centre pourra éventuellement devenir plus intéressante.
Selon la nature du critère de jugement, la problématique pourra différer notablement, notamment pour une étude ici-ailleurs. La durée d’hospitalisation, par exemple, est soumise à des différences inter-centres majeures explicables par des différences organisationnelles sans forcément de rapport avec les caractéristiques des patients. Une étude ici-ailleurs comparant la durée d’hospitalisation est soumise à un biais de comparabilité initiale des centres totalement inacceptable. Au contraire, une comparaison intra-centre la durée d’hospitalisation est possible, l’organisation du service étant alors superposable pour les différents patients suivis dans un même centre sur une courte période de temps.
Les différences organisationnelles entre services devraient affecter moins la mortalité à 30 jours que la durée d’hospitalisation. Cette mortalité à 30 jours dépendra certainement des caractéristiques initiales des patients, mais, dans bon nombre de situations, on peut s’attendre à ce que les différences de caractéristiques moyennes des patients entre les centres soient plus faibles que les différenes intra-centre mais inter-traitement.
Enfin, dans certaines situations où les deux approches, de comparaison intra-centre ou inter-centre paraissent toutes deux aussi biaisées, il est possible de réaliser les deux analyses ; formellement on pourra définir une analyse principale et une analyse de sensibilité, mais l’interprétation des résultats sera conjointe. Si les deux analyses fournissent des résultats cohérents, on pourra être relativement rassuré, se disant qu’il suffit qu’une des deux analyses ne soit pas biaisée de manière majeure pour que les conclusions soient fiables. Au contraire, en cas de résultat discordant, cela montrera l’existence de biais majeurs dans au moins une des deux analyses ; considérant que les deux paraissent également biaisées initialement, on ne peut alors savoir laquelle est correcte, et les résultats sont alors très douteux.
L’objectif de ce billet était de faire comprendre que l’idée selon laquelle un ajustement ne peut qu’enlever du biais et pas en ajouter, est simpliste. L’ajustement peut créer un biais plus grand qu’il n’en corrige, et il est parfois préférable de faire une forme d’anti-ajustement sur l’effet centre par aggrégation des résultats au niveau du centre, dans une approche écologique plutôt qu’individuelle. Les choix statistiques dépendent de nombreux facteurs, et notamment d’une évaluation subjective de l’ampleur des biais. En corrigeant des biais on en crée parfois d’autres. Il faut alors se demander si les biais créés sont plus grands que les biais corrigés. Il n’existe en pratique pas de quantification objective de ces biais, car généralement, un biais quantifiable est rectifiable et rectifié. Les biais restant sont alors seulement quantifiables subjectivement. La connaissance du sujet de recherche est alors nécessaire à un jugement subjectif pertinent. Cependant, cette connaissance se heurtera aux limites des connaissances et de la compréhension humaine.
En tout cas, l’ajustement ce n’est pas automatique !