avril 2020 – Biostatistics: The Good, the Bad and the Ugly

Pourquoi un modèle multivarié ?

Les modèles de régression logistique multivariés se retrouvent dans beaucoup de publications, sans que la raison de leur réalisation soit clairement annoncée. Cela est dommage parce que la manière de les construire dépend beaucoup de cette raison. Nous listons ici, un nombre de raisons de réaliser un modèle multivarié : Analyses de causalité en épidémiologie …

Continuer la lecture « Pourquoi un modèle multivarié ? »

There will be legacy

As of April 14, 2020, there are 694 programming languages listed on the Wikipedia list of programming languages. This lists programming languages, not implementations and standards, so that C++ is a single programming language, be it GNU C++, Microsoft’s Visual C++, Clang, Intel C++ compiler or C++98, C++03, C++11, C++14, C++17. Can a legacy programming …

Continuer la lecture « There will be legacy »

Test de normalité

L’usage de tests de normalité n’est pas pertinente dans la recherche biomédicale. J’ai un point de vue très tranché sur la question car cet usage me paraît être une aberration à plusieurs sens, que je détaillerai ci-dessous. 1er argument : les lois du vivant ne sont pas normales Pour rappel, la loi normale est une …

Continuer la lecture « Test de normalité »

Quelques néologismes

Si vous suivez ce blog, il peut être intéressant d’apprendre quelques néologismes que je suis susceptible d’utiliser de temps à autre. Petit péter, petit péteur Un résultat petit pète, lorsqu’il est statistiquement significatif (petit p < seuil de significativité). Ce terme est neutre et ne présume pas de la réalité de l’hypothèse nulle ou de …

Continuer la lecture « Quelques néologismes »

Modèle linéaire ajusté dans un essai clinique randomisé

Encore un billet sur les ajustements dans les essais cliniques randomisés ! Pourquoi s’intéresser à ce sujet ? Parce que plus un modèle et complexe, plus il fait d’hypothèses et plus il est susceptible d’engendrer des biais. Pour un gain de puissance, il paraît difficile d’accepter l’ajout de biais dans un essai clinique randomisé dont …

Continuer la lecture « Modèle linéaire ajusté dans un essai clinique randomisé »

Combien de noeuds pour paralléliser mes simulations ?

Si vous faites des simulations statistiques lourdes, vous devez ou devriez bénéficier de la parallélisation des ordinateurs multi-coeurs. Un quadri-coeur peut exécuter environ quatre fois plus vite (sauf saturation de la bande passante RAM) les simulations qu’un mono-coeur. Les outils de parallélisation tels que le package R « parallel » permettent de choisir le nombre de noeuds …

Continuer la lecture « Combien de noeuds pour paralléliser mes simulations ? »

Faut-il des petits p dans le tableau 1 d’un essai clinique randomisé ?

Introduction Le tableau 1, dans les essais cliniques randomisés, décrit généralement les caractéristiques initiales des deux groupes randomisés. Âge, sexe, état général, comorbidités, sévérité de la maladie d’intérêt. Les grandes revues, telles que je New England Journal of Medicine présentent généralement les caractéristiques sous forme d’un tableau avec une colonne par groupe de randomisation. Il …

Continuer la lecture « Faut-il des petits p dans le tableau 1 d’un essai clinique randomisé ? »

Les analyses statistiques orientées par les statistiques

Certains statisticiens orientent le choix des analyses statistiques par les résultats d’autres statistiques. Un grand classique, est illustré dans une « comparaison de deux groupes » sur une variable quantitative. Un test de normalité (p.e. Shapiro-Wilk) est d’abord fait. Si le test est significatif, alors la distribution est considérée comme non-normale et un test de Mann-Whitney est …

Continuer la lecture « Les analyses statistiques orientées par les statistiques »