Pourquoi un modèle multivarié ?

Les modèles de régression logistique multivariés se retrouvent dans beaucoup de publications, sans que la raison de leur réalisation soit clairement annoncée. Cela est dommage parce que la manière de les construire dépend beaucoup de cette raison. Nous listons ici, un nombre de raisons de réaliser un modèle multivarié : Analyses de causalité en épidémiologie …

There will be legacy

As of April 14, 2020, there are 694 programming languages listed on the Wikipedia list of programming languages. This lists programming languages, not implementations and standards, so that C++ is a single programming language, be it GNU C++, Microsoft’s Visual C++, Clang, Intel C++ compiler or C++98, C++03, C++11, C++14, C++17. Can a legacy programming …

Test de normalité

L’usage de tests de normalité n’est pas pertinente dans la recherche biomédicale. J’ai un point de vue très tranché sur la question car cet usage me paraît être une aberration à plusieurs sens, que je détaillerai ci-dessous. 1er argument : les lois du vivant ne sont pas normales Pour rappel, la loi normale est une …

Quelques néologismes

Si vous suivez ce blog, il peut être intéressant d’apprendre quelques néologismes que je suis susceptible d’utiliser de temps à autre. Petit péter, petit péteur Un résultat petit pète, lorsqu’il est statistiquement significatif (petit p < seuil de significativité). Ce terme est neutre et ne présume pas de la réalité de l’hypothèse nulle ou de …

Modèle linéaire ajusté dans un essai clinique randomisé

Encore un billet sur les ajustements dans les essais cliniques randomisés ! Pourquoi s’intéresser à ce sujet ? Parce que plus un modèle et complexe, plus il fait d’hypothèses et plus il est susceptible d’engendrer des biais. Pour un gain de puissance, il paraît difficile d’accepter l’ajout de biais dans un essai clinique randomisé dont …

Combien de noeuds pour paralléliser mes simulations ?

Si vous faites des simulations statistiques lourdes, vous devez ou devriez bénéficier de la parallélisation des ordinateurs multi-coeurs. Un quadri-coeur peut exécuter environ quatre fois plus vite (sauf saturation de la bande passante RAM) les simulations qu’un mono-coeur. Les outils de parallélisation tels que le package R « parallel » permettent de choisir le nombre de noeuds …

Faut-il des petits p dans le tableau 1 d’un essai clinique randomisé ?

Introduction Le tableau 1, dans les essais cliniques randomisés, décrit généralement les caractéristiques initiales des deux groupes randomisés. Âge, sexe, état général, comorbidités, sévérité de la maladie d’intérêt. Les grandes revues, telles que je New England Journal of Medicine présentent généralement les caractéristiques sous forme d’un tableau avec une colonne par groupe de randomisation. Il …

Les analyses statistiques orientées par les statistiques

Certains statisticiens orientent le choix des analyses statistiques par les résultats d’autres statistiques. Un grand classique, est illustré dans une « comparaison de deux groupes » sur une variable quantitative. Un test de normalité (p.e. Shapiro-Wilk) est d’abord fait. Si le test est significatif, alors la distribution est considérée comme non-normale et un test de Mann-Whitney est …