Statistical Models for Social Sciences

🔍 𝕺𝖕𝖙𝖎𝖒𝖎𝖘𝖊𝖗 𝖑𝖊 𝖉𝖎𝖆𝖌𝖓𝖔𝖘𝖙𝖎𝖈 𝖉𝖊𝖘 𝖗é𝖘𝖎𝖉𝖚𝖘 𝖉𝖆𝖓𝖘 𝖑𝖊𝖘 𝖒𝖔𝖉è𝖑𝖊𝖘 𝓜𝓜𝓡𝓜 𝖕𝖔𝖚𝖗 𝖉𝖔𝖓𝖓é𝖊𝖘 𝖑𝖔𝖓𝖌𝖎𝖙𝖚𝖉𝖎𝖓𝖆𝖑𝖊𝖘 (𝖊𝖋𝖋𝖊𝖙𝖘 𝖋𝖎𝖝𝖊𝖘)

Lorsque l’on teste des hypothèses à partir d’études longitudinales (données répétées) à l’aide d’un 𝐦𝐨𝐝è𝐥𝐞𝐬 𝐌𝐌𝐑𝐌 (Mixed Model for Repeated Measures) estimé via 𝗚𝗟𝗦 𝗽𝗮𝗿𝗮𝗺é𝘁𝗿𝗶𝗾𝘂𝗲, il est essentiel de 𝗱𝗶𝗮𝗴𝗻𝗼𝘀𝘁𝗶𝗾𝘂𝗲𝗿 𝗰𝗼𝗿𝗿𝗲𝗰𝘁𝗲𝗺𝗲𝗻𝘁 𝗹𝗲𝘀 𝗿é𝘀𝗶𝗱𝘂𝘀. Voici les étapes minimales que j’utilise systématiquement :

⚠️ 𝗔𝘁𝘁𝗲𝗻𝘁𝗶𝗼𝗻 : 𝗻’𝗮𝗻𝗮𝗹𝘆𝘀𝗲𝘇 𝗽𝗮𝘀 𝗹𝗲𝘀 𝗿é𝘀𝗶𝗱𝘂𝘀 "𝗻𝗮ï𝗳𝘀" 𝗶𝘀𝘀𝘂𝘀 𝗱𝗲𝘀 𝗿é𝗽𝗼𝗻𝘀𝗲𝘀 𝗼𝗯𝘀𝗲𝗿𝘃é𝗲𝘀 𝗰𝗼𝗺𝗺𝗲 𝗱𝗮𝗻𝘀 𝘂𝗻𝗲 𝗿é𝗴𝗿𝗲𝘀𝘀𝗶𝗼𝗻 𝗢𝗟𝗦 𝗰𝗹𝗮𝘀𝘀𝗶𝗾𝘂𝗲. Ils refléteront directement les problèmes de corrélation et d’hétéroscédasticité non traités. Il faut plutôt examiner les 𝗿é𝘀𝗶𝗱𝘂𝘀 𝗻𝗼𝗿𝗺𝗮𝗹𝗶𝘀é𝘀 𝗲𝘁 𝗱é𝗰𝗼𝗿𝗿é𝗹é𝘀 que fournit directement la procédure GLS (par exemple via 𝗻𝗹𝗺𝗲::𝗴𝗹𝘀() ou 𝗺𝗺𝗿𝗺::𝗺𝗺𝗿𝗺() dans 𝗥).

𝙐𝙣 𝙡𝙞𝙠𝙚 𝙚𝙩 𝙪𝙣 𝙋𝙖𝙧𝙩𝙖𝙜𝙚 de ce post avant d'aller plus loin nous fera plaisir.

🧪 É𝓽𝓪𝓹𝓮𝓼 𝓭𝓮 𝓭𝓲𝓪𝓰𝓷𝓸𝓼𝓽𝓲𝓬 𝓻𝓮𝓬𝓸𝓶𝓶𝓪𝓷𝓭é𝓮𝓼

𝟙. ℚℚ 𝕡𝕝𝕠𝕥 𝕕𝕖𝕤 𝕣é𝕤𝕚𝕕𝕦𝕤 𝕟𝕠𝕣𝕞𝕒𝕝𝕚𝕤é𝕤 Eviter les tests de normalité (souvent peu informatifs), mais lorsqu’ils sont requis (notamment pour petits échantillons), il vaut mieux les inclure. → Aimez également les observations en dehors de l’IC 95 % avec les identifiants des patients. ⚠️ 𝒟ℯ𝓊𝓍 𝓇ℯ𝓂𝒶𝓇𝓆𝓊ℯ𝓈 :

Même un point apparemment extrême peut être bénin (par ex., un quantile théorique à 2.2 vs. un empirique à 2.02).
Quelques patients peuvent générer de nombreuses observations hors seuil, surtout avec des données répétées (ex : 3 patients × 7 temps = 21 points).

𝟚. ℍ𝕚𝕤𝕥𝕠𝕘𝕣𝕒𝕞𝕞𝕖 + 𝕣𝕦𝕘 𝕡𝕝𝕠𝕥 + 𝕔𝕠𝕦𝕣𝕓𝕖 𝕕𝕖 𝕕𝕖𝕟𝕤𝕚𝕥é 𝕟𝕠𝕣𝕞𝕒𝕝𝕖 Même si le QQ plot est souvent suffisant, visualisez la distribution de façon plus intuitive. → J’ajoute les 𝘃𝗮𝗹𝗲𝘂𝗿𝘀 𝗱𝗲 𝘀𝗸𝗲𝘄𝗻𝗲𝘀𝘀❟ 𝗸𝘂𝗿𝘁𝗼𝘀𝗶𝘀 et le 𝗻𝗼𝗺𝗯𝗿𝗲 𝘁𝗼𝘁𝗮𝗹 𝗱’𝗼𝗯𝘀𝗲𝗿𝘃𝗮𝘁𝗶𝗼𝗻𝘀. Le rug plot permet de détecter des amas discrets masqués par l’histogramme.

𝟚. 𝔸𝕦𝕥𝕠𝕔𝕠𝕣𝕣𝕖𝕝𝕒𝕥𝕚𝕠𝕟 (𝔸ℂ𝔽 𝕡𝕝𝕠𝕥) Comparez la structure d’indépendance (cas OLS) à celle choisie dans le modèle MMRM. → Les barres bleues doivent décroître nettement si la corrélation est bien capturée.

𝟚. 𝔻𝕚𝕤𝕥𝕒𝕟𝕔𝕖 𝕕𝕖 ℂ𝕠𝕠𝕜 Plutôt que de regarder séparément les résidus et les observations à effet de levier élevé, utilisez cette mesure combinée. → N’appliquez pas systématiquement de seuil rigide, je préfère observer l’ensemble du nuage de points pour détecter des valeurs atypiques. 🎯 𝐼𝓂𝓅ℴ𝓇𝓉𝒶𝓃𝓉 :: 𝗨𝗻 𝗼𝘂𝘁𝗹𝗶𝗲𝗿 𝗻’𝗲𝘀𝘁 𝗽𝗮𝘀 𝘁𝗼𝘂𝗷𝗼𝘂𝗿𝘀 𝘂𝗻𝗲 𝗼𝗯𝘀𝗲𝗿𝘃𝗮𝘁𝗶𝗼𝗻 𝗶𝗻𝗳𝗹𝘂𝗲𝗻𝘁𝗲｡

𝟚. ℝé𝕤𝕚𝕕𝕦𝕤 𝕟𝕠𝕣𝕞𝕒𝕝𝕚𝕤é𝕤 𝕧𝕤 𝕧𝕒𝕝𝕖𝕦𝕣𝕤 𝕒𝕛𝕦𝕤𝕥é𝕖𝕤 (𝕗𝕚𝕥𝕥𝕖𝕕 𝕧𝕒𝕝𝕦𝕖𝕤) Ce classique permet de vérifier l’absence de structures non modélisées après ajustement.

🧭 𝓔𝓷 𝓻é𝓼𝓾𝓶é

Si vous réalisez vous-même ces diagnostics pour vos modèles longitudinaux, assurez-vous de toujours disposer de ces indicateurs de base pour évaluer la validité de vos hypothèses.

Vous souhaitez en savoir plus sur les statistiques, la science des données, SPSS, STATA, R et Python ?

Inscrivez-vous dès maintenant pour réserver votre place pour la prochaine session de notre formation en É𝗰𝗼𝗻𝗼𝗺é𝘁𝗿𝗶𝗲 𝗲𝘁 𝗧𝗲𝗰𝗵𝗻𝗶𝗾𝘂𝗲𝘀 𝗤𝘂𝗮𝗻𝘁𝗶𝘁𝗮𝘁𝗶𝘃𝗲𝘀

#Statistiques #Modélisation #MMRM #GLS #Résidus #DonnéesLongitudinales #Diagnostic #Visualisation #RStats #MéthodesStatistiques

Rechercher dans ce blog

Statistical Models for Social Sciences

Commentaires

Enregistrer un commentaire

Posts les plus consultés de ce blog

Économétrie des données de panel: de la théorie à la pratique

comment exporter les résultats des estimations de STATA vers word, Excel...

panel ARDL in STATA