Articles

Affichage des articles du avril, 2025

🧪 𝓟𝓸𝓾𝓻𝓺𝓾𝓸𝓲 𝓮𝓽 𝓬𝓸𝓶𝓶𝓮𝓷𝓽 𝓾𝓽𝓲𝓵𝓲𝓼𝓮𝓻 𝓵𝓮 𝓽𝓮𝓼𝓽 𝓭𝓮 𝓷𝓸𝓻𝓶𝓪𝓵𝓲𝓽é 𝓭𝓮 𝓢𝓱𝓪𝓹𝓲𝓻𝓸-𝓦𝓲𝓵𝓴 𝓭𝓪𝓷𝓼 𝓿𝓸𝓼 𝓪𝓷𝓪𝓵𝔂𝓼𝓮𝓼 𝓼𝓽𝓪𝓽𝓲𝓼𝓽𝓲𝓺𝓾𝓮𝓼

Image
Le 𝐭𝐞𝐬𝐭 𝐝𝐞 𝐧𝐨𝐫𝐦𝐚𝐥𝐢𝐭 é 𝐝𝐞 𝐒𝐡𝐚𝐩𝐢𝐫𝐨 - 𝐖𝐢𝐥𝐤 est l’un des outils statistiques les plus utilisés pour vérifier si un ensemble de données suit une 𝗹𝗼𝗶 𝗻𝗼𝗿𝗺𝗮𝗹𝗲 . Cette vérification est essentielle avant de procéder à des tests statistiques qui reposent sur l’hypothèse de normalité. Voici l’essentiel à retenir : ✅ 𝕻𝖊𝖗𝖙𝖎𝖓𝖊𝖓𝖈𝖊 : Le test est 𝗽𝗮𝗿𝘁𝗶𝗰𝘂𝗹𝗶 è 𝗿𝗲𝗺𝗲𝗻𝘁 𝗮𝗱𝗮𝗽𝘁 é 𝗮𝘂𝘅 𝗽𝗲𝘁𝗶𝘁𝘀 et 𝗺𝗼𝘆𝗲𝗻𝘀 é 𝗰𝗵𝗮𝗻𝘁𝗶𝗹𝗹𝗼𝗻𝘀 , bien qu’il puisse être utilisé sur de grands ensembles de données avec précaution. Plus la taille de l’échantillon augmente, plus le test devient sensible aux moindres écarts à la normalité. ✅ 𝕻𝖗𝖎𝖓𝖈𝖎𝖕𝖊: Il compare les valeurs observées (classées dans l’ordre croissant) aux 𝘃𝗮𝗹𝗲𝘂𝗿𝘀 𝘁𝗵 é 𝗼𝗿𝗶𝗾𝘂𝗲𝘀 𝗮𝘁𝘁𝗲𝗻𝗱𝘂𝗲𝘀 d’une distribution normale. Plus l’ajustement est bon, plus on peut supposer que les données suivent une loi normale. ✅ Résultat : Le test fou...
Image
  📊 𝕮𝖔𝖒𝖒𝖊𝖓𝖙 𝕷𝖎𝖗𝖊 𝖊𝖙 𝕴𝖓𝖙𝖊𝖗𝖕𝖗é𝖙𝖊𝖗 𝖑𝖊𝖘 𝕽é𝖘𝖚𝖑𝖙𝖆𝖙𝖘 𝖉’𝖚𝖓𝖊 𝕽é𝖌𝖗𝖊𝖘𝖘𝖎𝖔𝖓 𝕷𝖎𝖓é𝖆𝖎𝖗𝖊 𝖉𝖆𝖓𝖘 𝕽 Les résultats d’une régression linéaire contiennent plusieurs éléments essentiels qui permettent d’évaluer la 𝗾𝘂𝗮𝗹𝗶𝘁 é 𝗱𝘂 𝗺𝗼𝗱 è 𝗹𝗲 et la 𝘀𝗶𝗴𝗻𝗶𝗳𝗶𝗰𝗮𝘁𝗶𝗼𝗻 𝗱𝗲𝘀 𝗽𝗿 é 𝗱𝗶𝗰𝘁𝗲𝘂𝗿𝘀 . 𝙐𝙣 𝙡𝙞𝙠𝙚 𝙚𝙩 𝙪𝙣 𝙋𝙖𝙧𝙩𝙖𝙜𝙚 de ce post avant d'aller plus loin nous fera plaisir. Voici une explication détaillée des différentes composantes que vous retrouverez dans la sortie de R : ✅ ℂ𝕒𝕝𝕝 : Affiche la formule du modèle utilisée et le nom du jeu de données. Exemple : Modélisation du bonheur en fonction du PIB, du soutien social, de la liberté et de la perception de la corruption, avec le jeu de données my_data . ✅ ℝé𝕤𝕚𝕕𝕦𝕤 (ℝ𝕖𝕤𝕚𝕕𝕦𝕒𝕝𝕤) : Représentent l’écart entre les valeurs observées et celles prédites par le modèle. Le résumé présente : ℳ 𝒾𝓃 ℯ 𝓉 ℳ 𝒶𝓍 : Étendue des rési...

📊 𝕻𝖔𝖚𝖗𝖖𝖚𝖔𝖎 𝖑𝖊 𝕿𝖍é𝖔𝖗è𝖒𝖊 𝕮𝖊𝖓𝖙𝖗𝖆𝖑 𝕷𝖎𝖒𝖎𝖙𝖊 (𝓣𝓒𝓛) 𝖓𝖊 𝖘'𝖆𝖕𝖕𝖑𝖎𝖖𝖚𝖊 𝖕𝖆𝖘 𝖇𝖎𝖊𝖓 𝖆𝖚𝖝 𝖈𝖔𝖗𝖗é𝖑𝖆𝖙𝖎𝖔𝖓𝖘

Image
Le 𝗧𝗵 é 𝗼𝗿 è 𝗺𝗲 𝗖𝗲𝗻𝘁𝗿𝗮𝗹 𝗟𝗶𝗺𝗶𝘁𝗲 ( 𝗧𝗖𝗟 ) est un pilier des statistiques, mais il 𝗻𝗲 𝘀 ’ 𝗮𝗽𝗽𝗹𝗶𝗾𝘂𝗲 𝗽𝗮𝘀 𝗱𝗲 𝗺𝗮𝗻𝗶 è 𝗿𝗲 𝘂𝗻𝗶𝗳𝗼𝗿𝗺𝗲 à tous les estimateurs. Une exception importante : le 𝗰𝗼𝗲𝗳𝗳𝗶𝗰𝗶𝗲𝗻𝘁 𝗱𝗲 𝗰𝗼𝗿𝗿 é 𝗹𝗮𝘁𝗶𝗼𝗻 . ➡️ Les corrélations sont limitées entre -1 et 1, et leur 𝗱𝗶𝘀𝘁𝗿𝗶𝗯𝘂𝘁𝗶𝗼𝗻 𝗱 ’é 𝗰𝗵𝗮𝗻𝘁𝗶𝗹𝗹𝗼𝗻𝗻𝗮𝗴𝗲 𝗱𝗲𝘃𝗶𝗲𝗻𝘁 𝗮𝘀𝘆𝗺 é 𝘁𝗿𝗶𝗾𝘂𝗲 , surtout dans les petits échantillons ou lorsque la corrélation réelle est éloignée de zéro. ✔ ️ Pour beaucoup d’estimateurs comme les 𝗺𝗼𝘆𝗲𝗻𝗻𝗲𝘀 ou les 𝗰𝗼𝗲𝗳𝗳𝗶𝗰𝗶𝗲𝗻𝘁𝘀 𝗱𝗲 𝗿 é 𝗴𝗿𝗲𝘀𝘀𝗶𝗼𝗻 , le TCL garantit une distribution proche de la normale lorsque la taille d’échantillon augmente, ce qui permet une inférence fiable. ❌ Ce n’est pas le cas des 𝐜𝐨𝐫𝐫 é 𝐥𝐚𝐭𝐢𝐨𝐧𝐬 . Leur 𝐝𝐢𝐬𝐭𝐫𝐢𝐛𝐮𝐭𝐢𝐨𝐧 𝐚𝐬𝐲𝐦 é 𝐭𝐫𝐢𝐪𝐮𝐞 𝐞𝐭 𝐜𝐨𝐦𝐩𝐫𝐢𝐦 é 𝐞 peut fausser l’estimation de l’erreur standard,...