📈 𝑻𝒆𝒔𝒕 𝒅𝒆 𝒏𝒐𝒓𝒎𝒂𝒍𝒊𝒕𝒆́ 𝒅𝒂𝒏𝒔 𝑹 📉

Pour vérifier si vos données suivent une distribution normale, vous pouvez utiliser à la fois des tests statistiques et des méthodes graphiques.

Voici les méthodes les plus utilisées et les plus fiables, expliquées étape par étape.

1️⃣ 𝑻𝒆𝒔𝒕 𝒅𝒆 𝑺𝒉𝒂𝒑𝒊𝒓𝒐-𝑾𝒊𝒍𝒌 (le plus utilisé)

👉 Idéal pour les petits et moyens échantillons (n < 5000).

Syntaxe :

shapiro.test(vos_donnees)

Exemple :

data <- c(160, 162, 165, 170, 168, 164, 163)

shapiro.test(data)

Interprétation :

p > 0.05 → Les données suivent une distribution normale

p ≤ 0.05 → Les données ne sont PAS normales

2️⃣ 𝑻𝒆𝒔𝒕 𝒅𝒆 𝑲𝒐𝒍𝒎𝒐𝒈𝒐𝒓𝒐𝒗-𝑺𝒎𝒊𝒓𝒏𝒐𝒗 (KS)

👉 Utilisé pour les grands échantillons, mais moins puissant pour tester la normalité.

Syntaxe :

ks.test(vos_donnees, "pnorm", mean(vos_donnees), sd(vos_donnees))

Exemple :

ks.test(data, "pnorm", mean(data), sd(data))

3️⃣ 𝑻𝒆𝒔𝒕 𝒅’𝑨𝒏𝒅𝒆𝒓𝒔𝒐𝒏-𝑫𝒂𝒓𝒍𝒊𝒏𝒈 (très puissant)

👉 Plus sensible que le KS, particulièrement recommandé.

Installation et utilisation :

install.packages("nortest")

library(nortest)

ad.test(data)

4️⃣ 𝑴𝒆́𝒕𝒉𝒐𝒅𝒆𝒔 𝒈𝒓𝒂𝒑𝒉𝒊𝒒𝒖𝒆𝒔 (Fortement recommandées)

Les graphiques sont indispensables pour confirmer les tests statistiques.

A) Histogramme

hist(data, breaks = 10, col = "skyblue", main = "Histogramme")

👉 Permet de visualiser la forme générale de la distribution.

B) Q-Q Plot (Très important)

qqnorm(data)

qqline(data, col = "red")

👉 Si les points suivent la ligne droite rouge → la normalité est plausible.


5️⃣ 𝑩𝒐𝒏𝒏𝒆 𝒑𝒓𝒂𝒕𝒊𝒒𝒖𝒆

Ne jamais se fier à un seul test.

Toujours combiner :

✅ Test de Shapiro-Wilk

✅ Q-Q Plot

✅ Histogramme

La décision finale doit reposer sur l’ensemble de ces éléments.

________________________________________

Si vous avez trouvé cette publication utile, n'hésitez pas à 𝒍𝒂 𝒍𝒊𝒌𝒆𝒓 𝒆𝒕 à 𝒍𝒂 𝒑𝒂𝒓𝒕𝒂𝒈𝒆𝒓 avec vos amis et collègues !

Pour mieux apprendre l’utilisation des logiciel et modèles statistiques, nous vous invitons à prendre part à la prochaine session de notre formation en 𝙀𝙘𝙤𝙣𝙤𝙢é𝙩𝙧𝙞𝙚 𝙚𝙩 𝙏𝙚𝙘𝙝𝙣𝙞𝙦𝙪𝙚𝙨 𝙌𝙪𝙖𝙣𝙩𝙞𝙩𝙖𝙩𝙞𝙫𝙚𝙨 https://https://forms.gle/mopoGRWKwyTtbEJ16



________________________________________

 

#RStats #AnalyseDeDonnées #Statistiques #DataScience #MéthodesQuantitatives


Commentaires

Posts les plus consultés de ce blog

Économétrie des données de panel: de la théorie à la pratique