๐ป๐๐๐ ๐ ๐ ๐๐๐๐๐๐๐๐๐́ ๐ ๐๐๐ ๐น : ๐๐๐๐๐๐๐ ๐๐๐๐๐๐ ๐๐ ๐๐๐ ๐ ๐๐๐๐́๐๐ ๐๐๐๐ ๐๐๐๐๐๐๐๐ ?
En analyse statistique, avant d’appliquer certains tests ou modรจles, il est souvent nรฉcessaire de vรฉrifier si les donnรฉes suivent une ๐ ๐๐๐๐๐๐๐๐๐๐๐ ๐๐๐๐๐๐๐. Cette รฉtape est importante, car plusieurs mรฉthodes statistiques reposent sur l’hypothรจse de normalitรฉ. Dans ๐น, cette vรฉrification peut se faire ร l’aide de ๐๐๐๐๐ ๐๐๐๐๐๐๐๐๐๐๐๐ et de ๐๐́๐๐๐๐ ๐๐ ๐๐๐๐๐๐๐๐๐๐.
๐. ๐ณ๐ ๐๐๐๐ ๐ ๐ ๐บ๐๐๐๐๐๐-๐พ๐๐๐
Le test de ๐บ๐๐๐๐๐๐-๐พ๐๐๐ est l’un des plus utilisรฉs pour tester la normalitรฉ. Il est particuliรจrement adaptรฉ aux ๐๐๐๐๐๐ ๐๐ ๐๐๐๐๐๐ ๐́๐๐๐๐๐๐๐๐๐๐๐. Exemple sous R : R data <- c(160, 162, 165, 170, 168, 164, 163) shapiro.test(data) ๐ฐ๐๐๐๐๐๐๐́๐๐๐๐๐๐ : Si p-value > 0,05, la normalitรฉ est plausible. Si p-value ≤ 0,05, les donnรฉes s’รฉloignent significativement de la normalitรฉ.
๐. ๐ณ๐ ๐๐๐๐ ๐ ๐ ๐ฒ๐๐๐๐๐๐๐๐๐-๐บ๐๐๐๐๐๐
Le test de ๐ฒ๐๐๐๐๐๐๐๐๐-๐บ๐๐๐๐๐๐ peut รชtre utilisรฉ pour comparer une distribution observรฉe ร une distribution thรฉorique. Sous R : R ks.test(data, "pnorm", mean(data), sd(data)) Cependant, pour tester directement la normalitรฉ, ce test est gรฉnรฉralement ๐๐๐๐๐ ๐๐๐๐๐๐๐๐๐ ๐́ que Shapiro-Wilk ou Anderson-Darling.
๐. ๐ณ๐ ๐๐๐๐ ๐ ’๐จ๐๐ ๐๐๐๐๐-๐ซ๐๐๐๐๐๐
Le test d’๐จ๐๐ ๐๐๐๐๐-๐ซ๐๐๐๐๐๐ est trรจs utile, car il est souvent plus sensible aux รฉcarts par rapport ร la normalitรฉ. Sous R : R install.packages("nortest") library(nortest) ad.test(data) Il constitue une bonne alternative lorsque l’on souhaite renforcer la dรฉcision statistique.
๐. ๐ณ๐๐ ๐๐́๐๐๐๐ ๐๐ ๐๐๐๐๐๐๐๐๐๐
Les tests statistiques ne suffisent pas toujours. Il faut aussi regarder les donnรฉes.
๐จ. ๐ณ’๐๐๐๐๐๐๐๐๐๐๐
hist(data, breaks = 10, main = "Histogramme")
L’histogramme permet d’observer la forme gรฉnรฉrale de la distribution.
๐ฉ. ๐ณ๐ ๐ธ-๐ธ ๐ท๐๐๐
qqnorm(data) qqline(data)
Si les points sont proches de la droite, alors la normalitรฉ est raisonnablement plausible.
๐. ๐ณ๐ ๐๐๐๐๐ ๐ ๐́๐๐๐๐๐๐
En pratique, il ne faut pas se limiter ร un seul indicateur. La meilleure approche consiste ร combiner :
๐๐ ๐๐๐๐ ๐ ๐ ๐บ๐๐๐๐๐๐-๐พ๐๐๐
๐๐ ๐ธ-๐ธ ๐ท๐๐๐ ๐’๐๐๐๐๐๐๐๐๐๐๐
๐’๐๐๐๐๐๐๐ ๐ ๐ ๐๐๐๐๐๐๐๐ ๐ ๐๐ ๐ ๐๐๐๐́๐๐
Un test peut รชtre significatif dans un grand รฉchantillon mรชme lorsque l’รฉcart ร la normalitรฉ est faible. ร l’inverse, un petit รฉchantillon peut manquer de puissance pour dรฉtecter une vraie dรฉviation.
๐จ̀ ๐๐๐๐๐๐๐
Tester la normalitรฉ ne consiste pas seulement ร regarder une p-value. Il faut croiser les rรฉsultats statistiques avec les graphiques pour prendre une dรฉcision plus fiable. En analyse de donnรฉes, ๐๐ ๐๐๐๐๐ ๐๐๐๐๐๐๐๐́๐๐๐๐๐๐ ๐๐๐ ๐๐๐๐๐ ๐๐๐๐๐๐๐๐๐๐ ๐๐๐ ๐๐ ๐๐๐ ๐๐๐ ๐.
๐ณ๐๐๐๐, ๐๐๐๐๐๐๐๐ ๐๐ ๐๐๐๐๐๐๐-๐๐๐๐ pour plus de contenus sur les statistiques, l’รฉconomรฉtrie, R, Stata et l’analyse des donnรฉes.
Pour mieux maรฎtriser les logiciels et modรจles statistiques, prenez part ร notre prochaine session de formation en ๐๐๐ค๐ฃ๐ค๐ข๐́๐ฉ๐ง๐๐ ๐๐ฉ ๐๐๐๐๐ฃ๐๐ฆ๐ช๐๐จ ๐๐ช๐๐ฃ๐ฉ๐๐ฉ๐๐ฉ๐๐ซ๐๐จ Lien en commentaire.
#RStats #AnalyseDeDonnรฉes #Statistiques #DataScience #MรฉthodesQuantitatives

Commentaires
Enregistrer un commentaire