๐ ๐ข๐ด๐ฎ๐๐ท๐ฎ๐ผ๐ผ & ๐๐พ๐ป๐ฝ๐ธ๐ผ๐ฒ๐ผ : ๐ต๐ฎ๐ผ ๐ถ๐ธ๐ถ๐ฎ๐ท๐ฝ๐ผ ๐ธ๐พ๐ซ๐ต๐ฒรฉ๐ผ ๐ถ๐ช๐ฒ๐ผ ๐ฎ๐ผ๐ผ๐ฎ๐ท๐ฝ๐ฒ๐ฎ๐ต๐ผ ๐น๐ธ๐พ๐ป ๐ฌ๐ธ๐ถ๐น๐ป๐ฎ๐ท๐ญ๐ป๐ฎ ๐ต๐ช ๐ญ๐ฒ๐ผ๐ฝ๐ป๐ฒ๐ซ๐พ๐ฝ๐ฒ๐ธ๐ท ๐ฟ๐ธ๐ผ ๐ญ๐ธ๐ท๐ทรฉ๐ฎ๐ผ
L’asymรฉtrie (๐ฆ๐ธ๐ฒ๐๐ป๐ฒ๐๐) et l’aplatissement (๐๐๐ฟ๐๐ผ๐๐ถ๐) sont souvent nรฉgligรฉs, pourtant ils jouent un rรดle clรฉ dans l’interprรฉtation des distributions statistiques.
Alors que l’asymรฉtrie mesure la symรฉtrie (ou non) de la distribution, l’aplatissement renseigne sur le poids des valeurs extrรชmes dans les queues de la distribution.
_______________________________________________________________________
๐ข ๐ท๐๐ 4 ๐ธ๐๐๐๐๐๐ ๐ฎ๐รฉ๐ ๐๐ ๐พ๐๐๐๐๐๐๐๐๐๐:
1️⃣ ๐๐ ๐ช๐๐๐๐ : valeur
centrale autour de laquelle les donnรฉes sont distribuรฉes.
2️⃣ ๐๐๐ฃ๐๐๐๐๐ : mesure de la
dispersion autour de la moyenne.
3️⃣ ๐ธ๐ค๐ช๐รฉ๐ฅ๐ฃ๐๐ (๐๐๐๐จ๐๐๐ค๐ค): indique si
les donnรฉes sont dรฉcalรฉes vers la droite (asymรฉtrie positive) ou la gauche
(asymรฉtrie nรฉgative).
4️⃣ ๐ธ๐ก๐๐๐ฅ๐๐ค๐ค๐๐๐๐๐ฅ (๐๐ฆ๐ฃ๐ฅ๐ ๐ค๐๐ค): informe sur
la prรฉsence de valeurs extrรชmes. Une kurtosis รฉlevรฉe traduit des queues
รฉpaisses, donc plus de valeurs extrรชmes.
_______________________________________________________________________
✅ ๐ญ๐๐๐ ๐๐๐๐๐๐๐
๐๐ ๐๐๐๐๐๐ ๐’๐๐๐๐รฉ๐๐๐๐
๐๐ ๐’๐๐๐๐๐๐๐๐๐๐๐๐๐
๐๐๐๐๐๐ ๐๐:
- Dรฉtecter
les biais et les valeurs aberrantes pouvant fausser les analyses ;
- Amรฉliorer
la prรฉcision des modรจles prรฉdictifs en tenant compte de la forme rรฉelle
des distributions ;
- Prendre
des dรฉcisions plus รฉclairรฉes ร partir de donnรฉes fidรจlement interprรฉtรฉes.
_______________________________________________________________________
❌
๐ท๐๐ ๐๐๐๐๐๐๐
๐๐๐๐:
- Produire
des rรฉsultats erronรฉs si la distribution n’est pas normale ;
- Gรฉnรฉrer
des modรจles inadรฉquats, insensibles aux extrรชmes ;
- Biaiser
les comparaisons entre plusieurs jeux de donnรฉes.
_______________________________________________________________________
๐งช ๐ฎ๐๐๐๐๐๐ ๐๐๐ ๐๐๐๐๐๐๐ ?
๐น ๐ผ๐ โ : utilisez
๐ฒ๐ญ๐ฌ๐ณ๐ญ::๐๐ธ๐ฒ๐๐ป๐ฒ๐๐() et ๐ฒ๐ญ๐ฌ๐ณ๐ญ::๐ธ๐๐ฟ๐๐ผ๐๐ถ๐() pour calculer ces moments.
Visualisez-les avec ggplot2.
๐น ๐ผ๐ โ๐ช๐ฅ๐๐ ๐ :utilisez s๐๐ข๐ฉ๐ฒ.๐ฌ๐ญ๐๐ญ๐ฌ.๐ฌ๐ค๐๐ฐ() et ๐ฌ๐๐ข๐ฉ๐ฒ.๐ฌ๐ญ๐๐ญ๐ฌ.๐ค๐ฎ๐ซ๐ญ๐จ๐ฌ๐ข๐ฌ(), puis ๐ฆ๐๐ญ๐ฉ๐ฅ๐จ๐ญ๐ฅ๐ข๐ ou ๐ฌ๐๐๐๐จ๐ซ๐ง pour les
reprรฉsentations graphiques.
_______________________________________________________________________
๐ก Le
graphique ci-dessous montre l’impact visuel des variations de skewness et de
kurtosis, ร partir de donnรฉes simulรฉes dans R, analysรฉes avec e1071 et visualisรฉes via ggplot2. L’ajustement de la kurtosis ร
l’รฉchelle classique (+3) permet une lecture plus fidรจle des distributions.
_______________________________________________________________________
๐ Vous
souhaitez en savoir plus sur les statistiques, la science des donnรฉes, SPSS,
STATA, R et Python ?
Inscrivez-vous dรจs maintenant pour rรฉserver votre place pour la prochaine session de notre formation en ร๐ฐ๐ผ๐ป๐ผ๐บรฉ๐๐ฟ๐ถ๐ฒ ๐ฒ๐ ๐ง๐ฒ๐ฐ๐ต๐ป๐ถ๐พ๐๐ฒ๐ ๐ค๐๐ฎ๐ป๐๐ถ๐๐ฎ๐๐ถ๐๐ฒ๐
#structuredesdonnรฉes
#rstatistiques #analystedonnees #bigdata #dataanalysis #ggplot2
#intelligenceartificielle #statistiques
Commentaires
Enregistrer un commentaire