๐Ÿ“Š ๐“ข๐“ด๐“ฎ๐”€๐“ท๐“ฎ๐“ผ๐“ผ & ๐“š๐“พ๐“ป๐“ฝ๐“ธ๐“ผ๐“ฒ๐“ผ : ๐“ต๐“ฎ๐“ผ ๐“ถ๐“ธ๐“ถ๐“ฎ๐“ท๐“ฝ๐“ผ ๐“ธ๐“พ๐“ซ๐“ต๐“ฒรฉ๐“ผ ๐“ถ๐“ช๐“ฒ๐“ผ ๐“ฎ๐“ผ๐“ผ๐“ฎ๐“ท๐“ฝ๐“ฒ๐“ฎ๐“ต๐“ผ ๐“น๐“ธ๐“พ๐“ป ๐“ฌ๐“ธ๐“ถ๐“น๐“ป๐“ฎ๐“ท๐“ญ๐“ป๐“ฎ ๐“ต๐“ช ๐“ญ๐“ฒ๐“ผ๐“ฝ๐“ป๐“ฒ๐“ซ๐“พ๐“ฝ๐“ฒ๐“ธ๐“ท ๐“ฟ๐“ธ๐“ผ ๐“ญ๐“ธ๐“ท๐“ทรฉ๐“ฎ๐“ผ

L’asymรฉtrie (๐—ฆ๐—ธ๐—ฒ๐˜„๐—ป๐—ฒ๐˜€๐˜€) et l’aplatissement (๐—ž๐˜‚๐—ฟ๐˜๐—ผ๐˜€๐—ถ๐˜€) sont souvent nรฉgligรฉs, pourtant ils jouent un rรดle clรฉ dans l’interprรฉtation des distributions statistiques.

Alors que l’asymรฉtrie mesure la symรฉtrie (ou non) de la distribution, l’aplatissement renseigne sur le poids des valeurs extrรชmes dans les queues de la distribution.

_______________________________________________________________________

๐Ÿ”ข ๐•ท๐–Š๐–˜ 4 ๐•ธ๐–”๐–’๐–Š๐–“๐–™๐–˜ ๐•ฎ๐–‘รฉ๐–˜ ๐–Š๐–“ ๐•พ๐–™๐–†๐–™๐–Ž๐–˜๐–™๐–Ž๐––๐–š๐–Š:
1
๐•„๐• ๐•ช๐•–๐•Ÿ๐•Ÿ๐•– : valeur centrale autour de laquelle les donnรฉes sont distribuรฉes.
2
๐•๐•’๐•ฃ๐•š๐•’๐•Ÿ๐•”๐•– : mesure de la dispersion autour de la moyenne.
3
๐”ธ๐•ค๐•ช๐•žรฉ๐•ฅ๐•ฃ๐•š๐•– (๐•Š๐•œ๐•–๐•จ๐•Ÿ๐•–๐•ค๐•ค): indique si les donnรฉes sont dรฉcalรฉes vers la droite (asymรฉtrie positive) ou la gauche (asymรฉtrie nรฉgative).
4
๐”ธ๐•ก๐•๐•’๐•ฅ๐•š๐•ค๐•ค๐•–๐•ž๐•–๐•Ÿ๐•ฅ (๐•‚๐•ฆ๐•ฃ๐•ฅ๐• ๐•ค๐•š๐•ค): informe sur la prรฉsence de valeurs extrรชmes. Une kurtosis รฉlevรฉe traduit des queues รฉpaisses, donc plus de valeurs extrรชmes.

_______________________________________________________________________

✅ ๐•ญ๐–Ž๐–Š๐–“ ๐–•๐–—๐–Š๐–“๐–‰๐–—๐–Š ๐–Š๐–“ ๐–ˆ๐–”๐–’๐–•๐–™๐–Š ๐–‘’๐–†๐–˜๐–ž๐–’รฉ๐–™๐–—๐–Ž๐–Š ๐–Š๐–™ ๐–‘’๐–†๐–•๐–‘๐–†๐–™๐–Ž๐–˜๐–˜๐–Š๐–’๐–Š๐–“๐–™ ๐–•๐–Š๐–—๐–’๐–Š๐–™ ๐–‰๐–Š:

  • Dรฉtecter les biais et les valeurs aberrantes pouvant fausser les analyses ;
  • Amรฉliorer la prรฉcision des modรจles prรฉdictifs en tenant compte de la forme rรฉelle des distributions ;
  • Prendre des dรฉcisions plus รฉclairรฉes ร  partir de donnรฉes fidรจlement interprรฉtรฉes.

_______________________________________________________________________

❌ ๐•ท๐–Š๐–˜ ๐–Ž๐–Œ๐–“๐–”๐–—๐–Š๐–— ๐–•๐–Š๐–š๐–™:

  • Produire des rรฉsultats erronรฉs si la distribution n’est pas normale ;
  • Gรฉnรฉrer des modรจles inadรฉquats, insensibles aux extrรชmes ;
  • Biaiser les comparaisons entre plusieurs jeux de donnรฉes.

_______________________________________________________________________

๐Ÿงช ๐•ฎ๐–”๐–’๐–’๐–Š๐–“๐–™ ๐–‘๐–Š๐–˜ ๐–’๐–Š๐–˜๐–š๐–—๐–Š๐–— ?
๐Ÿ”น ๐”ผ๐•Ÿ โ„ : utilisez ๐—ฒ๐Ÿญ๐Ÿฌ๐Ÿณ๐Ÿญ::๐˜€๐—ธ๐—ฒ๐˜„๐—ป๐—ฒ๐˜€๐˜€() et ๐—ฒ๐Ÿญ๐Ÿฌ๐Ÿณ๐Ÿญ::๐—ธ๐˜‚๐—ฟ๐˜๐—ผ๐˜€๐—ถ๐˜€() pour calculer ces moments. Visualisez-les avec ggplot2.
๐Ÿ”น ๐”ผ๐•Ÿ โ„™๐•ช๐•ฅ๐•™๐• ๐•Ÿ :utilisez s๐œ๐ข๐ฉ๐ฒ.๐ฌ๐ญ๐š๐ญ๐ฌ.๐ฌ๐ค๐ž๐ฐ() et ๐ฌ๐œ๐ข๐ฉ๐ฒ.๐ฌ๐ญ๐š๐ญ๐ฌ.๐ค๐ฎ๐ซ๐ญ๐จ๐ฌ๐ข๐ฌ(), puis ๐ฆ๐š๐ญ๐ฉ๐ฅ๐จ๐ญ๐ฅ๐ข๐› ou ๐ฌ๐ž๐š๐›๐จ๐ซ๐ง pour les reprรฉsentations graphiques.

_______________________________________________________________________

๐Ÿ’ก Le graphique ci-dessous montre l’impact visuel des variations de skewness et de kurtosis, ร  partir de donnรฉes simulรฉes dans R, analysรฉes avec e1071 et visualisรฉes via ggplot2. L’ajustement de la kurtosis ร  l’รฉchelle classique (+3) permet une lecture plus fidรจle des distributions.

_______________________________________________________________________

๐Ÿ“š ๐ŸŽ“Vous souhaitez en savoir plus sur les statistiques, la science des donnรฉes, SPSS, STATA, R et Python ?

Inscrivez-vous dรจs maintenant pour rรฉserver votre place pour la prochaine session de notre formation en ร‰๐—ฐ๐—ผ๐—ป๐—ผ๐—บรฉ๐˜๐—ฟ๐—ถ๐—ฒ ๐—ฒ๐˜ ๐—ง๐—ฒ๐—ฐ๐—ต๐—ป๐—ถ๐—พ๐˜‚๐—ฒ๐˜€ ๐—ค๐˜‚๐—ฎ๐—ป๐˜๐—ถ๐˜๐—ฎ๐˜๐—ถ๐˜ƒ๐—ฒ๐˜€ 



#structuredesdonnรฉes #rstatistiques #analystedonnees #bigdata #dataanalysis #ggplot2 #intelligenceartificielle #statistiques

 

Commentaires

Posts les plus consultรฉs de ce blog

ร‰conomรฉtrie des donnรฉes de panel: de la thรฉorie ร  la pratique