๐ ๐๐ฎ ๐๐๐ฟ๐๐ผ๐๐ถ๐ : ๐ฐ๐ผ๐บ๐บ๐ฒ๐ป๐ ๐บ๐ฒ๐๐๐ฟ๐ฒ๐ฟ ๐น๐ฒ๐ ๐๐ฎ๐น๐ฒ๐๐ฟ๐ ๐ฒ๐ ๐๐ฟ๐ฒ̂๐บ๐ฒ๐ ๐ฑ’๐๐ป๐ฒ ๐ฑ๐ถ๐๐๐ฟ๐ถ๐ฏ๐๐๐ถ๐ผ๐ป ?
En analyse de donnรฉes, il ne suffit pas seulement de connaรฎtre la moyenne ou l’รฉcart-type.
Il faut aussi comprendre la forme de la distribution.
Parmi les
indicateurs importants, on retrouve la ๐ธ๐๐ฟ๐๐ผ๐๐ถ๐.
๐ ๐ค๐’๐ฒ๐๐-๐ฐ๐ฒ ๐พ๐๐ฒ ๐น๐ฎ ๐ธ๐๐ฟ๐๐ผ๐๐ถ๐ ?
La ๐ธ๐๐ฟ๐๐ผ๐๐ถ๐ mesure le degrรฉ de concentration des
valeurs extrรชmes dans une distribution.
Autrement
dit, elle permet de savoir si les donnรฉes prรฉsentent beaucoup ou peu de valeurs
รฉloignรฉes du centre.
Une ๐ธ๐๐ฟ๐๐ผ๐๐ถ๐ ๐ฒ́๐น๐ฒ๐๐ฒ́๐ฒ signifie que la distribution possรจde des queues
รฉpaisses, donc davantage de valeurs extrรชmes ou d’observations atypiques.
Une ๐ธ๐๐ฟ๐๐ผ๐๐ถ๐ ๐ณ๐ฎ๐ถ๐ฏ๐น๐ฒ indique au contraire des queues plus
lรฉgรจres, avec moins de valeurs extrรชmes.
๐ ๐ฃ๐ผ๐๐ฟ๐พ๐๐ผ๐ถ ๐ฐ’๐ฒ๐๐ ๐ถ๐บ๐ฝ๐ผ๐ฟ๐๐ฎ๐ป๐ ?
La kurtosis
est trรจs utile dans plusieurs domaines :
✅ en ๐ณ๐ถ๐ป๐ฎ๐ป๐ฐ๐ฒ, pour analyser les risques extrรชmes ;
✅ en ๐ฑ๐ฒ́๐๐ฒ๐ฐ๐๐ถ๐ผ๐ป ๐ฑ’๐ฎ๐ป๐ผ๐บ๐ฎ๐น๐ถ๐ฒ๐, pour repรฉrer les observations atypiques
;
✅ en ๐๐ฒ๐๐๐ ๐ฑ๐ฒ ๐ป๐ผ๐ฟ๐บ๐ฎ๐น๐ถ๐๐ฒ́, pour vรฉrifier si les donnรฉes
ressemblent ร une distribution normale.
๐ ๐๐ผ๐ฟ๐บ๐๐น๐ฒ ๐ฑ๐ฒ ๐น๐ฎ ๐ธ๐๐ฟ๐๐ผ๐๐ถ๐
Kurt[X]
= E[(X - ฮผ)⁴] / ฯ⁴
Avec :
ฮผ = moyenne
de la variable
ฯ⁴ = variance au carrรฉ
E[(X - ฮผ)⁴] = moment centrรฉ d’ordre 4
Pour une ๐ฑ๐ถ๐๐๐ฟ๐ถ๐ฏ๐๐๐ถ๐ผ๐ป ๐ป๐ผ๐ฟ๐บ๐ฎ๐น๐ฒ, la kurtosis est รฉgale ร 3.
On utilise
souvent l’๐ฒ๐
๐ฐ๐ฒ̀๐ ๐ฑ๐ฒ ๐ธ๐๐ฟ๐๐ผ๐๐ถ๐ :
ฮณ₂ = Kurt[X]
- 3
Lorsque ฮณ₂ = 0, la distribution est proche d’une
distribution normale.
⚡ ๐๐ผ๐บ๐บ๐ฒ๐ป๐ ๐ถ๐ป๐๐ฒ๐ฟ๐ฝ๐ฟ๐ฒ́๐๐ฒ๐ฟ ๐น๐ฎ ๐ธ๐๐ฟ๐๐ผ๐๐ถ๐ ?
① ๐ฌ₂ < 0 : distribution ๐ฝ๐น๐ฎ๐๐๐ฐ๐๐ฟ๐๐ถ๐พ๐๐ฒ
Les queues sont lรฉgรจres et les valeurs extrรชmes sont moins frรฉquentes.
② ๐ฌ₂ = 0 : distribution ๐บ๐ฒ́๐๐ผ๐ฐ๐๐ฟ๐๐ถ๐พ๐๐ฒ
La distribution ressemble ร une loi normale.
③ ๐ฌ₂ > 0 : distribution ๐น๐ฒ๐ฝ๐๐ผ๐ฐ๐๐ฟ๐๐ถ๐พ๐๐ฒ
Les queues sont รฉpaisses et les valeurs extrรชmes sont plus frรฉquentes.
④ Plus la kurtosis est รฉlevรฉe, plus les รฉvรฉnements
extrรชmes sont probables par rapport ร une distribution normale.
๐ง ๐๐ถ๐ณ๐ณ๐ฒ́๐ฟ๐ฒ๐ป๐ฐ๐ฒ ๐ฒ๐ป๐๐ฟ๐ฒ ๐ธ๐๐ฟ๐๐ผ๐๐ถ๐ ๐ฒ๐ ๐๐ธ๐ฒ๐๐ป๐ฒ๐๐
La ๐๐ธ๐ฒ๐๐ป๐ฒ๐๐ mesure l’asymรฉtrie d’une distribution.
Elle permet
de savoir si la distribution est รฉtirรฉe vers la gauche ou vers la droite.
La ๐ธ๐๐ฟ๐๐ผ๐๐ถ๐, quant ร elle, mesure l’importance des
valeurs extrรชmes dans les queues de la distribution.
En rรฉsumรฉ :
๐ฆ๐ธ๐ฒ๐๐ป๐ฒ๐๐ = asymรฉtrie
๐๐๐ฟ๐๐ผ๐๐ถ๐ = valeurs extrรชmes
Une
distribution peut donc รชtre symรฉtrique tout en ayant une kurtosis รฉlevรฉe.
๐ฏ ๐ค๐๐ฎ๐ป๐ฑ ๐๐๐ถ๐น๐ถ๐๐ฒ๐ฟ ๐น๐ฎ ๐ธ๐๐ฟ๐๐ผ๐๐ถ๐ ?
On l’utilise
notamment lorsque l’on veut :
✅ analyser les rendements financiers ;
✅ identifier les donnรฉes susceptibles de
contenir des valeurs extrรชmes ;
✅ vรฉrifier les hypothรจses de normalitรฉ ;
✅ choisir un modรจle statistique adaptรฉ aux
caractรฉristiques des donnรฉes.
๐ ๐̀ ๐ฟ๐ฒ๐๐ฒ๐ป๐ถ๐ฟ
La ๐ธ๐๐ฟ๐๐ผ๐๐ถ๐ ne mesure pas simplement si une courbe
est pointue ou plate.
Elle renseigne surtout sur la prรฉsence de valeurs extrรชmes dans une
distribution.
C’est donc un
indicateur essentiel pour mieux comprendre la structure des donnรฉes avant toute
modรฉlisation statistique.
________________________________________
Si vous avez trouvรฉ cette publication utile,
n'hรฉsitez pas ร ๐๐ ๐๐๐๐๐ ๐๐ ร ๐๐ ๐๐๐๐๐๐๐๐ avec vos amis et collรจgues
!
Pour mieux apprendre l’utilisation des logiciel et
modรจles statistiques, nous vous invitons ร prendre part ร la prochaine session
de notre formation en ๐๐๐ค๐ฃ๐ค๐ขรฉ๐ฉ๐ง๐๐ ๐๐ฉ ๐๐๐๐๐ฃ๐๐ฆ๐ช๐๐จ ๐๐ช๐๐ฃ๐ฉ๐๐ฉ๐๐ฉ๐๐ซ๐๐จ https://forms.gle/yZAZimRXbTFbUWZk6
________________________________________
#Statistiques #AnalyseDeDonnรฉes #DataScience #Economรฉtrie
#FormationStatistique

Commentaires
Enregistrer un commentaire