๐Ÿ“Š ๐—Ÿ๐—ฎ ๐—ž๐˜‚๐—ฟ๐˜๐—ผ๐˜€๐—ถ๐˜€ : ๐—ฐ๐—ผ๐—บ๐—บ๐—ฒ๐—ป๐˜ ๐—บ๐—ฒ๐˜€๐˜‚๐—ฟ๐—ฒ๐—ฟ ๐—น๐—ฒ๐˜€ ๐˜ƒ๐—ฎ๐—น๐—ฒ๐˜‚๐—ฟ๐˜€ ๐—ฒ๐˜…๐˜๐—ฟ๐—ฒ̂๐—บ๐—ฒ๐˜€ ๐—ฑ’๐˜‚๐—ป๐—ฒ ๐—ฑ๐—ถ๐˜€๐˜๐—ฟ๐—ถ๐—ฏ๐˜‚๐˜๐—ถ๐—ผ๐—ป ?

En analyse de donnรฉes, il ne suffit pas seulement de connaรฎtre la moyenne ou l’รฉcart-type.

Il faut aussi comprendre la forme de la distribution.

Parmi les indicateurs importants, on retrouve la ๐—ธ๐˜‚๐—ฟ๐˜๐—ผ๐˜€๐—ถ๐˜€.

๐Ÿ”Ž ๐—ค๐˜‚๐—ฒ๐˜€๐˜-๐—ฐ๐—ฒ ๐—พ๐˜‚๐—ฒ ๐—น๐—ฎ ๐—ธ๐˜‚๐—ฟ๐˜๐—ผ๐˜€๐—ถ๐˜€ ?

La ๐—ธ๐˜‚๐—ฟ๐˜๐—ผ๐˜€๐—ถ๐˜€ mesure le degrรฉ de concentration des valeurs extrรชmes dans une distribution.

Autrement dit, elle permet de savoir si les donnรฉes prรฉsentent beaucoup ou peu de valeurs รฉloignรฉes du centre.

Une ๐—ธ๐˜‚๐—ฟ๐˜๐—ผ๐˜€๐—ถ๐˜€ ๐—ฒ́๐—น๐—ฒ๐˜ƒ๐—ฒ́๐—ฒ signifie que la distribution possรจde des queues รฉpaisses, donc davantage de valeurs extrรชmes ou d’observations atypiques.

Une ๐—ธ๐˜‚๐—ฟ๐˜๐—ผ๐˜€๐—ถ๐˜€ ๐—ณ๐—ฎ๐—ถ๐—ฏ๐—น๐—ฒ indique au contraire des queues plus lรฉgรจres, avec moins de valeurs extrรชmes.

๐Ÿ“Œ ๐—ฃ๐—ผ๐˜‚๐—ฟ๐—พ๐˜‚๐—ผ๐—ถ ๐—ฐ๐—ฒ๐˜€๐˜ ๐—ถ๐—บ๐—ฝ๐—ผ๐—ฟ๐˜๐—ฎ๐—ป๐˜ ?

La kurtosis est trรจs utile dans plusieurs domaines :

en ๐—ณ๐—ถ๐—ป๐—ฎ๐—ป๐—ฐ๐—ฒ, pour analyser les risques extrรชmes ;
en ๐—ฑ๐—ฒ́๐˜๐—ฒ๐—ฐ๐˜๐—ถ๐—ผ๐—ป ๐—ฑ๐—ฎ๐—ป๐—ผ๐—บ๐—ฎ๐—น๐—ถ๐—ฒ๐˜€, pour repรฉrer les observations atypiques ;
en ๐˜๐—ฒ๐˜€๐˜๐˜€ ๐—ฑ๐—ฒ ๐—ป๐—ผ๐—ฟ๐—บ๐—ฎ๐—น๐—ถ๐˜๐—ฒ́, pour vรฉrifier si les donnรฉes ressemblent ร  une distribution normale.

๐Ÿ“ ๐—™๐—ผ๐—ฟ๐—บ๐˜‚๐—น๐—ฒ ๐—ฑ๐—ฒ ๐—น๐—ฎ ๐—ธ๐˜‚๐—ฟ๐˜๐—ผ๐˜€๐—ถ๐˜€

Kurt[X] = E[(X - ฮผ)⁴] / ฯƒ

Avec :

ฮผ = moyenne de la variable
ฯƒ⁴ = variance au carrรฉ
E[(X - ฮผ)⁴]
= moment centrรฉ d’ordre 4

Pour une ๐—ฑ๐—ถ๐˜€๐˜๐—ฟ๐—ถ๐—ฏ๐˜‚๐˜๐—ถ๐—ผ๐—ป ๐—ป๐—ผ๐—ฟ๐—บ๐—ฎ๐—น๐—ฒ, la kurtosis est รฉgale ร  3.

On utilise souvent l’๐—ฒ๐˜…๐—ฐ๐—ฒ̀๐˜€ ๐—ฑ๐—ฒ ๐—ธ๐˜‚๐—ฟ๐˜๐—ผ๐˜€๐—ถ๐˜€ :

ฮณ₂ = Kurt[X] - 3

Lorsque ฮณ₂ = 0, la distribution est proche d’une distribution normale.

๐—–๐—ผ๐—บ๐—บ๐—ฒ๐—ป๐˜ ๐—ถ๐—ป๐˜๐—ฒ๐—ฟ๐—ฝ๐—ฟ๐—ฒ́๐˜๐—ฒ๐—ฟ ๐—น๐—ฎ ๐—ธ๐˜‚๐—ฟ๐˜๐—ผ๐˜€๐—ถ๐˜€ ?

๐—ฌ₂ < 0 : distribution ๐—ฝ๐—น๐—ฎ๐˜๐˜†๐—ฐ๐˜‚๐—ฟ๐˜๐—ถ๐—พ๐˜‚๐—ฒ
Les queues sont lรฉgรจres et les valeurs extrรชmes sont moins frรฉquentes.

๐—ฌ₂ = 0 : distribution ๐—บ๐—ฒ́๐˜€๐—ผ๐—ฐ๐˜‚๐—ฟ๐˜๐—ถ๐—พ๐˜‚๐—ฒ
La distribution ressemble ร  une loi normale.

๐—ฌ₂ > 0 : distribution ๐—น๐—ฒ๐—ฝ๐˜๐—ผ๐—ฐ๐˜‚๐—ฟ๐˜๐—ถ๐—พ๐˜‚๐—ฒ
Les queues sont รฉpaisses et les valeurs extrรชmes sont plus frรฉquentes.

Plus la kurtosis est รฉlevรฉe, plus les รฉvรฉnements extrรชmes sont probables par rapport ร  une distribution normale.

๐Ÿง ๐——๐—ถ๐—ณ๐—ณ๐—ฒ́๐—ฟ๐—ฒ๐—ป๐—ฐ๐—ฒ ๐—ฒ๐—ป๐˜๐—ฟ๐—ฒ ๐—ธ๐˜‚๐—ฟ๐˜๐—ผ๐˜€๐—ถ๐˜€ ๐—ฒ๐˜ ๐˜€๐—ธ๐—ฒ๐˜„๐—ป๐—ฒ๐˜€๐˜€

La ๐˜€๐—ธ๐—ฒ๐˜„๐—ป๐—ฒ๐˜€๐˜€ mesure l’asymรฉtrie d’une distribution.

Elle permet de savoir si la distribution est รฉtirรฉe vers la gauche ou vers la droite.

La ๐—ธ๐˜‚๐—ฟ๐˜๐—ผ๐˜€๐—ถ๐˜€, quant ร  elle, mesure l’importance des valeurs extrรชmes dans les queues de la distribution.

En rรฉsumรฉ :

๐—ฆ๐—ธ๐—ฒ๐˜„๐—ป๐—ฒ๐˜€๐˜€ = asymรฉtrie
๐—ž๐˜‚๐—ฟ๐˜๐—ผ๐˜€๐—ถ๐˜€ = valeurs extrรชmes

Une distribution peut donc รชtre symรฉtrique tout en ayant une kurtosis รฉlevรฉe.

๐ŸŽฏ ๐—ค๐˜‚๐—ฎ๐—ป๐—ฑ ๐˜‚๐˜๐—ถ๐—น๐—ถ๐˜€๐—ฒ๐—ฟ ๐—น๐—ฎ ๐—ธ๐˜‚๐—ฟ๐˜๐—ผ๐˜€๐—ถ๐˜€ ?

On l’utilise notamment lorsque l’on veut :

analyser les rendements financiers ;
identifier les donnรฉes susceptibles de contenir des valeurs extrรชmes ;
vรฉrifier les hypothรจses de normalitรฉ ;
choisir un modรจle statistique adaptรฉ aux caractรฉristiques des donnรฉes.

๐Ÿ“Œ ๐—”̀ ๐—ฟ๐—ฒ๐˜๐—ฒ๐—ป๐—ถ๐—ฟ

La ๐—ธ๐˜‚๐—ฟ๐˜๐—ผ๐˜€๐—ถ๐˜€ ne mesure pas simplement si une courbe est pointue ou plate.
Elle renseigne surtout sur la prรฉsence de valeurs extrรชmes dans une distribution.

C’est donc un indicateur essentiel pour mieux comprendre la structure des donnรฉes avant toute modรฉlisation statistique.

________________________________________
Si vous avez trouvรฉ cette publication utile, n'hรฉsitez pas ร  ๐’๐’‚ ๐’๐’Š๐’Œ๐’†๐’“ ๐’†๐’• ร  ๐’๐’‚ ๐’‘๐’‚๐’“๐’•๐’‚๐’ˆ๐’†๐’“ avec vos amis et collรจgues !

Pour mieux apprendre l’utilisation des logiciel et modรจles statistiques, nous vous invitons ร  prendre part ร  la prochaine session de notre formation en ๐™€๐™˜๐™ค๐™ฃ๐™ค๐™ขรฉ๐™ฉ๐™ง๐™ž๐™š ๐™š๐™ฉ ๐™๐™š๐™˜๐™๐™ฃ๐™ž๐™ฆ๐™ช๐™š๐™จ ๐™Œ๐™ช๐™–๐™ฃ๐™ฉ๐™ž๐™ฉ๐™–๐™ฉ๐™ž๐™ซ๐™š๐™จ https://forms.gle/yZAZimRXbTFbUWZk6




________________________________________

#Statistiques #AnalyseDeDonnรฉes #DataScience #Economรฉtrie #FormationStatistique

 

Commentaires

Posts les plus consultรฉs de ce blog

ร‰conomรฉtrie des donnรฉes de panel: de la thรฉorie ร  la pratique