๐‘ป๐’†๐’”๐’• ๐’…๐’– ๐‘ฒ๐’‰๐’Š-๐’…๐’†๐’–๐’™ : ๐’„๐’๐’Ž๐’‘๐’“๐’†๐’๐’…๐’“๐’† ๐’’๐’‚๐’”๐’”๐’๐’„๐’Š๐’‚๐’•๐’Š๐’๐’ ๐’†๐’๐’•๐’“๐’† ๐’—๐’‚๐’“๐’Š๐’‚๐’ƒ๐’๐’†๐’” ๐’„๐’‚๐’•๐’†́๐’ˆ๐’๐’“๐’Š๐’†๐’๐’๐’†๐’”

Le ๐’•๐’†๐’”๐’• ๐’…๐’– ๐‘ฒ๐’‰๐’Š-๐’…๐’†๐’–๐’™ est un test statistique ๐’๐’๐’ ๐’‘๐’‚๐’“๐’‚๐’Ž๐’†́๐’•๐’“๐’Š๐’’๐’–๐’† utilisรฉ pour analyser des ๐’…๐’๐’๐’๐’†́๐’†๐’” ๐’„๐’‚๐’•๐’†́๐’ˆ๐’๐’“๐’Š๐’†๐’๐’๐’†๐’”.

Il permet de comparer les ๐’‡๐’“๐’†́๐’’๐’–๐’†๐’๐’„๐’†๐’” ๐’๐’ƒ๐’”๐’†๐’“๐’—๐’†́๐’†๐’” aux ๐’‡๐’“๐’†́๐’’๐’–๐’†๐’๐’„๐’†๐’” ๐’‚๐’•๐’•๐’†๐’๐’…๐’–๐’†๐’”.

Autrement dit, il rรฉpond ร  une question simple :

๐‘ณ๐’†๐’” ๐’…๐’Š๐’‡๐’‡๐’†́๐’“๐’†๐’๐’„๐’†๐’” ๐’๐’ƒ๐’”๐’†๐’“๐’—๐’†́๐’†๐’” ๐’”๐’๐’๐’•-๐’†๐’๐’๐’†๐’” ๐’“๐’†́๐’†๐’๐’๐’†๐’” ๐’๐’– ๐’…๐’–๐’†๐’” ๐’‚๐’– ๐’‰๐’‚๐’”๐’‚๐’“๐’… ?

On l’utilise souvent pour :

๐’•๐’†๐’”๐’•๐’†๐’“ ๐’๐’Š๐’๐’…๐’†́๐’‘๐’†๐’๐’…๐’‚๐’๐’„๐’† ๐’†๐’๐’•๐’“๐’† ๐’…๐’†๐’–๐’™ ๐’—๐’‚๐’“๐’Š๐’‚๐’ƒ๐’๐’†๐’”,
๐’—๐’†́๐’“๐’Š๐’‡๐’Š๐’†๐’“ ๐’๐’‚๐’‹๐’–๐’”๐’•๐’†๐’Ž๐’†๐’๐’• ๐’‚̀ ๐’–๐’๐’† ๐’…๐’Š๐’”๐’•๐’“๐’Š๐’ƒ๐’–๐’•๐’Š๐’๐’,
ou
๐’”๐’†́๐’๐’†๐’„๐’•๐’Š๐’๐’๐’๐’†๐’“ ๐’…๐’†๐’” ๐’—๐’‚๐’“๐’Š๐’‚๐’ƒ๐’๐’†๐’” en Machine Learning.

๐‘ณ๐’‚ ๐’‡๐’๐’“๐’Ž๐’–๐’๐’† ๐’…๐’– ๐‘ฒ๐’‰๐’Š-๐’…๐’†๐’–๐’™

ฯ‡² = ฮฃ (Oแตข − Eแตข)² / Eแตข

Avec :

Oแตข : frรฉquence observรฉe dans la catรฉgorie i
E
แตข : frรฉquence attendue dans la catรฉgorie i

Plus la valeur de ฯ‡² est รฉlevรฉe, plus l’รฉcart entre ce qui est observรฉ et ce qui รฉtait attendu est important.

๐‘ช๐’๐’Ž๐’Ž๐’†๐’๐’• ๐’„̧๐’‚ ๐’‡๐’๐’๐’„๐’•๐’Š๐’๐’๐’๐’† ?

๐Ÿ. On formule l’hypothรจse nulle, souvent : ๐’Š๐’ ๐’๐’š ๐’‚ ๐’‘๐’‚๐’” ๐’…๐’† ๐’“๐’†๐’๐’‚๐’•๐’Š๐’๐’ entre les variables.
๐Ÿ. On calcule les frรฉquences attendues sous cette hypothรจse.
๐Ÿ‘. On compare les frรฉquences observรฉes aux frรฉquences attendues.
๐Ÿ’. On calcule la statistique ฯ‡².
๐Ÿ“. On utilise la p-value pour dรฉcider si l’on rejette ou non l’hypothรจse nulle.

La ๐’‘-๐’—๐’‚๐’๐’–๐’† indique la probabilitรฉ d’obtenir un tel รฉcart simplement par hasard.

๐‘ฒ๐’‰๐’Š-๐’…๐’†๐’–๐’™ ๐’—๐’” ๐’•-๐’•๐’†๐’”๐’•

Le ๐’•-๐’•๐’†๐’”๐’• compare les moyennes de variables quantitatives et suppose souvent une certaine normalitรฉ.

Le ๐’•๐’†๐’”๐’• ๐’…๐’– ๐‘ฒ๐’‰๐’Š-๐’…๐’†๐’–๐’™, lui, analyse les relations entre des variables catรฉgorielles.

Ce sont donc deux outils diffรฉrents, adaptรฉs ร  des types de donnรฉes diffรฉrents.

๐‘ฐ๐’…๐’†́๐’† ๐’„๐’๐’†́ :
Le
๐’•๐’†๐’”๐’• ๐’…๐’– ๐‘ฒ๐’‰๐’Š-๐’…๐’†๐’–๐’™ est particuliรจrement utile lorsque l’on veut savoir si deux variables qualitatives sont associรฉes ou indรฉpendantes.

Si vous avez trouvรฉ cette publication utile, n'hรฉsitez pas ร  ๐’๐’‚ ๐’๐’Š๐’Œ๐’†๐’“ ๐’†๐’• ร  ๐’๐’‚ ๐’‘๐’‚๐’“๐’•๐’‚๐’ˆ๐’†๐’“ avec vos amis et collรจgues ! Pour mieux apprendre l’utilisation des logiciel et modรจles statistiques, nous vous invitons ร  prendre part ร  la prochaine session de notre formation en ๐™€๐™˜๐™ค๐™ฃ๐™ค๐™ขรฉ๐™ฉ๐™ง๐™ž๐™š ๐™š๐™ฉ ๐™๐™š๐™˜๐™๐™ฃ๐™ž๐™ฆ๐™ช๐™š๐™จ ๐™Œ๐™ช๐™–๐™ฃ๐™ฉ๐™ž๐™ฉ๐™–๐™ฉ๐™ž๐™ซ๐™š๐™จ https://forms.gle/yZAZimRXbTFbUWZk6



#Statistiques #KhiDeux #AnalyseDesDonnรฉes #MachineLearning #ร‰conomรฉtrie

 

Commentaires

Posts les plus consultรฉs de ce blog

ร‰conomรฉtrie des donnรฉes de panel: de la thรฉorie ร  la pratique