𝑻𝒆𝒔𝒕 𝒅𝒖 𝑲𝒉𝒊-𝒅𝒆𝒖𝒙 : 𝒄𝒐𝒎𝒑𝒓𝒆𝒏𝒅𝒓𝒆 𝒍’𝒂𝒔𝒔𝒐𝒄𝒊𝒂𝒕𝒊𝒐𝒏 𝒆𝒏𝒕𝒓𝒆 𝒗𝒂𝒓𝒊𝒂𝒃𝒍𝒆𝒔 𝒄𝒂𝒕𝒆́𝒈𝒐𝒓𝒊𝒆𝒍𝒍𝒆𝒔

Le 𝒕𝒆𝒔𝒕 𝒅𝒖 𝑲𝒉𝒊-𝒅𝒆𝒖𝒙 est un test statistique 𝒏𝒐𝒏 𝒑𝒂𝒓𝒂𝒎𝒆́𝒕𝒓𝒊𝒒𝒖𝒆 utilisé pour analyser des 𝒅𝒐𝒏𝒏𝒆́𝒆𝒔 𝒄𝒂𝒕𝒆́𝒈𝒐𝒓𝒊𝒆𝒍𝒍𝒆𝒔.

Il permet de comparer les 𝒇𝒓𝒆́𝒒𝒖𝒆𝒏𝒄𝒆𝒔 𝒐𝒃𝒔𝒆𝒓𝒗𝒆́𝒆𝒔 aux 𝒇𝒓𝒆́𝒒𝒖𝒆𝒏𝒄𝒆𝒔 𝒂𝒕𝒕𝒆𝒏𝒅𝒖𝒆𝒔.

Autrement dit, il répond à une question simple :

𝑳𝒆𝒔 𝒅𝒊𝒇𝒇𝒆́𝒓𝒆𝒏𝒄𝒆𝒔 𝒐𝒃𝒔𝒆𝒓𝒗𝒆́𝒆𝒔 𝒔𝒐𝒏𝒕-𝒆𝒍𝒍𝒆𝒔 𝒓𝒆́𝒆𝒍𝒍𝒆𝒔 𝒐𝒖 𝒅𝒖𝒆𝒔 𝒂𝒖 𝒉𝒂𝒔𝒂𝒓𝒅 ?

On l’utilise souvent pour :

𝒕𝒆𝒔𝒕𝒆𝒓 𝒍’𝒊𝒏𝒅𝒆́𝒑𝒆𝒏𝒅𝒂𝒏𝒄𝒆 𝒆𝒏𝒕𝒓𝒆 𝒅𝒆𝒖𝒙 𝒗𝒂𝒓𝒊𝒂𝒃𝒍𝒆𝒔,
𝒗𝒆́𝒓𝒊𝒇𝒊𝒆𝒓 𝒍’𝒂𝒋𝒖𝒔𝒕𝒆𝒎𝒆𝒏𝒕 𝒂̀ 𝒖𝒏𝒆 𝒅𝒊𝒔𝒕𝒓𝒊𝒃𝒖𝒕𝒊𝒐𝒏,
ou 𝒔𝒆́𝒍𝒆𝒄𝒕𝒊𝒐𝒏𝒏𝒆𝒓 𝒅𝒆𝒔 𝒗𝒂𝒓𝒊𝒂𝒃𝒍𝒆𝒔 en Machine Learning.

𝑳𝒂 𝒇𝒐𝒓𝒎𝒖𝒍𝒆 𝒅𝒖 𝑲𝒉𝒊-𝒅𝒆𝒖𝒙

χ² = Σ (Oᵢ − Eᵢ)² / Eᵢ

Avec :

Oᵢ : fréquence observée dans la catégorie i
Eᵢ : fréquence attendue dans la catégorie i

Plus la valeur de χ² est élevée, plus l’écart entre ce qui est observé et ce qui était attendu est important.

𝑪𝒐𝒎𝒎𝒆𝒏𝒕 𝒄̧𝒂 𝒇𝒐𝒏𝒄𝒕𝒊𝒐𝒏𝒏𝒆 ?

𝟏. On formule l’hypothèse nulle, souvent : 𝒊𝒍 𝒏’𝒚 𝒂 𝒑𝒂𝒔 𝒅𝒆 𝒓𝒆𝒍𝒂𝒕𝒊𝒐𝒏 entre les variables.
𝟐. On calcule les fréquences attendues sous cette hypothèse.
𝟑. On compare les fréquences observées aux fréquences attendues.
𝟒. On calcule la statistique χ².
𝟓. On utilise la p-value pour décider si l’on rejette ou non l’hypothèse nulle.

La 𝒑-𝒗𝒂𝒍𝒖𝒆 indique la probabilité d’obtenir un tel écart simplement par hasard.

𝑲𝒉𝒊-𝒅𝒆𝒖𝒙 𝒗𝒔 𝒕-𝒕𝒆𝒔𝒕

Le 𝒕-𝒕𝒆𝒔𝒕 compare les moyennes de variables quantitatives et suppose souvent une certaine normalité.

Le 𝒕𝒆𝒔𝒕 𝒅𝒖 𝑲𝒉𝒊-𝒅𝒆𝒖𝒙, lui, analyse les relations entre des variables catégorielles.

Ce sont donc deux outils différents, adaptés à des types de données différents.

𝑰𝒅𝒆́𝒆 𝒄𝒍𝒆́ :
Le 𝒕𝒆𝒔𝒕 𝒅𝒖 𝑲𝒉𝒊-𝒅𝒆𝒖𝒙 est particulièrement utile lorsque l’on veut savoir si deux variables qualitatives sont associées ou indépendantes.

Si vous avez trouvé cette publication utile, n'hésitez pas à 𝒍𝒂 𝒍𝒊𝒌𝒆𝒓 𝒆𝒕 à 𝒍𝒂 𝒑𝒂𝒓𝒕𝒂𝒈𝒆𝒓 avec vos amis et collègues ! Pour mieux apprendre l’utilisation des logiciel et modèles statistiques, nous vous invitons à prendre part à la prochaine session de notre formation en 𝙀𝙘𝙤𝙣𝙤𝙢é𝙩𝙧𝙞𝙚 𝙚𝙩 𝙏𝙚𝙘𝙝𝙣𝙞𝙦𝙪𝙚𝙨 𝙌𝙪𝙖𝙣𝙩𝙞𝙩𝙖𝙩𝙞𝙫𝙚𝙨 https://forms.gle/yZAZimRXbTFbUWZk6

#Statistiques #KhiDeux #AnalyseDesDonnées #MachineLearning #Économétrie

Rechercher dans ce blog

Statistical Models for Social Sciences

𝑻𝒆𝒔𝒕 𝒅𝒖 𝑲𝒉𝒊-𝒅𝒆𝒖𝒙 : 𝒄𝒐𝒎𝒑𝒓𝒆𝒏𝒅𝒓𝒆 𝒍’𝒂𝒔𝒔𝒐𝒄𝒊𝒂𝒕𝒊𝒐𝒏 𝒆𝒏𝒕𝒓𝒆 𝒗𝒂𝒓𝒊𝒂𝒃𝒍𝒆𝒔 𝒄𝒂𝒕𝒆́𝒈𝒐𝒓𝒊𝒆𝒍𝒍𝒆𝒔

Commentaires

Enregistrer un commentaire

Posts les plus consultés de ce blog

Économétrie des données de panel: de la théorie à la pratique

panel ARDL in STATA

comment exporter les résultats des estimations de STATA vers word, Excel...