Articles

𝑹² 𝒐𝒖 𝒄𝒐𝒆𝒇𝒇𝒊𝒄𝒊𝒆𝒏𝒕 𝒅𝒆 𝒅𝒆́𝒕𝒆𝒓𝒎𝒊𝒏𝒂𝒕𝒊𝒐𝒏 : 𝒄𝒐𝒎𝒎𝒆𝒏𝒕 𝒆́𝒗𝒂𝒍𝒖𝒆𝒓 𝒍𝒂 𝒒𝒖𝒂𝒍𝒊𝒕𝒆́ 𝒅’𝒖𝒏 𝒎𝒐𝒅𝒆̀𝒍𝒆 ?

Image
Le 𝑹 ² , aussi appelé 𝒄𝒐𝒆𝒇𝒇𝒊𝒄𝒊𝒆𝒏𝒕 𝒅𝒆 𝒅𝒆 ́ 𝒕𝒆𝒓𝒎𝒊𝒏𝒂𝒕𝒊𝒐𝒏 , est un indicateur qui permet de mesurer la part de la variation d’une variable dépendante expliquée par un modèle. Autrement dit, il répond à une question simple : 𝑸𝒖𝒆𝒍𝒍𝒆 𝒑𝒂𝒓𝒕 𝒅𝒆𝒔 𝒗𝒂𝒓𝒊𝒂𝒕𝒊𝒐𝒏𝒔 𝒅𝒆 𝒀 𝒆𝒔𝒕 𝒆𝒙𝒑𝒍𝒊𝒒𝒖𝒆 ́ 𝒆 𝒑𝒂𝒓 𝒍𝒆𝒔 𝒗𝒂𝒓𝒊𝒂𝒃𝒍𝒆𝒔 𝒅𝒖 𝒎𝒐𝒅𝒆 ̀ 𝒍𝒆 ? Par exemple, si 𝑹 ² = 𝟎 , 𝟖𝟎 , cela signifie que le modèle explique 𝟖𝟎 % 𝒅𝒆 𝒍𝒂 𝒗𝒂𝒓𝒊𝒂𝒕𝒊𝒐𝒏 observée dans les données. Les 𝟐𝟎 % restants correspondent à la partie non expliquée par le modèle, c’est-à-dire aux erreurs, aux facteurs non observés ou aux variations aléatoires. 𝑳𝒂 𝒇𝒐𝒓𝒎𝒖𝒍𝒆 𝒅𝒖 𝑹 ² R² = 1 − SS_res / SS_tot Avec : SS_res : somme des carrés des résidus, c’est-à-dire les erreurs de prédiction SS_tot : somme totale des carrés, c’est-à-dire la variation totale autour de la moyenne ŷ ᵢ : valeur prédite y ᵢ : valeur observée ...

𝑻𝒆𝒔𝒕 𝒅𝒖 𝑲𝒉𝒊-𝒅𝒆𝒖𝒙 : 𝒄𝒐𝒎𝒑𝒓𝒆𝒏𝒅𝒓𝒆 𝒍’𝒂𝒔𝒔𝒐𝒄𝒊𝒂𝒕𝒊𝒐𝒏 𝒆𝒏𝒕𝒓𝒆 𝒗𝒂𝒓𝒊𝒂𝒃𝒍𝒆𝒔 𝒄𝒂𝒕𝒆́𝒈𝒐𝒓𝒊𝒆𝒍𝒍𝒆𝒔

Image
Le 𝒕𝒆𝒔𝒕 𝒅𝒖 𝑲𝒉𝒊 - 𝒅𝒆𝒖𝒙 est un test statistique 𝒏𝒐𝒏 𝒑𝒂𝒓𝒂𝒎𝒆 ́ 𝒕𝒓𝒊𝒒𝒖𝒆 utilisé pour analyser des 𝒅𝒐𝒏𝒏𝒆 ́ 𝒆𝒔 𝒄𝒂𝒕𝒆 ́ 𝒈𝒐𝒓𝒊𝒆𝒍𝒍𝒆𝒔 . Il permet de comparer les 𝒇𝒓𝒆 ́ 𝒒𝒖𝒆𝒏𝒄𝒆𝒔 𝒐𝒃𝒔𝒆𝒓𝒗𝒆 ́ 𝒆𝒔 aux 𝒇𝒓𝒆 ́ 𝒒𝒖𝒆𝒏𝒄𝒆𝒔 𝒂𝒕𝒕𝒆𝒏𝒅𝒖𝒆𝒔 . Autrement dit, il répond à une question simple : 𝑳𝒆𝒔 𝒅𝒊𝒇𝒇𝒆 ́ 𝒓𝒆𝒏𝒄𝒆𝒔 𝒐𝒃𝒔𝒆𝒓𝒗𝒆 ́ 𝒆𝒔 𝒔𝒐𝒏𝒕 - 𝒆𝒍𝒍𝒆𝒔 𝒓𝒆 ́ 𝒆𝒍𝒍𝒆𝒔 𝒐𝒖 𝒅𝒖𝒆𝒔 𝒂𝒖 𝒉𝒂𝒔𝒂𝒓𝒅 ? On l’utilise souvent pour : 𝒕𝒆𝒔𝒕𝒆𝒓 𝒍 ’ 𝒊𝒏𝒅𝒆 ́ 𝒑𝒆𝒏𝒅𝒂𝒏𝒄𝒆 𝒆𝒏𝒕𝒓𝒆 𝒅𝒆𝒖𝒙 𝒗𝒂𝒓𝒊𝒂𝒃𝒍𝒆𝒔 , 𝒗𝒆 ́ 𝒓𝒊𝒇𝒊𝒆𝒓 𝒍 ’ 𝒂𝒋𝒖𝒔𝒕𝒆𝒎𝒆𝒏𝒕 𝒂 ̀ 𝒖𝒏𝒆 𝒅𝒊𝒔𝒕𝒓𝒊𝒃𝒖𝒕𝒊𝒐𝒏 , ou 𝒔𝒆 ́ 𝒍𝒆𝒄𝒕𝒊𝒐𝒏𝒏𝒆𝒓 𝒅𝒆𝒔 𝒗𝒂𝒓𝒊𝒂𝒃𝒍𝒆𝒔 en Machine Learning. 𝑳𝒂 𝒇𝒐𝒓𝒎𝒖𝒍𝒆 𝒅𝒖 𝑲𝒉𝒊 - 𝒅𝒆𝒖𝒙 χ ² = Σ (O ᵢ − E ᵢ )² / E ᵢ Avec : O ᵢ : fréquence observée dans la catégorie i E ᵢ : fréquence attendue dans la catégorie i Plus la valeur de χ ² est ...

𝑷𝒐𝒍𝒊𝒕𝒊𝒒𝒖𝒆 𝒎𝒐𝒏𝒆́𝒕𝒂𝒊𝒓𝒆 : 𝒄𝒐𝒎𝒎𝒆𝒏𝒕 𝒍𝒂 𝒃𝒂𝒏𝒒𝒖𝒆 𝒄𝒆𝒏𝒕𝒓𝒂𝒍𝒆 𝒓𝒆́𝒈𝒖𝒍𝒆 𝒍’𝒆́𝒄𝒐𝒏𝒐𝒎𝒊𝒆 ?

Image
La 𝒑𝒐𝒍𝒊𝒕𝒊𝒒𝒖𝒆 𝒎𝒐𝒏𝒆 ́ 𝒕𝒂𝒊𝒓𝒆 désigne l’ensemble des actions menées par la 𝒃𝒂𝒏𝒒𝒖𝒆 𝒄𝒆𝒏𝒕𝒓𝒂𝒍𝒆 pour influencer l’activité économique d’un pays. Son objectif principal est de préserver la 𝒔𝒕𝒂𝒃𝒊𝒍𝒊𝒕𝒆 ́ 𝒆 ́ 𝒄𝒐𝒏𝒐𝒎𝒊𝒒𝒖𝒆 . La banque centrale agit notamment pour : 𝒄𝒐𝒏𝒕𝒓𝒐 ̂ 𝒍𝒆𝒓 𝒍 ’ 𝒊𝒏𝒇𝒍𝒂𝒕𝒊𝒐𝒏 𝒔𝒐𝒖𝒕𝒆𝒏𝒊𝒓 𝒍𝒂 𝒄𝒓𝒐𝒊𝒔𝒔𝒂𝒏𝒄𝒆 𝒔𝒕𝒂𝒃𝒊𝒍𝒊𝒔𝒆𝒓 𝒍𝒂 𝒎𝒐𝒏𝒏𝒂𝒊𝒆 𝒇𝒂𝒗𝒐𝒓𝒊𝒔𝒆𝒓 𝒍 ’ 𝒆𝒎𝒑𝒍𝒐𝒊 L’un de ses principaux outils est le 𝒕𝒂𝒖𝒙 𝒅 ’ 𝒊𝒏𝒕𝒆 ́ 𝒓𝒆 ̂ 𝒕 𝒅𝒊𝒓𝒆𝒄𝒕𝒆𝒖𝒓 . C’est le taux auquel la banque centrale prête de l’argent aux banques commerciales. Lorsque la banque centrale 𝒃𝒂𝒊𝒔𝒔𝒆 𝒍𝒆𝒔 𝒕𝒂𝒖𝒙 , le crédit devient moins cher. Les ménages peuvent consommer davantage et les entreprises peuvent investir plus facilement. Cela stimule l’économie. À l’inverse, lorsqu’elle 𝒂𝒖𝒈𝒎𝒆𝒏𝒕𝒆 𝒍𝒆𝒔 𝒕𝒂𝒖𝒙 , le crédit devient plus coûteux. La consommation et l’invest...

𝑹𝒂𝒏𝒅𝒐𝒎 𝑭𝒐𝒓𝒆𝒔𝒕 : 𝒄𝒐𝒎𝒑𝒓𝒆𝒏𝒅𝒓𝒆 𝒍’𝒖𝒏 𝒅𝒆𝒔 𝒂𝒍𝒈𝒐𝒓𝒊𝒕𝒉𝒎𝒆𝒔 𝒍𝒆𝒔 𝒑𝒍𝒖𝒔 𝒖𝒕𝒊𝒍𝒊𝒔𝒆́𝒔 𝒆𝒏 𝑴𝒂𝒄𝒉𝒊𝒏𝒆 𝑳𝒆𝒂𝒓𝒏𝒊𝒏𝒈

Image
Le 𝑹𝒂𝒏𝒅𝒐𝒎 𝑭𝒐𝒓𝒆𝒔𝒕 est une méthode d’ 𝒂𝒑𝒑𝒓𝒆𝒏𝒕𝒊𝒔𝒔𝒂𝒈𝒆 𝒆𝒏𝒔𝒆𝒎𝒃𝒍𝒊𝒔𝒕𝒆 qui construit plusieurs arbres de décision et combine leurs prédictions. L’idée est simple : au lieu de faire confiance à un seul arbre, on utilise une 𝒇𝒐𝒓𝒆 ̂ 𝒕 𝒅 ’ 𝒂𝒓𝒃𝒓𝒆𝒔 𝒅𝒆 𝒅𝒆 ́ 𝒄𝒊𝒔𝒊𝒐𝒏 . Chaque arbre est entraîné sur un échantillon aléatoire des données. À chaque séparation, il ne considère aussi qu’un sous-ensemble aléatoire de variables. Cette double randomisation permet de rendre les arbres différents les uns des autres, de réduire le 𝒔𝒖𝒓𝒂𝒑𝒑𝒓𝒆𝒏𝒕𝒊𝒔𝒔𝒂𝒈𝒆 et d’améliorer la performance du modèle. En classification, la prédiction finale est obtenue par 𝒗𝒐𝒕𝒆 𝒎𝒂𝒋𝒐𝒓𝒊𝒕𝒂𝒊𝒓𝒆 . En régression, elle est obtenue par 𝒎𝒐𝒚𝒆𝒏𝒏𝒆 𝒅𝒆𝒔 𝒑𝒓𝒆 ́ 𝒅𝒊𝒄𝒕𝒊𝒐𝒏𝒔 . 𝑳𝒂 𝒇𝒐𝒓𝒎𝒖𝒍𝒆 𝒈𝒆 ́ 𝒏𝒆 ́ 𝒓𝒂𝒍𝒆 : ŷ_RF(x) = (1/B) × Σ T_b(x) Avec : B : nombre d’arbres T_b(x) : prédiction de l’arbre b x : variables exp...

𝑴𝒆́𝒕𝒉𝒐𝒅𝒆 𝒅𝒖 𝒄𝒐𝒏𝒕𝒓𝒐̂𝒍𝒆 𝒔𝒚𝒏𝒕𝒉𝒆́𝒕𝒊𝒒𝒖𝒆 : 𝒄𝒐𝒎𝒑𝒓𝒆𝒏𝒅𝒓𝒆 𝒍’𝒊𝒎𝒑𝒂𝒄𝒕 𝒅’𝒖𝒏𝒆 𝒊𝒏𝒕𝒆𝒓𝒗𝒆𝒏𝒕𝒊𝒐𝒏

Image
La 𝒎𝒆́𝒕𝒉𝒐𝒅𝒆 𝒅𝒖 𝒄𝒐𝒏𝒕𝒓𝒐̂𝒍𝒆 𝒔𝒚𝒏𝒕𝒉𝒆́𝒕𝒊𝒒𝒖𝒆 est une méthode d’𝒊𝒏𝒇𝒆́𝒓𝒆𝒏𝒄𝒆 𝒄𝒂𝒖𝒔𝒂𝒍𝒆 utilisée pour estimer l’effet d’une intervention lorsqu’il n’est pas possible de faire une expérimentation aléatoire classique. L’idée est simple : on construit un 𝒈𝒓𝒐𝒖𝒑𝒆 𝒅𝒆 𝒄𝒐𝒏𝒕𝒓𝒐̂𝒍𝒆 𝒂𝒓𝒕𝒊𝒇𝒊𝒄𝒊𝒆𝒍 à partir de plusieurs unités non traitées. Autrement dit, au lieu de chercher un seul groupe témoin parfait, on crée un 𝒄𝒐𝒏𝒕𝒓𝒐̂𝒍𝒆 𝒔𝒚𝒏𝒕𝒉𝒆́𝒕𝒊𝒒𝒖𝒆 en combinant plusieurs groupes réels avec des poids différents. L’objectif est que ce contrôle synthétique ressemble le plus possible à l’unité traitée 𝒂𝒗𝒂𝒏𝒕 𝒍’𝒊𝒏𝒕𝒆𝒓𝒗𝒆𝒏𝒕𝒊𝒐𝒏. Si l’on ne peut pas randomiser, on cherche donc à reconstruire soi-même le 𝒄𝒐𝒏𝒕𝒓𝒆𝒇𝒂𝒄𝒕𝒖𝒆𝒍, c’est-à-dire ce qui se serait probablement passé sans intervention. 𝑳𝒆 𝒎𝒐𝒅𝒆̀𝒍𝒆 𝒑𝒆𝒖𝒕 𝒔’𝒆́𝒄𝒓𝒊𝒓𝒆 𝒂𝒊𝒏𝒔𝒊 : Ŷ₁ᴺ = Σ wⱼ Yⱼₜ Avec : Ŷ₁ᴺ : résultat estimé du contrôle synthétique wⱼ : poid...