๐น² ๐๐ ๐๐๐๐๐๐๐๐๐๐๐ ๐ ๐ ๐ ๐́๐๐๐๐๐๐๐๐๐๐๐ : ๐๐๐๐๐๐๐ ๐́๐๐๐๐๐๐ ๐๐ ๐๐๐๐๐๐๐́ ๐ ’๐๐ ๐๐๐ ๐̀๐๐ ?
Le ๐น², aussi appelรฉ ๐๐๐๐๐๐๐๐๐๐๐ ๐ ๐ ๐ ๐́๐๐๐๐๐๐๐๐๐๐๐, est un indicateur qui permet de mesurer la part de la variation d’une variable dรฉpendante expliquรฉe par un modรจle.
Autrement
dit, il rรฉpond ร une question simple :
๐ธ๐๐๐๐๐ ๐๐๐๐ ๐
๐๐ ๐๐๐๐๐๐๐๐๐๐ ๐
๐ ๐ ๐๐๐ ๐๐๐๐๐๐๐๐́๐ ๐๐๐ ๐๐๐ ๐๐๐๐๐๐๐๐๐ ๐
๐ ๐๐๐
๐̀๐๐ ?
Par exemple,
si ๐น² = ๐,๐๐, cela signifie que le modรจle explique ๐๐ % ๐
๐ ๐๐ ๐๐๐๐๐๐๐๐๐ observรฉe dans les donnรฉes.
Les ๐๐ % restants correspondent ร la partie non expliquรฉe par le
modรจle, c’est-ร -dire aux erreurs, aux facteurs non observรฉs ou aux variations
alรฉatoires.
๐ณ๐ ๐๐๐๐๐๐๐ ๐
๐ ๐น²
R² = 1 −
SS_res / SS_tot
Avec :
SS_res : somme des carrรฉs des rรฉsidus,
c’est-ร -dire les erreurs de prรฉdiction
SS_tot : somme totale des carrรฉs, c’est-ร -dire la variation
totale autour de la moyenne
ลทแตข : valeur prรฉdite
yแตข : valeur observรฉe
ศณ : moyenne des valeurs observรฉes
๐ช๐๐๐๐๐๐ ๐๐๐๐๐๐๐๐́๐๐๐ ๐น² ?
๐น² = ๐ : le modรจle explique parfaitement les
donnรฉes.
๐น² = ๐,๐๐ : le modรจle explique 90 % de la
variation, ce qui indique un trรจs bon ajustement.
๐น² = ๐,๐๐ : le modรจle explique la moitiรฉ de la
variation, ce qui traduit un ajustement modรฉrรฉ.
๐น² proche de ๐ : le modรจle explique trรจs peu la
variation de la variable รฉtudiรฉe.
Mais
attention : un ๐น² รฉlevรฉ ne signifie pas automatiquement que le modรจle est
bon.
Il faut aussi
vรฉrifier :
๐๐ ๐๐๐๐๐๐๐๐๐๐๐๐๐๐๐́ ๐
๐๐ ๐๐๐๐๐๐๐๐๐๐๐๐,
๐๐ ๐๐๐๐́๐๐๐๐๐ ๐́๐๐๐๐๐๐๐๐๐ ๐๐ ๐๐๐๐๐๐๐๐๐๐๐,
๐๐๐ ๐๐́๐๐๐
๐๐,
๐๐ ๐๐๐๐๐๐๐๐๐๐๐́๐๐๐๐๐́,
et ๐๐ ๐๐๐๐๐๐ ๐
๐ ๐๐๐๐๐๐๐๐๐๐๐๐๐.
๐น² ๐๐ ๐น² ๐๐๐๐๐๐́
Le ๐น² classique augmente souvent lorsqu’on ajoute de nouvelles
variables au modรจle, mรชme si ces variables n’apportent pas rรฉellement
d’information utile.
C’est
pourquoi on utilise souvent le ๐น² ๐๐๐๐๐๐́.
Le ๐น² ajustรฉ pรฉnalise l’ajout inutile de variables. Il peut
diminuer si une nouvelle variable n’amรฉliore pas suffisamment le modรจle.
Il est donc
particuliรจrement utile lorsque l’on compare plusieurs modรจles avec un nombre
diffรฉrent de variables explicatives.
๐ธ๐๐๐๐
๐๐๐๐๐๐๐๐ ๐น² ?
Le ๐น² est surtout utilisรฉ dans les modรจles de ๐๐́๐๐๐๐๐๐๐๐ ๐๐๐๐́๐๐๐๐ avec une variable dรฉpendante quantitative
continue.
Pour les
modรจles de classification, les modรจles non linรฉaires ou les problรจmes de
prรฉdiction avancรฉe, il faut souvent utiliser d’autres indicateurs comme :
๐๐ ๐น๐ด๐บ๐ฌ,
๐๐ ๐ด๐จ๐ฌ,
๐’๐๐๐๐๐๐๐๐,
๐๐ ๐ญ๐-๐๐๐๐๐,
ou ๐’๐จ๐ผ๐ช.
๐ฐ๐
๐́๐ ๐๐๐́ :
Le ๐น² indique la proportion de la variation expliquรฉe par le modรจle, mais il ne
suffit jamais ร lui seul pour juger la qualitรฉ complรจte d’une analyse.
Si vous avez trouvรฉ cette
publication utile, n'hรฉsitez pas ร ๐๐ ๐๐๐๐๐ ๐๐ ร ๐๐ ๐๐๐๐๐๐๐๐ avec vos amis et
collรจgues ! Pour mieux apprendre l’utilisation des logiciel et modรจles
statistiques, nous vous invitons ร prendre part ร la prochaine session de notre
formation en ๐๐๐ค๐ฃ๐ค๐ขรฉ๐ฉ๐ง๐๐ ๐๐ฉ ๐๐๐๐๐ฃ๐๐ฆ๐ช๐๐จ ๐๐ช๐๐ฃ๐ฉ๐๐ฉ๐๐ฉ๐๐ซ๐๐จ https://forms.gle/yZAZimRXbTFbUWZk6
#Statistiques #RegressionLineaire
#AnalyseDesDonnรฉes #รconomรฉtrie #DataScience
.png)
Commentaires
Enregistrer un commentaire