𝑨𝑪𝑷 / 𝑷𝑪𝑨 : 𝒓𝒆́𝒅𝒖𝒊𝒓𝒆 𝒍𝒆𝒔 𝒅𝒊𝒎𝒆𝒏𝒔𝒊𝒐𝒏𝒔 𝒔𝒂𝒏𝒔 𝒑𝒆𝒓𝒅𝒓𝒆 𝒍’𝒆𝒔𝒔𝒆𝒏𝒕𝒊𝒆𝒍
Dans une base de données, il arrive souvent que plusieurs variables racontent presque la même histoire. Par exemple, la taille, le poids, le tour de taille ou encore l’indice de masse corporelle peuvent être fortement liés. Dans ce cas, analyser toutes ces variables séparément peut rendre l’interprétation lourde et parfois confuse. C’est là qu’intervient 𝒍’𝑨𝒏𝒂𝒍𝒚𝒔𝒆 𝒆𝒏 𝑪𝒐𝒎𝒑𝒐𝒔𝒂𝒏𝒕𝒆𝒔 𝑷𝒓𝒊𝒏𝒄𝒊𝒑𝒂𝒍𝒆𝒔, appelée aussi PCA en anglais. Son objectif est simple : transformer plusieurs variables corrélées en un petit nombre de nouvelles variables appelées composantes principales. Ces composantes résument l’information contenue dans les données, en conservant le maximum de variabilité possible. 𝑳𝒂 𝒑𝒓𝒆𝒎𝒊𝒆̀𝒓𝒆 𝒄𝒐𝒎𝒑𝒐𝒔𝒂𝒏𝒕𝒆 capte la plus grande partie de l’information. 𝑳𝒂 𝒅𝒆𝒖𝒙𝒊𝒆̀𝒎𝒆 𝒄𝒐𝒎𝒑𝒐𝒔𝒂𝒏𝒕𝒆 capte une autre partie importante, mais indépendante de la première. Les composantes suivantes ajoutent progressivement moins d’information. En pr...