๐จ๐ช๐ท / ๐ท๐ช๐จ : ๐๐́๐ ๐๐๐๐ ๐๐๐ ๐ ๐๐๐๐๐๐๐๐๐ ๐๐๐๐ ๐๐๐๐ ๐๐ ๐’๐๐๐๐๐๐๐๐๐
Dans une base de donnรฉes, il arrive souvent que plusieurs variables racontent presque la mรชme histoire.
Par exemple, la taille, le poids, le tour de taille ou encore l’indice de masse corporelle peuvent รชtre fortement liรฉs.
Dans ce cas, analyser toutes ces variables sรฉparรฉment peut rendre l’interprรฉtation lourde et parfois confuse.
C’est lร qu’intervient ๐’๐จ๐๐๐๐๐๐ ๐๐ ๐ช๐๐๐๐๐๐๐๐๐๐ ๐ท๐๐๐๐๐๐๐๐๐๐, appelรฉe aussi PCA en anglais.
Son objectif est simple :
transformer plusieurs variables corrรฉlรฉes en un petit nombre de nouvelles variables appelรฉes composantes principales.
Ces composantes rรฉsument l’information contenue dans les donnรฉes, en conservant le maximum de variabilitรฉ possible.
๐ณ๐ ๐๐๐๐๐๐̀๐๐ ๐๐๐๐๐๐๐๐๐๐ capte la plus grande partie de l’information.
๐ณ๐ ๐ ๐๐๐๐๐̀๐๐ ๐๐๐๐๐๐๐๐๐๐ capte une autre partie importante, mais indรฉpendante de la premiรจre.
Les composantes suivantes ajoutent progressivement moins d’information.
En pratique, l’ACP permet de passer de 10, 20 ou 100 variables ร seulement quelques axes principaux, tout en gardant l’essentiel de la structure des donnรฉes.
Elle est trรจs utile pour :
rรฉduire la dimension des donnรฉes
รฉviter la redondance entre variables
faciliter la visualisation
prรฉparer les donnรฉes pour le Machine Learning
construire des indices synthรฉtiques en recherche
Mais attention : l’ACP ne dit pas automatiquement quelles variables sont “importantes” au sens thรฉorique.
Elle identifie surtout les directions oรน les donnรฉes varient le plus.
Autrement dit, l’ACP simplifie les donnรฉes, mais l’interprรฉtation reste entre les mains du chercheur.
๐ฌ๐ ๐๐́๐๐๐๐́ :
L’ACP transforme un grand nombre de variables liรฉes entre elles en quelques composantes principales capables de rรฉsumer l’information essentielle.
Inscrivez-vous dรจs maintenant pour rรฉserver votre place pour la prochaine session de notre formation en ร๐ฐ๐ผ๐ป๐ผ๐บรฉ๐๐ฟ๐ถ๐ฒ ๐ฒ๐ ๐ง๐ฒ๐ฐ๐ต๐ป๐ถ๐พ๐๐ฒ๐ https://forms.gle/yZAZimRXbTFbUWZk6
#AnalyseDesDonnรฉes
#ACP
#PCA
#DataScience
#Statistiques

Commentaires
Enregistrer un commentaire