๐‘จ๐‘ช๐‘ท / ๐‘ท๐‘ช๐‘จ : ๐’“๐’†́๐’…๐’–๐’Š๐’“๐’† ๐’๐’†๐’” ๐’…๐’Š๐’Ž๐’†๐’๐’”๐’Š๐’๐’๐’” ๐’”๐’‚๐’๐’” ๐’‘๐’†๐’“๐’…๐’“๐’† ๐’’๐’†๐’”๐’”๐’†๐’๐’•๐’Š๐’†๐’

Dans une base de donnรฉes, il arrive souvent que plusieurs variables racontent presque la mรชme histoire.

Par exemple, la taille, le poids, le tour de taille ou encore l’indice de masse corporelle peuvent รชtre fortement liรฉs.

Dans ce cas, analyser toutes ces variables sรฉparรฉment peut rendre l’interprรฉtation lourde et parfois confuse.

C’est lร  qu’intervient ๐’’๐‘จ๐’๐’‚๐’๐’š๐’”๐’† ๐’†๐’ ๐‘ช๐’๐’Ž๐’‘๐’๐’”๐’‚๐’๐’•๐’†๐’” ๐‘ท๐’“๐’Š๐’๐’„๐’Š๐’‘๐’‚๐’๐’†๐’”, appelรฉe aussi PCA en anglais.

Son objectif est simple :

transformer plusieurs variables corrรฉlรฉes en un petit nombre de nouvelles variables appelรฉes composantes principales.

Ces composantes rรฉsument l’information contenue dans les donnรฉes, en conservant le maximum de variabilitรฉ possible.

๐‘ณ๐’‚ ๐’‘๐’“๐’†๐’Ž๐’Š๐’†̀๐’“๐’† ๐’„๐’๐’Ž๐’‘๐’๐’”๐’‚๐’๐’•๐’† capte la plus grande partie de l’information.

๐‘ณ๐’‚ ๐’…๐’†๐’–๐’™๐’Š๐’†̀๐’Ž๐’† ๐’„๐’๐’Ž๐’‘๐’๐’”๐’‚๐’๐’•๐’† capte une autre partie importante, mais indรฉpendante de la premiรจre.

Les composantes suivantes ajoutent progressivement moins d’information.

En pratique, l’ACP permet de passer de 10, 20 ou 100 variables ร  seulement quelques axes principaux, tout en gardant l’essentiel de la structure des donnรฉes.

Elle est trรจs utile pour :

rรฉduire la dimension des donnรฉes

รฉviter la redondance entre variables

faciliter la visualisation

prรฉparer les donnรฉes pour le Machine Learning

construire des indices synthรฉtiques en recherche

Mais attention : l’ACP ne dit pas automatiquement quelles variables sont “importantes” au sens thรฉorique.

Elle identifie surtout les directions oรน les donnรฉes varient le plus.

Autrement dit, l’ACP simplifie les donnรฉes, mais l’interprรฉtation reste entre les mains du chercheur.

๐‘ฌ๐’ ๐’“๐’†́๐’”๐’–๐’Ž๐’†́ :

L’ACP transforme un grand nombre de variables liรฉes entre elles en quelques composantes principales capables de rรฉsumer l’information essentielle.

Inscrivez-vous dรจs maintenant pour rรฉserver votre place pour la prochaine session de notre formation en ร‰๐—ฐ๐—ผ๐—ป๐—ผ๐—บรฉ๐˜๐—ฟ๐—ถ๐—ฒ ๐—ฒ๐˜ ๐—ง๐—ฒ๐—ฐ๐—ต๐—ป๐—ถ๐—พ๐˜‚๐—ฒ๐˜€ https://forms.gle/yZAZimRXbTFbUWZk6




#AnalyseDesDonnรฉes

#ACP

#PCA

#DataScience

#Statistiques

Commentaires

Posts les plus consultรฉs de ce blog

ร‰conomรฉtrie des donnรฉes de panel: de la thรฉorie ร  la pratique