๐ŸŽฏ ๐‘จ๐’๐’‚๐’๐’š๐’”๐’† ๐’†๐’ ๐‘ช๐’๐’Ž๐’‘๐’๐’”๐’‚๐’๐’•๐’†๐’” ๐‘ท๐’“๐’Š๐’๐’„๐’Š๐’‘๐’‚๐’๐’†๐’” (๐‘จ๐‘ช๐‘ท) : ๐‘ท๐’๐’–๐’“๐’’๐’–๐’๐’Š ๐’„’๐’†๐’”๐’• ๐’†๐’”๐’”๐’†๐’๐’•๐’Š๐’†๐’ ?

๐Ÿ“‰๐Ÿ“ˆ ๐‘บ๐’Š๐’ˆ๐’๐’Š๐’‡๐’Š๐’„๐’‚๐’•๐’Š๐’๐’ ๐’…๐’† ๐’๐‘จ๐‘ช๐‘ท

L’๐‘จ๐‘ช๐‘ท (Analyse en Composantes Principales) est une mรฉthode puissante qui permet de ๐’”๐’Š๐’Ž๐’‘๐’๐’Š๐’‡๐’Š๐’†๐’“ ๐’…๐’†๐’” ๐’…๐’๐’๐’๐’†́๐’†๐’” ๐’„๐’๐’Ž๐’‘๐’๐’†๐’™๐’†๐’” tout en conservant l’essentiel de l’information.


๐Ÿ”น ๐‘น๐’†́๐’…๐’–๐’„๐’•๐’Š๐’๐’ ๐’…๐’† ๐’…๐’Š๐’Ž๐’†๐’๐’”๐’Š๐’๐’

Si vous avez beaucoup de variables (gรจnes, nutriments du sol, traits vรฉgรฉtaux, bandes spectrales…), l’ACP les transforme en :

๐‘ท๐‘ช1, ๐‘ท๐‘ช2, ๐‘ท๐‘ช3… (Composantes Principales)

๐Ÿ‘‰ Moins de variables
๐Ÿ‘‰ Mรชme information essentielle


๐Ÿ”น ๐‘ด๐’Š๐’”๐’† ๐’†๐’ ๐’†́๐’—๐’Š๐’…๐’†๐’๐’„๐’† ๐’…๐’† ๐’”๐’•๐’“๐’–๐’„๐’•๐’–๐’“๐’†๐’” ๐’„๐’‚๐’„๐’‰๐’†́๐’†๐’”

L’ACP permet de visualiser :

Des groupes
Des sรฉparations
Des clusters

Exemples :
• Variรฉtรฉs de plantes
• Niveaux de fertigation
• Plantes saines vs stressรฉes
• Groupes ER+ vs ER−

Si les groupes sont sรฉparรฉs sur PC1 vs PC2, cela signifie qu’ils diffรจrent globalement.


๐Ÿ”น ๐‘บ๐’–๐’‘๐’‘๐’“๐’†๐’”๐’”๐’Š๐’๐’ ๐’…๐’† ๐’๐’‚ ๐’“๐’†๐’…๐’๐’๐’…๐’‚๐’๐’„๐’†

Beaucoup de variables sont corrรฉlรฉes entre elles :

• Hauteur, surface foliaire, biomasse
• Nitrate et conductivitรฉ (EC)

L’ACP combine ces variables corrรฉlรฉes en quelques composantes synthรฉtiques, รฉvitant la rรฉpรฉtition d’information.


๐Ÿ”น ๐‘ฐ๐’…๐’†๐’๐’•๐’Š๐’‡๐’Š๐’† ๐’๐’†๐’” ๐’—๐’‚๐’“๐’Š๐’‚๐’ƒ๐’๐’†๐’” ๐’๐’†๐’” ๐’‘๐’๐’–๐’” ๐’Š๐’Ž๐’‘๐’๐’“๐’•๐’‚๐’๐’•๐’†๐’”

Grรขce aux ๐‘ณ๐’๐’‚๐’…๐’Š๐’๐’ˆ๐’” :

Un loading รฉlevรฉ = forte contribution ร  la composante
Permet d’identifier les variables qui expliquent le plus la variation

๐Ÿ‘‰ « Quelle variable explique rรฉellement la diffรฉrence ? »


๐Ÿ”น ๐‘ฝ๐’Š๐’”๐’–๐’‚๐’๐’Š๐’”๐’‚๐’•๐’Š๐’๐’ ๐’‡๐’‚๐’„๐’Š๐’๐’Š๐’•๐’†́๐’†

Impossible de visualiser 20 variables simultanรฉment.

Mais avec l’ACP :

Graphique PC1 vs PC2
Graphique PC1 vs PC3

On observe facilement :

• Tendances
• Regroupements
• Valeurs aberrantes


๐Ÿ”น ๐‘น๐’†́๐’…๐’–๐’„๐’•๐’Š๐’๐’ ๐’…๐’– ๐’ƒ๐’“๐’–๐’Š๐’•

Les composantes secondaires contiennent souvent :

• Variabilitรฉ alรฉatoire
• Erreurs de mesure

En gardant uniquement les principales composantes, on amรฉliore la qualitรฉ de l’analyse.


๐Ÿ”น ๐‘จ๐’Ž๐’†́๐’๐’Š๐’๐’“๐’† ๐’๐’†๐’” ๐’Ž๐’๐’…๐’†̀๐’๐’†๐’” ๐’…๐’‚๐’‘๐’‘๐’“๐’†๐’๐’•๐’Š๐’”๐’”๐’‚๐’ˆ๐’†

Avant le Machine Learning, l’ACP permet de :

Rรฉduire le surapprentissage
Rรฉduire le temps d’entraรฎnement
Stabiliser les modรจles

Particuliรจrement utile si :

• Beaucoup de variables
• Petit รฉchantillon


๐Ÿ”น ๐‘ซ๐’†́๐’•๐’†๐’„๐’•๐’Š๐’๐’ ๐’…๐’๐’–๐’•๐’๐’Š๐’†๐’“๐’”

Les points รฉloignรฉs du nuage principal dans un graphique ACP sont souvent :

• ร‰chantillons atypiques
• Erreurs potentielles
• Variations biologiques extrรชmes


๐Ÿ”น ๐‘ช๐’† ๐’’๐’–๐’† ๐’๐‘จ๐‘ช๐‘ท ๐’๐’† ๐’‡๐’‚๐’Š๐’• ๐’‘๐’‚๐’”

L’ACP ne teste pas directement la significativitรฉ (contrairement ร  ANOVA ou t-test).

C’est une mรฉthode ๐’†๐’™๐’‘๐’๐’๐’“๐’‚๐’•๐’๐’Š๐’“๐’†.

Ensuite, on peut confirmer les rรฉsultats avec :

ANOVA / MANOVA
PERMANOVA
Modรจles de classification


๐Ÿ’ก ๐‘ฌ๐’ ๐’“๐’†́๐’”๐’–๐’Ž๐’†́

Si PC1 et PC2 sรฉparent clairement les groupes, cela signifie que l’ACP capture une ๐’—๐’‚๐’“๐’Š๐’‚๐’•๐’Š๐’๐’ ๐’”๐’•๐’“๐’–๐’„๐’•๐’–๐’“๐’†๐’๐’๐’† ๐’“๐’†́๐’†๐’๐’๐’† dans les donnรฉes.

L’ACP est donc un outil fondamental pour :

Explorer
Comprendre
Simplifier
Prรฉparer les analyses avancรฉes




________________________________________________________________________________

Si vous avez trouvรฉ cette publication utile, n'hรฉsitez pas ร  ๐’๐’‚ ๐’๐’Š๐’Œ๐’†๐’“ ๐’†๐’• ร  ๐’๐’‚ ๐’‘๐’‚๐’“๐’•๐’‚๐’ˆ๐’†๐’“ avec vos amis et collรจgues !

Pour mieux apprendre l’utilisation des logiciel et modรจles statistiques, nous vous invitons ร  prendre part ร  la prochaine session de notre formation en ๐™€๐™˜๐™ค๐™ฃ๐™ค๐™ขรฉ๐™ฉ๐™ง๐™ž๐™š ๐™š๐™ฉ ๐™๐™š๐™˜๐™๐™ฃ๐™ž๐™ฆ๐™ช๐™š๐™จ ๐™Œ๐™ช๐™–๐™ฃ๐™ฉ๐™ž๐™ฉ๐™–๐™ฉ๐™ž๐™ซ๐™š๐™จ https://forms.gle/yZAZimRXbTFbUWZk6



________________________________________


#ACP #AnalyseDeDonnรฉes #StatistiquesAvancรฉes #DataScience #MachineLearning

 

Commentaires

Posts les plus consultรฉs de ce blog

ร‰conomรฉtrie des donnรฉes de panel: de la thรฉorie ร  la pratique