Articles

📊 𝙍𝙚́𝙜𝙧𝙚𝙨𝙨𝙞𝙤𝙣 𝙇𝙞𝙣𝙚́𝙖𝙞𝙧𝙚 𝙈𝙪𝙡𝙩𝙞𝙥𝙡𝙚 : Comprendre l’effet simultané de plusieurs variables

Image
  La 𝙧𝙚́𝙜𝙧𝙚𝙨𝙨𝙞𝙤𝙣 𝙡𝙞𝙣𝙚́𝙖𝙞𝙧𝙚 𝙢𝙪𝙡𝙩𝙞𝙥𝙡𝙚 est une méthode statistique utilisée pour analyser la relation entre une variable dépendante et plusieurs variables explicatives. Elle permet de comprendre comment plusieurs facteurs influencent simultanément un même phénomène. Dans ce modèle, chaque variable explicative possède son propre effet sur la variable dépendante. Lors de l’analyse, on suppose que toutes les autres variables restent constantes lorsque l’on étudie l’effet d’une variable particulière. Cela permet d’identifier la contribution spécifique de chaque facteur. La 𝙧𝙚́𝙜𝙧𝙚𝙨𝙨𝙞𝙤𝙣 𝙡𝙞𝙣𝙚́𝙖𝙞𝙧𝙚 𝙢𝙪𝙡𝙩𝙞𝙥𝙡𝙚 est principalement utilisée pour : • 𝙘𝙤𝙢𝙥𝙧𝙚𝙣𝙙𝙧𝙚 les relations entre plusieurs variables • 𝙞𝙙𝙚𝙣𝙩𝙞𝙛𝙞𝙚𝙧 les facteurs explicatifs les plus importants • 𝙛𝙖𝙞𝙧𝙚 des prédictions • 𝙘𝙤𝙣𝙩𝙧𝙤̂𝙡𝙚𝙧 l’effet d’autres variables Par exemple, si l’on souhaite prédire le rendement agricole, celui-ci peut dépendre de plusieur...

📈 𝑻𝒆𝒔𝒕 𝒅𝒆 𝒏𝒐𝒓𝒎𝒂𝒍𝒊𝒕𝒆́ 𝒅𝒂𝒏𝒔 𝑹 📉

Image
Pour vérifier si vos données suivent une distribution normale, vous pouvez utiliser à la fois des tests statistiques et des méthodes graphiques. Voici les méthodes les plus utilisées et les plus fiables, expliquées étape par étape. 1️⃣ 𝑻𝒆𝒔𝒕 𝒅𝒆 𝑺𝒉𝒂𝒑𝒊𝒓𝒐-𝑾𝒊𝒍𝒌 (le plus utilisé) 👉 Idéal pour les petits et moyens échantillons (n < 5000). Syntaxe : shapiro.test(vos_donnees) Exemple : data <- c(160, 162, 165, 170, 168, 164, 163) shapiro.test(data) Interprétation : p > 0.05 → Les données suivent une distribution normale p ≤ 0.05 → Les données ne sont PAS normales 2️⃣ 𝑻𝒆𝒔𝒕 𝒅𝒆 𝑲𝒐𝒍𝒎𝒐𝒈𝒐𝒓𝒐𝒗-𝑺𝒎𝒊𝒓𝒏𝒐𝒗 (KS) 👉 Utilisé pour les grands échantillons, mais moins puissant pour tester la normalité. Syntaxe : ks.test(vos_donnees, "pnorm", mean(vos_donnees), sd(vos_donnees)) Exemple : ks.test(data, "pnorm", mean(data), sd(data)) 3️⃣ 𝑻𝒆𝒔𝒕 𝒅’𝑨𝒏𝒅𝒆𝒓𝒔𝒐𝒏-𝑫𝒂𝒓𝒍𝒊𝒏𝒈 (très puissant) 👉 Plus sensible que le KS, particulièremen...

🎯 𝑨𝒏𝒂𝒍𝒚𝒔𝒆 𝒆𝒏 𝑪𝒐𝒎𝒑𝒐𝒔𝒂𝒏𝒕𝒆𝒔 𝑷𝒓𝒊𝒏𝒄𝒊𝒑𝒂𝒍𝒆𝒔 (𝑨𝑪𝑷) : 𝑷𝒐𝒖𝒓𝒒𝒖𝒐𝒊 𝒄’𝒆𝒔𝒕 𝒆𝒔𝒔𝒆𝒏𝒕𝒊𝒆𝒍 ?

Image
📉📈 𝑺𝒊𝒈𝒏𝒊𝒇𝒊𝒄𝒂𝒕𝒊𝒐𝒏 𝒅𝒆 𝒍 ’ 𝑨𝑪𝑷 L’ 𝑨𝑪𝑷 (Analyse en Composantes Principales) est une méthode puissante qui permet de 𝒔𝒊𝒎𝒑𝒍𝒊𝒇𝒊𝒆𝒓 𝒅𝒆𝒔 𝒅𝒐𝒏𝒏𝒆 ́ 𝒆𝒔 𝒄𝒐𝒎𝒑𝒍𝒆𝒙𝒆𝒔 tout en conservant l’essentiel de l’information. 🔹 𝑹𝒆 ́ 𝒅𝒖𝒄𝒕𝒊𝒐𝒏 𝒅𝒆 𝒅𝒊𝒎𝒆𝒏𝒔𝒊𝒐𝒏 Si vous avez beaucoup de variables (gènes, nutriments du sol, traits végétaux, bandes spectrales…), l’ACP les transforme en : 𝑷𝑪 1, 𝑷𝑪 2, 𝑷𝑪 3… (Composantes Principales) 👉 Moins de variables 👉 Même information essentielle 🔹 𝑴𝒊𝒔𝒆 𝒆𝒏 𝒆 ́ 𝒗𝒊𝒅𝒆𝒏𝒄𝒆 𝒅𝒆 𝒔𝒕𝒓𝒖𝒄𝒕𝒖𝒓𝒆𝒔 𝒄𝒂𝒄𝒉𝒆 ́ 𝒆𝒔 L’ACP permet de visualiser : ✔ Des groupes ✔ Des séparations ✔ Des clusters Exemples : • Variétés de plantes • Niveaux de fertigation • Plantes saines vs stressées • Groupes ER+ vs ER− Si les groupes sont séparés sur PC1 vs PC2 , cela signifie qu’ils diffèrent globalement. 🔹 𝑺𝒖𝒑𝒑𝒓𝒆𝒔𝒔𝒊𝒐𝒏 𝒅𝒆 𝒍𝒂 𝒓𝒆𝒅...