𝙈𝙤𝙮𝙚𝙣𝙣𝙚 𝙫𝙨 𝙈𝙚́𝙙𝙞𝙖𝙣𝙚 : 𝘾𝙤𝙢𝙥𝙧𝙚𝙣𝙙𝙧𝙚 𝙡𝙖 𝙙𝙞𝙛𝙛𝙚́𝙧𝙚𝙣𝙘𝙚 𝙥𝙤𝙪𝙧 𝙢𝙞𝙚𝙪𝙭 𝙖𝙣𝙖𝙡𝙮𝙨𝙚𝙧 𝙫𝙤𝙨 𝙙𝙤𝙣𝙣𝙚́𝙚𝙨 📊

Comprendre la différence entre la moyenne et la médiane est essentiel en analyse de données. Bien qu’elles soient toutes deux des mesures de tendance centrale, elles peuvent produire des résultats très différents lorsque le jeu de données contient des valeurs aberrantes (outliers).

Bien distinguer moyenne et médiane permet de choisir la mesure la plus adaptée selon les caractéristiques de vos données.
La médiane est particulièrement pertinente pour les distributions asymétriques, car elle n’est pas influencée par les valeurs extrêmes et reflète mieux la valeur centrale réelle.
La moyenne reste idéale pour les distributions normales, où chaque observation contribue équitablement au calcul.

Ne pas faire la différence entre moyenne et médiane peut conduire à des interprétations erronées, surtout en présence d’outliers ou de distributions biaisées.
Un mauvais choix de la mesure peut générer des conclusions biaisées, impactant la prise de décision fondée sur les données.

Dans la visualisation associée à ce post, deux jeux de données sont comparés à l’aide de courbes de densité.
👉 À gauche, la moyenne et la médiane sont proches, ce qui indique une distribution symétrique.
👉 À droite, les valeurs extrêmes tirent la moyenne vers l’extérieur, tandis que la médiane reste proche du mode, offrant une représentation plus fidèle du centre de la distribution.

🔹 R : utilisez les fonctions mean() et median() (base R), combinées à ggplot2 pour visualiser et comparer ces mesures.
🔹 Python : utilisez mean() et median() (modules statistics ou numpy) et visualisez avec matplotlib ou seaborn.


𝙀𝙣𝙫𝙞𝙚 𝙙𝙖𝙡𝙡𝙚𝙧 𝙥𝙡𝙪𝙨 𝙡𝙤𝙞𝙣 ?

Pour mieux apprendre l’utilisation des logiciel et modèles statistiques, nous vous invitons à prendre part à la prochaine session de notre formation en 𝙀𝙘𝙤𝙣𝙤𝙢é𝙩𝙧𝙞𝙚 𝙚𝙩 𝙏𝙚𝙘𝙝𝙣𝙞𝙦𝙪𝙚𝙨 𝙌𝙪𝙖𝙣𝙩𝙞𝙩𝙖𝙩𝙞𝙫𝙚𝙨 https://https://forms.gle/mopoGRWKwyTtbEJ16



________________________________________

________________________________________

💙 𝙡𝙞𝙠𝙚 𝙚𝙩 𝙪𝙣 𝙋artage si ce contenu vous a été utile !


 

#AnalyseDeDonnées #Statistiques #RStats #PythonData #DataVisualization

 

Commentaires

Posts les plus consultés de ce blog

Économétrie des données de panel: de la théorie à la pratique