📌 𝗗𝗮𝘁𝗮 𝗔𝗻𝗮𝗹𝘆𝘀𝘁 : 𝟲 𝗰𝗼𝗻𝗰𝗲𝗽𝘁𝘀 𝘀𝘁𝗮𝘁𝗶𝘀𝘁𝗶𝗾𝘂𝗲𝘀 𝗮̀ 𝗺𝗮𝗶̂𝘁𝗿𝗶𝘀𝗲𝗿 𝗽𝗼𝘂𝗿 𝗺𝗶𝗲𝘂𝘅 𝗮𝗻𝗮𝗹𝘆𝘀𝗲𝗿 𝗹𝗲𝘀 𝗱𝗼𝗻𝗻𝗲́𝗲𝘀 📊

La statistique est l’un des fondements les plus importants de l’𝗮𝗻𝗮𝗹𝘆𝘀𝗲 𝗱𝗲 𝗱𝗼𝗻𝗻𝗲́𝗲𝘀.

Un bon Data Analyst ne se contente pas de produire des tableaux, des graphiques ou des dashboards.

Il doit surtout savoir 𝗿𝗲́𝘀𝘂𝗺𝗲𝗿, 𝗰𝗼𝗺𝗽𝗮𝗿𝗲𝗿, 𝘁𝗲𝘀𝘁𝗲𝗿, 𝗺𝗼𝗱𝗲́𝗹𝗶𝘀𝗲𝗿 𝗲𝘁 𝗶𝗻𝘁𝗲𝗿𝗽𝗿𝗲́𝘁𝗲𝗿 correctement les données.

Voici 𝟲 𝗰𝗼𝗻𝗰𝗲𝗽𝘁𝘀 𝘀𝘁𝗮𝘁𝗶𝘀𝘁𝗶𝗾𝘂𝗲𝘀 essentiels à maîtriser 👇

𝟭. 𝗦𝘁𝗮𝘁𝗶𝘀𝘁𝗶𝗾𝘂𝗲𝘀 𝗱𝗲𝘀𝗰𝗿𝗶𝗽𝘁𝗶𝘃𝗲𝘀

Elles permettent de résumer les données à travers des indicateurs simples comme :

• la 𝗺𝗼𝘆𝗲𝗻𝗻𝗲 ;
• la 𝗺𝗲́𝗱𝗶𝗮𝗻𝗲 ;
• le 𝗺𝗼𝗱𝗲 ;
• la 𝘃𝗮𝗿𝗶𝗮𝗻𝗰𝗲 ;
• l’𝗲́𝗰𝗮𝗿𝘁-𝘁𝘆𝗽𝗲.

C’est la première étape pour comprendre la structure d’un jeu de données.

𝟮. 𝗣𝗿𝗼𝗯𝗮𝗯𝗶𝗹𝗶𝘁𝗲́𝘀

Les probabilités aident à analyser l’incertitude.

Elles permettent de comprendre les 𝗲́𝘃𝗲́𝗻𝗲𝗺𝗲𝗻𝘁𝘀 𝗶𝗻𝗱𝗲́𝗽𝗲𝗻𝗱𝗮𝗻𝘁𝘀, les 𝗲́𝘃𝗲́𝗻𝗲𝗺𝗲𝗻𝘁𝘀 𝗱𝗲́𝗽𝗲𝗻𝗱𝗮𝗻𝘁𝘀 et les principales distributions comme la 𝗹𝗼𝗶 𝗻𝗼𝗿𝗺𝗮𝗹𝗲, la 𝗹𝗼𝗶 𝗯𝗶𝗻𝗼𝗺𝗶𝗮𝗹𝗲 ou la 𝗹𝗼𝗶 𝗱𝗲 𝗣𝗼𝗶𝘀𝘀𝗼𝗻.

Sans probabilités, il devient difficile de raisonner correctement face au hasard.

𝟯. 𝗦𝘁𝗮𝘁𝗶𝘀𝘁𝗶𝗾𝘂𝗲𝘀 𝗶𝗻𝗳𝗲́𝗿𝗲𝗻𝘁𝗶𝗲𝗹𝗹𝗲𝘀

Elles permettent de tirer des conclusions sur une population à partir d’un échantillon.

On y retrouve notamment :

• les 𝘁𝗲𝘀𝘁𝘀 𝗱’𝗵𝘆𝗽𝗼𝘁𝗵𝗲̀𝘀𝗲 ;
• les 𝗶𝗻𝘁𝗲𝗿𝘃𝗮𝗹𝗹𝗲𝘀 𝗱𝗲 𝗰𝗼𝗻𝗳𝗶𝗮𝗻𝗰𝗲 ;
• les 𝗽-𝘃𝗮𝗹𝘂𝗲𝘀 ;
• les marges d’erreur.

C’est indispensable pour passer de la simple description à une analyse plus rigoureuse.

𝟰. 𝗖𝗼𝗿𝗿𝗲́𝗹𝗮𝘁𝗶𝗼𝗻 𝘃𝘀 𝗖𝗮𝘂𝘀𝗮𝗹𝗶𝘁𝗲́

Deux variables peuvent évoluer ensemble sans que l’une soit la cause de l’autre.

C’est pourquoi il faut toujours faire attention aux 𝗰𝗼𝗿𝗿𝗲́𝗹𝗮𝘁𝗶𝗼𝗻𝘀 𝗳𝗮𝗹𝗹𝗮𝗰𝗶𝗲𝘂𝘀𝗲𝘀.

Une corrélation peut suggérer une relation, mais elle ne prouve pas automatiquement une causalité.

𝟱. 𝗔𝗻𝗮𝗹𝘆𝘀𝗲 𝗱𝗲 𝗿𝗲́𝗴𝗿𝗲𝘀𝘀𝗶𝗼𝗻

La régression permet d’expliquer ou de prédire une variable à partir d’une ou plusieurs autres variables.

Elle peut être :

• 𝘀𝗶𝗺𝗽𝗹𝗲, lorsqu’il y a une seule variable explicative ;
• 𝗺𝘂𝗹𝘁𝗶𝗽𝗹𝗲, lorsqu’il y a plusieurs variables explicatives.

C’est l’un des outils les plus utilisés en data analysis, économétrie et machine learning.

𝟲. 𝗗𝗶𝘀𝘁𝗿𝗶𝗯𝘂𝘁𝗶𝗼𝗻𝘀 𝗱𝗲 𝗱𝗼𝗻𝗻𝗲́𝗲𝘀

Comprendre la distribution des données permet de choisir les bons outils d’analyse.

Une variable peut être :

• 𝗻𝗼𝗿𝗺𝗮𝗹𝗲 ;
• 𝗮𝘀𝘆𝗺𝗲́𝘁𝗿𝗶𝗾𝘂𝗲 ;
• 𝗱𝗶𝘀𝗰𝗿𝗲̀𝘁𝗲 ;
• 𝗰𝗼𝗻𝘁𝗶𝗻𝘂𝗲 ;
• 𝗰𝗮𝘁𝗲́𝗴𝗼𝗿𝗶𝗲𝗹𝗹𝗲.

Analyser la forme d’une distribution aide à éviter les mauvaises interprétations.

📍 𝗔̀ 𝗿𝗲𝘁𝗲𝗻𝗶𝗿

Maîtriser ces 6 notions permet de mieux comprendre les données, de choisir les bonnes méthodes, d’éviter les erreurs d’interprétation et de prendre de meilleures décisions.

En data analysis, les outils sont importants.

Mais la vraie valeur vient de la capacité à 𝗿𝗮𝗶𝘀𝗼𝗻𝗻𝗲𝗿 𝘀𝘁𝗮𝘁𝗶𝘀𝘁𝗶𝗾𝘂𝗲𝗺𝗲𝗻𝘁.

Si cette publication vous a été utile, pensez à 𝗹𝗶𝗸𝗲𝗿, 𝗽𝗮𝗿𝘁𝗮𝗴𝗲𝗿 et 𝘃𝗼𝘂𝘀 𝗮𝗯𝗼𝗻𝗻𝗲𝗿 à la page.

Pour mieux apprendre l’utilisation des logiciels et modèles statistiques, prenez part à notre prochaine formation en 𝗘́𝗰𝗼𝗻𝗼𝗺𝗲́𝘁𝗿𝗶𝗲 𝗲𝘁 𝗧𝗲𝗰𝗵𝗻𝗶𝗾𝘂𝗲𝘀 𝗤𝘂𝗮𝗻𝘁𝗶𝘁𝗮𝘁𝗶𝘃𝗲𝘀 https://forms.gle/yZAZimRXbTFbUWZk6

#DataAnalysis #Statistiques #DataScience #MachineLearning #BigData

Rechercher dans ce blog

Statistical Models for Social Sciences

Commentaires

Enregistrer un commentaire

Posts les plus consultés de ce blog

Économétrie des données de panel: de la théorie à la pratique

panel ARDL in STATA

comment exporter les résultats des estimations de STATA vers word, Excel...