๐Ÿ“Œ ๐——๐—ฎ๐˜๐—ฎ ๐—”๐—ป๐—ฎ๐—น๐˜†๐˜€๐˜ : ๐Ÿฒ ๐—ฐ๐—ผ๐—ป๐—ฐ๐—ฒ๐—ฝ๐˜๐˜€ ๐˜€๐˜๐—ฎ๐˜๐—ถ๐˜€๐˜๐—ถ๐—พ๐˜‚๐—ฒ๐˜€ ๐—ฎ̀ ๐—บ๐—ฎ๐—ถ̂๐˜๐—ฟ๐—ถ๐˜€๐—ฒ๐—ฟ ๐—ฝ๐—ผ๐˜‚๐—ฟ ๐—บ๐—ถ๐—ฒ๐˜‚๐˜… ๐—ฎ๐—ป๐—ฎ๐—น๐˜†๐˜€๐—ฒ๐—ฟ ๐—น๐—ฒ๐˜€ ๐—ฑ๐—ผ๐—ป๐—ป๐—ฒ́๐—ฒ๐˜€ ๐Ÿ“Š

La statistique est l’un des fondements les plus importants de l’๐—ฎ๐—ป๐—ฎ๐—น๐˜†๐˜€๐—ฒ ๐—ฑ๐—ฒ ๐—ฑ๐—ผ๐—ป๐—ป๐—ฒ́๐—ฒ๐˜€.

Un bon Data Analyst ne se contente pas de produire des tableaux, des graphiques ou des dashboards.

Il doit surtout savoir ๐—ฟ๐—ฒ́๐˜€๐˜‚๐—บ๐—ฒ๐—ฟ, ๐—ฐ๐—ผ๐—บ๐—ฝ๐—ฎ๐—ฟ๐—ฒ๐—ฟ, ๐˜๐—ฒ๐˜€๐˜๐—ฒ๐—ฟ, ๐—บ๐—ผ๐—ฑ๐—ฒ́๐—น๐—ถ๐˜€๐—ฒ๐—ฟ ๐—ฒ๐˜ ๐—ถ๐—ป๐˜๐—ฒ๐—ฟ๐—ฝ๐—ฟ๐—ฒ́๐˜๐—ฒ๐—ฟ correctement les donnรฉes.

Voici ๐Ÿฒ ๐—ฐ๐—ผ๐—ป๐—ฐ๐—ฒ๐—ฝ๐˜๐˜€ ๐˜€๐˜๐—ฎ๐˜๐—ถ๐˜€๐˜๐—ถ๐—พ๐˜‚๐—ฒ๐˜€ essentiels ร  maรฎtriser ๐Ÿ‘‡

๐Ÿญ. ๐—ฆ๐˜๐—ฎ๐˜๐—ถ๐˜€๐˜๐—ถ๐—พ๐˜‚๐—ฒ๐˜€ ๐—ฑ๐—ฒ๐˜€๐—ฐ๐—ฟ๐—ถ๐—ฝ๐˜๐—ถ๐˜ƒ๐—ฒ๐˜€

Elles permettent de rรฉsumer les donnรฉes ร  travers des indicateurs simples comme :

• la ๐—บ๐—ผ๐˜†๐—ฒ๐—ป๐—ป๐—ฒ ;
• la
๐—บ๐—ฒ́๐—ฑ๐—ถ๐—ฎ๐—ป๐—ฒ ;
• le
๐—บ๐—ผ๐—ฑ๐—ฒ ;
• la
๐˜ƒ๐—ฎ๐—ฟ๐—ถ๐—ฎ๐—ป๐—ฐ๐—ฒ ;
• l’
๐—ฒ́๐—ฐ๐—ฎ๐—ฟ๐˜-๐˜๐˜†๐—ฝ๐—ฒ.

C’est la premiรจre รฉtape pour comprendre la structure d’un jeu de donnรฉes.

๐Ÿฎ. ๐—ฃ๐—ฟ๐—ผ๐—ฏ๐—ฎ๐—ฏ๐—ถ๐—น๐—ถ๐˜๐—ฒ́๐˜€

Les probabilitรฉs aident ร  analyser l’incertitude.

Elles permettent de comprendre les ๐—ฒ́๐˜ƒ๐—ฒ́๐—ป๐—ฒ๐—บ๐—ฒ๐—ป๐˜๐˜€ ๐—ถ๐—ป๐—ฑ๐—ฒ́๐—ฝ๐—ฒ๐—ป๐—ฑ๐—ฎ๐—ป๐˜๐˜€, les ๐—ฒ́๐˜ƒ๐—ฒ́๐—ป๐—ฒ๐—บ๐—ฒ๐—ป๐˜๐˜€ ๐—ฑ๐—ฒ́๐—ฝ๐—ฒ๐—ป๐—ฑ๐—ฎ๐—ป๐˜๐˜€ et les principales distributions comme la ๐—น๐—ผ๐—ถ ๐—ป๐—ผ๐—ฟ๐—บ๐—ฎ๐—น๐—ฒ, la ๐—น๐—ผ๐—ถ ๐—ฏ๐—ถ๐—ป๐—ผ๐—บ๐—ถ๐—ฎ๐—น๐—ฒ ou la ๐—น๐—ผ๐—ถ ๐—ฑ๐—ฒ ๐—ฃ๐—ผ๐—ถ๐˜€๐˜€๐—ผ๐—ป.

Sans probabilitรฉs, il devient difficile de raisonner correctement face au hasard.

๐Ÿฏ. ๐—ฆ๐˜๐—ฎ๐˜๐—ถ๐˜€๐˜๐—ถ๐—พ๐˜‚๐—ฒ๐˜€ ๐—ถ๐—ป๐—ณ๐—ฒ́๐—ฟ๐—ฒ๐—ป๐˜๐—ถ๐—ฒ๐—น๐—น๐—ฒ๐˜€

Elles permettent de tirer des conclusions sur une population ร  partir d’un รฉchantillon.

On y retrouve notamment :

• les ๐˜๐—ฒ๐˜€๐˜๐˜€ ๐—ฑ๐—ต๐˜†๐—ฝ๐—ผ๐˜๐—ต๐—ฒ̀๐˜€๐—ฒ ;
• les
๐—ถ๐—ป๐˜๐—ฒ๐—ฟ๐˜ƒ๐—ฎ๐—น๐—น๐—ฒ๐˜€ ๐—ฑ๐—ฒ ๐—ฐ๐—ผ๐—ป๐—ณ๐—ถ๐—ฎ๐—ป๐—ฐ๐—ฒ ;
• les
๐—ฝ-๐˜ƒ๐—ฎ๐—น๐˜‚๐—ฒ๐˜€ ;
• les marges d’erreur.

C’est indispensable pour passer de la simple description ร  une analyse plus rigoureuse.

๐Ÿฐ. ๐—–๐—ผ๐—ฟ๐—ฟ๐—ฒ́๐—น๐—ฎ๐˜๐—ถ๐—ผ๐—ป ๐˜ƒ๐˜€ ๐—–๐—ฎ๐˜‚๐˜€๐—ฎ๐—น๐—ถ๐˜๐—ฒ́

Deux variables peuvent รฉvoluer ensemble sans que l’une soit la cause de l’autre.

C’est pourquoi il faut toujours faire attention aux ๐—ฐ๐—ผ๐—ฟ๐—ฟ๐—ฒ́๐—น๐—ฎ๐˜๐—ถ๐—ผ๐—ป๐˜€ ๐—ณ๐—ฎ๐—น๐—น๐—ฎ๐—ฐ๐—ถ๐—ฒ๐˜‚๐˜€๐—ฒ๐˜€.

Une corrรฉlation peut suggรฉrer une relation, mais elle ne prouve pas automatiquement une causalitรฉ.

๐Ÿฑ. ๐—”๐—ป๐—ฎ๐—น๐˜†๐˜€๐—ฒ ๐—ฑ๐—ฒ ๐—ฟ๐—ฒ́๐—ด๐—ฟ๐—ฒ๐˜€๐˜€๐—ถ๐—ผ๐—ป

La rรฉgression permet d’expliquer ou de prรฉdire une variable ร  partir d’une ou plusieurs autres variables.

Elle peut รชtre :

๐˜€๐—ถ๐—บ๐—ฝ๐—น๐—ฒ, lorsqu’il y a une seule variable explicative ;
๐—บ๐˜‚๐—น๐˜๐—ถ๐—ฝ๐—น๐—ฒ, lorsqu’il y a plusieurs variables explicatives.

C’est l’un des outils les plus utilisรฉs en data analysis, รฉconomรฉtrie et machine learning.

๐Ÿฒ. ๐——๐—ถ๐˜€๐˜๐—ฟ๐—ถ๐—ฏ๐˜‚๐˜๐—ถ๐—ผ๐—ป๐˜€ ๐—ฑ๐—ฒ ๐—ฑ๐—ผ๐—ป๐—ป๐—ฒ́๐—ฒ๐˜€

Comprendre la distribution des donnรฉes permet de choisir les bons outils d’analyse.

Une variable peut รชtre :

๐—ป๐—ผ๐—ฟ๐—บ๐—ฎ๐—น๐—ฒ ;
๐—ฎ๐˜€๐˜†๐—บ๐—ฒ́๐˜๐—ฟ๐—ถ๐—พ๐˜‚๐—ฒ ;
๐—ฑ๐—ถ๐˜€๐—ฐ๐—ฟ๐—ฒ̀๐˜๐—ฒ ;
๐—ฐ๐—ผ๐—ป๐˜๐—ถ๐—ป๐˜‚๐—ฒ ;
๐—ฐ๐—ฎ๐˜๐—ฒ́๐—ด๐—ผ๐—ฟ๐—ถ๐—ฒ๐—น๐—น๐—ฒ.

Analyser la forme d’une distribution aide ร  รฉviter les mauvaises interprรฉtations.

๐Ÿ“ ๐—”̀ ๐—ฟ๐—ฒ๐˜๐—ฒ๐—ป๐—ถ๐—ฟ

Maรฎtriser ces 6 notions permet de mieux comprendre les donnรฉes, de choisir les bonnes mรฉthodes, d’รฉviter les erreurs d’interprรฉtation et de prendre de meilleures dรฉcisions.

En data analysis, les outils sont importants.

Mais la vraie valeur vient de la capacitรฉ ร  ๐—ฟ๐—ฎ๐—ถ๐˜€๐—ผ๐—ป๐—ป๐—ฒ๐—ฟ ๐˜€๐˜๐—ฎ๐˜๐—ถ๐˜€๐˜๐—ถ๐—พ๐˜‚๐—ฒ๐—บ๐—ฒ๐—ป๐˜.

Si cette publication vous a รฉtรฉ utile, pensez ร  ๐—น๐—ถ๐—ธ๐—ฒ๐—ฟ, ๐—ฝ๐—ฎ๐—ฟ๐˜๐—ฎ๐—ด๐—ฒ๐—ฟ et ๐˜ƒ๐—ผ๐˜‚๐˜€ ๐—ฎ๐—ฏ๐—ผ๐—ป๐—ป๐—ฒ๐—ฟ ร  la page.

Pour mieux apprendre l’utilisation des logiciels et modรจles statistiques, prenez part ร  notre prochaine formation en ๐—˜́๐—ฐ๐—ผ๐—ป๐—ผ๐—บ๐—ฒ́๐˜๐—ฟ๐—ถ๐—ฒ ๐—ฒ๐˜ ๐—ง๐—ฒ๐—ฐ๐—ต๐—ป๐—ถ๐—พ๐˜‚๐—ฒ๐˜€ ๐—ค๐˜‚๐—ฎ๐—ป๐˜๐—ถ๐˜๐—ฎ๐˜๐—ถ๐˜ƒ๐—ฒ๐˜€ https://forms.gle/yZAZimRXbTFbUWZk6



#DataAnalysis #Statistiques #DataScience #MachineLearning #BigData

 

Commentaires

Posts les plus consultรฉs de ce blog

ร‰conomรฉtrie des donnรฉes de panel: de la thรฉorie ร  la pratique