𝑳𝒆𝒔 𝑫𝒊𝒔𝒕𝒓𝒊𝒃𝒖𝒕𝒊𝒐𝒏𝒔 𝒅𝒆 𝑷𝒓𝒐𝒃𝒂𝒃𝒊𝒍𝒊𝒕é : 𝒄𝒐𝒎𝒑𝒓𝒆𝒏𝒅𝒓𝒆 𝒄𝒐𝒎𝒎𝒆𝒏𝒕 𝒍’𝒊𝒏𝒄𝒆𝒓𝒕𝒊𝒕𝒖𝒅𝒆 𝒔𝒆 𝒓é𝒑𝒂𝒓𝒕𝒊𝒕

En statistique, en économétrie et en Data Science, on ne travaille pas seulement avec des chiffres.

On travaille surtout avec des phénomènes incertains :

un client achète ou n’achète pas,

un patient guérit ou ne guérit pas,

un événement se produit une fois, plusieurs fois ou jamais.

C’est là qu’interviennent les 𝒅𝒊𝒔𝒕𝒓𝒊𝒃𝒖𝒕𝒊𝒐𝒏𝒔 𝒅𝒆 𝒑𝒓𝒐𝒃𝒂𝒃𝒊𝒍𝒊𝒕é.

Une distribution de probabilité permet de décrire 𝒍𝒆𝒔 𝒗𝒂𝒍𝒆𝒖𝒓𝒔 𝒑𝒐𝒔𝒔𝒊𝒃𝒍𝒆𝒔 𝒅’𝒖𝒏𝒆 𝒗𝒂𝒓𝒊𝒂𝒃𝒍𝒆 et la probabilité associée à chacune d’elles.

𝟏. 𝑳𝒆𝒔 𝒅𝒊𝒔𝒕𝒓𝒊𝒃𝒖𝒕𝒊𝒐𝒏𝒔 𝒅𝒊𝒔𝒄𝒓è𝒕𝒆𝒔

Elles concernent les variables que l’on peut compter.

Exemples :

le nombre de ventes,

le nombre de clics,

le nombre d’accidents,

le nombre de clients satisfaits.

On y retrouve notamment :

𝑩𝒆𝒓𝒏𝒐𝒖𝒍𝒍𝒊, pour un événement oui/non ;

𝑩𝒊𝒏𝒐𝒎𝒊𝒂𝒍𝒆, pour compter les succès sur plusieurs essais ;

𝑷𝒐𝒊𝒔𝒔𝒐𝒏, pour mesurer le nombre d’événements sur une période donnée.

𝟐. 𝑳𝒆𝒔 𝒅𝒊𝒔𝒕𝒓𝒊𝒃𝒖𝒕𝒊𝒐𝒏𝒔 𝒄𝒐𝒏𝒕𝒊𝒏𝒖𝒆𝒔

Elles concernent les variables mesurables sur un intervalle.

Exemples :

le revenu,

le poids,

la taille,

le temps d’attente,

la température.

Parmi les plus utilisées, on retrouve :

𝑵𝒐𝒓𝒎𝒂𝒍𝒆, très présente dans les phénomènes naturels ;

𝑬𝒙𝒑𝒐𝒏𝒆𝒏𝒕𝒊𝒆𝒍𝒍𝒆, utile pour analyser les durées entre événements ;

𝑼𝒏𝒊𝒇𝒐𝒓𝒎𝒆, lorsque les valeurs ont la même probabilité d’apparaître.

𝑳𝒆𝒔 𝒊𝒅é𝒆𝒔 𝒄𝒍é𝒔 à 𝒓𝒆𝒕𝒆𝒏𝒊𝒓

Une distribution de probabilité doit respecter trois principes essentiels :

𝑳𝒆𝒔 𝒑𝒓𝒐𝒃𝒂𝒃𝒊𝒍𝒊𝒕é𝒔 𝒔𝒐𝒏𝒕 𝒑𝒐𝒔𝒊𝒕𝒊𝒗𝒆𝒔

Une probabilité ne peut jamais être négative.

𝑳𝒂 𝒔𝒐𝒎𝒎𝒆 𝒅𝒆𝒔 𝒑𝒓𝒐𝒃𝒂𝒃𝒊𝒍𝒊𝒕é𝒔 𝒗𝒂𝒖𝒕 𝟏

Autrement dit, tous les cas possibles couvrent 100 % des possibilités.

𝑳𝒂 𝒅𝒊𝒔𝒕𝒓𝒊𝒃𝒖𝒕𝒊𝒐𝒏 𝒂 𝒅𝒆𝒔 𝒑𝒂𝒓𝒂𝒎è𝒕𝒓𝒆𝒔

Comme la moyenne, la variance, l’écart-type ou le taux d’occurrence.

𝑷𝒐𝒖𝒓𝒒𝒖𝒐𝒊 𝒄’𝒆𝒔𝒕 𝒊𝒎𝒑𝒐𝒓𝒕𝒂𝒏𝒕 ?

Parce qu’avant de choisir un test statistique, un modèle économétrique ou un algorithme de machine learning, il faut comprendre 𝒍𝒂 𝒏𝒂𝒕𝒖𝒓𝒆 𝒅𝒆 𝒍𝒂 𝒗𝒂𝒓𝒊𝒂𝒃𝒍𝒆.

Une mauvaise compréhension de la distribution peut conduire à :

des tests mal choisis,

des modèles mal spécifiés,

des conclusions statistiques fragiles.

𝑨̀ 𝒓𝒆𝒕𝒆𝒏𝒊𝒓

Les distributions de probabilité sont la base pour comprendre l’incertitude, modéliser les données et prendre de meilleures décisions.

En Data Science, on ne se contente pas d’observer les données.

On cherche surtout à comprendre 𝒄𝒐𝒎𝒎𝒆𝒏𝒕 𝒆𝒍𝒍𝒆𝒔 𝒔𝒆 𝒓é𝒑𝒂𝒓𝒕𝒊𝒔𝒔𝒆𝒏𝒕.

Inscrivez-vous dès maintenant pour réserver votre place pour la prochaine session de notre formation en É𝗰𝗼𝗻𝗼𝗺é𝘁𝗿𝗶𝗲 𝗲𝘁 𝗧𝗲𝗰𝗵𝗻𝗶𝗾𝘂𝗲𝘀 quantitatives https://forms.gle/yZAZimRXbTFbUWZk6

#DataScience #Probabilités #Économétrie #AnalyseDeDonnées

Rechercher dans ce blog

Statistical Models for Social Sciences

𝑳𝒆𝒔 𝑫𝒊𝒔𝒕𝒓𝒊𝒃𝒖𝒕𝒊𝒐𝒏𝒔 𝒅𝒆 𝑷𝒓𝒐𝒃𝒂𝒃𝒊𝒍𝒊𝒕é : 𝒄𝒐𝒎𝒑𝒓𝒆𝒏𝒅𝒓𝒆 𝒄𝒐𝒎𝒎𝒆𝒏𝒕 𝒍’𝒊𝒏𝒄𝒆𝒓𝒕𝒊𝒕𝒖𝒅𝒆 𝒔𝒆 𝒓é𝒑𝒂𝒓𝒕𝒊𝒕

Commentaires

Enregistrer un commentaire

Posts les plus consultés de ce blog

Économétrie des données de panel: de la théorie à la pratique

comment exporter les résultats des estimations de STATA vers word, Excel...

panel ARDL in STATA