๐‘ณ๐’†๐’” ๐‘ซ๐’Š๐’”๐’•๐’“๐’Š๐’ƒ๐’–๐’•๐’Š๐’๐’๐’” ๐’…๐’† ๐‘ท๐’“๐’๐’ƒ๐’‚๐’ƒ๐’Š๐’๐’Š๐’•รฉ : ๐’„๐’๐’Ž๐’‘๐’“๐’†๐’๐’…๐’“๐’† ๐’„๐’๐’Ž๐’Ž๐’†๐’๐’• ๐’’๐’Š๐’๐’„๐’†๐’“๐’•๐’Š๐’•๐’–๐’…๐’† ๐’”๐’† ๐’“รฉ๐’‘๐’‚๐’“๐’•๐’Š๐’•

En statistique, en รฉconomรฉtrie et en Data Science, on ne travaille pas seulement avec des chiffres.

On travaille surtout avec des phรฉnomรจnes incertains :

un client achรจte ou n’achรจte pas,

un patient guรฉrit ou ne guรฉrit pas,

un รฉvรฉnement se produit une fois, plusieurs fois ou jamais.

C’est lร  qu’interviennent les ๐’…๐’Š๐’”๐’•๐’“๐’Š๐’ƒ๐’–๐’•๐’Š๐’๐’๐’” ๐’…๐’† ๐’‘๐’“๐’๐’ƒ๐’‚๐’ƒ๐’Š๐’๐’Š๐’•รฉ.

Une distribution de probabilitรฉ permet de dรฉcrire ๐’๐’†๐’” ๐’—๐’‚๐’๐’†๐’–๐’“๐’” ๐’‘๐’๐’”๐’”๐’Š๐’ƒ๐’๐’†๐’” ๐’…’๐’–๐’๐’† ๐’—๐’‚๐’“๐’Š๐’‚๐’ƒ๐’๐’† et la probabilitรฉ associรฉe ร  chacune d’elles.

๐Ÿ. ๐‘ณ๐’†๐’” ๐’…๐’Š๐’”๐’•๐’“๐’Š๐’ƒ๐’–๐’•๐’Š๐’๐’๐’” ๐’…๐’Š๐’”๐’„๐’“รจ๐’•๐’†๐’”

Elles concernent les variables que l’on peut compter.

Exemples :

le nombre de ventes,

le nombre de clics,

le nombre d’accidents,

le nombre de clients satisfaits.

On y retrouve notamment :

๐‘ฉ๐’†๐’“๐’๐’๐’–๐’๐’๐’Š, pour un รฉvรฉnement oui/non ;

๐‘ฉ๐’Š๐’๐’๐’Ž๐’Š๐’‚๐’๐’†, pour compter les succรจs sur plusieurs essais ;

๐‘ท๐’๐’Š๐’”๐’”๐’๐’, pour mesurer le nombre d’รฉvรฉnements sur une pรฉriode donnรฉe.

๐Ÿ. ๐‘ณ๐’†๐’” ๐’…๐’Š๐’”๐’•๐’“๐’Š๐’ƒ๐’–๐’•๐’Š๐’๐’๐’” ๐’„๐’๐’๐’•๐’Š๐’๐’–๐’†๐’”

Elles concernent les variables mesurables sur un intervalle.

Exemples :

le revenu,

le poids,

la taille,

le temps d’attente,

la tempรฉrature.

Parmi les plus utilisรฉes, on retrouve :

๐‘ต๐’๐’“๐’Ž๐’‚๐’๐’†, trรจs prรฉsente dans les phรฉnomรจnes naturels ;

๐‘ฌ๐’™๐’‘๐’๐’๐’†๐’๐’•๐’Š๐’†๐’๐’๐’†, utile pour analyser les durรฉes entre รฉvรฉnements ;

๐‘ผ๐’๐’Š๐’‡๐’๐’“๐’Ž๐’†, lorsque les valeurs ont la mรชme probabilitรฉ d’apparaรฎtre.

๐‘ณ๐’†๐’” ๐’Š๐’…รฉ๐’†๐’” ๐’„๐’รฉ๐’” ร  ๐’“๐’†๐’•๐’†๐’๐’Š๐’“

Une distribution de probabilitรฉ doit respecter trois principes essentiels :

๐‘ณ๐’†๐’” ๐’‘๐’“๐’๐’ƒ๐’‚๐’ƒ๐’Š๐’๐’Š๐’•รฉ๐’” ๐’”๐’๐’๐’• ๐’‘๐’๐’”๐’Š๐’•๐’Š๐’—๐’†๐’”

Une probabilitรฉ ne peut jamais รชtre nรฉgative.

๐‘ณ๐’‚ ๐’”๐’๐’Ž๐’Ž๐’† ๐’…๐’†๐’” ๐’‘๐’“๐’๐’ƒ๐’‚๐’ƒ๐’Š๐’๐’Š๐’•รฉ๐’” ๐’—๐’‚๐’–๐’• ๐Ÿ

Autrement dit, tous les cas possibles couvrent 100 % des possibilitรฉs.

๐‘ณ๐’‚ ๐’…๐’Š๐’”๐’•๐’“๐’Š๐’ƒ๐’–๐’•๐’Š๐’๐’ ๐’‚ ๐’…๐’†๐’” ๐’‘๐’‚๐’“๐’‚๐’Žรจ๐’•๐’“๐’†๐’”

Comme la moyenne, la variance, l’รฉcart-type ou le taux d’occurrence.

๐‘ท๐’๐’–๐’“๐’’๐’–๐’๐’Š ๐’„’๐’†๐’”๐’• ๐’Š๐’Ž๐’‘๐’๐’“๐’•๐’‚๐’๐’• ?

Parce qu’avant de choisir un test statistique, un modรจle รฉconomรฉtrique ou un algorithme de machine learning, il faut comprendre ๐’๐’‚ ๐’๐’‚๐’•๐’–๐’“๐’† ๐’…๐’† ๐’๐’‚ ๐’—๐’‚๐’“๐’Š๐’‚๐’ƒ๐’๐’†.

Une mauvaise comprรฉhension de la distribution peut conduire ร  :

des tests mal choisis,

des modรจles mal spรฉcifiรฉs,

des conclusions statistiques fragiles.

๐‘จ̀ ๐’“๐’†๐’•๐’†๐’๐’Š๐’“

Les distributions de probabilitรฉ sont la base pour comprendre l’incertitude, modรฉliser les donnรฉes et prendre de meilleures dรฉcisions.

En Data Science, on ne se contente pas d’observer les donnรฉes.

On cherche surtout ร  comprendre ๐’„๐’๐’Ž๐’Ž๐’†๐’๐’• ๐’†๐’๐’๐’†๐’” ๐’”๐’† ๐’“รฉ๐’‘๐’‚๐’“๐’•๐’Š๐’”๐’”๐’†๐’๐’•.

Inscrivez-vous dรจs maintenant pour rรฉserver votre place pour la prochaine session de notre formation en ร‰๐—ฐ๐—ผ๐—ป๐—ผ๐—บรฉ๐˜๐—ฟ๐—ถ๐—ฒ ๐—ฒ๐˜ ๐—ง๐—ฒ๐—ฐ๐—ต๐—ป๐—ถ๐—พ๐˜‚๐—ฒ๐˜€ quantitatives https://forms.gle/yZAZimRXbTFbUWZk6




#DataScience #Probabilitรฉs #ร‰conomรฉtrie #AnalyseDeDonnรฉes

Commentaires

Posts les plus consultรฉs de ce blog

ร‰conomรฉtrie des donnรฉes de panel: de la thรฉorie ร  la pratique