๐ณ๐๐ ๐ซ๐๐๐๐๐๐๐๐๐๐๐๐ ๐ ๐ ๐ท๐๐๐๐๐๐๐๐๐รฉ : ๐๐๐๐๐๐๐๐ ๐๐ ๐๐๐๐๐๐๐ ๐’๐๐๐๐๐๐๐๐๐๐ ๐ ๐๐ ๐รฉ๐๐๐๐๐๐
En statistique, en รฉconomรฉtrie et en Data Science, on ne travaille pas seulement avec des chiffres.
On travaille surtout avec des phรฉnomรจnes incertains :
un client achรจte ou n’achรจte pas,
un patient guรฉrit ou ne guรฉrit pas,
un รฉvรฉnement se produit une fois, plusieurs fois ou jamais.
C’est lร qu’interviennent les ๐ ๐๐๐๐๐๐๐๐๐๐๐๐ ๐ ๐ ๐๐๐๐๐๐๐๐๐๐รฉ.
Une distribution de probabilitรฉ permet de dรฉcrire ๐๐๐ ๐๐๐๐๐๐๐ ๐๐๐๐๐๐๐๐๐ ๐ ’๐๐๐ ๐๐๐๐๐๐๐๐ et la probabilitรฉ associรฉe ร chacune d’elles.
๐. ๐ณ๐๐ ๐ ๐๐๐๐๐๐๐๐๐๐๐๐ ๐ ๐๐๐๐รจ๐๐๐
Elles concernent les variables que l’on peut compter.
Exemples :
le nombre de ventes,
le nombre de clics,
le nombre d’accidents,
le nombre de clients satisfaits.
On y retrouve notamment :
๐ฉ๐๐๐๐๐๐๐๐, pour un รฉvรฉnement oui/non ;
๐ฉ๐๐๐๐๐๐๐๐, pour compter les succรจs sur plusieurs essais ;
๐ท๐๐๐๐๐๐, pour mesurer le nombre d’รฉvรฉnements sur une pรฉriode donnรฉe.
๐. ๐ณ๐๐ ๐ ๐๐๐๐๐๐๐๐๐๐๐๐ ๐๐๐๐๐๐๐๐๐
Elles concernent les variables mesurables sur un intervalle.
Exemples :
le revenu,
le poids,
la taille,
le temps d’attente,
la tempรฉrature.
Parmi les plus utilisรฉes, on retrouve :
๐ต๐๐๐๐๐๐, trรจs prรฉsente dans les phรฉnomรจnes naturels ;
๐ฌ๐๐๐๐๐๐๐๐๐๐๐๐, utile pour analyser les durรฉes entre รฉvรฉnements ;
๐ผ๐๐๐๐๐๐๐, lorsque les valeurs ont la mรชme probabilitรฉ d’apparaรฎtre.
๐ณ๐๐ ๐๐ รฉ๐๐ ๐๐รฉ๐ ร ๐๐๐๐๐๐๐
Une distribution de probabilitรฉ doit respecter trois principes essentiels :
๐ณ๐๐ ๐๐๐๐๐๐๐๐๐๐รฉ๐ ๐๐๐๐ ๐๐๐๐๐๐๐๐๐
Une probabilitรฉ ne peut jamais รชtre nรฉgative.
๐ณ๐ ๐๐๐๐๐ ๐ ๐๐ ๐๐๐๐๐๐๐๐๐๐รฉ๐ ๐๐๐๐ ๐
Autrement dit, tous les cas possibles couvrent 100 % des possibilitรฉs.
๐ณ๐ ๐ ๐๐๐๐๐๐๐๐๐๐๐ ๐ ๐ ๐๐ ๐๐๐๐๐รจ๐๐๐๐
Comme la moyenne, la variance, l’รฉcart-type ou le taux d’occurrence.
๐ท๐๐๐๐๐๐๐ ๐’๐๐๐ ๐๐๐๐๐๐๐๐๐ ?
Parce qu’avant de choisir un test statistique, un modรจle รฉconomรฉtrique ou un algorithme de machine learning, il faut comprendre ๐๐ ๐๐๐๐๐๐ ๐ ๐ ๐๐ ๐๐๐๐๐๐๐๐.
Une mauvaise comprรฉhension de la distribution peut conduire ร :
des tests mal choisis,
des modรจles mal spรฉcifiรฉs,
des conclusions statistiques fragiles.
๐จ̀ ๐๐๐๐๐๐๐
Les distributions de probabilitรฉ sont la base pour comprendre l’incertitude, modรฉliser les donnรฉes et prendre de meilleures dรฉcisions.
En Data Science, on ne se contente pas d’observer les donnรฉes.
On cherche surtout ร comprendre ๐๐๐๐๐๐๐ ๐๐๐๐๐ ๐๐ ๐รฉ๐๐๐๐๐๐๐๐๐๐.
Inscrivez-vous dรจs maintenant pour rรฉserver votre place pour la prochaine session de notre formation en ร๐ฐ๐ผ๐ป๐ผ๐บรฉ๐๐ฟ๐ถ๐ฒ ๐ฒ๐ ๐ง๐ฒ๐ฐ๐ต๐ป๐ถ๐พ๐๐ฒ๐ quantitatives https://forms.gle/yZAZimRXbTFbUWZk6
#DataScience #Probabilitรฉs #รconomรฉtrie #AnalyseDeDonnรฉes

Commentaires
Enregistrer un commentaire