En Machine Learning, la régression sert à prédire une valeur numérique : prix d’une maison, chiffre d’affaires, température, rendement, score, etc. Mais il n’existe pas un seul modèle de régression. Chaque algorithme a sa logique, ses forces et ses limites. Voici un aperçu simple de quelques algorithmes très utilisés 𝟏. 𝑹é𝒈𝒓𝒆𝒔𝒔𝒊𝒐𝒏 𝒍𝒊𝒏é𝒂𝒊𝒓𝒆 C’est le modèle le plus classique. Elle fonctionne bien lorsque la relation entre X et Y est approximativement linéaire. Simple Rapide Facile à interpréter 𝟐. 𝑹é𝒈𝒓𝒆𝒔𝒔𝒊𝒐𝒏 𝒔𝒕𝒐𝒄𝒉𝒂𝒔𝒕𝒊𝒒𝒖𝒆 Elle introduit plus de flexibilité dans l’apprentissage et peut être utile lorsque les données sont plus complexes ou bruitées. Flexible Utile en apprentissage itératif 𝟑. 𝑹é𝒈𝒓𝒆𝒔𝒔𝒊𝒐𝒏 𝒂𝒓𝒃𝒓𝒆 𝒅𝒆 𝒅é𝒄𝒊𝒔𝒊𝒐𝒏 Elle découpe les données en plusieurs zones et prédit selon des règles successives. Capte les relations non linéaires Facile à visualiser Peut surapprendre si elle est mal réglée 𝟒. 𝑹é𝒈𝒓𝒆𝒔𝒔𝒊...
Articles
𝑳𝒆𝒔 𝑫𝒊𝒔𝒕𝒓𝒊𝒃𝒖𝒕𝒊𝒐𝒏𝒔 𝒅𝒆 𝑷𝒓𝒐𝒃𝒂𝒃𝒊𝒍𝒊𝒕é : 𝒄𝒐𝒎𝒑𝒓𝒆𝒏𝒅𝒓𝒆 𝒄𝒐𝒎𝒎𝒆𝒏𝒕 𝒍’𝒊𝒏𝒄𝒆𝒓𝒕𝒊𝒕𝒖𝒅𝒆 𝒔𝒆 𝒓é𝒑𝒂𝒓𝒕𝒊𝒕
- Obtenir le lien
- X
- Autres applications
En statistique, en économétrie et en Data Science, on ne travaille pas seulement avec des chiffres. On travaille surtout avec des phénomènes incertains : un client achète ou n’achète pas, un patient guérit ou ne guérit pas, un événement se produit une fois, plusieurs fois ou jamais. C’est là qu’interviennent les 𝒅𝒊𝒔𝒕𝒓𝒊𝒃𝒖𝒕𝒊𝒐𝒏𝒔 𝒅𝒆 𝒑𝒓𝒐𝒃𝒂𝒃𝒊𝒍𝒊𝒕é. Une distribution de probabilité permet de décrire 𝒍𝒆𝒔 𝒗𝒂𝒍𝒆𝒖𝒓𝒔 𝒑𝒐𝒔𝒔𝒊𝒃𝒍𝒆𝒔 𝒅’𝒖𝒏𝒆 𝒗𝒂𝒓𝒊𝒂𝒃𝒍𝒆 et la probabilité associée à chacune d’elles. 𝟏. 𝑳𝒆𝒔 𝒅𝒊𝒔𝒕𝒓𝒊𝒃𝒖𝒕𝒊𝒐𝒏𝒔 𝒅𝒊𝒔𝒄𝒓è𝒕𝒆𝒔 Elles concernent les variables que l’on peut compter. Exemples : le nombre de ventes, le nombre de clics, le nombre d’accidents, le nombre de clients satisfaits. On y retrouve notamment : 𝑩𝒆𝒓𝒏𝒐𝒖𝒍𝒍𝒊, pour un événement oui/non ; 𝑩𝒊𝒏𝒐𝒎𝒊𝒂𝒍𝒆, pour compter les succès sur plusieurs essais ; 𝑷𝒐𝒊𝒔𝒔𝒐𝒏, pour mesurer le nombre d’événements sur une période donnée. 𝟐. 𝑳𝒆𝒔 𝒅𝒊𝒔𝒕𝒓𝒊𝒃𝒖𝒕...
🔵 𝟏𝟎 𝒍𝒐𝒊𝒔 𝒅𝒆 𝒑𝒓𝒐𝒃𝒂𝒃𝒊𝒍𝒊𝒕é à 𝒎𝒂î𝒕𝒓𝒊𝒔𝒆𝒓 𝒆𝒏 𝑫𝒂𝒕𝒂 𝑺𝒄𝒊𝒆𝒏𝒄𝒆
- Obtenir le lien
- X
- Autres applications
En 𝑫𝒂𝒕𝒂 𝑺𝒄𝒊𝒆𝒏𝒄𝒆, les données ne sont pas toujours certaines, prévisibles ou régulières. Elles comportent souvent de l’𝒊𝒏𝒄𝒆𝒓𝒕𝒊𝒕𝒖𝒅𝒆, de la 𝒗𝒂𝒓𝒊𝒂𝒃𝒊𝒍𝒊𝒕é et parfois du 𝒉𝒂𝒔𝒂𝒓𝒅. C’est précisément là que les 𝒍𝒐𝒊𝒔 𝒅𝒆 𝒑𝒓𝒐𝒃𝒂𝒃𝒊𝒍𝒊𝒕é deviennent indispensables. Elles permettent de modéliser les phénomènes, anticiper les résultats, tester des hypothèses et prendre de meilleures décisions à partir des données. Voici 𝟏𝟎 𝒅𝒊𝒔𝒕𝒓𝒊𝒃𝒖𝒕𝒊𝒐𝒏𝒔 𝒆𝒔𝒔𝒆𝒏𝒕𝒊𝒆𝒍𝒍𝒆𝒔 à connaître : 𝑳𝒐𝒊 𝒖𝒏𝒊𝒇𝒐𝒓𝒎𝒆 Chaque résultat a la même chance d’apparaître. 𝑳𝒐𝒊 𝒃𝒊𝒏𝒐𝒎𝒊𝒂𝒍𝒆 Elle modélise le nombre de succès dans une série d’essais indépendants. 𝑳𝒐𝒊 𝒎𝒖𝒍𝒕𝒊𝒏𝒐𝒎𝒊𝒂𝒍𝒆 Elle généralise la loi binomiale lorsque plusieurs catégories sont possibles. 𝑳𝒐𝒊 𝒏𝒐𝒓𝒎𝒂𝒍𝒆 La célèbre courbe en cloche, très utilisée en statistique et en économétrie. 𝑳𝒐𝒊 𝒅𝒖 𝒌𝒉𝒊-𝒅𝒆𝒖𝒙 Très utile pour les tests d’indépendance, d’ajustement et d’...