๐‘นรฉ๐’ˆ๐’“๐’†๐’”๐’”๐’Š๐’๐’ ๐‘ณ๐’๐’ˆ๐’Š๐’”๐’•๐’Š๐’’๐’–๐’† : ๐’’๐’‚๐’๐’ˆ๐’๐’“๐’Š๐’•๐’‰๐’Ž๐’† ๐’’๐’–๐’Š ๐’•๐’“๐’‚๐’๐’”๐’‡๐’๐’“๐’Ž๐’† ๐’๐’†๐’” ๐’…๐’๐’๐’รฉ๐’†๐’” ๐’†๐’ ๐’…รฉ๐’„๐’Š๐’”๐’Š๐’๐’๐’”

En analyse statistique et en Machine Learning, certaines questions ne cherchent pas ร  prรฉdire une valeur continue, mais plutรดt ร  rรฉpondre par oui ou non, succรจs ou รฉchec, client fidรจle ou client perdu, malade ou non malade.

C’est prรฉcisรฉment lร  que la ๐’“รฉ๐’ˆ๐’“๐’†๐’”๐’”๐’Š๐’๐’ ๐’๐’๐’ˆ๐’Š๐’”๐’•๐’Š๐’’๐’–๐’† devient incontournable.

Contrairement ร  la rรฉgression linรฉaire qui prรฉdit directement une valeur numรฉrique, la rรฉgression logistique estime une ๐’‘๐’“๐’๐’ƒ๐’‚๐’ƒ๐’Š๐’๐’Š๐’•รฉ comprise entre 0 et 1.

Elle rรฉpond ร  une question simple :

๐‘ธ๐’–๐’†๐’๐’๐’† ๐’†๐’”๐’• ๐’๐’‚ ๐’‘๐’“๐’๐’ƒ๐’‚๐’ƒ๐’Š๐’๐’Š๐’•รฉ ๐’’๐’–’๐’–๐’ ๐’Š๐’๐’…๐’Š๐’—๐’Š๐’…๐’– ๐’‚๐’‘๐’‘๐’‚๐’“๐’•๐’Š๐’†๐’๐’๐’† ร  ๐’๐’‚ ๐’„๐’‚๐’•รฉ๐’ˆ๐’๐’“๐’Š๐’† 1 ?

Son principe repose sur trois grandes รฉtapes :

๐Ÿ. ๐‘ผ๐’ ๐’Ž๐’๐’…รจ๐’๐’† ๐’๐’Š๐’รฉ๐’‚๐’Š๐’“๐’†

Les variables explicatives sont d’abord combinรฉes sous forme linรฉaire :

๐’› = ๐’˜๐‘ฟ + ๐’ƒ

๐Ÿ. ๐‘ผ๐’๐’† ๐’‡๐’๐’๐’„๐’•๐’Š๐’๐’ ๐’”๐’Š๐’ˆ๐’Ž๐’รฏ๐’…๐’†

Cette fonction transforme toute valeur rรฉelle en une probabilitรฉ comprise entre 0 et 1.

๐Ÿ‘. ๐‘ผ๐’๐’† ๐’“รจ๐’ˆ๐’๐’† ๐’…๐’† ๐’…รฉ๐’„๐’Š๐’”๐’Š๐’๐’

Si la probabilitรฉ prรฉdite est supรฉrieure au seuil choisi, souvent 0,5, l’observation est classรฉe dans la catรฉgorie 1.

Sinon, elle est classรฉe dans la catรฉgorie 0.

Exemple simple :

Si un modรจle estime qu’un client a 78 % de probabilitรฉ de quitter une entreprise, il peut รชtre classรฉ comme client ร  risque.

La rรฉgression logistique est trรจs utilisรฉe dans plusieurs domaines :

santรฉ : prรฉdire la prรฉsence ou non d’une maladie ;

finance : estimer le risque de dรฉfaut de paiement ;

marketing : prรฉvoir l’achat ou l’abandon d’un client ;

banque : dรฉtecter les profils ร  risque ;

data science : rรฉsoudre des problรจmes de classification binaire.

Mais attention : la rรฉgression logistique ne dit pas seulement quelle classe choisir.

Elle donne aussi une information trรจs prรฉcieuse : ๐’๐’‚ ๐’‘๐’“๐’๐’ƒ๐’‚๐’ƒ๐’Š๐’๐’Š๐’•รฉ ๐’…๐’† ๐’„๐’†๐’•๐’•๐’† ๐’…รฉ๐’„๐’Š๐’”๐’Š๐’๐’.

C’est ce qui en fait un modรจle ร  la fois simple, interprรฉtable et puissant pour les problรจmes de classification.

๐‘ฌ๐’ ๐’“รฉ๐’”๐’–๐’Žรฉ :

La rรฉgression logistique transforme les donnรฉes en probabilitรฉs, puis les probabilitรฉs en dรฉcisions.

Inscrivez-vous dรจs maintenant pour rรฉserver votre place pour la prochaine session de notre formation en ร‰๐—ฐ๐—ผ๐—ป๐—ผ๐—บรฉ๐˜๐—ฟ๐—ถ๐—ฒ ๐—ฒ๐˜ ๐—ง๐—ฒ๐—ฐ๐—ต๐—ป๐—ถ๐—พ๐˜‚๐—ฒ๐˜€ Quantitatives https://forms.gle/yZAZimRXbTFbUWZk6



#RรฉgressionLogistique

#MachineLearning

#DataScience

#Statistiques

#AnalyseDeDonnรฉes

Commentaires

Posts les plus consultรฉs de ce blog

ร‰conomรฉtrie des donnรฉes de panel: de la thรฉorie ร  la pratique