Économétrie : le modèle de régression logistique simple et application sous SPSS

La régression logistique simple est une méthode statistique qui permet de modéliser un phénomène binaire, c'est-à-dire n'ayant que deux éventualités (échec et succès à un examen par exemple). Si Y est la variable binaire à modéliser, on pourra l'écrire sous la forme:


L’objectif est donc de modéliser 

p(x) = Prob(Y = 1/X = x) en considérant X comme vecteur de facteurs.  Le modèle linéaire p(x) = βX  n’est pas approprié lorsque X est continue et le modèle logistique est donc plus naturel.

Considérons ici sans nuire à la généralité le cas d'un seul facteur pour expliquer notre phénomène binaire. Un modèle qui convient bien pour modéliser notre probabilité de succès est donné par la fonction de lien logit suivante :

L'estimation des paramètres se fait par la méthode du maximum de vraisemblance. Si on a des réalisations x1,..., xn et  y1,...,yn de nos deux variables, la vraisemblance est donnée par :
La maximisation du logarithme de la vraisemblance (log vraisemblance) permet d'estimer les coefficients.
La vidéo ci-dessous permet de résumer toutes les étapes de la modélisation logistique simple.

Le tutoriel qui suit explique comment estimer un modèle logistique simple sous SPSS en prenant un exemple sur une base de données de médecine. Les interprétations notamment en terme d'odd ratio ajusté y sont données.




Commentaires

Posts les plus consultés de ce blog

Économétrie des données de panel: de la théorie à la pratique