📌 𝗥𝗲́𝗴𝗿𝗲𝘀𝘀𝗶𝗼𝗻 𝗱𝗲 𝗣𝗼𝗶𝘀𝘀𝗼𝗻 : 𝗹𝗲 𝗺𝗼𝗱𝗲̀𝗹𝗲 𝗶𝗱𝗲́𝗮𝗹 𝗽𝗼𝘂𝗿 𝗮𝗻𝗮𝗹𝘆𝘀𝗲𝗿 𝗱𝗲𝘀 𝗱𝗼𝗻𝗻𝗲́𝗲𝘀 𝗱𝗲 𝗰𝗼𝗺𝗽𝘁𝗮𝗴𝗲 📊

En statistique et en économétrie, toutes les variables dépendantes ne sont pas continues.

Parfois, ce que l’on cherche à expliquer est un 𝗻𝗼𝗺𝗯𝗿𝗲 𝗱𝗲́𝘃𝗲́𝗻𝗲𝗺𝗲𝗻𝘁𝘀.

Par exemple :

• nombre de visites sur un site web par jour ;
• nombre d’accidents sur une route ;
• nombre de réclamations d’assurance par année ;
• nombre de défauts dans une production ;
• nombre de consultations médicales ;
• nombre d’achats réalisés par un client.

Dans ce type de situation, la 𝗿𝗲́𝗴𝗿𝗲𝘀𝘀𝗶𝗼𝗻 𝗹𝗶𝗻𝗲́𝗮𝗶𝗿𝗲 𝗰𝗹𝗮𝘀𝘀𝗶𝗾𝘂𝗲 n’est pas toujours adaptée.

Pourquoi ?

Parce qu’elle peut prédire des valeurs négatives ou des valeurs décimales pour une variable qui devrait être un 𝗲𝗻𝘁𝗶𝗲𝗿 𝗽𝗼𝘀𝗶𝘁𝗶𝗳.

Or, on ne peut pas avoir −2 accidents, 3,7 réclamations ou −1 visite.

C’est ici que la 𝗿𝗲́𝗴𝗿𝗲𝘀𝘀𝗶𝗼𝗻 𝗱𝗲 𝗣𝗼𝗶𝘀𝘀𝗼𝗻 devient utile.

📌 𝗤𝘂𝗲𝘀𝘁-𝗰𝗲 𝗾𝘂𝗲 𝗹𝗮 𝗿𝗲́𝗴𝗿𝗲𝘀𝘀𝗶𝗼𝗻 𝗱𝗲 𝗣𝗼𝗶𝘀𝘀𝗼𝗻 ?

La régression de Poisson est un 𝗺𝗼𝗱𝗲̀𝗹𝗲 𝗹𝗶𝗻𝗲́𝗮𝗶𝗿𝗲 𝗴𝗲́𝗻𝗲́𝗿𝗮𝗹𝗶𝘀𝗲́ utilisé pour analyser des 𝘃𝗮𝗿𝗶𝗮𝗯𝗹𝗲𝘀 𝗱𝗲 𝗰𝗼𝗺𝗽𝘁𝗮𝗴𝗲.

Elle permet d’expliquer ou de prédire 𝗰𝗼𝗺𝗯𝗶𝗲𝗻 𝗱𝗲 𝗳𝗼𝗶𝘀 un événement se produit en fonction de plusieurs variables explicatives.

📐 𝗟𝗲 𝗺𝗼𝗱𝗲̀𝗹𝗲

La forme du modèle est :

log(λ) = β₀ + β₁x₁ + β₂x₂ + ... + βₖxₖ

Avec :

λ = nombre moyen attendu d’événements ;
β₀ = constante du modèle ;
βᵢ = effet de la variable explicative x ;
• log = logarithme naturel ;
• exp(
βᵢ) = effet multiplicatif sur le nombre attendu d’événements.

Comme λ = exp(β₀ + β₁x₁ + β₂x₂ + ...), la valeur prédite est toujours positive.

C’est l’un des grands avantages du modèle.

📌 𝗖𝗼𝗺𝗺𝗲𝗻𝘁 𝗹𝗮 𝗿𝗲́𝗴𝗿𝗲𝘀𝘀𝗶𝗼𝗻 𝗱𝗲 𝗣𝗼𝗶𝘀𝘀𝗼𝗻 𝗳𝗼𝗻𝗰𝘁𝗶𝗼𝗻𝗻𝗲 ?

𝟭. On choisit une variable dépendante de comptage.
Exemple : nombre de visites, nombre d’accidents, nombre de plaintes.

𝟮. On suppose que cette variable suit une loi de Poisson.

𝟯. On estime les coefficients du modèle par la méthode du 𝗺𝗮𝘅𝗶𝗺𝘂𝗺 𝗱𝗲 𝘃𝗿𝗮𝗶𝘀𝗲𝗺𝗯𝗹𝗮𝗻𝗰𝗲.

𝟰. On prédit le nombre moyen attendu avec :

λ = exp(β₀ + β₁x₁ + β₂x₂ + ...)

𝟱. On interprète les coefficients à travers exp(βᵢ).

📌 𝗖𝗼𝗺𝗺𝗲𝗻𝘁 𝗶𝗻𝘁𝗲𝗿𝗽𝗿𝗲́𝘁𝗲𝗿 𝗹𝗲𝘀 𝗿𝗲́𝘀𝘂𝗹𝘁𝗮𝘁𝘀 ?

Dans une régression de Poisson, les coefficients β ne s’interprètent pas directement comme dans une régression linéaire.

On utilise souvent exp(β).

Si exp(βᵢ) > 1, la variable augmente le nombre attendu d’événements.

Si exp(βᵢ) < 1, la variable diminue le nombre attendu d’événements.

Si exp(βᵢ) = 1, la variable n’a pas d’effet multiplicatif notable.

Exemple :

Si exp(β) = 1,20, cela signifie que la variable augmente le nombre attendu d’événements d’environ 20 %.

Si exp(β) = 0,80, cela signifie que la variable réduit le nombre attendu d’événements d’environ 20 %.

📌 𝗗𝗶𝗳𝗳𝗲́𝗿𝗲𝗻𝗰𝗲 𝗮𝘃𝗲𝗰 𝗹𝗮 𝗿𝗲́𝗴𝗿𝗲𝘀𝘀𝗶𝗼𝗻 𝗹𝗶𝗻𝗲́𝗮𝗶𝗿𝗲

La 𝗿𝗲́𝗴𝗿𝗲𝘀𝘀𝗶𝗼𝗻 𝗹𝗶𝗻𝗲́𝗮𝗶𝗿𝗲 est adaptée aux variables continues.

Elle suppose généralement une variance constante et peut produire des prédictions négatives.

La 𝗿𝗲́𝗴𝗿𝗲𝘀𝘀𝗶𝗼𝗻 𝗱𝗲 𝗣𝗼𝗶𝘀𝘀𝗼𝗻 est adaptée aux variables de comptage.

Elle utilise un lien logarithmique et produit des valeurs attendues positives.

Autrement dit :

𝗥𝗲́𝗴𝗿𝗲𝘀𝘀𝗶𝗼𝗻 𝗹𝗶𝗻𝗲́𝗮𝗶𝗿𝗲 → variable continue
𝗥𝗲́𝗴𝗿𝗲𝘀𝘀𝗶𝗼𝗻 𝗱𝗲 𝗣𝗼𝗶𝘀𝘀𝗼𝗻 → variable de comptage

📌 𝗤𝘂𝗮𝗻𝗱 𝘂𝘁𝗶𝗹𝗶𝘀𝗲𝗿 𝗹𝗮 𝗿𝗲́𝗴𝗿𝗲𝘀𝘀𝗶𝗼𝗻 𝗱𝗲 𝗣𝗼𝗶𝘀𝘀𝗼𝗻 ?

On l’utilise lorsque :

• la variable dépendante est un nombre entier positif ;
• les valeurs représentent des événements comptés ;
• les prédictions ne doivent pas être négatives ;
• la moyenne et la variance de la variable sont relativement proches.

𝗔𝘁𝘁𝗲𝗻𝘁𝗶𝗼𝗻

Si la variance est beaucoup plus grande que la moyenne, on parle de 𝘀𝘂𝗿𝗱𝗶𝘀𝗽𝗲𝗿𝘀𝗶𝗼𝗻.

Dans ce cas, la régression de Poisson peut être insuffisante.

On peut alors envisager un modèle 𝗯𝗶𝗻𝗼𝗺𝗶𝗮𝗹 𝗻𝗲́𝗴𝗮𝘁𝗶𝗳.

📍 𝗔̀ 𝗿𝗲𝘁𝗲𝗻𝗶𝗿

La régression de Poisson est un outil puissant pour modéliser des événements qui se comptent.

Elle permet de répondre à une question simple :

👉 𝗤𝘂𝗲𝗹𝘀 𝗳𝗮𝗰𝘁𝗲𝘂𝗿𝘀 𝗶𝗻𝗳𝗹𝘂𝗲𝗻𝗰𝗲𝗻𝘁 𝗹𝗲 𝗻𝗼𝗺𝗯𝗿𝗲 𝗱𝗲 𝗳𝗼𝗶𝘀 𝗾𝘂𝘂𝗻 𝗲́𝘃𝗲́𝗻𝗲𝗺𝗲𝗻𝘁 𝘀𝗲 𝗽𝗿𝗼𝗱𝘂𝗶𝘁 ?

Elle est très utilisée en santé, assurance, marketing, économie, finance, industrie et data science.

Si cette publication vous a été utile, pensez à 𝗹𝗶𝗸𝗲𝗿, 𝗽𝗮𝗿𝘁𝗮𝗴𝗲𝗿 et 𝘃𝗼𝘂𝘀 𝗮𝗯𝗼𝗻𝗻𝗲𝗿 à la page.

Pour mieux maîtriser les logiciels statistiques, l’économétrie et les modèles quantitatifs, prenez part à notre prochaine formation en 𝗘́𝗰𝗼𝗻𝗼𝗺𝗲́𝘁𝗿𝗶𝗲 𝗲𝘁 𝗧𝗲𝗰𝗵𝗻𝗶𝗾𝘂𝗲𝘀 𝗤𝘂𝗮𝗻𝘁𝗶𝘁𝗮𝘁𝗶𝘃𝗲𝘀 https://forms.gle/yZAZimRXbTFbUWZk6



#Statistiques #Économétrie #DataScience #RégressionDePoisson #AnalyseDeDonnées #ModèlesStatistiques

 

Commentaires

Posts les plus consultés de ce blog

Économétrie des données de panel: de la théorie à la pratique