𝐐𝐮’𝐞𝐬𝐭-𝐜𝐞 𝐪𝐮𝐞 le 𝐜𝐥𝐚𝐬𝐬𝐢𝐟𝐢𝐞𝐮𝐫 𝐍𝐚𝐢𝐯𝐞 𝐁𝐚𝐲𝐞𝐬 ?

Le 𝐍𝐚𝐢𝐯𝐞 𝐁𝐚𝐲𝐞𝐬 est un 𝐜𝐥𝐚𝐬𝐬𝐢𝐟𝐢𝐞𝐮𝐫 𝐩𝐫𝐨𝐛𝐚𝐛𝐢𝐥𝐢𝐬𝐭𝐞 rapide, fondé sur le 𝐭𝐡𝐞́𝐨𝐫𝐞̀𝐦𝐞 𝐝𝐞 𝐁𝐚𝐲𝐞𝐬.

Son objectif est de prédire la classe d’une observation en calculant la probabilité de chaque classe à partir des variables explicatives.

Pourquoi dit-on “naive” ?
Parce qu’il suppose que toutes les variables explicatives sont
𝐢𝐧𝐝𝐞́𝐩𝐞𝐧𝐝𝐚𝐧𝐭𝐞𝐬 𝐜𝐨𝐧𝐝𝐢𝐭𝐢𝐨𝐧𝐧𝐞𝐥𝐥𝐞𝐦𝐞𝐧𝐭 à la classe.

Cette hypothèse est souvent peu réaliste dans la pratique, mais le modèle donne malgré tout des résultats surprenamment efficaces.

📐 𝐋𝐚 𝐟𝐨𝐫𝐦𝐮𝐥𝐞 :
P(Cₖ | x) = P(Cₖ) × ∏ P(x
| Cₖ) / P(x)

𝐎𝐮̀ :
P(Cₖ | x) → probabilité a posteriori de la classe k sachant les variables
P(Cₖ) → probabilité a priori de la classe k
P(x
| Cₖ) → vraisemblance de la variable i sachant la classe k
P(x) → évidence, commune à toutes les classes, souvent ignorée dans la décision finale

𝐂𝐨𝐦𝐦𝐞𝐧𝐭 𝐜̧𝐚 𝐟𝐨𝐧𝐜𝐭𝐢𝐨𝐧𝐧𝐞 ?
Calculer les probabilités a priori à partir des données d’apprentissage
Estimer la vraisemblance de chaque variable pour chaque classe
Multiplier la probabilité a priori par les vraisemblances de toutes les variables
Retenir la classe ayant la probabilité la plus élevée

🔍 𝐍𝐚𝐢𝐯𝐞 𝐁𝐚𝐲𝐞𝐬 𝐯𝐬 𝐑𝐞́𝐠𝐫𝐞𝐬𝐬𝐢𝐨𝐧 𝐋𝐨𝐠𝐢𝐬𝐭𝐢𝐪𝐮𝐞

La 𝐫𝐞́𝐠𝐫𝐞𝐬𝐬𝐢𝐨𝐧 𝐥𝐨𝐠𝐢𝐬𝐭𝐢𝐪𝐮𝐞 apprend les poids des variables par optimisation et modélise directement P(y|x). C’est un modèle discriminant.

Le 𝐍𝐚𝐢𝐯𝐞 𝐁𝐚𝐲𝐞𝐬, lui, estime les probabilités à partir des fréquences observées, modélise la distribution conjointe P(x,y) et appartient aux modèles génératifs.

En pratique :
𝐍𝐚𝐢𝐯𝐞 𝐁𝐚𝐲𝐞𝐬 est très rapide à entraîner.
La régression logistique demande une optimisation itérative, mais gère souvent mieux les variables corrélées.

𝐐𝐮𝐚𝐧𝐝 𝐮𝐭𝐢𝐥𝐢𝐬𝐞𝐫 𝐍𝐚𝐢𝐯𝐞 𝐁𝐚𝐲𝐞𝐬 ?
Utilisez-le notamment pour :
• la classification de textes (spam, analyse de sentiments)
• les prédictions en temps réel quand la rapidité est essentielle
• les données de grande dimension et creuses avec peu d’exemples d’apprentissage

𝐀̀ 𝐫𝐞𝐭𝐞𝐧𝐢𝐫 :
Le
𝐍𝐚𝐢𝐯𝐞 𝐁𝐚𝐲𝐞𝐬 est un modèle simple, rapide et puissant, particulièrement utile lorsque l’on veut construire un classificateur efficace avec peu de complexité.

________________________________________

________________________________________

Si vous avez trouvé cette publication utile, n'hésitez pas à 𝒍𝒂 𝒍𝒊𝒌𝒆𝒓 𝒆𝒕 à 𝒍𝒂 𝒑𝒂𝒓𝒕𝒂𝒈𝒆𝒓 avec vos amis et collègues !

Pour mieux apprendre l’utilisation des logiciel et modèles statistiques, nous vous invitons à prendre part à la prochaine session de notre formation en 𝙀𝙘𝙤𝙣𝙤𝙢é𝙩𝙧𝙞𝙚 𝙚𝙩 𝙏𝙚𝙘𝙝𝙣𝙞𝙦𝙪𝙚𝙨 𝙌𝙪𝙖𝙣𝙩𝙞𝙩𝙖𝙩𝙞𝙫𝙚𝙨 https://forms.gle/yZAZimRXbTFbUWZk6



________________________________________

________________________________________

#MachineLearning #NaiveBayes #Statistiques #DataScience #Classification

 

Commentaires

Posts les plus consultés de ce blog

Économétrie des données de panel: de la théorie à la pratique