𝐐𝐮’𝐞𝐬𝐭-𝐜𝐞 𝐪𝐮𝐞 le 𝐜𝐥𝐚𝐬𝐬𝐢𝐟𝐢𝐞𝐮𝐫 𝐍𝐚𝐢𝐯𝐞 𝐁𝐚𝐲𝐞𝐬 ?
Le 𝐍𝐚𝐢𝐯𝐞 𝐁𝐚𝐲𝐞𝐬 est un 𝐜𝐥𝐚𝐬𝐬𝐢𝐟𝐢𝐞𝐮𝐫 𝐩𝐫𝐨𝐛𝐚𝐛𝐢𝐥𝐢𝐬𝐭𝐞 rapide, fondé sur le 𝐭𝐡𝐞́𝐨𝐫𝐞̀𝐦𝐞 𝐝𝐞 𝐁𝐚𝐲𝐞𝐬.
Son objectif
est de prédire la classe d’une observation en calculant la
probabilité de chaque classe à partir des variables explicatives.
Pourquoi
dit-on “naive” ?
Parce qu’il suppose que toutes les variables explicatives sont 𝐢𝐧𝐝𝐞́𝐩𝐞𝐧𝐝𝐚𝐧𝐭𝐞𝐬 𝐜𝐨𝐧𝐝𝐢𝐭𝐢𝐨𝐧𝐧𝐞𝐥𝐥𝐞𝐦𝐞𝐧𝐭 à la classe.
Cette
hypothèse est souvent peu réaliste dans la pratique, mais le modèle donne
malgré tout des résultats surprenamment efficaces.
📐 𝐋𝐚 𝐟𝐨𝐫𝐦𝐮𝐥𝐞 :
P(Cₖ | x) = P(Cₖ) × ∏ P(xᵢ | Cₖ) / P(x)
𝐎𝐮̀ :
P(Cₖ | x) → probabilité a posteriori de la classe k
sachant les variables
P(Cₖ) → probabilité a priori de la classe k
P(xᵢ | Cₖ) → vraisemblance de la variable i
sachant la classe k
P(x) → évidence, commune à toutes les classes, souvent ignorée
dans la décision finale
⚡ 𝐂𝐨𝐦𝐦𝐞𝐧𝐭 𝐜̧𝐚 𝐟𝐨𝐧𝐜𝐭𝐢𝐨𝐧𝐧𝐞 ?
① Calculer les probabilités a
priori à partir des données d’apprentissage
② Estimer la vraisemblance
de chaque variable pour chaque classe
③ Multiplier la probabilité a priori par
les vraisemblances de toutes les variables
④ Retenir la classe ayant la probabilité
la plus élevée
🔍 𝐍𝐚𝐢𝐯𝐞 𝐁𝐚𝐲𝐞𝐬 𝐯𝐬 𝐑𝐞́𝐠𝐫𝐞𝐬𝐬𝐢𝐨𝐧 𝐋𝐨𝐠𝐢𝐬𝐭𝐢𝐪𝐮𝐞
La 𝐫𝐞́𝐠𝐫𝐞𝐬𝐬𝐢𝐨𝐧 𝐥𝐨𝐠𝐢𝐬𝐭𝐢𝐪𝐮𝐞 apprend les poids des variables par
optimisation et modélise directement P(y|x). C’est un modèle discriminant.
Le 𝐍𝐚𝐢𝐯𝐞 𝐁𝐚𝐲𝐞𝐬, lui, estime les probabilités à partir
des fréquences observées, modélise la distribution conjointe P(x,y)
et appartient aux modèles génératifs.
En pratique :
𝐍𝐚𝐢𝐯𝐞 𝐁𝐚𝐲𝐞𝐬 est très rapide à entraîner.
La régression logistique demande une optimisation itérative,
mais gère souvent mieux les variables corrélées.
✍️ 𝐐𝐮𝐚𝐧𝐝 𝐮𝐭𝐢𝐥𝐢𝐬𝐞𝐫 𝐍𝐚𝐢𝐯𝐞 𝐁𝐚𝐲𝐞𝐬 ?
Utilisez-le notamment pour :
• la classification de textes (spam, analyse de sentiments)
• les prédictions en temps réel quand la rapidité est
essentielle
• les données de grande dimension et creuses avec peu
d’exemples d’apprentissage
𝐀̀ 𝐫𝐞𝐭𝐞𝐧𝐢𝐫 :
Le 𝐍𝐚𝐢𝐯𝐞 𝐁𝐚𝐲𝐞𝐬 est un modèle simple, rapide et puissant,
particulièrement utile lorsque l’on veut construire un classificateur efficace
avec peu de complexité.
________________________________________
________________________________________
Si vous avez trouvé cette publication
utile, n'hésitez pas à 𝒍𝒂 𝒍𝒊𝒌𝒆𝒓 𝒆𝒕
à 𝒍𝒂 𝒑𝒂𝒓𝒕𝒂𝒈𝒆𝒓
avec vos amis et collègues !
Pour mieux apprendre l’utilisation des
logiciel et modèles statistiques, nous vous invitons à prendre part à la
prochaine session de notre formation en 𝙀𝙘𝙤𝙣𝙤𝙢é𝙩𝙧𝙞𝙚 𝙚𝙩 𝙏𝙚𝙘𝙝𝙣𝙞𝙦𝙪𝙚𝙨 𝙌𝙪𝙖𝙣𝙩𝙞𝙩𝙖𝙩𝙞𝙫𝙚𝙨 https://forms.gle/yZAZimRXbTFbUWZk6
________________________________________
________________________________________
#MachineLearning #NaiveBayes #Statistiques #DataScience #Classification

Commentaires
Enregistrer un commentaire