๐Ÿ“Š ๐๐ซ๐ž́๐œ๐ข๐ฌ๐ข๐จ๐ง, ๐‘๐š๐ฉ๐ฉ๐ž๐ฅ ๐ž๐ญ ๐’๐œ๐จ๐ซ๐ž ๐…๐Ÿ : ๐œ๐จ๐ฆ๐ฆ๐ž๐ง๐ญ ๐ž́๐ฏ๐š๐ฅ๐ฎ๐ž๐ซ ๐ฎ๐ง ๐ฆ๐จ๐๐ž̀๐ฅ๐ž ๐๐ž ๐œ๐ฅ๐š๐ฌ๐ฌ๐ข๐Ÿ๐ข๐œ๐š๐ญ๐ข๐จ๐ง ?

En machine learning, il ne suffit pas toujours de regarder le ๐ญ๐š๐ฎ๐ฑ ๐๐ž ๐›๐จ๐ง๐ง๐ž๐ฌ ๐ฉ๐ซ๐ž́๐๐ข๐œ๐ญ๐ข๐จ๐ง๐ฌ, souvent appelรฉ ๐š๐œ๐œ๐ฎ๐ซ๐š๐œ๐ฒ.

Pourquoi ?

Parce que l’accuracy peut devenir trompeuse lorsque les classes sont ๐๐ž́๐ฌ๐ž́๐ช๐ฎ๐ข๐ฅ๐ข๐›๐ซ๐ž́๐ž๐ฌ.

Imaginons un modรจle qui doit dรฉtecter les emails spam.
Si 95 % des emails ne sont pas des spams, un modรจle qui prรฉdit toujours “non spam” aura 95 % d’accuracy, mais il ne dรฉtectera aucun spam.

C’est pour cela qu’on utilise souvent trois indicateurs essentiels :

๐๐ซ๐ž́๐œ๐ข๐ฌ๐ข๐จ๐ง, ๐‘๐š๐ฉ๐ฉ๐ž๐ฅ ๐ž๐ญ ๐’๐œ๐จ๐ซ๐ž ๐…๐Ÿ.

๐Ÿ“ ๐‹๐ž๐ฌ ๐Ÿ๐จ๐ซ๐ฆ๐ฎ๐ฅ๐ž๐ฌ ๐š̀ ๐œ๐จ๐ง๐ง๐š๐ข̂๐ญ๐ซ๐ž

๐๐ซ๐ž́๐œ๐ข๐ฌ๐ข๐จ๐ง = ๐“๐ / (๐“๐ + ๐…๐)

๐‘๐š๐ฉ๐ฉ๐ž๐ฅ = ๐“๐ / (๐“๐ + ๐…๐)

๐’๐œ๐จ๐ซ๐ž ๐…๐Ÿ = ๐Ÿ × (๐๐ซ๐ž́๐œ๐ข๐ฌ๐ข๐จ๐ง × ๐‘๐š๐ฉ๐ฉ๐ž๐ฅ) / (๐๐ซ๐ž́๐œ๐ข๐ฌ๐ข๐จ๐ง + ๐‘๐š๐ฉ๐ฉ๐ž๐ฅ)

Avec :

๐“๐ : vrais positifs
๐…๐ : faux positifs
๐…๐ : faux nรฉgatifs
๐“๐ : vrais nรฉgatifs

๐Ÿ”น ๐‹๐š ๐ฉ๐ซ๐ž́๐œ๐ข๐ฌ๐ข๐จ๐ง, ๐œ๐ž๐ฌ๐ญ ๐ช๐ฎ๐จ๐ข ?

La prรฉcision rรฉpond ร  la question :

๐Ÿ‘‰ Parmi tous les cas prรฉdits positifs par le modรจle, combien sont rรฉellement positifs ?

Une forte prรฉcision signifie que le modรจle fait peu de ๐Ÿ๐š๐ฎ๐ฌ๐ฌ๐ž๐ฌ ๐š๐ฅ๐ž๐ซ๐ญ๐ž๐ฌ.

Elle est importante lorsque les ๐Ÿ๐š๐ฎ๐ฑ ๐ฉ๐จ๐ฌ๐ข๐ญ๐ข๐Ÿ๐ฌ coรปtent cher.

Exemple : un filtre anti-spam qui bloque par erreur des emails importants.

๐Ÿ”น ๐‹๐ž ๐ซ๐š๐ฉ๐ฉ๐ž๐ฅ, ๐œ๐ž๐ฌ๐ญ ๐ช๐ฎ๐จ๐ข ?

Le rappel rรฉpond ร  la question :

๐Ÿ‘‰ Parmi tous les vrais cas positifs, combien le modรจle a-t-il rรฉussi ร  dรฉtecter ?

Un rappel รฉlevรฉ signifie que le modรจle laisse passer peu de ๐Ÿ๐š๐ฎ๐ฑ ๐ง๐ž́๐ ๐š๐ญ๐ข๐Ÿ๐ฌ.

Il est important lorsque manquer un cas positif peut avoir de fortes consรฉquences.

Exemple : un systรจme de dรฉpistage mรฉdical qui ne doit pas rater les cas ร  risque.

๐Ÿ”น ๐‹๐ž ๐ฌ๐œ๐จ๐ซ๐ž ๐…๐Ÿ, ๐œ๐ž๐ฌ๐ญ ๐ช๐ฎ๐จ๐ข ?

Le score F1 combine la prรฉcision et le rappel dans une seule mesure.

Il est particuliรจrement utile lorsque l’on veut trouver un ๐ž́๐ช๐ฎ๐ข๐ฅ๐ข๐›๐ซ๐ž entre les fausses alertes et les cas manquรฉs.

Le score F1 utilise une moyenne harmonique.
Cela signifie que si la prรฉcision ou le rappel est trรจs faible, le score F1 sera aussi faible.

๐ŸŽฏ ๐‹๐ž ๐œ๐จ๐ฆ๐ฉ๐ซ๐จ๐ฆ๐ข๐ฌ ๐š̀ ๐œ๐จ๐ฆ๐ฉ๐ซ๐ž๐ง๐๐ซ๐ž

On ne peut pas toujours maximiser la prรฉcision et le rappel en mรชme temps.

Si on baisse le seuil de classification, le modรจle dรฉtecte plus de cas positifs.
Le rappel augmente, mais la prรฉcision peut diminuer.

Si on augmente le seuil, le modรจle devient plus strict.
La prรฉcision peut augmenter, mais le rappel peut baisser.

C’est pourquoi il faut choisir le seuil en fonction du ๐œ๐จ๐ฎ̂๐ญ ๐๐ž๐ฌ ๐ž๐ซ๐ซ๐ž๐ฎ๐ซ๐ฌ.

๐€̀ ๐ซ๐ž๐ญ๐ž๐ง๐ข๐ซ

L’๐š๐œ๐œ๐ฎ๐ซ๐š๐œ๐ฒ donne une vue globale, mais elle peut รชtre trompeuse.

La ๐ฉ๐ซ๐ž́๐œ๐ข๐ฌ๐ข๐จ๐ง mesure la qualitรฉ des prรฉdictions positives.

Le ๐ซ๐š๐ฉ๐ฉ๐ž๐ฅ mesure la capacitรฉ du modรจle ร  retrouver les vrais positifs.

Le ๐ฌ๐œ๐จ๐ซ๐ž ๐…๐Ÿ รฉquilibre prรฉcision et rappel.

Ces indicateurs sont indispensables lorsque les classes sont dรฉsรฉquilibrรฉes ou lorsque les erreurs n’ont pas le mรชme coรปt.

๐Ÿ“Œ Pour mieux apprendre les statistiques, l’รฉconomรฉtrie, le machine learning et l’analyse des donnรฉes, rejoignez notre prochaine formation en ๐„́๐œ๐จ๐ง๐จ๐ฆ๐ž́๐ญ๐ซ๐ข๐ž ๐ž๐ญ ๐“๐ž๐œ๐ก๐ง๐ข๐ช๐ฎ๐ž๐ฌ ๐๐ฎ๐š๐ง๐ญ๐ข๐ญ๐š๐ญ๐ข๐ฏ๐ž๐ฌ https://forms.gle/yZAZimRXbTFbUWZk6

 


#MachineLearning #DataScience #Statistiques #Precision #Recall #F1Score #Classification #AnalyseDeDonnees #Econometrie #IntelligenceArtificielle

 

Commentaires

Posts les plus consultรฉs de ce blog

ร‰conomรฉtrie des donnรฉes de panel: de la thรฉorie ร  la pratique