๐Ÿ“Š ๐‘ช๐’๐’‚๐’”๐’”๐’Š๐’‡๐’Š๐’„๐’‚๐’•๐’Š๐’๐’ ๐’…๐’†́๐’”๐’†́๐’’๐’–๐’Š๐’๐’Š๐’ƒ๐’“๐’†́๐’† : ๐’‘๐’๐’–๐’“๐’’๐’–๐’๐’Š ๐’’๐’‚๐’„๐’„๐’–๐’“๐’‚๐’„๐’š ๐’๐’† ๐’”๐’–๐’‡๐’‡๐’Š๐’• ๐’‘๐’‚๐’” ?

En Machine Learning, tous les modรจles de classification ne doivent pas รชtre jugรฉs uniquement avec le taux de bonne classification.

Quand les donnรฉes sont dรฉsรฉquilibrรฉes, un modรจle peut sembler performant… alors qu’il se trompe sur la classe la plus importante.

๐Ÿ‘‰ ๐‘ช’๐’†๐’”๐’• ๐’๐’† ๐’‘๐’“๐’๐’ƒ๐’๐’†̀๐’Ž๐’† ๐’„๐’๐’‚๐’”๐’”๐’Š๐’’๐’–๐’† ๐’…๐’†๐’” ๐’…๐’๐’๐’๐’†́๐’†๐’” ๐’…๐’†́๐’”๐’†́๐’’๐’–๐’Š๐’๐’Š๐’ƒ๐’“๐’†́๐’†๐’”.

Imaginons un jeu de donnรฉes oรน 90 % des observations appartiennent ร  une seule classe.

Un modรจle qui prรฉdit toujours cette classe peut afficher 90 % d’accuracy…

Mais en rรฉalitรฉ, il peut รชtre incapable de dรฉtecter la classe minoritaire.

๐Ÿ”ต ๐‘ณ’๐’‚๐’„๐’„๐’–๐’“๐’‚๐’„๐’š

Elle mesure la proportion totale de prรฉdictions correctes.

๐Ÿ‘‰ Utile, mais parfois trompeuse en cas de classes dรฉsรฉquilibrรฉes.

๐Ÿ”ต ๐‘ณ๐’‚ ๐’‘๐’“๐’†́๐’„๐’Š๐’”๐’Š๐’๐’

Elle rรฉpond ร  la question :

parmi les cas prรฉdits positifs, combien sont rรฉellement positifs ?

C’est une mesure d’exactitude.

๐Ÿ”ต ๐‘ณ๐’† ๐’“๐’‚๐’‘๐’‘๐’†๐’ (๐‘น๐’†๐’„๐’‚๐’๐’)

Il rรฉpond ร  la question :

parmi les vrais positifs existants, combien ont รฉtรฉ dรฉtectรฉs ?

C’est une mesure de complรฉtude.

๐Ÿ”ต ๐‘ณ๐’† ๐‘ญ1-๐‘บ๐’„๐’๐’“๐’†

Il combine prรฉcision et rappel.

๐Ÿ‘‰ Trรจs utile lorsque l’on cherche un bon รฉquilibre entre les deux.

๐Ÿ”ต ๐‘ณ๐’‚ ๐’Ž๐’‚๐’•๐’“๐’Š๐’„๐’† ๐’…๐’† ๐’„๐’๐’๐’‡๐’–๐’”๐’Š๐’๐’

Elle permet de comprendre les prรฉdictions ร  travers :

TP, TN, FP, FN.

C’est un outil essentiel pour interprรฉter rรฉellement la performance du modรจle.

๐Ÿ“Œ ๐‘ท๐’๐’–๐’“๐’’๐’–๐’๐’Š ๐’„’๐’†๐’”๐’• ๐’Š๐’Ž๐’‘๐’๐’“๐’•๐’‚๐’๐’• ?

Dans plusieurs domaines comme :

la santรฉ, la fraude, le crรฉdit, la cybersรฉcuritรฉ ou le diagnostic,

la classe minoritaire est souvent la plus critique.

Un modรจle peut donc avoir une bonne accuracy…

mais รชtre mauvais lร  oรน cela compte vraiment.

✅ ๐‘ธ๐’–๐’†๐’๐’’๐’–๐’†๐’” ๐’”๐’๐’๐’–๐’•๐’Š๐’๐’๐’” ๐’‡๐’‚๐’„๐’† ๐’‚๐’– ๐’…๐’†́๐’”๐’†́๐’’๐’–๐’Š๐’๐’Š๐’ƒ๐’“๐’† :

rรฉpliquer la classe minoritaire ;

crรฉer des donnรฉes synthรฉtiques ;

modifier la fonction de perte ;

ajuster ou changer l’algorithme.

๐Ÿ“Œ ๐‘จ̀ ๐’“๐’†๐’•๐’†๐’๐’Š๐’“ :

Un bon modรจle n’est pas seulement celui qui affiche une forte accuracy.

C’est surtout celui qui sait bien reconnaรฎtre chaque classe, notamment la plus rare.

๐Ÿ‘‰ ๐‘ฌ๐’ ๐’„๐’๐’‚๐’”๐’”๐’Š๐’‡๐’Š๐’„๐’‚๐’•๐’Š๐’๐’, ๐’ƒ๐’Š๐’†๐’ ๐’†́๐’—๐’‚๐’๐’–๐’†๐’“ ๐’–๐’ ๐’Ž๐’๐’…๐’†̀๐’๐’†, ๐’„’๐’†๐’”๐’• ๐’‚๐’–๐’”๐’”๐’Š ๐’„๐’๐’Ž๐’‘๐’“๐’†๐’๐’…๐’“๐’† ๐’๐’‚ ๐’๐’‚๐’•๐’–๐’“๐’† ๐’…๐’†๐’” ๐’…๐’๐’๐’๐’†́๐’†๐’”.


Inscrivez-vous dรจs maintenant pour rรฉserver votre place pour la prochaine session de notre formation en ร‰๐—ฐ๐—ผ๐—ป๐—ผ๐—บรฉ๐˜๐—ฟ๐—ถ๐—ฒ ๐—ฒ๐˜ ๐—ง๐—ฒ๐—ฐ๐—ต๐—ป๐—ถ๐—พ๐˜‚๐—ฒ๐˜€ https://forms.gle/yZAZimRXbTFbUWZk6





#MachineLearning #DataScience #Classification #IntelligenceArtificielle #AnalyseDeDonnรฉes

Commentaires

Posts les plus consultรฉs de ce blog

ร‰conomรฉtrie des donnรฉes de panel: de la thรฉorie ร  la pratique