๐Ÿ“Š ๐‘ช๐’‚๐’๐’Š๐’ƒ๐’“๐’‚๐’ˆ๐’† ๐’…’๐’–๐’ ๐’Ž๐’๐’…๐’†̀๐’๐’† : ๐’‘๐’๐’–๐’“๐’’๐’–๐’๐’Š ๐’–๐’๐’† ๐’‘๐’“๐’๐’ƒ๐’‚๐’ƒ๐’Š๐’๐’Š๐’•๐’†́ ๐’‘๐’“๐’†́๐’…๐’Š๐’•๐’† ๐’…๐’๐’Š๐’• ๐’†̂๐’•๐’“๐’† ๐’‡๐’Š๐’‚๐’ƒ๐’๐’† ?

En machine learning, il ne suffit pas qu’un modรจle classe correctement les observations.

Il faut aussi que ses ๐’‘๐’“๐’๐’ƒ๐’‚๐’ƒ๐’Š๐’๐’Š๐’•๐’†́๐’” ๐’‘๐’“๐’†́๐’…๐’Š๐’•๐’†๐’” soient crรฉdibles.

C’est exactement le rรดle du ๐’„๐’‚๐’๐’Š๐’ƒ๐’“๐’‚๐’ˆ๐’† ๐’…๐’–๐’ ๐’Ž๐’๐’…๐’†̀๐’๐’†.

Un modรจle est bien calibrรฉ lorsque ses probabilitรฉs prรฉdites correspondent aux frรฉquences rรฉellement observรฉes.

Par exemple, si un modรจle prรฉdit une probabilitรฉ de ๐ŸŽ,๐Ÿ– pour 100 cas, environ 80 cas devraient effectivement รชtre corrects.

๐Ÿ‘‰ Si c’est le cas, le modรจle est bien calibrรฉ.
๐Ÿ‘‰ Si ce n’est pas le cas, ses probabilitรฉs peuvent รชtre trompeuses.

๐Ÿ“Œ ๐‘ผ๐’ ๐’†๐’™๐’†๐’Ž๐’‘๐’๐’† ๐’”๐’Š๐’Ž๐’‘๐’๐’†

Un modรจle peut annoncer :
“Je suis sรปr ร  90 %.”

Mais si, dans la rรฉalitรฉ, il n’a raison que dans 70 % des cas, alors le modรจle est ๐’”๐’–๐’“๐’„๐’๐’๐’‡๐’Š๐’‚๐’๐’•.

ร€ l’inverse, si le modรจle annonce 60 %, mais qu’il a raison dans 80 % des cas, il est ๐’”๐’๐’–๐’”-๐’„๐’๐’๐’‡๐’Š๐’‚๐’๐’•.

C’est pourquoi on utilise souvent un ๐’…๐’Š๐’‚๐’ˆ๐’“๐’‚๐’Ž๐’Ž๐’† ๐’…๐’† ๐’‡๐’Š๐’‚๐’ƒ๐’Š๐’๐’Š๐’•๐’†́ pour comparer les probabilitรฉs prรฉdites aux frรฉquences rรฉelles.

๐Ÿ“ ๐‘ณ๐’Š๐’๐’…๐’Š๐’„๐’‚๐’•๐’†๐’–๐’“ ๐‘ฌ๐‘ช๐‘ฌ

L’un des indicateurs les plus utilisรฉs est l’๐‘ฌ๐‘ช๐‘ฌ, ou ๐‘ฌ๐’™๐’‘๐’†๐’„๐’•๐’†๐’… ๐‘ช๐’‚๐’๐’Š๐’ƒ๐’“๐’‚๐’•๐’Š๐’๐’ ๐‘ฌ๐’“๐’“๐’๐’“.

Il mesure l’รฉcart entre :

• la ๐’‘๐’“๐’†́๐’„๐’Š๐’”๐’Š๐’๐’ ๐’“๐’†́๐’†๐’๐’๐’† du modรจle ;
• et la
๐’„๐’๐’๐’‡๐’Š๐’‚๐’๐’„๐’† ๐’Ž๐’๐’š๐’†๐’๐’๐’† annoncรฉe par le modรจle.

Plus l’ECE est faible, meilleur est le calibrage.

Un calibrage parfait signifie que la courbe de fiabilitรฉ suit la diagonale d’identitรฉ.

๐Ÿ“Œ ๐‘ช๐’๐’Ž๐’Ž๐’†๐’๐’• ๐’„๐’๐’“๐’“๐’Š๐’ˆ๐’†๐’“ ๐’–๐’ ๐’Ž๐’๐’…๐’†̀๐’๐’† ๐’Ž๐’‚๐’ ๐’„๐’‚๐’๐’Š๐’ƒ๐’“๐’†́ ?

On peut utiliser des mรฉthodes dites ๐’‘๐’๐’”๐’•-๐’‰๐’๐’„, c’est-ร -dire appliquรฉes aprรจs l’entraรฎnement du modรจle.

Le principe est simple :

1 entraรฎner le modรจle normalement ;
2
garder un jeu de donnรฉes sรฉparรฉ pour le calibrage ;
3
ajuster les probabilitรฉs prรฉdites ;
4
appliquer la correction lors des prรฉdictions futures.

Parmi les mรฉthodes les plus connues, on trouve :

๐Ÿ”น ๐‘ป๐’†๐’Ž๐’‘๐’†๐’“๐’‚๐’•๐’–๐’“๐’† ๐‘บ๐’„๐’‚๐’๐’Š๐’๐’ˆ
Elle ajuste les probabilitรฉs en adoucissant les scores du modรจle.
Elle est simple, rapide et trรจs utilisรฉe avec les rรฉseaux de neurones.

๐Ÿ”น ๐‘ท๐’๐’‚๐’•๐’• ๐‘บ๐’„๐’‚๐’๐’Š๐’๐’ˆ
Elle utilise une rรฉgression logistique pour corriger les probabilitรฉs.
Elle fonctionne bien lorsque le jeu de calibrage est relativement petit.

๐Ÿ”น ๐‘น๐’†́๐’ˆ๐’“๐’†๐’”๐’”๐’Š๐’๐’ ๐’Š๐’”๐’๐’•๐’๐’๐’Š๐’’๐’–๐’†
Elle est plus flexible, car elle ne suppose pas une forme particuliรจre de correction.
Mais elle demande davantage de donnรฉes pour รฉviter le surapprentissage.

๐ŸŽฏ ๐‘ท๐’๐’–๐’“๐’’๐’–๐’๐’Š ๐’๐’† ๐’„๐’‚๐’๐’Š๐’ƒ๐’“๐’‚๐’ˆ๐’† ๐’†๐’”๐’•-๐’Š๐’ ๐’Š๐’Ž๐’‘๐’๐’“๐’•๐’‚๐’๐’• ?

Parce que dans plusieurs domaines, on ne prend pas seulement une dรฉcision ร  partir de la classe prรฉdite.

On prend une dรฉcision ร  partir du niveau de ๐’“๐’Š๐’”๐’’๐’–๐’† annoncรฉ par le modรจle.

C’est trรจs important en :

santรฉ ;
finance ;
assurance ;
scoring ;
dรฉtection de fraude ;
systรจmes autonomes ;
dรฉcisions publiques basรฉes sur les donnรฉes.

Un modรจle peut avoir une bonne accuracy, mais รชtre mal calibrรฉ.

Dans ce cas, il peut classer correctement tout en donnant des probabilitรฉs peu fiables.

๐‘ณ๐’† ๐’‘๐’Š๐’†̀๐’ˆ๐’† ๐’‚̀ ๐’†́๐’—๐’Š๐’•๐’†๐’“

Il ne faut pas confondre ๐’‘๐’†๐’“๐’‡๐’๐’“๐’Ž๐’‚๐’๐’„๐’† ๐’…๐’† ๐’„๐’๐’‚๐’”๐’”๐’Š๐’‡๐’Š๐’„๐’‚๐’•๐’Š๐’๐’ et ๐’‡๐’Š๐’‚๐’ƒ๐’Š๐’๐’Š๐’•๐’†́ ๐’…๐’†๐’” ๐’‘๐’“๐’๐’ƒ๐’‚๐’ƒ๐’Š๐’๐’Š๐’•๐’†́๐’”.

Un modรจle peut bien classer, mais mal estimer l’incertitude.

C’est pourquoi il est utile de vรฉrifier les courbes de fiabilitรฉ, l’ECE, mais aussi le calibrage par classe, surtout lorsque les donnรฉes sont dรฉsรฉquilibrรฉes.

๐‘จ̀ ๐’“๐’†๐’•๐’†๐’๐’Š๐’“

Le ๐’„๐’‚๐’๐’Š๐’ƒ๐’“๐’‚๐’ˆ๐’† ๐’…๐’–๐’ ๐’Ž๐’๐’…๐’†̀๐’๐’† permet de vรฉrifier si les probabilitรฉs prรฉdites sont rรฉellement fiables.

Un modรจle bien calibrรฉ ne dit pas seulement quelle classe est la plus probable.

Il indique aussi un niveau de confiance cohรฉrent avec la rรฉalitรฉ.

En machine learning, surtout dans les domaines sensibles au risque, une probabilitรฉ mal calibrรฉe peut conduire ร  de mauvaises dรฉcisions.

๐Ÿ“Œ Un bon modรจle ne doit donc pas seulement รชtre prรฉcis.
Il doit aussi รชtre
๐’‡๐’Š๐’‚๐’ƒ๐’๐’†, ๐’Š๐’๐’•๐’†๐’“๐’‘๐’“๐’†́๐’•๐’‚๐’ƒ๐’๐’† ๐’†๐’• ๐’ƒ๐’Š๐’†๐’ ๐’„๐’‚๐’๐’Š๐’ƒ๐’“๐’†́.

๐Ÿ“Œ Pour mieux apprendre les statistiques, l’รฉconomรฉtrie et l’analyse des donnรฉes, rejoignez notre prochaine formation en ๐‘ฌ́๐’„๐’๐’๐’๐’Ž๐’†́๐’•๐’“๐’Š๐’† ๐’†๐’• ๐‘ป๐’†๐’„๐’‰๐’๐’Š๐’’๐’–๐’†๐’” ๐‘ธ๐’–๐’‚๐’๐’•๐’Š๐’•๐’‚๐’•๐’Š๐’—๐’†๐’” https://forms.gle/yZAZimRXbTFbUWZk6

 


#MachineLearning #DataScience #ModelCalibration #Calibration #Statistiques #IntelligenceArtificielle #AnalyseDeDonnees #Classification #Prediction #SciencesSociales

Commentaires

Posts les plus consultรฉs de ce blog

ร‰conomรฉtrie des donnรฉes de panel: de la thรฉorie ร  la pratique