๐Ÿ“Š ๐‘ณ๐’๐’”๐’” ๐‘ญ๐’–๐’๐’„๐’•๐’Š๐’๐’๐’” ๐’†๐’ ๐‘ด๐’‚๐’„๐’‰๐’Š๐’๐’† ๐‘ณ๐’†๐’‚๐’“๐’๐’Š๐’๐’ˆ : ๐’„๐’๐’Ž๐’‘๐’“๐’†๐’๐’…๐’“๐’† ๐’„๐’† ๐’’๐’–๐’† ๐’๐’† ๐’Ž๐’๐’…๐’†̀๐’๐’† ๐’„๐’‰๐’†๐’“๐’„๐’‰๐’† ๐’‚̀ ๐’Ž๐’Š๐’๐’Š๐’Ž๐’Š๐’”๐’†๐’“

En ๐‘ด๐’‚๐’„๐’‰๐’Š๐’๐’† ๐‘ณ๐’†๐’‚๐’“๐’๐’Š๐’๐’ˆ, une bonne prรฉdiction ne suffit pas.

Il faut aussi mesurer ร  quel point le modรจle se trompe.

C’est exactement le rรดle des ๐’‡๐’๐’๐’„๐’•๐’Š๐’๐’๐’” ๐’…๐’† ๐’‘๐’†๐’“๐’•๐’†, encore appelรฉes ๐‘ณ๐’๐’”๐’” ๐‘ญ๐’–๐’๐’„๐’•๐’Š๐’๐’๐’”.

๐Ÿ‘‰ Une fonction de perte quantifie l’รฉcart entre la ๐’‘๐’“๐’†́๐’…๐’Š๐’„๐’•๐’Š๐’๐’ du modรจle et la ๐’—๐’‚๐’๐’†๐’–๐’“ ๐’“๐’†́๐’†๐’๐’๐’†.

Plus cette perte est faible, plus le modรจle apprend correctement.

Pensez ร  ๐’๐’‚ ๐’๐’Š๐’Œ๐’†๐’“ et ร  ๐’๐’‚ ๐’‘๐’‚๐’“๐’•๐’‚๐’ˆ๐’†๐’“.

๐Ÿ“Œ ๐‘จ̀ ๐’“๐’†๐’•๐’†๐’๐’Š๐’“ :
๐‘ฌ๐’๐’•๐’“๐’‚๐’Š̂๐’๐’†๐’“ ๐’–๐’ ๐’Ž๐’๐’…๐’†̀๐’๐’†, ๐’„๐’†๐’”๐’• ๐’”๐’–๐’“๐’•๐’๐’–๐’• ๐’„๐’‰๐’†๐’“๐’„๐’‰๐’†๐’“ ๐’‚̀ ๐’Ž๐’Š๐’๐’Š๐’Ž๐’Š๐’”๐’†๐’“ ๐’–๐’๐’† ๐’‡๐’๐’๐’„๐’•๐’Š๐’๐’ ๐’…๐’† ๐’‘๐’†๐’“๐’•๐’†.

๐Ÿ”น ๐‘ณ๐’†๐’” ๐’‘๐’“๐’Š๐’๐’„๐’Š๐’‘๐’‚๐’๐’†๐’” ๐’๐’๐’”๐’” ๐’‡๐’–๐’๐’„๐’•๐’Š๐’๐’๐’” ๐’†๐’ ๐’“๐’†́๐’ˆ๐’“๐’†๐’”๐’”๐’Š๐’๐’

Lorsque la cible est ๐’’๐’–๐’‚๐’๐’•๐’Š๐’•๐’‚๐’•๐’Š๐’—๐’†, on utilise souvent :

๐‘ด๐‘บ๐‘ฌ – Mean Squared Error
Elle pรฉnalise fortement les grandes erreurs. Trรจs utilisรฉe en rรฉgression.

๐‘ด๐‘จ๐‘ฌ – Mean Absolute Error
Elle mesure l’erreur absolue moyenne. Plus robuste aux valeurs extrรชmes.

๐‘ฏ๐’–๐’ƒ๐’†๐’“ ๐‘ณ๐’๐’”๐’”
Un compromis entre MSE et MAE.

๐‘ธ๐’–๐’‚๐’๐’•๐’Š๐’๐’† ๐‘ณ๐’๐’”๐’”
Utile pour la prรฉvision par quantiles.

๐‘ท๐’๐’Š๐’”๐’”๐’๐’ ๐‘ณ๐’๐’”๐’”
Adaptรฉe aux variables de comptage.

๐Ÿ”น ๐‘ณ๐’†๐’” ๐’๐’๐’”๐’” ๐’‡๐’–๐’๐’„๐’•๐’Š๐’๐’๐’” ๐’†๐’ ๐’„๐’๐’‚๐’”๐’”๐’Š๐’‡๐’Š๐’„๐’‚๐’•๐’Š๐’๐’

Quand l’objectif est de prรฉdire une ๐’„๐’‚๐’•๐’†́๐’ˆ๐’๐’“๐’Š๐’†, les plus utilisรฉes sont :

๐‘ช๐’“๐’๐’”๐’”-๐‘ฌ๐’๐’•๐’“๐’๐’‘๐’š / ๐‘ณ๐’๐’ˆ ๐‘ณ๐’๐’”๐’”
La rรฉfรฉrence pour la classification.

๐‘ฉ๐’Š๐’๐’‚๐’“๐’š ๐‘ช๐’“๐’๐’”๐’”-๐‘ฌ๐’๐’•๐’“๐’๐’‘๐’š
Trรจs utilisรฉe pour les problรจmes binaires.

๐‘ฒ๐‘ณ ๐‘ซ๐’Š๐’—๐’†๐’“๐’ˆ๐’†๐’๐’„๐’†
Mesure la diffรฉrence entre deux distributions de probabilitรฉ.

๐‘ฏ๐’Š๐’๐’ˆ๐’† ๐‘ณ๐’๐’”๐’”
Frรฉquente avec les SVM.

๐‘บ๐’’๐’–๐’‚๐’“๐’†๐’… ๐‘ฏ๐’Š๐’๐’ˆ๐’†
Une version plus pรฉnalisante du Hinge Loss.

๐‘ญ๐’๐’„๐’‚๐’ ๐‘ณ๐’๐’”๐’”
Trรจs utile en cas de dรฉsรฉquilibre de classes.

๐Ÿ”น ๐‘ณ๐’†๐’” ๐’๐’๐’”๐’” ๐’‡๐’–๐’๐’„๐’•๐’Š๐’๐’๐’” ๐’”๐’‘๐’†́๐’„๐’Š๐’‚๐’๐’Š๐’”๐’†́๐’†๐’”

Certaines tรขches nรฉcessitent des fonctions de perte plus spรฉcifiques :

๐‘ซ๐’Š๐’„๐’† ๐‘ณ๐’๐’”๐’”
Trรจs utilisรฉe en segmentation d’images.

๐‘จ๐’…๐’—๐’†๐’“๐’”๐’‚๐’“๐’Š๐’‚๐’ ๐‘ณ๐’๐’”๐’”
Prรฉsente dans les GANs.

๐‘ป๐’“๐’Š๐’‘๐’๐’†๐’• ๐‘ณ๐’๐’”๐’”
Utile en reconnaissance faciale et en apprentissage de reprรฉsentations.

๐‘ช๐’๐’๐’•๐’“๐’‚๐’”๐’•๐’Š๐’—๐’† ๐‘ณ๐’๐’”๐’”
Permet d’apprendre des similaritรฉs entre observations.

๐‘ช๐‘ป๐‘ช ๐‘ณ๐’๐’”๐’”
Trรจs utilisรฉe en reconnaissance vocale.

๐‘ช๐’๐’”๐’Š๐’๐’† ๐‘ท๐’“๐’๐’™๐’Š๐’Ž๐’Š๐’•๐’š
Utile quand on compare des vecteurs ou des embeddings.

๐Ÿ” ๐‘ท๐’๐’–๐’“๐’’๐’–๐’๐’Š ๐’๐’† ๐’„๐’‰๐’๐’Š๐’™ ๐’…๐’† ๐’๐’‚ ๐’๐’๐’”๐’” ๐’‡๐’–๐’๐’„๐’•๐’Š๐’๐’ ๐’†๐’”๐’• ๐’”๐’Š ๐’Š๐’Ž๐’‘๐’๐’“๐’•๐’‚๐’๐’• ?

Parce qu’elle influence directement :

๐Ÿ“Œ ๐’๐’‚ ๐’—๐’Š๐’•๐’†๐’”๐’”๐’† ๐’…๐’‚๐’‘๐’‘๐’“๐’†๐’๐’•๐’Š๐’”๐’”๐’‚๐’ˆ๐’†
๐Ÿ“Œ ๐’๐’‚ ๐’”๐’•๐’‚๐’ƒ๐’Š๐’๐’Š๐’•๐’†́ ๐’…๐’– ๐’Ž๐’๐’…๐’†̀๐’๐’†
๐Ÿ“Œ ๐’๐’‚ ๐’“๐’๐’ƒ๐’–๐’”๐’•๐’†๐’”๐’”๐’† ๐’‚๐’–๐’™ ๐’—๐’‚๐’๐’†๐’–๐’“๐’” ๐’†๐’™๐’•๐’“๐’†̂๐’Ž๐’†๐’”
๐Ÿ“Œ ๐’๐’‚ ๐’‘๐’†๐’“๐’‡๐’๐’“๐’Ž๐’‚๐’๐’„๐’† ๐’‡๐’Š๐’๐’‚๐’๐’†
๐Ÿ“Œ ๐’๐’‚ ๐’„๐’๐’‰๐’†́๐’“๐’†๐’๐’„๐’† ๐’†๐’๐’•๐’“๐’† ๐’๐’† ๐’Ž๐’๐’…๐’†̀๐’๐’† ๐’†๐’• ๐’๐’‚ ๐’•๐’‚̂๐’„๐’‰๐’†

Un modรจle trรจs puissant avec une mauvaise fonction de perte peut apprendre de maniรจre inefficace.

๐Ÿ‘‰ ๐‘จ̀ ๐’“๐’†๐’•๐’†๐’๐’Š๐’“ :
๐‘ณ๐’‚ ๐’๐’๐’”๐’” ๐’‡๐’–๐’๐’„๐’•๐’Š๐’๐’ ๐’๐’†๐’”๐’• ๐’‘๐’‚๐’” ๐’–๐’ ๐’…๐’†́๐’•๐’‚๐’Š๐’ ๐’•๐’†๐’„๐’‰๐’๐’Š๐’’๐’–๐’†.
๐‘ช๐’†๐’”๐’• ๐’๐’–๐’ ๐’…๐’†๐’” ๐’†́๐’๐’†́๐’Ž๐’†๐’๐’•๐’” ๐’๐’†๐’” ๐’‘๐’๐’–๐’” ๐’…๐’†́๐’„๐’Š๐’”๐’Š๐’‡๐’” ๐’…๐’‚๐’๐’” ๐’๐’‚ ๐’’๐’–๐’‚๐’๐’Š๐’•๐’†́ ๐’…๐’–๐’ ๐’Ž๐’๐’…๐’†̀๐’๐’† ๐’…๐’† ๐‘ด๐’‚๐’„๐’‰๐’Š๐’๐’† ๐‘ณ๐’†๐’‚๐’“๐’๐’Š๐’๐’ˆ.

Et vous, quelle loss function utilisez-vous le plus dans vos projets : MSE, Cross-Entropy, MAE, Dice, Hinge ou autre ? ๐Ÿ‘‡

Pour mieux apprendre l’utilisation des logiciels et des modรจles statistiques, nous vous invitons ร  prendre part ร  notre prochaine session de formation en ๐™€๐™˜๐™ค๐™ฃ๐™ค๐™ขรฉ๐™ฉ๐™ง๐™ž๐™š ๐™š๐™ฉ ๐™๐™š๐™˜๐™๐™ฃ๐™ž๐™ฆ๐™ช๐™š๐™จ ๐™Œ๐™ช๐™–๐™ฃ๐™ฉ๐™ž๐™ฉ๐™–๐™ฉ๐™ž๐™ซ๐™šs https://forms.gle/yZAZimRXbTFbUWZk6



#MachineLearning #DataScience #LossFunctions #DeepLearning #Regression #Classification #IntelligenceArtificielle #AnalyseDeDonnรฉes #Statistiques #ApprentissageAutomatique

 

Commentaires

Posts les plus consultรฉs de ce blog

ร‰conomรฉtrie des donnรฉes de panel: de la thรฉorie ร  la pratique