Articles

๐‘ฉ๐’Š๐’†๐’ ๐’„๐’‰๐’๐’Š๐’”๐’Š๐’“ ๐’”๐’‚ ๐’‡๐’๐’๐’„๐’•๐’Š๐’๐’ ๐’…๐’† ๐’‘๐’†๐’“๐’•๐’† : ๐’–๐’ ๐’„๐’‰๐’๐’Š๐’™ ๐’…๐’†́๐’„๐’Š๐’”๐’Š๐’‡ ๐’†๐’ ๐‘ด๐’‚๐’„๐’‰๐’Š๐’๐’† ๐‘ณ๐’†๐’‚๐’“๐’๐’Š๐’๐’ˆ ๐Ÿ“Š๐Ÿค–

Image
Quand on parle de performance d’un modรจle de ๐Œ๐š๐œ๐ก๐ข๐ง๐ž ๐‹๐ž๐š๐ซ๐ง๐ข๐ง๐  , on pense souvent aux donnรฉes, aux variables ou ร  l’algorithme. Mais un รฉlรฉment central est parfois nรฉgligรฉ : ๐ฅ๐š ๐Ÿ๐จ๐ง๐œ๐ญ๐ข๐จ๐ง ๐๐ž ๐ฉ๐ž๐ซ๐ญ๐ž . C’est elle qui permet au modรจle de mesurer l’รฉcart entre ce qu’il prรฉdit et ce qu’il aurait dรป prรฉdire. En d’autres termes, elle guide l’apprentissage en indiquant au modรจle quelle erreur corriger. ๐Ÿ‘‰ Un bon modรจle n’apprend pas seulement ร  prรฉdire. Il apprend ร  rรฉduire intelligemment ses erreurs . ๐๐จ๐ฎ๐ซ๐ช๐ฎ๐จ๐ข ๐ฅ๐š ๐Ÿ๐จ๐ง๐œ๐ญ๐ข๐จ๐ง ๐๐ž ๐ฉ๐ž๐ซ๐ญ๐ž ๐ž๐ฌ๐ญ ๐ฌ๐ข ๐ข๐ฆ๐ฉ๐จ๐ซ๐ญ๐š๐ง๐ญ๐ž ? Parce qu’elle influence directement : ✅ la qualitรฉ des prรฉdictions ✅ la stabilitรฉ de l’entraรฎnement ✅ la sensibilitรฉ aux valeurs extrรชmes ✅ la capacitรฉ du modรจle ร  bien apprendre sur des donnรฉes รฉquilibrรฉes ou non Autrement dit, deux modรจles identiques peuvent produire des rรฉsultats trรจs diffรฉrents selon la fonction de perte utilisรฉe . ๐„๐ง ...

๐‘ช๐’๐’๐’•๐’“๐’‚๐’Š๐’๐’•๐’† ๐’ƒ๐’–๐’…๐’ˆ๐’†́๐’•๐’‚๐’Š๐’“๐’† : ๐’„๐’๐’Ž๐’Ž๐’†๐’๐’• ๐’๐’† ๐’„๐’๐’๐’”๐’๐’Ž๐’Ž๐’‚๐’•๐’†๐’–๐’“ ๐’‡๐’‚๐’Š๐’• ๐’”๐’†๐’” ๐’„๐’‰๐’๐’Š๐’™ ? ๐Ÿ“Š

Image
En รฉconomie, chaque consommateur fait face ร  une rรฉalitรฉ simple : ๐ฌ๐ž๐ฌ ๐ซ๐ž๐ฌ๐ฌ๐จ๐ฎ๐ซ๐œ๐ž๐ฌ ๐ฌ๐จ๐ง๐ญ ๐ฅ๐ข๐ฆ๐ข๐ญ๐ž ́ ๐ž๐ฌ . Autrement dit, il ne peut pas tout acheter ร  la fois. Il doit donc faire des ๐š๐ซ๐›๐ข๐ญ๐ซ๐š๐ ๐ž๐ฌ . Prenons un exemple concret. Supposons qu’un consommateur dispose de ๐๐ข๐ฑ ๐๐จ๐ฅ๐ฅ๐š๐ซ๐ฌ par semaine pour acheter deux biens : des burgers et des tickets de bus. Si un burger coรปte ๐๐ž๐ฎ๐ฑ ๐๐จ๐ฅ๐ฅ๐š๐ซ๐ฌ et qu’un ticket de bus coรปte ๐œ๐ข๐ง๐ช๐ฎ๐š๐ง๐ญ๐ž ๐œ๐ž๐ง๐ญ๐ข๐ฆ๐ž๐ฌ , alors toutes les combinaisons possibles de ces deux biens dรฉpendent de ce budget.   C’est exactement ce que reprรฉsente la ๐œ๐จ๐ง๐ญ๐ซ๐š๐ข๐ง๐ญ๐ž ๐›๐ฎ๐๐ ๐ž ́ ๐ญ๐š๐ข๐ซ๐ž . Elle montre toutes les combinaisons de biens que le consommateur peut se permettre compte tenu de son revenu et des prix. Par exemple : s’il dรฉpense tout son argent en burgers, il pourra en acheter ๐œ๐ข๐ง๐ช , mais aucun ticket de bus ; s’il dรฉpense tout en tickets de bus, il pourra en acheter ๐ฏ๐ข๐ง๐ ...

๐—ง๐—ต๐—ฒ́๐—ผ๐—ฟ๐—ถ๐—ฒ ๐—ฑ๐˜‚ ๐—ฐ๐—ผ๐—บ๐—ฝ๐—ผ๐—ฟ๐˜๐—ฒ๐—บ๐—ฒ๐—ป๐˜ ๐—ฑ๐˜‚ ๐—ฐ๐—ผ๐—ป๐˜€๐—ผ๐—บ๐—บ๐—ฎ๐˜๐—ฒ๐˜‚๐—ฟ : ๐—ฐ๐—ผ๐—บ๐—บ๐—ฒ๐—ป๐˜ ๐˜€๐—ฒ ๐—ณ๐—ผ๐—ฟ๐—บ๐—ฒ ๐—น๐—ฎ ๐—ฑ๐—ฒ๐—บ๐—ฎ๐—ป๐—ฑ๐—ฒ ?

Image
La ๐˜๐—ต๐—ฒ ́ ๐—ผ๐—ฟ๐—ถ๐—ฒ ๐˜๐—ฟ๐—ฎ๐—ฑ๐—ถ๐˜๐—ถ๐—ผ๐—ป๐—ป๐—ฒ๐—น๐—น๐—ฒ ๐—ฑ๐—ฒ ๐—น๐—ฎ ๐—ฑ๐—ฒ๐—บ๐—ฎ๐—ป๐—ฑ๐—ฒ commence par l’รฉtude du ๐—ฐ๐—ผ๐—บ๐—ฝ๐—ผ๐—ฟ๐˜๐—ฒ๐—บ๐—ฒ๐—ป๐˜ ๐—ฑ๐˜‚ ๐—ฐ๐—ผ๐—ป๐˜€๐—ผ๐—บ๐—บ๐—ฎ๐˜๐—ฒ๐˜‚๐—ฟ . Pourquoi ? Parce que la demande du marchรฉ correspond gรฉnรฉralement ร  la somme des demandes individuelles des consommateurs. Dans les รฉconomies dรฉveloppรฉes, la demande des consommateurs reprรฉsente une part importante de la demande totale. Il est donc essentiel de comprendre comment un individu dรฉcide d’acheter un bien ou un service. La thรฉorie suppose que le consommateur est ๐—ฟ๐—ฎ๐˜๐—ถ๐—ผ๐—ป๐—ป๐—ฒ๐—น . Avec un revenu donnรฉ et des prix connus, il cherche ร  rรฉpartir son revenu de maniรจre ร  obtenir la ๐˜€๐—ฎ๐˜๐—ถ๐˜€๐—ณ๐—ฎ๐—ฐ๐˜๐—ถ๐—ผ๐—ป ๐—บ๐—ฎ๐˜…๐—ถ๐—บ๐—ฎ๐—น๐—ฒ . C’est ce qu’on appelle le principe de ๐—บ๐—ฎ๐˜…๐—ถ๐—บ๐—ถ๐˜€๐—ฎ๐˜๐—ถ๐—ผ๐—ป ๐—ฑ๐—ฒ ๐—น ’ ๐˜‚๐˜๐—ถ๐—น๐—ถ๐˜๐—ฒ ́ . Cette approche suppose aussi que le consommateur dispose d’une ๐—ถ๐—ป๐—ณ๐—ผ๐—ฟ๐—บ๐—ฎ๐˜๐—ถ๐—ผ๐—ป ๐—ฐ๐—ผ๐—บ๐—ฝ๐—น๐—ฒ ̀ ๐˜๐—ฒ : il connaรฎt les biens disponibles, leurs prix et le niveau de son revenu. Pour ...

๐—–๐—ผ๐—บ๐—ฝ๐—ฟ๐—ผ๐—บ๐—ถ๐˜€ ๐—•๐—ถ๐—ฎ๐—ถ๐˜€-๐—ฉ๐—ฎ๐—ฟ๐—ถ๐—ฎ๐—ป๐—ฐ๐—ฒ : ๐—ฝ๐—ผ๐˜‚๐—ฟ๐—พ๐˜‚๐—ผ๐—ถ ๐˜‚๐—ป ๐—บ๐—ผ๐—ฑ๐—ฒ̀๐—น๐—ฒ ๐— ๐—Ÿ ๐—ฒ́๐—ฐ๐—ต๐—ผ๐˜‚๐—ฒ ๐—ฎ̀ ๐—ด๐—ฒ́๐—ป๐—ฒ́๐—ฟ๐—ฎ๐—น๐—ถ๐˜€๐—ฒ๐—ฟ ?

Image
En ๐—บ๐—ฎ๐—ฐ๐—ต๐—ถ๐—ป๐—ฒ ๐—น๐—ฒ๐—ฎ๐—ฟ๐—ป๐—ถ๐—ป๐—ด , un modรจle ne doit pas seulement bien apprendre les donnรฉes d’entraรฎnement. Il doit surtout bien prรฉdire sur de ๐—ป๐—ผ๐˜‚๐˜ƒ๐—ฒ๐—น๐—น๐—ฒ๐˜€ ๐—ฑ๐—ผ๐—ป๐—ป๐—ฒ ́ ๐—ฒ๐˜€ . Le ๐—ฐ๐—ผ๐—บ๐—ฝ๐—ฟ๐—ผ๐—บ๐—ถ๐˜€ ๐—ฏ๐—ถ๐—ฎ๐—ถ๐˜€ - ๐˜ƒ๐—ฎ๐—ฟ๐—ถ๐—ฎ๐—ป๐—ฐ๐—ฒ explique pourquoi certains modรจles รฉchouent ร  gรฉnรฉraliser. L’erreur d’un modรจle vient gรฉnรฉralement de trois sources : ๐—•๐—ถ๐—ฎ๐—ถ๐˜€ : le modรจle est trop simple et fait de mauvaises hypothรจses. ๐—ฉ๐—ฎ๐—ฟ๐—ถ๐—ฎ๐—ป๐—ฐ๐—ฒ : le modรจle est trop sensible aux donnรฉes d’entraรฎnement. ๐—•๐—ฟ๐˜‚๐—ถ๐˜ ๐—ถ๐—ฟ๐—ฟ๐—ฒ ́ ๐—ฑ๐˜‚๐—ฐ๐˜๐—ถ๐—ฏ๐—น๐—ฒ : la part d’alรฉa prรฉsente dans les donnรฉes. La dรฉcomposition peut s’รฉcrire : Erreur attendue = Biais² + Variance + Bruit irrรฉductible Un modรจle trop simple produit un ๐—ฏ๐—ถ๐—ฎ๐—ถ๐˜€ ๐—ฒ ́ ๐—น๐—ฒ๐˜ƒ๐—ฒ ́ . Il n’arrive pas ร  capturer les vraies relations dans les donnรฉes. C’est le cas du ๐˜€๐—ผ๐˜‚๐˜€ - ๐—ฎ๐—ท๐˜‚๐˜€๐˜๐—ฒ๐—บ๐—ฒ๐—ป๐˜ , ou ๐˜‚๐—ป๐—ฑ๐—ฒ๐—ฟ๐—ณ๐—ถ๐˜๐˜๐—ถ๐—ป๐—ด . Un modรจle trop complexe produit une ๐˜ƒ๐—ฎ๐—ฟ๐—ถ๐—ฎ๐—ป๐—ฐ๐—ฒ ๐—ฒ ́ ๐—น๐—ฒ๐˜ƒ๐—ฒ ́ ๐—ฒ . Il apprend ...

๐—ฆ๐—›๐—”๐—ฃ ๐—ฒ๐—ป ๐— ๐—ฎ๐—ฐ๐—ต๐—ถ๐—ป๐—ฒ ๐—Ÿ๐—ฒ๐—ฎ๐—ฟ๐—ป๐—ถ๐—ป๐—ด : ๐—ฐ๐—ผ๐—บ๐—บ๐—ฒ๐—ป๐˜ ๐—ฒ๐˜…๐—ฝ๐—น๐—ถ๐—พ๐˜‚๐—ฒ๐—ฟ ๐—น๐—ฒ๐˜€ ๐—ฝ๐—ฟ๐—ฒ́๐—ฑ๐—ถ๐—ฐ๐˜๐—ถ๐—ผ๐—ป๐˜€ ๐—ฑ’๐˜‚๐—ป ๐—บ๐—ผ๐—ฑ๐—ฒ̀๐—น๐—ฒ ?

Image
En ๐—บ๐—ฎ๐—ฐ๐—ต๐—ถ๐—ป๐—ฒ ๐—น๐—ฒ๐—ฎ๐—ฟ๐—ป๐—ถ๐—ป๐—ด , il ne suffit pas toujours d’avoir un modรจle performant. Il faut aussi comprendre ๐—ฝ๐—ผ๐˜‚๐—ฟ๐—พ๐˜‚๐—ผ๐—ถ ๐—น๐—ฒ ๐—บ๐—ผ๐—ฑ๐—ฒ ̀ ๐—น๐—ฒ ๐—ฝ๐—ฟ๐—ฒ ́ ๐—ฑ๐—ถ๐˜ ๐˜๐—ฒ๐—น ๐—ผ๐˜‚ ๐˜๐—ฒ๐—น ๐—ฟ๐—ฒ ́ ๐˜€๐˜‚๐—น๐˜๐—ฎ๐˜ . C’est lร  qu’intervient ๐—ฆ๐—›๐—”๐—ฃ , pour ๐—ฆ๐—›๐—ฎ๐—ฝ๐—น๐—ฒ๐˜† ๐—”๐—ฑ๐—ฑ๐—ถ๐˜๐—ถ๐˜ƒ๐—ฒ ๐—ฒ๐˜…๐—ฃ๐—น๐—ฎ๐—ป๐—ฎ๐˜๐—ถ๐—ผ๐—ป๐˜€ . ๐—ฆ๐—›๐—”๐—ฃ est une mรฉthode d’explication des modรจles basรฉe sur la ๐˜๐—ต๐—ฒ ́ ๐—ผ๐—ฟ๐—ถ๐—ฒ ๐—ฑ๐—ฒ๐˜€ ๐—ท๐—ฒ๐˜‚๐˜… ๐—ฐ๐—ผ๐—ผ๐—ฝ๐—ฒ ́ ๐—ฟ๐—ฎ๐˜๐—ถ๐—ณ๐˜€ . L’idรฉe est simple : chaque variable est considรฉrรฉe comme un ๐—ท๐—ผ๐˜‚๐—ฒ๐˜‚๐—ฟ qui contribue ร  la prรฉdiction finale du modรจle. La question principale est donc : Quelle est la contribution de chaque variable ร  une prรฉdiction prรฉcise ? Par exemple, si un modรจle prรฉdit un risque รฉlevรฉ, ๐—ฆ๐—›๐—”๐—ฃ permet d’identifier les variables qui ont augmentรฉ ou diminuรฉ cette prรฉdiction. ๐—Ÿ๐—ฎ ๐—ณ๐—ผ๐—ฟ๐—บ๐˜‚๐—น๐—ฒ ๐—ฑ๐—ฒ ๐—ฆ๐—ต๐—ฎ๐—ฝ๐—น๐—ฒ๐˜† La valeur SHAP d’une variable peut รชtre reprรฉsentรฉe ainsi : ฯ†แตข = ฮฃ [|S|!(|F|-|S|-1)! / |F|!] × [f(S ∪ {i}) - f(S)] ...
Image
  ๐—ฅ๐—ฒ ́ ๐—ด๐˜‚๐—น๐—ฎ๐—ฟ๐—ถ๐˜€๐—ฎ๐˜๐—ถ๐—ผ๐—ป ๐—Ÿ๐Ÿญ ๐—ฒ๐˜ ๐—Ÿ๐Ÿฎ : ๐—ฐ๐—ผ๐—บ๐—บ๐—ฒ๐—ป๐˜ ๐—น๐˜‚๐˜๐˜๐—ฒ๐—ฟ ๐—ฐ๐—ผ๐—ป๐˜๐—ฟ๐—ฒ ๐—น๐—ฒ ๐˜€๐˜‚๐—ฟ๐—ฎ๐—ท๐˜‚๐˜€๐˜๐—ฒ๐—บ๐—ฒ๐—ป๐˜ ? En ๐—บ๐—ฎ๐—ฐ๐—ต๐—ถ๐—ป๐—ฒ ๐—น๐—ฒ๐—ฎ๐—ฟ๐—ป๐—ถ๐—ป๐—ด , un modรจle cherche souvent ร  trรจs bien expliquer les donnรฉes d’entraรฎnement. Mais lorsqu’il s’adapte trop fortement ร  ces donnรฉes, il risque de perdre sa capacitรฉ ร  bien prรฉdire sur de nouvelles observations. C’est ce qu’on appelle le ๐˜€๐˜‚๐—ฟ๐—ฎ๐—ท๐˜‚๐˜€๐˜๐—ฒ๐—บ๐—ฒ๐—ป๐˜ , ou ๐—ผ๐˜ƒ๐—ฒ๐—ฟ๐—ณ๐—ถ๐˜๐˜๐—ถ๐—ป๐—ด . La ๐—ฟ๐—ฒ ́ ๐—ด๐˜‚๐—น๐—ฎ๐—ฟ๐—ถ๐˜€๐—ฎ๐˜๐—ถ๐—ผ๐—ป permet de limiter ce problรจme en ajoutant une ๐—ฝ๐—ฒ ́ ๐—ป๐—ฎ๐—น๐—ถ๐˜๐—ฒ ́ ร  la fonction de perte du modรจle. L’idรฉe est simple : on ne veut pas seulement minimiser l’erreur de prรฉdiction. On veut aussi รฉviter que les coefficients deviennent trop grands. ๐—™๐—ผ๐—ฟ๐—บ๐—ฒ ๐—ด๐—ฒ ́ ๐—ป๐—ฒ ́ ๐—ฟ๐—ฎ๐—น๐—ฒ La fonction de perte rรฉgularisรฉe peut s’รฉcrire : L_reg = L( ฮธ ) + ฮปฮฉ ( ฮธ ) Avec : L( ฮธ ) : fonction de perte initiale, comme MSE ou cross-entropy ฮฉ ( ฮธ ) : terme de pรฉnalitรฉ ฮป : intensitรฉ d...