Articles

𝑭𝒐𝒏𝒄𝒕𝒊𝒐𝒏𝒔 𝒅’𝑨𝒄𝒕𝒊𝒗𝒂𝒕𝒊𝒐𝒏 𝒆𝒏 𝑴𝒂𝒄𝒉𝒊𝒏𝒆 𝑳𝒆𝒂𝒓𝒏𝒊𝒏𝒈 : 𝒍𝒆 𝒎𝒐𝒕𝒆𝒖𝒓 𝒄𝒂𝒄𝒉𝒆́ 𝒅𝒆𝒔 𝒓𝒆́𝒔𝒆𝒂𝒖𝒙 𝒅𝒆 𝒏𝒆𝒖𝒓𝒐𝒏𝒆𝒔

Image
En Machine Learning, surtout dans les réseaux de neurones, une question revient souvent : 𝑸𝒖’𝒆𝒔𝒕-𝒄𝒆 𝒒𝒖𝒊 𝒑𝒆𝒓𝒎𝒆𝒕 𝒂̀ 𝒖𝒏 𝒎𝒐𝒅𝒆̀𝒍𝒆 𝒅’𝒂𝒑𝒑𝒓𝒆𝒏𝒅𝒓𝒆 𝒅𝒆𝒔 𝒓𝒆𝒍𝒂𝒕𝒊𝒐𝒏𝒔 𝒄𝒐𝒎𝒑𝒍𝒆𝒙𝒆𝒔 ? La réponse se trouve en grande partie dans les 𝒇𝒐𝒏𝒄𝒕𝒊𝒐𝒏𝒔 𝒅’𝒂𝒄𝒕𝒊𝒗𝒂𝒕𝒊𝒐𝒏. Une fonction d’activation transforme le signal reçu par un neurone artificiel avant de le transmettre à la couche suivante. Sans elle, un réseau de neurones resterait presque un simple modèle linéaire, même avec plusieurs couches. 𝑳𝒂 𝒇𝒐𝒏𝒄𝒕𝒊𝒐𝒏 𝒍𝒊𝒏𝒆́𝒂𝒊𝒓𝒆 Elle produit une sortie proportionnelle à l’entrée. Elle est simple, mais limitée pour apprendre des relations complexes. 𝑳𝒂 𝒔𝒊𝒈𝒎𝒐𝒊̈𝒅𝒆 Elle transforme les valeurs en probabilités comprises entre 0 et 1. Elle est très utilisée pour les problèmes de classification binaire. 𝑳𝒂 𝑻𝒂𝒏𝒉 Elle ressemble à la sigmoïde, mais ses valeurs varient entre -1 et 1. Elle permet souvent de mieux centrer les données auto...

📊 𝑹𝒆́𝒈𝒓𝒆𝒔𝒔𝒊𝒐𝒏 𝑳𝒊𝒏𝒆́𝒂𝒊𝒓𝒆 : 𝒍𝒂 𝒎𝒆́𝒕𝒉𝒐𝒅𝒆 𝒒𝒖𝒊 𝒕𝒓𝒂𝒏𝒔𝒇𝒐𝒓𝒎𝒆 𝒍𝒆𝒔 𝒅𝒐𝒏𝒏𝒆́𝒆𝒔 𝒆𝒏 𝒆𝒙𝒑𝒍𝒊𝒄𝒂𝒕𝒊𝒐𝒏𝒔

Image
En statistique, en économétrie et en data science, la 𝒓𝒆́𝒈𝒓𝒆𝒔𝒔𝒊𝒐𝒏 𝒍𝒊𝒏𝒆́𝒂𝒊𝒓𝒆 fait partie des outils les plus utilisés pour comprendre la relation entre plusieurs variables. Son objectif est simple : expliquer ou prédire une variable dépendante à partir d’une ou plusieurs variables explicatives. Par exemple, on peut l’utiliser pour analyser : l’effet du revenu sur la consommation ; l’impact du niveau d’éducation sur le salaire ; la relation entre l’investissement et la croissance ; l’influence du prix sur la demande ; les facteurs qui expliquent la performance d’une entreprise. La logique du modèle repose sur une équation simple : 𝒚 = 𝜷₀ + 𝜷₁𝑿₁ + 𝜷₂𝑿₂ + … + 𝜷ₖ𝑿ₖ + 𝜺 Dans cette équation : 𝒚 représente la variable à expliquer. 𝑿₁, 𝑿₂, …, 𝑿ₖ représentent les variables explicatives. 𝜷₀ est la constante du modèle. 𝜷₁, 𝜷₂, …, 𝜷ₖ mesurent l’effet de chaque variable explicative sur la variable dépendante. 𝜺 représente la part non expliquée par le modèle....

📊 𝑳𝒆𝒔 𝑫𝒊𝒔𝒕𝒓𝒊𝒃𝒖𝒕𝒊𝒐𝒏𝒔 𝒅𝒆 𝑷𝒓𝒐𝒃𝒂𝒃𝒊𝒍𝒊𝒕𝒆́ : 𝒍𝒂 𝒃𝒂𝒔𝒆 𝒑𝒐𝒖𝒓 𝒄𝒐𝒎𝒑𝒓𝒆𝒏𝒅𝒓𝒆 𝒍’𝒊𝒏𝒄𝒆𝒓𝒕𝒊𝒕𝒖𝒅𝒆

Image
En statistique, en économétrie et en data science, les données ne se comportent pas toujours de la même manière. Certaines valeurs sont regroupées autour d’une moyenne. D’autres apparaissent sous forme de succès ou d’échec. Certaines mesurent le temps d’attente, le nombre d’événements ou encore des proportions. C’est là qu’interviennent les 𝒅𝒊𝒔𝒕𝒓𝒊𝒃𝒖𝒕𝒊𝒐𝒏𝒔 𝒅𝒆 𝒑𝒓𝒐𝒃𝒂𝒃𝒊𝒍𝒊𝒕𝒆́. Elles permettent de décrire 𝒄𝒐𝒎𝒎𝒆𝒏𝒕 𝒖𝒏𝒆 𝒗𝒂𝒓𝒊𝒂𝒃𝒍𝒆 𝒑𝒆𝒖𝒕 𝒑𝒓𝒆𝒏𝒅𝒓𝒆 𝒅𝒊𝒇𝒇𝒆́𝒓𝒆𝒏𝒕𝒆𝒔 𝒗𝒂𝒍𝒆𝒖𝒓𝒔 et avec quelle probabilité. 𝑳𝒂 𝒍𝒐𝒊 𝒏𝒐𝒓𝒎𝒂𝒍𝒆 est très utilisée pour analyser des phénomènes proches d’une moyenne : notes, tailles, erreurs de mesure, revenus, etc. 𝑳𝒂 𝒍𝒐𝒊 𝒃𝒆𝒓𝒏𝒐𝒖𝒍𝒍𝒊 décrit une situation simple avec deux issues possibles : succès ou échec, oui ou non, 1 ou 0. 𝑳𝒂 𝒍𝒐𝒊 𝒃𝒊𝒏𝒐𝒎𝒊𝒂𝒍𝒆 permet de compter le nombre de succès dans plusieurs essais répétés. 𝑳𝒂 𝒍𝒐𝒊 𝒅𝒆 𝑷𝒐𝒊𝒔𝒔𝒐𝒏 est utile pour modéliser le nombre...

📊 𝑳𝒆𝒔 𝟑 𝑮𝒓𝒂𝒏𝒅𝒔 𝑻𝒚𝒑𝒆𝒔 𝒅𝒆 𝑴𝒂𝒄𝒉𝒊𝒏𝒆 𝑳𝒆𝒂𝒓𝒏𝒊𝒏𝒈 𝒂̀ 𝑴𝒂𝒊̂𝒕𝒓𝒊𝒔𝒆𝒓 𝒆𝒏 𝑫𝒂𝒕𝒂 𝑺𝒄𝒊𝒆𝒏𝒄𝒆 🚀

Image
Le 𝑴𝒂𝒄𝒉𝒊𝒏𝒆 𝑳𝒆𝒂𝒓𝒏𝒊𝒏𝒈 est aujourd’hui au cœur de l’intelligence artificielle, de la data science et de l’analyse prédictive. Mais pour bien comprendre son fonctionnement, il faut d’abord distinguer ses 𝒕𝒓𝒐𝒊𝒔 𝒈𝒓𝒂𝒏𝒅𝒆𝒔 𝒇𝒂𝒎𝒊𝒍𝒍𝒆𝒔. 𝟏. 𝑳’𝑨𝒑𝒑𝒓𝒆𝒏𝒕𝒊𝒔𝒔𝒂𝒈𝒆 𝑺𝒖𝒑𝒆𝒓𝒗𝒊𝒔𝒆́ Ici, le modèle apprend à partir de données déjà étiquetées. On lui montre des exemples avec les bonnes réponses, puis il apprend à prédire. Exemples : 𝑪𝒍𝒂𝒔𝒔𝒊𝒇𝒊𝒄𝒂𝒕𝒊𝒐𝒏 : prédire si un client va acheter ou non. 𝑹𝒆́𝒈𝒓𝒆𝒔𝒔𝒊𝒐𝒏 : prédire un prix, un revenu, une note ou une quantité. Méthodes fréquentes : 𝑹𝒆́𝒈𝒓𝒆𝒔𝒔𝒊𝒐𝒏 𝒍𝒐𝒈𝒊𝒔𝒕𝒊𝒒𝒖𝒆, 𝒂𝒓𝒃𝒓𝒆𝒔 𝒅𝒆 𝒅𝒆́𝒄𝒊𝒔𝒊𝒐𝒏, 𝒓𝒂𝒏𝒅𝒐𝒎 𝒇𝒐𝒓𝒆𝒔𝒕, 𝑿𝑮𝑩𝒐𝒐𝒔𝒕, 𝑺𝑽𝑴. 𝟐. 𝑳’𝑨𝒑𝒑𝒓𝒆𝒏𝒕𝒊𝒔𝒔𝒂𝒈𝒆 𝑵𝒐𝒏 𝑺𝒖𝒑𝒆𝒓𝒗𝒊𝒔𝒆́ Dans ce cas, les données ne sont pas étiquetées. Le modèle cherche lui-même des structures, des groupes ou des régularités cachées. Exemples : 𝑪𝒍𝒖𝒔𝒕𝒆𝒓𝒊𝒏𝒈 : regr...

📊 𝗧𝗥𝗔𝗡𝗦𝗙𝗢𝗥𝗠𝗔𝗧𝗜𝗢𝗡𝗦 𝗗𝗘𝗦 𝗗𝗢𝗡𝗡𝗘́𝗘𝗦 𝗘𝗡 𝗘́𝗖𝗢𝗡𝗢𝗠𝗘́𝗧𝗥𝗜𝗘 : 𝗨𝗡𝗘 𝗘́𝗧𝗔𝗣𝗘 𝗤𝗨𝗜 𝗣𝗘𝗨𝗧 𝗖𝗛𝗔𝗡𝗚𝗘𝗥 𝗧𝗢𝗨𝗧

Image
En économétrie, la qualité d’un modèle ne dépend pas seulement du choix des variables ou de la méthode d’estimation. Elle dépend aussi de la manière dont les données sont préparées avant l’analyse. 𝗨𝗻𝗲 𝗺𝗮𝘂𝘃𝗮𝗶𝘀𝗲 𝘁𝗿𝗮𝗻𝘀𝗳𝗼𝗿𝗺𝗮𝘁𝗶𝗼𝗻 peut conduire à des résultats biaisés, instables ou difficiles à interpréter. 𝗨𝗻𝗲 𝗯𝗼𝗻𝗻𝗲 𝘁𝗿𝗮𝗻𝘀𝗳𝗼𝗿𝗺𝗮𝘁𝗶𝗼𝗻 permet au contraire d’améliorer la lisibilité, la stabilité et la pertinence empirique du modèle. 𝟭. 𝗟𝗮 𝘁𝗿𝗮𝗻𝘀𝗳𝗼𝗿𝗺𝗮𝘁𝗶𝗼𝗻 𝗹𝗼𝗴𝗮𝗿𝗶𝘁𝗵𝗺𝗶𝗾𝘂𝗲 Elle est très utilisée lorsque les variables sont fortement asymétriques. Elle permet aussi d’interpréter certains coefficients en termes de pourcentage ou d’élasticité. Exemple : revenu, PIB, consommation, prix, salaires. 𝟮. 𝗟𝗮 𝗱𝗶𝗳𝗳𝗲́𝗿𝗲𝗻𝗰𝗶𝗮𝘁𝗶𝗼𝗻 Elle est souvent utilisée dans les séries temporelles pour réduire les tendances et rendre les variables plus stationnaires. Exemple : transformer un niveau de PIB en variation du PIB. 𝟯. 𝗟...