Articles

🐍 𝑷𝒚𝒕𝒉𝒐𝒏 𝑪𝒉𝒆𝒂𝒕𝒔𝒉𝒆𝒆𝒕 : 𝒍𝒆𝒔 𝒃𝒂𝒔𝒆𝒔 𝒂̀ 𝒎𝒂𝒊̂𝒕𝒓𝒊𝒔𝒆𝒓 𝒑𝒐𝒖𝒓 𝒑𝒓𝒐𝒈𝒓𝒆𝒔𝒔𝒆𝒓 𝒗𝒊𝒕𝒆 🚀

Image
Python est aujourd’hui l’un des langages les plus utilisés en 𝒅𝒂𝒕𝒂 𝒂𝒏𝒂𝒍𝒚𝒔𝒊𝒔 , 𝒎𝒂𝒄𝒉𝒊𝒏𝒆 𝒍𝒆𝒂𝒓𝒏𝒊𝒏𝒈 , 𝒂𝒖𝒕𝒐𝒎𝒂𝒕𝒊𝒔𝒂𝒕𝒊𝒐𝒏 et 𝒓𝒆𝒄𝒉𝒆𝒓𝒄𝒉𝒆 𝒔𝒄𝒊𝒆𝒏𝒕𝒊𝒇𝒊𝒒𝒖𝒆 . Mais pour bien progresser, il ne suffit pas seulement de connaître quelques commandes. Il faut surtout maîtriser les 𝒔𝒕𝒓𝒖𝒄𝒕𝒖𝒓𝒆𝒔 , les 𝒇𝒐𝒏𝒄𝒕𝒊𝒐𝒏𝒔 , les 𝒑𝒂𝒕𝒕𝒆𝒓𝒏𝒔 et les outils modernes du langage. Avant d’aller plus loin, pensez à 𝒍𝒊𝒌𝒆𝒓 et 𝒑𝒂𝒓𝒕𝒂𝒈𝒆𝒓 cette publication pour aider d’autres personnes à apprendre Python plus facilement. 📦 𝟏 . 𝑳𝒆𝒔 𝒔𝒕𝒓𝒖𝒄𝒕𝒖𝒓𝒆𝒔 𝒅𝒆 𝒅𝒐𝒏𝒏𝒆 ́ 𝒆𝒔 Les structures de données sont la base de tout programme Python. On retrouve notamment : 🔹 les 𝒍𝒊𝒔𝒕𝒆𝒔 pour stocker des éléments ordonnés ; 🔹 les 𝒅𝒊𝒄𝒕𝒊𝒐𝒏𝒏𝒂𝒊𝒓𝒆𝒔 pour associer des clés à des valeurs ; 🔹 les 𝒔𝒆𝒕𝒔 pour gérer des éléments uniques ; 🔹 les 𝒕𝒖𝒑𝒍𝒆𝒔 pour stocker des données non modifiables. Il...

📊 𝑹𝑶𝑪-𝑨𝑼𝑪 𝒆𝒏 𝑴𝒂𝒄𝒉𝒊𝒏𝒆 𝑳𝒆𝒂𝒓𝒏𝒊𝒏𝒈 : 𝒄𝒐𝒎𝒎𝒆𝒏𝒕 𝒆́𝒗𝒂𝒍𝒖𝒆𝒓 𝒖𝒏 𝒎𝒐𝒅𝒆̀𝒍𝒆 𝒅𝒆 𝒄𝒍𝒂𝒔𝒔𝒊𝒇𝒊𝒄𝒂𝒕𝒊𝒐𝒏 ? 🤖📈

Image
En 𝑴𝒂𝒄𝒉𝒊𝒏𝒆 𝑳𝒆𝒂𝒓𝒏𝒊𝒏𝒈 , lorsqu’on construit un modèle de 𝒄𝒍𝒂𝒔𝒔𝒊𝒇𝒊𝒄𝒂𝒕𝒊𝒐𝒏 𝒃𝒊𝒏𝒂𝒊𝒓𝒆 , il ne suffit pas toujours de regarder le taux de bonnes prédictions. C’est ici que la 𝑹𝑶𝑪 - 𝑨𝑼𝑪 devient très utile. 🔹 𝑸𝒖 ’ 𝒆𝒔𝒕 - 𝒄𝒆 𝒒𝒖𝒆 𝒍𝒂 𝑹𝑶𝑪 - 𝑨𝑼𝑪 ? La 𝑹𝑶𝑪 - 𝑨𝑼𝑪 est une mesure utilisée pour évaluer la capacité d’un modèle à 𝒃𝒊𝒆𝒏 𝒅𝒊𝒔𝒕𝒊𝒏𝒈𝒖𝒆𝒓 𝒍𝒆𝒔 𝒅𝒆𝒖𝒙 𝒄𝒍𝒂𝒔𝒔𝒆𝒔 : la classe positive et la classe négative. Elle est particulièrement utilisée lorsque le modèle produit un score ou une probabilité. La courbe ROC représente le lien entre : ✅ le 𝑻𝒂𝒖𝒙 𝒅𝒆 𝑽𝒓𝒂𝒊𝒔 𝑷𝒐𝒔𝒊𝒕𝒊𝒇𝒔 et ❌ le 𝑻𝒂𝒖𝒙 𝒅𝒆 𝑭𝒂𝒖𝒙 𝑷𝒐𝒔𝒊𝒕𝒊𝒇𝒔 pour différents seuils de décision. 🔹 𝑳𝒆𝒔 𝒅𝒆𝒖𝒙 𝒊𝒏𝒅𝒊𝒄𝒂𝒕𝒆𝒖𝒓𝒔 𝒄𝒍𝒆 ́ 𝒔 𝑻𝑷𝑹 = 𝑻𝑷 / ( 𝑻𝑷 + 𝑭𝑵 ) Le 𝑻𝑷𝑹 correspond à la sensibilité ou au rappel. Il mesure la proportion de vrais positifs correctement détectés. ...

📌 𝑳𝒆𝒔 𝒃𝒂𝒔𝒆𝒔 𝒎𝒂𝒕𝒉𝒆́𝒎𝒂𝒕𝒊𝒒𝒖𝒆𝒔 𝒂̀ 𝒎𝒂𝒊̂𝒕𝒓𝒊𝒔𝒆𝒓 𝒆𝒏 𝑫𝒂𝒕𝒂 𝑺𝒄𝒊𝒆𝒏𝒄𝒆 🚀

Image
La 𝐃𝐚𝐭𝐚 𝐒𝐜𝐢𝐞𝐧𝐜𝐞 ne repose pas uniquement sur les logiciels, les algorithmes ou l’intelligence artificielle. Elle repose aussi sur une base solide en 𝐦𝐚𝐭𝐡𝐞́𝐦𝐚𝐭𝐢𝐪𝐮𝐞𝐬 . Pour bien comprendre les modèles statistiques, le machine learning et l’analyse des données, certains outils sont indispensables : 𝐋𝐞𝐬 𝐞𝐧𝐬𝐞𝐦𝐛𝐥𝐞𝐬 pour organiser et manipuler les données 𝐋𝐞𝐬 𝐩𝐫𝐨𝐛𝐚𝐛𝐢𝐥𝐢𝐭𝐞́𝐬 pour raisonner sous incertitude 𝐋𝐞 𝐜𝐚𝐥𝐜𝐮𝐥 𝐝𝐢𝐟𝐟𝐞́𝐫𝐞𝐧𝐭𝐢𝐞𝐥 pour comprendre l’optimisation des modèles 𝐋’𝐚𝐥𝐠𝐞̀𝐛𝐫𝐞 𝐥𝐢𝐧𝐞́𝐚𝐢𝐫𝐞 pour travailler avec les matrices, les vecteurs et les transformations Ces notions sont au cœur de nombreuses méthodes utilisées en 𝐬𝐭𝐚𝐭𝐢𝐬𝐭𝐢𝐪𝐮𝐞, en 𝐞́𝐜𝐨𝐧𝐨𝐦𝐞́𝐭𝐫𝐢𝐞, en 𝐦𝐚𝐜𝐡𝐢𝐧𝐞 𝐥𝐞𝐚𝐫𝐧𝐢𝐧𝐠 et en 𝐢𝐧𝐭𝐞𝐥𝐥𝐢𝐠𝐞𝐧𝐜𝐞 𝐚𝐫𝐭𝐢𝐟𝐢𝐜𝐢𝐞𝐥𝐥𝐞. Une fiche pratique comme celle-ci permet donc de réviser rapidement les formules essentielles : 𝐩𝐫𝐨𝐛𝐚𝐛𝐢𝐥𝐢𝐭𝐞́𝐬, 𝐝𝐞́𝐫𝐢𝐯𝐞́𝐞𝐬, ...

📊 𝑬́𝒄𝒐𝒏𝒐𝒎𝒆́𝒕𝒓𝒊𝒆, 𝒆́𝒗𝒂𝒍𝒖𝒂𝒕𝒊𝒐𝒏 𝒅𝒆𝒔 𝒑𝒐𝒍𝒊𝒕𝒊𝒒𝒖𝒆𝒔 𝒆𝒕 𝒃𝒊𝒆𝒏-𝒆̂𝒕𝒓𝒆 𝒔𝒐𝒄𝒊𝒂𝒍 : 𝒑𝒐𝒖𝒓𝒒𝒖𝒐𝒊 𝒍𝒂 𝒎𝒆𝒔𝒖𝒓𝒆 𝒄𝒐𝒎𝒑𝒕𝒆 ?

Image
Le 𝒃𝒊𝒆𝒏 - 𝒆 ̂ 𝒕𝒓𝒆 𝒔𝒐𝒄𝒊𝒂𝒍 ne peut pas être résumé uniquement par la croissance du PIB. Une économie peut croître sans que toutes les populations bénéficient réellement de cette croissance. Le bien-être dépend aussi de plusieurs dimensions : 𝒍𝒆 𝒓𝒆𝒗𝒆𝒏𝒖 , 𝒍𝒂 𝒔𝒂𝒏𝒕𝒆 ́, 𝒍 ’ 𝒆 ́ 𝒅𝒖𝒄𝒂𝒕𝒊𝒐𝒏 , 𝒍 ’ 𝒆𝒎𝒑𝒍𝒐𝒊 , 𝒍𝒂 𝒔𝒕𝒂𝒃𝒊𝒍𝒊𝒕𝒆 ́ 𝒅𝒆𝒔 𝒎𝒆 ́ 𝒏𝒂𝒈𝒆𝒔 et leur capacité à faire face aux chocs économiques. C’est précisément à ce niveau que l’ 𝒆 ́ 𝒄𝒐𝒏𝒐𝒎𝒆 ́ 𝒕𝒓𝒊𝒆 devient indispensable. Elle permet de passer d’une simple description des données à une analyse plus rigoureuse des effets réels des politiques publiques. 🔹 𝑷𝒐𝒖𝒓𝒒𝒖𝒐𝒊 𝒍 ’ 𝒆 ́ 𝒄𝒐𝒏𝒐𝒎𝒆 ́ 𝒕𝒓𝒊𝒆 𝒆𝒔𝒕 - 𝒆𝒍𝒍𝒆 𝒆𝒔𝒔𝒆𝒏𝒕𝒊𝒆𝒍𝒍𝒆 ? Parce qu’en évaluation des politiques publiques, il ne suffit pas d’observer qu’un indicateur s’est amélioré après une intervention. La vraie question est plutôt : 𝒄𝒆𝒕𝒕𝒆 𝒂𝒎𝒆 ́ 𝒍𝒊𝒐𝒓𝒂𝒕𝒊𝒐𝒏 𝒆...

🔵 𝟏𝟎 𝑳𝒐𝒊𝒔 𝒅𝒆 𝑷𝒓𝒐𝒃𝒂𝒃𝒊𝒍𝒊𝒕𝒆́ 𝒂̀ 𝑴𝒂𝒊̂𝒕𝒓𝒊𝒔𝒆𝒓 𝒆𝒏 𝑫𝒂𝒕𝒂 𝑺𝒄𝒊𝒆𝒏𝒄𝒆

Image
En 𝑫𝒂𝒕𝒂 𝑺𝒄𝒊𝒆𝒏𝒄𝒆, les modèles ne reposent pas seulement sur les algorithmes, les logiciels ou l’intelligence artificielle. Ils reposent aussi sur une base fondamentale : 𝒍𝒆𝒔 𝒍𝒐𝒊𝒔 𝒅𝒆 𝒑𝒓𝒐𝒃𝒂𝒃𝒊𝒍𝒊𝒕𝒆́. Ces distributions permettent de mieux comprendre les phénomènes aléatoires, de modéliser les données, d’évaluer l’incertitude et de faire des prédictions plus fiables. Voici 𝟏𝟎 𝒅𝒊𝒔𝒕𝒓𝒊𝒃𝒖𝒕𝒊𝒐𝒏𝒔 𝒆𝒔𝒔𝒆𝒏𝒕𝒊𝒆𝒍𝒍𝒆𝒔 à connaître absolument. 1️⃣ 𝑳𝒐𝒊 𝑼𝒏𝒊𝒇𝒐𝒓𝒎𝒆 Tous les résultats possibles ont la même probabilité d’apparaître. 2️⃣ 𝑳𝒐𝒊 𝑩𝒊𝒏𝒐𝒎𝒊𝒂𝒍𝒆 Elle modélise le nombre de succès dans une série d’essais indépendants. 3️⃣ 𝑳𝒐𝒊 𝑴𝒖𝒍𝒕𝒊𝒏𝒐𝒎𝒊𝒂𝒍𝒆 Elle généralise la loi binomiale lorsque les résultats possibles dépassent deux catégories. 4️⃣ 𝑳𝒐𝒊 𝑵𝒐𝒓𝒎𝒂𝒍𝒆 C’est la célèbre courbe en cloche, très utilisée pour modéliser de nombreux phénomènes naturels et sociaux. 5️⃣ 𝑳𝒐𝒊 𝒅𝒖 𝑲𝒉𝒊-𝒅𝒆𝒖𝒙 Elle intervient notamment da...