𝐑𝐚𝐧𝐝𝐨𝐦 𝐅𝐨𝐫𝐞𝐬𝐭 : 𝐮𝐧 𝐦𝐨𝐝𝐞̀𝐥𝐞 𝐩𝐮𝐢𝐬𝐬𝐚𝐧𝐭 𝐩𝐨𝐮𝐫 𝐥𝐚 𝐩𝐫𝐞́𝐝𝐢𝐜𝐭𝐢𝐨𝐧 𝐞𝐭 𝐥𝐚 𝐜𝐥𝐚𝐬𝐬𝐢𝐟𝐢𝐜𝐚𝐭𝐢𝐨𝐧
Le 𝐑𝐚𝐧𝐝𝐨𝐦 𝐅𝐨𝐫𝐞𝐬𝐭 est une 𝐦𝐞 ́ 𝐭𝐡𝐨𝐝𝐞 𝐝 ’ 𝐞𝐧𝐬𝐞𝐦𝐛𝐥𝐞 qui construit un grand nombre d’arbres de décision puis combine leurs prédictions. Chaque arbre est entraîné sur un échantillon aléatoire des données obtenu par bootstrap , et à chaque séparation, il ne considère qu’un sous-ensemble aléatoire de variables . Cette double part d’aléa rend les arbres différents les uns des autres, ce qui permet de réduire le surapprentissage et d’ améliorer la précision du modèle. 👉 La prédiction finale correspond à : • un vote majoritaire en classification • une moyenne en régression 📐 𝐋𝐞 𝐦𝐨𝐝𝐞 ̀ 𝐥𝐞 : ŷ_RF(x) = (1 / B) × Σ T_b(x) 𝐎𝐮 ̀ : B → nombre d’arbres T_b(x) → prédiction de l’arbre b x → variables explicatives 🌲 𝐂𝐨𝐦𝐦𝐞𝐧𝐭 𝐜 ̧ 𝐚 𝐟𝐨𝐧𝐜𝐭𝐢𝐨𝐧𝐧𝐞 ? ① Tirer B échantillons bootstrap avec remise ② Construire un arbre sur chaque échantillon ③ À chaque nœud, sélectionner aléatoirement m variables parmi les p vari...