TP Arbres de Décision, Forêts Aléatoires, et boosting "


Rappels généraux sur les "Jupyter notebooks"

Jupyter Notebook est un environnement interactif de calculs. Dans un notebook (fichier d'extension .ipynb) peuvent être combinés du texte, des images et des liens (comme dans du HTML), mais aussi du code Python modifiable et éxécutable directement dans la page, les résultats d'exécution du code (affichage texte, plots, images, etc...) s'ajoutant automatiquement juste en-dessous du code exécuté.
Cet environnement, ainsi que la librairie SciKit-learn sont désormais largement utilisés dans la communauté de l'apprentissage statistique (Machine-Learning, ML).
La façon la + simple et rapide d'installer sur un ordinateur PERSONNEL (par exemple votre laptop) tout ce qu'il faut pour utiliser Jupyter-notebook et SciKit-learn, est de récupérer et installer Anaconda, qui est un gros "package tout-en-un" existant pour tous les Systèmes d'Exploitation courants (Windows, MacOS, et Linux). Une fois ce logiciel installé, il suffit de démarrer le jupyter-notebook, qui ouvre dans votre navigateur Web une sorte d'explorateur permettant de trouver, ouvrir puis exécuter les notebooks (fichiers d'extension .ipynb) présents sur l'ordinateur 

Rappels sur le fonctionnement de jupyter-notebook sur les postes Linux du CCSI

Anaconda (version 2, avec Python 2.7) est DEJA INSTALLé sur les postes Linux du CCSI (L.117, L.119, L.120, L.022, etc).
Si vous travaillez en salle machine de MINES_ParisTech, AUCUNE INSTALL A FAIRE : connectez-vous juste en LINUX, puis démarrez Jupyter en tapant jupyter-notebook dans un terminal.

Démarrage du TP

Commencez par télécharger quelque part sous votre homedir le notebook du TP adb-rf-boosting-notebook.ipynb 
Ensuite, démarrez jupyter-notebook comme indiqué + haut, et cherchez et ouvrez ledit notebook que vous venez de télécharger.

Enoncé du TP

Vous le verrez en ouvrant le notebook sous Jupyter, mais vous pouvez aussi en VOIR ICI LE CONTENU SOUS FORME HTML.