Commit e1331eaf authored by TheophilePACE's avatar TheophilePACE

supervisé V .1, clustering V.2

parents 9e91a175 6355ed55
...@@ -12,7 +12,7 @@ ...@@ -12,7 +12,7 @@
"metadata": {}, "metadata": {},
"source": [ "source": [
"Aujourd'hui, on utilisera les données proposées par scikit learn. Ces données sont déjà nettoyées, déjà prêtes dans la libraries. \n", "Aujourd'hui, on utilisera les données proposées par scikit learn. Ces données sont déjà nettoyées, déjà prêtes dans la libraries. \n",
"Pour commencer, importer les libraries : numpy, matplotlib et le module datasets de scikit-learn" "Pour commencer, importez les libraries : numpy, matplotlib et le module datasets de scikit-learn"
] ]
}, },
{ {
...@@ -26,8 +26,8 @@ ...@@ -26,8 +26,8 @@
"cell_type": "markdown", "cell_type": "markdown",
"metadata": {}, "metadata": {},
"source": [ "source": [
"Maintenant, on va utiliser les fonctions suivantes de la libraire dataset : datasets.make_circles, datasets.make_moons, datasets.make_blobs, datasets.make_blobs.\n", "Maintenant, on va utiliser les fonctions suivantes de la librairie `dataset` : `datasets.make_circles`, `datasets.make_moons`, `datasets.make_blobs`, `datasets.make_blobs`.\n",
"Consulter la documentation intégrées de ces méthodes.\n", "Consultez la documentation intégrée de ces méthodes.\n",
"Vous pouvez trouver des exemples d'utilisation de ces méthodes sur https://scikit-learn.org/stable/auto_examples/cluster/plot_cluster_comparison.html " "Vous pouvez trouver des exemples d'utilisation de ces méthodes sur https://scikit-learn.org/stable/auto_examples/cluster/plot_cluster_comparison.html "
] ]
}, },
...@@ -56,7 +56,7 @@ ...@@ -56,7 +56,7 @@
"cell_type": "markdown", "cell_type": "markdown",
"metadata": {}, "metadata": {},
"source": [ "source": [
"Tracer les données générées dans $R^2$.\n", "Tracer les données générées dans le plan ($R^2$).\n",
"Commenter la difficulté du clustering." "Commenter la difficulté du clustering."
] ]
}, },
...@@ -67,12 +67,40 @@ ...@@ -67,12 +67,40 @@
"outputs": [], "outputs": [],
"source": [] "source": []
}, },
{
"cell_type": "markdown",
"metadata": {},
"source": [
"# Formatage du jeu de données"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Pour entrainer nos algorithmes, on va splitter notre jeu de données en 3 sous-jeux de données: \n",
"- train\n",
"- validation\n",
"- test\n",
"\n",
"Pourquoi est-ce nécessaire?\n",
"\n",
"Pour cela, utilisez la fonction scikit-learn `sklearn.model_selection.train_test_split`. Importez cette méthode, "
]
},
{
"cell_type": "code",
"execution_count": null,
"metadata": {},
"outputs": [],
"source": []
},
{ {
"cell_type": "markdown", "cell_type": "markdown",
"metadata": {}, "metadata": {},
"source": [ "source": [
"# K-means\n", "# K-means\n",
"Utiliser les k-means sur chacun des datasets. __Conseil:__ : Une cellule par dataset pour plus de clarté." "Utilisez les k-means sur chacun des datasets. __Conseil:__ : Une cellule par dataset pour plus de clarté."
] ]
}, },
{ {
...@@ -86,7 +114,7 @@ ...@@ -86,7 +114,7 @@
"cell_type": "markdown", "cell_type": "markdown",
"metadata": {}, "metadata": {},
"source": [ "source": [
"Comment avez vous choisi K ? Faites quelques testes, commentez les résultats. Gardez le meilleur hyperparmètre K. " "Comment avez-vous choisi K ? Faites quelques tests, commentez les résultats. Gardez le meilleur hyperparmètre K. "
] ]
}, },
{ {
...@@ -100,7 +128,7 @@ ...@@ -100,7 +128,7 @@
"cell_type": "markdown", "cell_type": "markdown",
"metadata": {}, "metadata": {},
"source": [ "source": [
"Relancer plusieurs fois pour chaque dataset. Obtenez-vous les mêmes résultats? Si non, pourquoi?" "Relancez plusieurs fois pour chaque dataset. Obtenez-vous les mêmes résultats? Si non, pourquoi?"
] ]
}, },
{ {
...@@ -116,7 +144,7 @@ ...@@ -116,7 +144,7 @@
"source": [ "source": [
"# ACP / PCA / Principal Components Analysis\n", "# ACP / PCA / Principal Components Analysis\n",
"On a vu la PCA ce matin. La fonction Scikit pour cette transformation est `sklearn.decomposition.PCA`. À vrai dire, c'est un objet. Consulter la documentation rapidemment : https://scikit-learn.org/stable/modules/generated/sklearn.decomposition.PCA.html ou la doc intégrée.\n", "On a vu la PCA ce matin. La fonction Scikit pour cette transformation est `sklearn.decomposition.PCA`. À vrai dire, c'est un objet. Consulter la documentation rapidemment : https://scikit-learn.org/stable/modules/generated/sklearn.decomposition.PCA.html ou la doc intégrée.\n",
"Effectuer une PCA sur vos données avec 2 composants. " "Effectuez une PCA sur vos données avec 2 composantes. "
] ]
}, },
{ {
...@@ -144,7 +172,7 @@ ...@@ -144,7 +172,7 @@
"cell_type": "markdown", "cell_type": "markdown",
"metadata": {}, "metadata": {},
"source": [ "source": [
"Charger le jeu de données iris. Ce jeu de données est un dataset très connu, assez facile. " "Chargez le jeu de données iris. Ce jeu de données est un dataset très connu, assez facile. "
] ]
}, },
{ {
...@@ -158,7 +186,7 @@ ...@@ -158,7 +186,7 @@
"cell_type": "markdown", "cell_type": "markdown",
"metadata": {}, "metadata": {},
"source": [ "source": [
"Effectuer une PCA. Quelle est la variance expliquée?" "Effectuez une PCA. Quelle est la variance expliquée?"
] ]
}, },
{ {
...@@ -172,7 +200,7 @@ ...@@ -172,7 +200,7 @@
"cell_type": "markdown", "cell_type": "markdown",
"metadata": {}, "metadata": {},
"source": [ "source": [
"Finalement, tracer ce jeu de données dans $R^2$. Est-ce facile de retrouver des clusters?" "Finalement, tracez ce jeu de données dans $R^2$. Est-il facile de retrouver des clusters?"
] ]
}, },
{ {
...@@ -187,7 +215,7 @@ ...@@ -187,7 +215,7 @@
"metadata": {}, "metadata": {},
"source": [ "source": [
"# Si vous vous ennuyez\n", "# Si vous vous ennuyez\n",
"Si vous avez le temps, essayez de lancer un k-means sur les iris. Ensuite, effectuez une PCA, puis relancer des k-means." "Si vous avez le temps, essayez de lancer un k-means sur les iris. Ensuite, effectuez une PCA, puis relancez des k-means."
] ]
}, },
{ {
...@@ -202,7 +230,7 @@ ...@@ -202,7 +230,7 @@
"metadata": {}, "metadata": {},
"source": [ "source": [
"Est-ce que vos résultats sont différents ? \n", "Est-ce que vos résultats sont différents ? \n",
"Essayer de tracer vos résultats, en indiquant les clusters trouvés." "Essayez de tracer vos résultats, en indiquant les clusters trouvés."
] ]
}, },
{ {
...@@ -230,6 +258,30 @@ ...@@ -230,6 +258,30 @@
"nbconvert_exporter": "python", "nbconvert_exporter": "python",
"pygments_lexer": "ipython3", "pygments_lexer": "ipython3",
"version": "3.6.6" "version": "3.6.6"
},
"toc": {
"colors": {
"hover_highlight": "#DAA520",
"navigate_num": "#000000",
"navigate_text": "#333333",
"running_highlight": "#FF0000",
"selected_highlight": "#FFD700",
"sidebar_border": "#EEEEEE",
"wrapper_background": "#FFFFFF"
},
"moveMenuLeft": true,
"nav_menu": {
"height": "102px",
"width": "252px"
},
"navigate_menu": true,
"number_sections": true,
"sideBar": true,
"threshold": 4,
"toc_cell": false,
"toc_section_display": "block",
"toc_window_display": false,
"widenNotebook": false
} }
}, },
"nbformat": 4, "nbformat": 4,
......
Markdown is supported
0% or
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment