5e › IA et nous › Jeu de NIM

📄 IA et nous — Séance 2/5

Comprendre l’apprentissage par renforcement avec le jeu de NIM

⏱ 1 heure

👤 5e — Binôme

📚 Apprentissage par renforcement

🎯 Problématique

Comment une IA peut-elle apprendre à gagner au jeu de NIM ?

Ma progression

Découvrir

Jouer

Algorithme

IA apprend

✓

Quiz

La progression se met à jour automatiquement au fil des activités

📚 Lexique — Les mots clés

Ces mots vont revenir tout au long de l’activité. Lis-les avant de commencer !

🏆 Apprentissage par renforcement Une IA apprend en testant des actions et en recevant une récompense ou une pénalité selon le résultat.	🎉 Récompense Signal positif ou négatif donné à l’IA après une action, pour lui indiquer si c’était une bonne idée.	🧠 Q-learning Méthode d’apprentissage par renforcement où l’IA mémorise la valeur de chaque action possible.	🔢 Modulo Le reste d’une division. Par exemple, 13 modulo 4 vaut 1, car 13 = 3 × 4 + 1.
🎯 Stratégie gagnante Une suite de choix qui permet de gagner à coup sûr, quoi que fasse l’adversaire.	🧭 Exploration Le fait d’essayer des actions au hasard pour découvrir ce qui fonctionne.	🎯 Exploitation Le fait de réutiliser une action qu’on sait déjà efficace, plutôt que d’en essayer une nouvelle.	✅ Position gagnante Une situation de jeu où le joueur qui doit jouer peut forcer sa victoire s’il fait les bons choix.

📋 Travail à faire

Étape 1 — Découvrir le jeu de NIM

Objectif : Comprendre les règles du jeu avant d’affronter l’IA.

① Il y a 16 bâtons au départ.

② À chaque tour, un joueur prend 1, 2 ou 3 bâtons.

③ Celui qui prend le dernier bâton gagne !

④ Joue plusieurs parties contre ton binôme et essaie de trouver une stratégie.

Étape 2 — Jouer contre l’IA

Règle : 16 bâtons. Prendre 1, 2 ou 3 par tour. Celui qui prend le dernier gagne !

bâtons restants

tes victoires

victoires IA

💡 Astuce : essaie de laisser 4, 8, ou 12 bâtons à l’IA. Tu remarques quelque chose ?

Étape 3 — Algorithme à compléter

1. Clique sur un mot en bas pour le sélectionner. 2. Clique ensuite sur le ??? pour le placer.

# Algo gagnant — SI / SINON avec MODULO 4

SI (Nombre_Allumettes MODULO 4) est ???

ALORS

Prendre ??? allumettes

SINON

Prendre ??? allumette (déséquilibre)

FIN SI

différent de 0 Nombre_Allumettes MODULO 4 1 égal à 0 3

MODULO te donne le reste d’une division. Si ce reste est différent de zéro, tu as exactement la bonne information pour gagner ce tour !

Étape 4 — L’IA apprend en jouant (Q-learning)

Au début l’IA joue au hasard. Au fil des parties elle mémorise les bons coups et son taux de victoire augmente progressivement !

parties jouées

taux victoire IA

Novice

niveau IA

Évolution du taux de victoire

100

200

500

1000

✍️ Trace écrite

1. Explique avec tes mots ce qu’est l’apprentissage par renforcement, à partir de ce que tu as vu avec le jeu de NIM.

Es-tu sûr(e) d’avoir besoin d’aide ?

Es-tu sûr(e) d’avoir terminé cette question ?

🟩 Aide

L’IA n’a pas reçu la stratégie toute faite : elle a testé des actions, perdu, gagné, et ajusté son comportement selon le résultat.

✕ Fermer

🔵 Défi

Donne un exemple, hors jeu vidéo, où un humain apprend lui aussi par renforcement (essai, erreur, récompense).

✕ Fermer

2. Pourquoi l’IA gagne-t-elle de plus en plus souvent au fil des parties d’entraînement ?

Es-tu sûr(e) d’avoir besoin d’aide ?

Es-tu sûr(e) d’avoir terminé cette question ?

🟩 Aide

Regarde le graphique : à chaque partie, l’IA mémorise un peu mieux quelles actions menaient à une victoire.

✕ Fermer

🔵 Défi

D’après toi, le taux de victoire de l’IA pourrait-il un jour atteindre 100 % contre un adversaire qui joue au hasard ? Justifie.

✕ Fermer

3. Explique le principe de l’algorithme MODULO 4, et pourquoi il fonctionne à chaque fois.

Es-tu sûr(e) d’avoir besoin d’aide ?

Es-tu sûr(e) d’avoir terminé cette question ?

🟩 Aide

Si tu laisses toujours un multiple de 4 à ton adversaire, il sera toujours coincé, quoi qu’il joue.

✕ Fermer

🔵 Défi

Le jeu commence avec 16 bâtons. Si tu joues en premier et que tu appliques bien l’algorithme, peux-tu être certain de gagner ? Justifie.

✕ Fermer

4. Cette IA pourrait-elle apprendre un autre jeu sans qu’on change son code ? Justifie ta réponse.

Es-tu sûr(e) d’avoir besoin d’aide ?

Es-tu sûr(e) d’avoir terminé cette question ?

🟩 Aide

Pense à ce que l’IA a mémorisé : des actions liées précisément aux règles du jeu de NIM.

✕ Fermer

🔵 Défi

Que faudrait-il changer pour que cette même méthode (apprentissage par renforcement) fonctionne sur un autre jeu ?

✕ Fermer

✓ Sauvegardé !

❓ Quiz bilan

Question 1 / 4

Quelle est la clé de la stratégie gagnante avec 16 bâtons ?

Question 2 / 4

Qu’est-ce que l’apprentissage par renforcement ?

Question 3 / 4

Au début de l’apprentissage, comment joue l’IA ?

Question 4 / 4

Que calcule MODULO 4 dans l’algorithme ?

🏆 J’ai réussi si…

✔ Je connais les règles du jeu de NIM

✔ J’ai joué au moins 2 parties contre l’IA

✔ Je sais compléter l’algorithme gagnant avec le raisonnement MODULO 4

✔ Je comprends comment une IA peut apprendre à gagner en s’entraînant

✔ J’ai réussi le quiz

🎬🎙️ Vidéo & Podcast

Pour aller plus loin

Class’Code IA — Pixees

Pour comprendre l’IA →

IA et apprentissage — Code.org

Tester l’apprentissage →

Ressources professeur Espace prof

Fiche de déroulement Correction Bonus

💻 Matériel

💻 1 ordi / élève (idéal) 💻 1 ordi / binôme 🨺 16 bâtonnets / binôme

Compétences abordées

► Comprendre et traduire par un algorithme en langage naturel le programme associé à une fonctionnalité d’un OST

Espace professeur

Comprendre l’apprentissage par renforcement avec le jeu de NIM

🎯 Problématique

Ma progression

📚 Lexique — Les mots clés

📋 Travail à faire

✍️ Trace écrite

❓ Quiz bilan

🏆 J’ai réussi si…

🎬🎙️ Vidéo & Podcast

Pour aller plus loin