Espace professeur

Connectez-vous pour accéder à vos ressources

Identifiants incorrects. Veuillez réessayer.
Mot de passe oublié ?
5e IA et nous Jeu de NIM
📄 IA et nous — Séance 2/5

Comprendre l’apprentissage par renforcement avec le jeu de NIM

⏱ 1 heure
👤 5e — Binôme
📚 Apprentissage par renforcement

🎯 Problématique

Comment une IA peut-elle apprendre à gagner au jeu de NIM ?

Ma progression

1
Découvrir
2
Jouer
3
Algorithme
4
IA apprend
Quiz

La progression se met à jour automatiquement au fil des activités

📚 Lexique — Les mots clés

Ces mots vont revenir tout au long de l’activité. Lis-les avant de commencer !

🏆 Apprentissage par renforcement

Une IA apprend en testant des actions et en recevant une récompense ou une pénalité selon le résultat.

🎉 Récompense

Signal positif ou négatif donné à l’IA après une action, pour lui indiquer si c’était une bonne idée.

🧠 Q-learning

Méthode d’apprentissage par renforcement où l’IA mémorise la valeur de chaque action possible.

🔢 Modulo

Le reste d’une division. Par exemple, 13 modulo 4 vaut 1, car 13 = 3 × 4 + 1.

🎯 Stratégie gagnante

Une suite de choix qui permet de gagner à coup sûr, quoi que fasse l’adversaire.

🧭 Exploration

Le fait d’essayer des actions au hasard pour découvrir ce qui fonctionne.

🎯 Exploitation

Le fait de réutiliser une action qu’on sait déjà efficace, plutôt que d’en essayer une nouvelle.

✅ Position gagnante

Une situation de jeu où le joueur qui doit jouer peut forcer sa victoire s’il fait les bons choix.

📋 Travail à faire

Étape 1 — Découvrir le jeu de NIM
Objectif : Comprendre les règles du jeu avant d’affronter l’IA.
① Il y a 16 bâtons au départ.
② À chaque tour, un joueur prend 1, 2 ou 3 bâtons.
Celui qui prend le dernier bâton gagne !
④ Joue plusieurs parties contre ton binôme et essaie de trouver une stratégie.
Étape 2 — Jouer contre l’IA
Règle : 16 bâtons. Prendre 1, 2 ou 3 par tour. Celui qui prend le dernier gagne !
16
bâtons restants
0
tes victoires
0
victoires IA
💡 Astuce : essaie de laisser 4, 8, ou 12 bâtons à l’IA. Tu remarques quelque chose ?
Étape 3 — Algorithme à compléter

1. Clique sur un mot en bas pour le sélectionner. 2. Clique ensuite sur le ??? pour le placer.

# Algo gagnant — SI / SINON avec MODULO 4
SI (Nombre_Allumettes MODULO 4) est ???
  ALORS
    Prendre ??? allumettes
SINON
    Prendre ??? allumette (déséquilibre)
FIN SI
différent de 0 Nombre_Allumettes MODULO 4 1 égal à 0 3
MODULO te donne le reste d’une division. Si ce reste est différent de zéro, tu as exactement la bonne information pour gagner ce tour !
Étape 4 — L’IA apprend en jouant (Q-learning)

Au début l’IA joue au hasard. Au fil des parties elle mémorise les bons coups et son taux de victoire augmente progressivement !

0
parties jouées
0%
taux victoire IA
Novice
niveau IA
Évolution du taux de victoire
0
10
20
50
100
200
500
1000

✍️ Trace écrite

1. Explique avec tes mots ce qu’est l’apprentissage par renforcement, à partir de ce que tu as vu avec le jeu de NIM.

Es-tu sûr(e) d’avoir besoin d’aide ?

Es-tu sûr(e) d’avoir terminé cette question ?

🟩 Aide

L’IA n’a pas reçu la stratégie toute faite : elle a testé des actions, perdu, gagné, et ajusté son comportement selon le résultat.

✕ Fermer
🔵 Défi

Donne un exemple, hors jeu vidéo, où un humain apprend lui aussi par renforcement (essai, erreur, récompense).

✕ Fermer
2. Pourquoi l’IA gagne-t-elle de plus en plus souvent au fil des parties d’entraînement ?

Es-tu sûr(e) d’avoir besoin d’aide ?

Es-tu sûr(e) d’avoir terminé cette question ?

🟩 Aide

Regarde le graphique : à chaque partie, l’IA mémorise un peu mieux quelles actions menaient à une victoire.

✕ Fermer
🔵 Défi

D’après toi, le taux de victoire de l’IA pourrait-il un jour atteindre 100 % contre un adversaire qui joue au hasard ? Justifie.

✕ Fermer
3. Explique le principe de l’algorithme MODULO 4, et pourquoi il fonctionne à chaque fois.

Es-tu sûr(e) d’avoir besoin d’aide ?

Es-tu sûr(e) d’avoir terminé cette question ?

🟩 Aide

Si tu laisses toujours un multiple de 4 à ton adversaire, il sera toujours coincé, quoi qu’il joue.

✕ Fermer
🔵 Défi

Le jeu commence avec 16 bâtons. Si tu joues en premier et que tu appliques bien l’algorithme, peux-tu être certain de gagner ? Justifie.

✕ Fermer
4. Cette IA pourrait-elle apprendre un autre jeu sans qu’on change son code ? Justifie ta réponse.

Es-tu sûr(e) d’avoir besoin d’aide ?

Es-tu sûr(e) d’avoir terminé cette question ?

🟩 Aide

Pense à ce que l’IA a mémorisé : des actions liées précisément aux règles du jeu de NIM.

✕ Fermer
🔵 Défi

Que faudrait-il changer pour que cette même méthode (apprentissage par renforcement) fonctionne sur un autre jeu ?

✕ Fermer
✓ Sauvegardé !

❓ Quiz bilan

Question 1 / 4
Quelle est la clé de la stratégie gagnante avec 16 bâtons ?
Question 2 / 4
Qu’est-ce que l’apprentissage par renforcement ?
Question 3 / 4
Au début de l’apprentissage, comment joue l’IA ?
Question 4 / 4
Que calcule MODULO 4 dans l’algorithme ?

🏆 J’ai réussi si…

✔ Je connais les règles du jeu de NIM
✔ J’ai joué au moins 2 parties contre l’IA
✔ Je sais compléter l’algorithme gagnant avec le raisonnement MODULO 4
✔ Je comprends comment une IA peut apprendre à gagner en s’entraînant
✔ J’ai réussi le quiz

🎬🎙️ Vidéo & Podcast

Ressources professeur Espace prof

💻 Matériel

💻 1 ordi / élève (idéal) 💻 1 ordi / binôme 🨺 16 bâtonnets / binôme

Compétences abordées

  • Comprendre et traduire par un algorithme en langage naturel le programme associé à une fonctionnalité d’un OST
Retour en haut