Tous les jeux IA
🧱
DQN

IA Casse-Briques — DQN ε-greedy

Comment un Deep Q-Network apprend le Casse-Briques — replay d'expérience et courbe epsilon.

Jouer au jeu

Comment fonctionne l'IA

Le Casse-Briques est entraîné avec un DQN. L'agent déplace la raquette pour garder la balle et casser les briques, en apprenant les Q-values par l'expérience.

État, actions, récompense

  • État : position de la raquette, position et vitesse de la balle.
  • Actions : gauche, droite ou rester.
  • Récompense : positive en cassant des briques, négative en perdant la balle.

Exploration vs exploitation

Une politique ε-greedy démarre quasi aléatoire (ε élevé) puis exploite la politique apprise à mesure que ε décroît.

Ce que vous voyez

La courbe epsilon et les barres Q-value montrent le passage de l'exploration à l'exploitation.

Besoin d'un ingénieur IA ou data scientist ?

Je conçois des modèles ML sur mesure, des agents IA, de la vision par ordinateur et de l'automatisation — de l'idée à la production.