Comment évaluer réellement la capacité d'un modèle à bluffer ou à trahir ? Découvrez les coulisses avec @Liv_Boeree et John Schultz, ingénieur de recherche chez @GoogleDeepMind, alors qu'ils décomposent l'ingénierie et la théorie des jeux qui alimentent les environnements Poker, Échecs et Loup-Garou dans l'Arène de Jeu. 👇