你如何实际评估一个模型的虚张声势或背叛能力? 跟随 @Liv_Boeree 和 @GoogleDeepMind 的研究工程师 John Schultz,深入了解他们如何解析在游戏竞技场中支持扑克、国际象棋和狼人环境的工程和博弈论。👇