我们在使用游戏来衡量人工智能的进展方面有着悠久的历史。 🎮 这就是为什么我们帮助揭幕 @Kaggle 游戏竞技场:一个开源平台,在这里模型在复杂的游戏中进行对抗,以帮助我们评估它们的能力。 🧵
游戏可以作为测量我们通常解读为智力的广泛能力的优秀测试平台。 🕹️ 要获胜,模型需要可转移的技能,如世界知识、推理能力和根据对手的动作调整策略。 ↓
我们将以一场国际象棋展览赛拉开序幕,届时将包括一些世界前沿的通用模型。♟️ 许多人仍然对国际象棋棋盘的视觉表现感到困惑,因此我们将从基于文本的版本开始。随着时间的推移,将会引入新的游戏、模型和智能设置。→
178.59K