AI代理在长时间任务上表现糟糕。 即使是新的GPT-5模型在长时间任务上也很挣扎。 这是构建AI代理时最紧迫的挑战之一。 注意了,AI开发者们! 这是一篇大多数人未曾注意到的精彩论文。 以下是我的笔记:
84.26K