AI代理在長時間任務上表現糟糕。 即使是新的GPT-5模型在長時間任務上也很掙扎。 這是構建AI代理時最緊迫的挑戰之一。 注意了,AI開發者們! 這是一篇大多數人未曾注意到的精彩論文。 以下是我的筆記:
84.26K