📊 排名第一后,模型排名如何随时间演变? 我们分析了自2023年中期以来的每个顶尖表现者,当时@OpenAI的GPT‑4位于排行榜的顶端。截至今天,领导者似乎平均只在第一名的位置上停留35天。领先模型通常在5个月内跌出前5名,在7个月内跌出前10名。之前的领导者已经大幅下滑,o1现在排名第56,Claude 3 Opus排名第139,随着进展越来越快。我们拭目以待2026年会带来什么。