Grok 4 (Thinking) 在 ARC-AGI-2 上以 15.9% 的成績實現新的 SOTA 這幾乎是之前商業 SOTA 的兩倍,並超過了當前 Kaggle 競爭對手 SOTA
184.08K