📣 Щойно випущено 📣 новий тест Vals AI Ми створили еталон SAGE після того, як виявили, що моделям важко оцінювати роботи студентів. Парадоксально, але найкращі моделі зараз можуть розв'язувати складні математичні задачі + вигравати IMO, але насилу долужать 50% при виставленні оцінок. (1/5)