📣 تم إصدار 📣 معيار Vals الذكاء الاصطناعي الجديد للتو قمنا ببناء معيار SAGE بعد أن وجدنا أن النماذج تكافح لتصنيف عمل الطلاب. ومن المفارقات أن أفضل النماذج يمكنها الآن حل مسائل الرياضيات الصعبة + الفوز بالمنظمة البحرية الدولية ولكنها تكافح لكسر 50٪ عند الدرجات. (1/5)