تبدو ورقة TRM وكأنها اختراق كبير في مجال الذكاء الاصطناعي. إنه يدمر حدود باريتو على معايير ARC AGI 1 و 2 (وحل سودوكو والمتاهة) بتكلفة تقديرية < 0.01 دولار لكل مهمة وتكلف < 500 دولار لتدريب طراز 7M على 2 H100s لمدة يومين. [تفاصيل التدريب والاختبار] بالنسبة إلى ARC ، تدربت على 160 مثالا من ConceptARC. في وقت الاختبار ، يستخدم الإجابة الأكثر شيوعا المتمثلة في 1000 زيادة في وقت الاختبار ويدمج شكلا ثابتا للمهمة في الإدخال. [الآثار المترتبة على الصناعة] تستخدم معظم شركات الذكاء الاصطناعي اليوم LLMs للأغراض العامة مع المطالبة بالمهام. بالنسبة لمهام محددة ، قد لا تكون الطرز الأصغر أرخص فحسب ، بل قد تكون ذات جودة أعلى بكثير! يمكن للشركات الناشئة (ويجب) تدريب النماذج مقابل 1000 دولار < لمهام فرعية محددة "ذات طول ثابت" (استخراج PDF محدد ، والتنبؤ بالسلاسل الزمنية ، وما إلى ذلك) واستخدامها كأداة للنموذج العام ليس فقط لدفع الأداء ، ولكن لبناء بعض عناوين IP ذات مغزى في المهمة التي يحاولون أتمتتها.
مصدر:
‏‎26.15‏K