"التدريب القائم على النتائج سيبقي سلاسل الأفكار صادقة." للأسف، لا. نظهر أن التدريب على *المخرجات فقط* لا يزال يمكن أن يجعل النماذج تخفي سلوكا غير مرغوب فيه في سلسلة أفكارها. فريق شارد من ماتس 8.0 يقدم: 🧵