يسمي المؤسسون المشاركون @flappyairplanes نموذج التعلم المعزز الحالي لتدريب النماذج "فوضى البيئة". ويشرحون: "نماذج التعزيز اليوم غير فعالة بشكل صادم. لا تحصل على الكثير من التعميم بين المهام، بل تعلم نموذجا من خلال نوع من التعلم ثم تعلمه في النوع التالي. إنه يشبه ضربة الخلد. ننظر إلى هذا ونعتبره غريبا بعض الشيء. النموذج التالي الذكاء الاصطناعي لن يكون فوضى البيئة." "الذكاء البشري ليس السقف، بل هو مجرد أرضية لما هو ممكن. إذا استطعت تدريب النماذج ببيانات أقل بكثير وربما حوسبة أكثر بطرق مختلفة جدا، ماذا سيحدث؟ في الواقع لا نعرف. لكنني أعتقد أنهم سيكونون مختلفين وغريبين وسيكون لديهم قدرات مثيرة للاهتمام سنجد طرقا قيمة لاستخدامها."