على الرغم من أنني لا أقول أن حلقة تحسين الذات هذه لا يمكن أن تعمل في النهاية ، أعتقد أننا لم نصل بعد إلى "سرعة الهروب". LLMs حاليا ليست "صادقة" بما فيه الكفاية ، خاصة عند تطبيق ضغط التحسين حتى لا تستسلم للانهيار. حتى ذلك الحين ، لدينا بالضبط حجم عينة N = 1 للأشياء التي تضفي بشكل موثوق مجموعة متنوعة من القدرات الناشئة: التدريب المسبق. يجب أن يقضي الناس وقتا أقل في التفكير في ما بعد التدريب وقضاء المزيد من الوقت في التفكير في الأشياء التي تبدو بشكل فعال وكأنها تدريب مسبق ولكن يمكن أن تحمل وعودا مختلفة.