Deși nu spun că această buclă de auto-îmbunătățire nu poate funcționa în cele din urmă, cred că nu am atins încă "viteza de evadare". LLM-urile în prezent nu sunt suficient de "cinstite", mai ales atunci când se aplică presiune de optimizare pentru a nu ceda la colaps. Până atunci, avem exact o dimensiune a eșantionului N=1 de lucruri care impregnează în mod fiabil un set divers de capacități emergente: pre-antrenament. Oamenii ar trebui să petreacă mai puțin timp gândindu-se la post-antrenament și să petreacă mai mult timp gândindu-se la lucruri care arată efectiv ca pre-antrenament, dar ar putea avea promisiuni diferite.