Хоча я не кажу, що цей цикл самовдосконалення не може спрацювати в кінцевому підсумку, я думаю, що ми ще не досягли «швидкості втечі». В даний час LLM недостатньо «чесні», особливо коли тиск оптимізації застосовується для того, щоб не піддатися колапсу. До того часу ми маємо рівно N=1 розмір вибірки речей, які надійно наповнюють різноманітним набором емерджентних можливостей: попереднє навчання. Люди повинні витрачати менше часу на роздуми про посттренування і витрачати більше часу на роздуми про речі, які ефективно виглядають як передтренування, але можуть містити інші обіцянки.