Anche se non dico che questo ciclo di auto-miglioramento non possa funzionare eventualmente, penso che non abbiamo ancora raggiunto la "velocità di fuga". Gli LLM attualmente non sono sufficientemente "onesti", specialmente quando viene applicata la pressione dell'ottimizzazione per non soccombere al collasso. Fino ad allora, abbiamo esattamente un campione N=1 di cose che conferiscono in modo affidabile un insieme diversificato di capacità emergenti: il pre-addestramento. Le persone dovrebbero passare meno tempo a pensare al post-addestramento e più tempo a riflettere su cose che sembrano effettivamente pre-addestramento ma potrebbero contenere promesse diverse.