Jeg tror observasjonen om at LLM-er er "dårlige veiledere" ved at de ikke kan undersøke nøyaktig forståelse er nøyaktig. Det faktum at det er dumt å «oppvekte hele utrullingen» er også sant. Det er imidlertid ikke åpenbart for meg at botemiddelet for det er LLM-refleksjon over "hva som gikk bra". Jeg tror dette støter på veldig lignende problemer med kollapsrisiko eller feilallokering av tilsyn. For selv om vi kanskje suger tilsyn gjennom et sugerør, er det eneste som er enda verre å suge tilsmusset tilsyn gjennom et sugerør.