Jag tror att observationen att LLM:er är "dåliga handledare" i det att de inte exakt kan undersöka förståelsen är korrekt. Att det är dumt att "vikta upp hela utrullningen" är också sant. Det är dock inte självklart för mig att botemedlet för det är LLM-reflektion över "vad som gick bra". Jag anser att detta leder till mycket likartade problem med kollapsrisk eller felallokering av tillsyn. För även om vi kanske suger tillsyn genom ett sugrör, är det enda som är ännu värre att suga in förorenad tillsyn genom ett sugrör.