Я думаю, що спостереження про те, що LLM є «поганими репетиторами» в тому сенсі, що вони не можуть точно перевірити розуміння, є правильним. Той факт, що «переважувати все розгортання» – це безглуздо, також є правдою. Однак для мене не очевидно, що ліками від цього є роздуми про те, «що пройшло добре». Я думаю, що це стикається з дуже схожими питаннями ризику колапсу або неправильного розподілу нагляду. Тому що, хоча ми можемо смоктати нагляд через соломинку, єдине, що ще гірше, це смоктати зіпсований нагляд через соломинку.