LLMは理解を正確に探ることができないという点で「悪い家庭教師」であるという観察は正確だと思います。「ロールアウト全体を重み付ける」ことが愚かであるという事実も事実です。しかし、その解決策が「何がうまくいったか」についてのLLMの反省であるかどうかは私には明らかではありません。これは、崩壊のリスクや監督の誤った割り当てという非常によく似た問題に遭遇すると思います。なぜなら、私たちはストローで監督を吸っているかもしれませんが、さらに悪いのは、ストローで汚染された監督を吸い取ることだけだからです。