Je pense que l'observation selon laquelle les LLM sont des "mauvais tuteurs" en ce sens qu'ils ne peuvent pas sonder précisément la compréhension est exacte. Le fait que "surpondérer l'ensemble du déploiement" soit stupide est également vrai. Cependant, il n'est pas évident pour moi que le remède à cela soit la réflexion des LLM sur "ce qui s'est bien passé". Je pense que cela rencontre des problèmes très similaires de risque d'effondrement ou de mauvaise allocation de la supervision. Parce que, même si nous aspirons la supervision à travers une paille, la seule chose qui soit encore pire est d'aspirer une supervision contaminée à travers une paille.