Vedere il grande router di GPT-5 continuare a fallire per me mi convince che "LLM come giudici" e dati sintetici per addestrare meglio gli LLM SOTA siano solo un'illusione.
1,3K