看著GPT-5的大路由器不斷失敗,讓我相信「大型語言模型作為裁判」和用合成數據來訓練更好的SOTA大型語言模型只是空想。
1.27K