Kertas @Scale_AI baru! Penyebab di balik peretasan hadiah? Kami melacaknya ke salah spesifikasi dalam ekor hadiah tinggi. Perbaikan kami: hadiah berbasis rubrik untuk membedakan respons "luar biasa" selain "hebat". Hasilnya: Lebih sedikit peretasan, pasca-pelatihan yang lebih kuat!