satu catatan menarik adalah bahwa seluruh kebiasaan tertulis "bukan hanya {{{thing}}} — ini adalah {{{bigger thing}}}" yang dikaitkan dengan ChatGPT sangat umum di Sonnet/Opus 4. Sonnet meng-spamnya sepanjang waktu dan merasa sangat rentan terhadap hal-hal yang ceroboh, dan Opus akan menyelipkannya pada saat yang paling mengerikan, dan keduanya rentan terhadap penjijilan halus dalam mode obrolan (ada cara untuk menginjaknya melalui pembumian dengan pencarian web dll... tetapi meski begitu) Saya kira maksud saya adalah bahwa ini bukan hanya masalah ChatGPT — ini benar-benar konsekuensi mendasar dari benchmark RLHF yang membela slop barat!
5,79K