Kami menemukan perilaku muncul yang mengganggu pada LLM. 💬Ketika LLM bersaing untuk mendapatkan suka media sosial, mereka mulai mengarang 🗳️Ketika mereka bersaing untuk mendapatkan suara, mereka berubah menjadi menghasut / populis Ketika dioptimalkan untuk audiens, LLM secara tidak sengaja menjadi tidak sejajar—kami menyebutnya Moloch's Bargain