Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Salah satu pendiri @flappyairplanes menyebut paradigma RL saat ini untuk pelatihan model "lingkungan slop". Mereka menjelaskan:
"Paradigma penguatan saat ini sangat tidak efisien. Anda tidak benar-benar mendapatkan banyak generalisasi lintas tugas, Anda mengajarkan model melalui satu jenis pembelajaran dan kemudian Anda mengajarkannya berikutnya. Ini seperti memukul lalat. Kami melihat ini dan berpikir itu agak gila. Paradigma AI berikutnya tidak akan menjadi lingkungan yang ceroboh."
"Kecerdasan tingkat manusia bukanlah langit-langit, itu hanya lantai di atas apa yang mungkin. Jika Anda dapat melatih model dengan data yang jauh lebih sedikit dan mungkin lebih banyak komputasi dengan cara yang sangat berbeda, apa yang akan terjadi? Kami sebenarnya tidak tahu. Tapi saya pikir mereka akan berbeda dan aneh dan mereka akan memiliki kemampuan menarik yang akan kami temukan cara yang sangat berharga untuk digunakan."
Teratas
Peringkat
Favorit
