Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Meta baru saja menjatuhkan makalah ini yang menumpahkan saus rahasia pembelajaran penguatan (RL) pada LLM.
Ini menjabarkan resep RL, menggunakan 400.000 jam GPU dan mengemukakan hukum penskalaan untuk kinerja dengan lebih banyak komputasi di RL, seperti hukum penskalaan prapelatihan klasik.
Harus dibaca untuk kutu buku AI.

Sumber:
95,07K
Teratas
Peringkat
Favorit