Argomenti di tendenza
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Meta ha appena pubblicato questo documento che svela il segreto della reinforcement learning (RL) sugli LLM.
Presenta una ricetta per la RL, utilizza 400.000 ore GPU e propone una legge di scalabilità per le prestazioni con più calcolo nella RL, simile alle classiche leggi di scalabilità del pre-addestramento.
Da leggere assolutamente per gli appassionati di AI.

Fonte:
95,06K
Principali
Ranking
Preferiti