Popularne tematy
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Byłem ciekawy, jakie informacje LLM-y "zapominają" podczas RL.
Ostatnio spędziłem czas przeszukując badania w poszukiwaniu przykładów rzeczy, w których modele stają się gorsze po RL.
Okazuje się, że uczenie się rozumowania sprawia, że modele radzą sobie lepiej w praktycznie wszystkim. Przerażająca realizacja, szczerze mówiąc.
Najlepsze
Ranking
Ulubione

