Tópicos populares
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
O ARC-AGI está a redefinir a forma como medir o progresso no caminho para a AGI - focando no raciocínio, generalização e adaptabilidade em vez de memorização ou escala.
Na NeurIPS 2025, a @sdianahu da YC sentou-se com o Presidente da @arcprize, @GregKamradt, para descobrir por que a maioria dos benchmarks de IA falha, como o ARC-AGI revela os limites dos modelos atuais e por que medir a inteligência pode ser mais difícil do que construí-la.
00:11 — O que é o Prémio ARC e por que existe
00:38 — A definição de AGI de François Chollet
01:48 — O que o ARC-AGI realmente testa
02:25 — Quando os LLMs falharam no benchmark ARC
03:38 — O ARC-AGI torna-se o padrão
04:49 — Falsos positivos no progresso da IA
06:06 — A evolução do ARC-AGI
08:55 — Medindo a inteligência para além da precisão
10:25 — O que acontece se um modelo resolver o ARC-AGI?
Top
Classificação
Favoritos
