ARC-AGI-3:n esikatselutapahtuman yhteenveto @GregKamradt vaiheet Interactive Reasoning Benchmark -opinnäytetyömme läpi * Miksi staattiset vertailuarvot eivät mittaa agenttisia ominaisuuksia * ARC-palkinnon lähestymistapa interaktiivisten vertailukohtien luomiseen
20,93K