.@christinahkim sier at grensen ikke er benchmarks lenger. Det er bruk. Eval-partiturer er mettede, men dagliglivet er det ikke. Det virkelige signalet om fremgang er hvor mange som bruker AI for å få virkelige ting gjort. Det er slik vi vet at vi nærmer oss AGI.
23,7K