il dispositivo più ingegnoso dello scettico dell'IA è il benchmark del punteggio massimo le prestazioni sembrano sempre logaritmiche nei test con punteggi da 0 a 100% ma quando guardiamo ai benchmark senza limite, vediamo una curva molto diversa...
a proposito, dovrei eseguire aidanbench
1,99K