Kjører Ring 1T resonneringsmodell på en enkelt M3 Ultra med mlx-lm. Det er kvantisert til 3.5 biter per vekt. Bruker 440 GB og genererte ~6k tokens med 18,2 toks/sek. Kommer nærmere GPT-5 hjemme.
Her er space invaders-spillet det genererte:
39,5K