Ejecución del modelo de razonamiento Ring 1T en un solo M3 Ultra con mlx-lm. Está cuantificado a 3,5 bits por peso. Utiliza 440 GB y genera ~ 6k tokens a 18.2 toks / seg. Acercándonos a GPT-5 en casa.
Aquí está el juego de invasores espaciales que generó:
48.64K