Běžící prstenec 1T uvažující model na jediném M3 Ultra s mlx-lm. Je kvantován na 3,5 bitů na váhu. Využívá 440 GB a generuje ~6 tisíc tokenů rychlostí 18,2 tok/s. Přiblížení se k GPT-5 doma.
Zde je hra Space Invaders, kterou vytvořil:
51,39K