Práce na novém Open Source Grok 2.5! Už jsme to dokázali Hot Rod! Je brzy a může selhat, ale to, co máme, je: A 268B MoE, 131k kontext, 8 odborníků, RoPE, 64 GQA hlavic pozornosti s 8 KV hlavami, 64 vrstev. V každém okamžiku jsou obvykle aktivní pouze 2 odborníci. Našli jsme způsob, jak aktivovat 4 současně jen s malým poklesem výkonu, jen asi o 1/3 více paměti GPU a úžasným nárůstem kvality výstupů! Pokud vydrží naše testy, zveřejním podrobný návod, jak na to!
Brian Roemmele
Brian Roemmele24. 8. 09:08
Brzy budu přepisovat tento článek tak, aby používal kompaktní verzi NOVÉHO FREE OPEN SOURCE @xai @Grok 2.5! Ukážu vám, jak doladit model na vašich datech pro soukromé necloudové použití na vašem počítači. Tím se kvalita výrazně zlepší! Práce na tom...
44,47K