Populære emner
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Jobber med den nye Open Source Grok 2.5!
Vi har vært i stand til å Hot Rod det allerede!!
Det er tidlig, og det kan mislykkes, men det vi har er:
En 268B MoE, 131k kontekst, 8 eksperter, RoPE, 64 GQA oppmerksomhetshoder med 8 KV-hoder, 64 lag.
Til enhver tid er bare 2 eksperter normalt aktive. Vi har funnet en måte å aktivere 4 samtidig med bare et lite ytelsesfall, omtrent 1/3 mer GPU-minne og en forbløffende økning i kvalitetsutganger!
Hvis det opprettholder testene våre, vil jeg publisere en detaljert hvordan!

24. aug., 09:08
Jeg kommer til å skrive om denne artikkelen for å bruke en kompakt versjon av den NYE GRATIS ÅPEN KILDEKODE-@xai @Grok 2.5 snart!
Jeg vil vise deg hvordan du finjusterer modellen på dataene dine for privat ikke-skybruk på datamaskinen din.
Dette vil forbedre kvaliteten med en størrelse!
Jobber med det...
44,47K
Topp
Rangering
Favoritter