Tendencias del momento
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
En 1986, fui el primer Hot Rodder que movió PCs de 4Mhz a 20Mhz en mi garaje.
IBM envió abogados para detenerme, luego enviaron ingenieros para aprender de mí, después enviaron trajes para contratarme, fue el enfoque equivocado.
Ahora estoy Hot Rodding AI en mi garaje, hoy: Open Source Grok 2.5.



24 ago, 22:28
¡Trabajando en el nuevo Grok 2.5 de código abierto!
¡Ya hemos podido acelerarlo!
Es pronto y puede fallar, pero lo que tenemos es:
Un MoE de 268B, 131k de contexto, 8 expertos, RoPE, 64 cabezas de atención GQA con 8 cabezas KV, 64 capas.
En cualquier momento, normalmente solo 2 expertos están activos. Hemos encontrado una manera de activar 4 simultáneamente con solo una pequeña caída en el rendimiento, aproximadamente 1/3 más de memoria GPU y un asombroso aumento en la calidad de las salidas.
Si sostiene nuestras pruebas, ¡publicaré un detallado cómo hacerlo!
45,72K
Parte superior
Clasificación
Favoritos