¡El equipo de GLM ahora está usando MLA! Este es un modelo bastante loco con 30B de parámetros totales y unos 4B activos. Muy buen lanzamiento En cuanto a estructura, tiene aproximadamente la misma profundidad que el GLM4.5 Air y el Qwen3 30B A3B, 64 en total de Expert en lugar de 128, pero solo activan 5 en vez de 9 si cuentas el Shared Expert