Zespół GLM korzysta teraz z MLA!! To naprawdę szalony model z 30 miliardami parametrów i około 4 miliardami aktywnymi. Bardzo ładne wydanie jeśli chodzi o strukturę, jest to w przybliżeniu ta sama głębokość co glm4.5 air i qwen3 30B A3B, 64 całkowitych ekspertów zamiast 128, ale aktywne są tylko 5 zamiast 9, jeśli liczyć wspólnego eksperta.