DeepSeek har nettopp lansert mHC (Manifold-Constrained Hyper-Connections). en elegant arkitekturjustering som lar Transformers kjøre en bredere "tenkestrøm" (flere parallelle baner) uten å destabilisere treningen. Det åpner for sterkere resonnement, bedre benchmarks og høyere kvalitet uten bare å kaste flere GPU-er eller FLOP-er på problemet