DeepSeek hat gerade mHC (Manifold-Constrained Hyper-Connections) vorgestellt. Eine elegante Architekturänderung, die es Transformern ermöglicht, einen breiteren "Denkstrom" (mehr parallele Spuren) zu betreiben, ohne das Training zu destabilisieren. Es eröffnet stärkere Schlussfolgerungen, bessere Benchmarks und qualitativ hochwertigere Ausgaben, ohne einfach mehr GPUs oder FLOPs auf das Problem zu werfen.