DeepSeek har precis lanserat mHC (Manifold-Constrained Hyper-Connections). en smidig arkitekturjustering som låter Transformers köra en bredare "tänkarström" (mer parallella banor) utan att destabilisera träningen. Det låser upp starkare resonemang, bättre benchmarks och högre kvalitet på utdata utan att bara kasta in fler GPU:er eller FLOPs på problemet