DeepSeek yeni mHC'yi (Manifold Kısıtlı Hiper-Bağlantılar) tanıttı. Transformers'ın daha geniş bir "düşünme akışı" (daha fazla paralel şerit) çalıştırmasına olanak tanıyan, eğitimi istikrarsızlaştırmadan kullanabilen şık bir mimari ayarlama. Daha güçlü akıl yürütmeleri, daha iyi benchmarkları ve daha kaliteli çıktıları ortaya çıkarıyor, sorunu sadece daha fazla GPU veya FLOP kullanmadan