Skalering av vitenskapelige verdensmodeller krever samdesign av arkitekturer, treningsmål og numerikk. I dag deler vi de første innleggene i serien vår om lavpresisjons fortrening, med start i NVIDIAs NVFP4-oppskrift for stabil 4-bits trening. Del 1: Del 2: Vi dekker grunnleggende flyttallsprinsipper, heuristikker, tilpassede CUDA-kjerner og stabiliseringsteknikker. Fremtidige oppføringer vil dekke egendefinerte oppskrifter og resultater på hybride arkitekturer.