Scalarea modelelor științifice necesită co-proiectarea arhitecturilor, obiectivelor de instruire și a numerelor. Astăzi, împărtășim primele postări din seria noastră despre preantrenarea cu precizie redusă, începând cu rețeta NVFP4 a NVIDIA pentru antrenament stabil pe 4 biți. Partea 1: Partea 2: Acoperim fundamentele virgulă mobilă, euristici, kernel-urile personalizate CUDA și tehnicile de stabilizare. Intrările viitoare vor acoperi rețete personalizate și rezultate despre arhitecturi hibride.