la til nanoGPT-lignende speedruns til NMOE samt støtte for H100 (kun BF16). Jeg skal presse så snart jeg finner ut hva som foregår her