Noe nytt arbeid med @aldrmv @angeloskath og @GrangierDavid: Beregningsoptimal kvantiseringsbevisst trening @aldrmv bygget en skaleringslov som kan svare på mange nyttige spørsmål, inkludert: - For et gitt tokenbudsjett, hvor mye trening bør være full previsjon vs kvantiseringsbevisst? - Hva er den optimale kvantiseringen for et gitt minnebudsjett? - Hvordan endres brøkdelen av kvantiseringsbevisst trening når du øker treningstokens?