Felice di condividere un documento che abbiamo scritto in Apple — “Addestramento consapevole della quantizzazione ottimale per il calcolo”! TLDR: Tratta il QAT come un cittadino di prima classe e pianificalo in anticipo se vuoi ottenere il miglior modello quantizzato con il calcolo che hai. 🧵🧵🧵