Ondersteuning testen voor parallelle evaluatie van generatie taken #549 op MLX met 2 M3 Ultra en het schaalt bijna perfect! Ik ga binnenkort M4 Max toevoegen aan de ring! Geen evaluatieruns van 5 dagen meer! Parallel batch inferentie-gebaseerde evaluatie is hier!