¡Probando la evaluación paralela de datos de soporte para tareas de generación #549 en MLX con 2 M3 Ultra y se escala casi a la perfección! ¡Pronto agregaré M4 Max al grupo! ¡No más ejecuciones de evaluación de 5 días! ¡La evaluación basada en inferencia por lotes paralelos ya está aquí!