Testando a avaliação paralela de suporte de dados para tarefas de geração #549 no MLX com 2 M3 Ultra e está a escalar quase perfeitamente! Vou adicionar o M4 Max ao grupo em breve! Chega de execuções de avaliação de 5 dias! A avaliação baseada em inferência em lote paralelo chegou!