Boom! Evaluasi MLX dengan inferensi batch paralel yang didistribusikan pada 2 M3 Ultra dan 1 M4 Max! Saat ini permintaan didistribusikan secara merata di semua node di ring, saya akan bermain dengan ini untuk menetapkannya berdasarkan ukuran setiap node 💪🏻