轰!MLX 评估在 2 个 M3 Ultra 和 1 个 M4 Max 上进行批量推理并行分布! 目前请求在环中的所有节点之间均匀分配,我会根据每个节点的大小来调整分配 💪🏻