在 M3 Ultra 上使用 MLX 进行 Qwen3-Next-80B-A3B-Instruct 基准测试。 q5 和 q6 在 MMLU Pro 上优于 bf16 🤷🏻‍♂️ 我尝试了 q8 和 q6 两次,得到了相同的结果。🤔 我会重新尝试 fp16。