Model gpt-oss-120b @OpenAI kami tidak hanya mencapai 402 token per detik, tetapi juga mempertahankan throughput dari 1k hingga 100k token tanpa keruntuhan. Untuk tim yang menskalakan aplikasi dunia nyata, konsistensi ini berarti biaya yang dapat diprediksi, keandalan tingkat produksi, dan kepercayaan diri untuk menerapkan dalam skala besar.