我們的 @OpenAI gpt-oss-120b 模型不僅實現了每秒 402 個標記的速度,而且在從 1k 到 100k 個標記的過程中保持了這一吞吐量而不崩潰。對於擴展現實世界應用的團隊來說,這種一致性意味著可預測的成本、生產級的可靠性,以及在大規模部署時的信心。