Podle @ArtificialAnlys Hyperbolic vyniká silným výkonem napříč délkami kontextu. Náš model gpt-oss-120b od @OpenAI poskytuje 402 tokenů/s a zůstává konzistentní v délkách kontextu, což nás řadí po bok nejrychlejších poskytovatelů inference.
🚀 Qwen3 – Next využívající technologii NVIDIA: Nyní živě na Hyperbolic
Vynikající benchmarky společnosti Hyperbolic pro Qwen3-Next-80B-A3B jsou založeny na našich clusterech NVIDIA @nvidia s grafickými procesory H100 a H200 na vyžádání optimalizovanými pro pracovní zátěže AI. Grafické procesory NVIDIA H100 a H200 pohánějí naši infrastrukturu pomocí architektury Hopper a poskytují výpočetní výkon nezbytný pro masivní modely MoE Qwen3-Next. Zatímco H100s nabízí 80 GB paměti HBM3, H200s upgraduje na 141 GB paměti HBM3e s až o 45 % lepším výkonem.
Qwen3-Next-80B-A3B – Benchmarking: Proč hyperbolické leady
Nedávný benchmarking společnosti @ArtificialAnlys umístil Hyperbolic na samé první místo v kategoriích Qwen3-Next-80B-A3B-Thinking a Qwen3-Next-80B-A3B-Instruct ve všech klíčových metrikách: rychlosti, latenci a nákladech.