Popularne tematy
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Sekret wydajności Parallaxa tkwi w kluczowych optymalizacjach serwerowych:
– Ciągłe grupowanie: dynamicznie grupuje żądania, aby maksymalizować wykorzystanie sprzętu i przepustowość.
– Paged KV-Cache: blokowa konstrukcja zapobiega fragmentacji pamięci, obsługuje tysiące równoczesnych żądań.
– Heterogeniczni pracownicy: optymalna wydajność na GPU i Macach.
Szybko. Niezawodnie. W pełni rozproszone.

20 cze 2025
Compared to Petals (BitTorrent-style serving), Parallax running Qwen2.5-72B on 2× RTX 5090s achieved:
– 3.1× lower end-to-end latency, 5.3× faster inter-token latency
– 2.9× faster time-to-first-token, 3.1× higher I/O throughput
Results were consistent and showed great scalability across different input configurations, and this is just the beginning.
66,56K
Najlepsze
Ranking
Ulubione