Raportul tehnic Kimi K2.5 tocmai a fost lansat! Lovituri rapide: - Antrenament comun text–viziune: preantrenat cu tokenuri viziune-text de 15T, SFT fără viziune (doar text) pentru activarea raționamentului vizual - Agent Swarm + PARL: sub-agenți paraleli orchestrați dinamic, până la 4,5× latență mai mică, 78,4% pe BrowseComp - MoonViT-3D: un encoder unificat imagine–video cu compresie temporală de 4×, permițând videoclipuri 4× mai lungi în același context - Toggle: RL eficient din punct de vedere al token-urilor, cu 25–30% mai puține token-uri fără scădere a preciziei Iată munca noastră pentru o inteligență agentică scalabilă și reală. Mai multe detalii în raport 👉