Kimi K2.5 teknisk rapport kom nettopp ut! Raske treff: - Felles tekst–syn-trening: forhåndstrent med 15T visjons-tekst-tokens, null-syn SFT (kun tekst) for å aktivere visuell resonnering - Agent Swarm + PARL: dynamisk orkestrerte parallelle underagenter, opptil 4,5 × lavere forsinkelse, 78,4 % på BrowseComp - MoonViT-3D: en samlet bilde–video-koder med 4× temporær komprimering, som muliggjør 4× lengre videoer i samme kontekst - Toggle: token-effektiv RL, 25–30 % færre tokens uten nøyaktighetsfall Her er vårt arbeid mot skalerbar, ekte agentisk intelligens. Flere detaljer i rapporten 👉