¡Acaba de caer el informe técnico del Kimi K2.5! Golpes rápidos: - Entrenamiento conjunto texto–visión: preentrenado con tokens de visión y texto 15T, SFT de visión cero (solo texto) para activar el razonamiento visual - Enjambre de Agentes + PARL: subagentes paralelos orquestados dinámicamente, hasta 4,5× menor latencia, 78,4% en BrowseComp - MoonViT-3D: un codificador unificado imagen–vídeo con compresión temporal de 4×, que permite vídeos de 4× largos en el mismo contexto - Toggle: RL eficiente en tokens, 25–30% menos tokens sin caída de precisión Aquí está nuestro trabajo hacia una inteligencia agente escalable y real. Más detalles en el informe 👉